第9号(2001年10月1日発行)
海外のパソコンから日本語のホームページにアクセスすると、どのように見えるのでしょうか。普通は、日本語の文字の部分が意味不明の記号などに置き換えられて表示され、まったく読めない状態になっていると思います。
海外のパソコンで日本語のホームページを読むには、日本語を表示するための特別な機能をあらかじめセットしておく必要があります。しかし、ある程度の手間がかかるので、パソコンやインターネット閲覧ソフトに関する技術的な知識に自信がない人は、二の足を踏んで、結果的にあきらめてしまう場合が多いのではないかと思われます。
このような問題の解消を目指す研究の例を紹介しましょう。
世界中のインターネット閲覧ソフトで日本語を確実に表示できるようにするには、どうすればよいのでしょうか。現在いくつかの方法が開発されていますが、国立国語研究所が中心になって開発しているシステムは、日本語の一つ一つの文字を「画像(イメージ)」で画面にすばやく表示できるよう工夫をこらしています。
この方法を最初に利用した例は、「日本語の語彙データベース(注1)」を海外から検索できるホームページで、平成13年春に国立国語研究所から公開されました。準備した文字画像は、日本の漢字に加えて中国の簡体字・繁体字、甲骨文字、梵字など9万種以上あり、研究所の外に設置された専用サーバーから高速で配信するようになっています。
検索ホームページの使い方は、以下のとおりです。国立国語研究所のホームページにアクセスすると、図1に示す入力画面が表示されます(※注意「現在こちらのサイトは閲覧することができません」)。入力エリアに検索したい言葉のローマ字表記を入力して<Find>のボタンをクリックすると、図2に示すような検索結果が表示されます。これは、「いし」という読みの語が昭和30年代に出版された雑誌90種類に何回出現したかを検索した例で、Written form(表記)は日本語表示、Origin(語種)やPart of Speech(品種)などの情報は英語で表示されるようになっています。
たとえば、本のタイトル(書名)などを英訳すると、本来のニュアンスがどうしても伝わりにくくなります。海外から我が国の出版情報を検索する場合、少なくとも書名や著者名は日本語で表示されるのが望ましいと考えられます。
そこで、国立国語研究所は、我が国の出版情報データベースを海外からも日本語で高速に検索できるシステムの研究に取り組んでいるところです。(データベースの中身は、社団法人・日本書籍出版協会が作成しているもので、現在入手可能な書籍約60万件の書誌情報が収められています。)
このような研究は、海外の日本語学習者にインターネットで日本語教材を提供する際にも役に立つのではないかと期待されています。
(注1)『現代雑誌九十種の用語用字:全語彙・表記』、国立国語研究所、1996、三省堂
図1 入力画面の例
図2 検索結果の例
(横山 詔一)
『国語研の窓』は1999年~2009年に発行された広報誌です。記事内のデータやURLは全て発行当時のものです。