国語研の窓

第30号(2007年1月1日発行)

研究室から:行政情報処理と漢字

1.汎用電子情報交換環境整備プログラム

みなさんは,「電子政府」や「電子自治体」という言葉を聞いたことがあるでしょうか。現在,府省庁や地方自治体など全国の行政機関では,さまざまな手続きに使う文書の電算化が進められ,インターネットを利用した電子申請のシステムが整備されつつあります。コンピュータを使って円滑な情報交換ができるような「電子政府」を実現するためには,住民の氏名や住所,あるいは,法人の名称や所在地などを記載するために必要な漢字についても,「電子政府」を支える基盤の一つとして整備をしていく必要があります。

例えば,戸籍や住民基本台帳で使われている人名・地名を書き表すための漢字には,漢和辞典にも載っておらず,コンピュータ間でのやり取りのできないものが少なくありません。そこで,国立国語研究所と情報処理学会と日本規格協会の3機関が中心となり,「電子政府」で必要となる漢字の調査研究を,平成14年度から17年度までの4年間,経済産業省の委託研究として進めてきました。

国立国語研究所は文字の同定などの基礎研究にあたる文字情報の整理・体系化,情報処理学会は整理・体系化を経た文字情報を集積するデータベースの構築と運営,日本規格協会は統一的なデザインによる新たな文字グリフ(平成明朝体)の制作をそれぞれ担当しました。また,この事業は正式名称を「汎用電子情報交換環境整備プログラム」と言い,内閣官房・総務省・法務省・文化庁が協力した「5府省庁横断プロジェクト」であり,出版・印刷・情報機器などの実業界からも応援を得て行われました。

図1 プロジェクトの推進体制
図1 プロジェクトの推進体制

2.漢字情報データベース

平成14年度から17年度までの調査研究では,法務省の「戸籍統一文字」約50,000字と総務省の「住民基本台帳ネットワーク統一文字」(以下「住基統一文字」)約20,000字を集め,ひとつひとつの文字に対して,部首・画数・読みなどの基本情報,国語施策(常用漢字など)や戸籍行政(人名用漢字など)に関する行政の文字情報,コンピュータで漢字を扱うためのJIS規格(国内規格)やUCS規格(国際規格)の文字コード情報,大漢和辞典文字番号などの辞書情報を付与し,調査結果を漢字情報データベースとして蓄積しました。

図2は,漢字情報データベースで「学」を検索した結果です。日常的によく使われている「学」のほかに旧字体の「學」など,戸籍や住民基本台帳では多くの異体字が必要とされています。漢字情報データベースはこのような異体字も多数収録し,全体の字種は異なり約59,000字となっています。

漢字情報データベースは,行政の漢字処理の基盤としてだけでなく,文献の解読や漢字使用頻度調査,漢字の認知科学など,漢字に関わるさまざまな学術分野での活用が期待されています。

図2 漢字情報データベースの検索例
図2 漢字情報データベースの検索例

3.漢和辞典にない文字

住基統一文字約20,000字と,国内最大の漢和辞典である『大漢和辞典』(諸橋轍次,大修館書店)の親字約50,000字とを照合してみると,住基統一文字のうち約2,000字は,『大漢和辞典』に載っていない文字だということがわかります。

図3 住基統一文字と『大漢和辞典』
図3 住基統一文字と『大漢和辞典』

では,『大漢和辞典』に載っていない文字にはどのようなものがあるのでしょうか。

例えば,山梨県の地名「大垈(おおぬた)」や「藤垈(ふじぬた)」に使われる「垈」は,山梨県地方特有の「地域文字」です。「ぬた」は湿地を表わすとされています。ところが,「垈」と同字形の文字を,韓国ソウル市の地下鉄の駅名に見ることができます。韓国語で「垈()」は土地や宅地を表わし,韓国の古文献にもこの意味で使われています。

山梨県の「垈(ぬた)」と韓国の「垈()」とでは,文字が表わしている意味が異なります。それに,日本国内で「垈」を現在使う地域は山梨県しかなく,過去にさかのぼって,歴史的な文献や考古学的な遺物からも,「垈」はまだ見つかっていません。つまり,朝鮮半島から「垈」が伝えられた痕跡が見出せないのです。現状では,山梨県の「垈(ぬた)」と韓国の「垈()」とは同形異字,すなわち,互いに関連性のない他人の空似としておくほかないようです。

図4 山梨県甲斐市「大垈」
図4 山梨県甲斐市「大垈」
図5 ソウル市地下鉄「落星垈」駅
図5 ソウル市地下鉄「落星垈」駅

このように,『大漢和辞典』に載っていない文字には,ある特定の地域や場所を書きあらわすための文字が含まれています。その地域や場所に無関係の人にとっては,見たこともない珍しい文字になります。しかし,その地域や場所に深く関わる人にとっては,日常的な文字であり必要な文字です。「電子政府」や「電子自治体」を実現するためには,文字の流通度に関わりなく,必要な文字を行政情報処理の場で扱うことができるようにしなくてはなりません。

4.平成18年度以降の展開

「汎用電子情報交換環境整備プログラム」は平成18年度以降も継続となり,今度は不動産登記や法人登記など,登記事務で使われる文字を検討することになりました。図6に登記文字のごく一部を示します。左から「華」「鄭」「龍」の中国簡体字です。

図6 登記文字
図6 登記文字

国際化の時代を迎え,日本に仕事や居住の場をもつ外国人も増え,文字使用にもその影響が現われている事例です。行政情報処理の実務では,日本で使われている漢字だけを扱っていては間に合わなくなりました。「電子政府」の基盤を支える文字の調査研究でも,東アジア漢字文化圏を視野に,調査研究を進めていくことが必要です。

(高田 智和)

『国語研の窓』は1999年~2009年に発行された広報誌です。記事内のデータやURLは全て発行当時のものです。