国語研の窓

第22号(2005年1月1日発行)

研究室から:行政処理を支える漢字研究

1.行政用の漢字を観察する

市役所や町村役場など,日本全国の行政機関は,いろいろな手続に関する書類のほとんどをコンピュータで処理しています。そのような書類には,住民の姓名・住所,あるいは企業などの名称・所在地などが記載されていることがよくあります。姓名・住所といった固有名詞には,様々な漢字が使われているのですが,それらは一体どのようなものなのでしょうか。

ここでは「文字の形」に注目して,行政機関で使われている漢字を観察してみましょう。図 1 を御覧ください。ここには,住民基本台帳のコンピュータ処理に使われている「慎」と,戸籍のコンピュータ処理に使われている「慎」が示されています。よく見ると,「真」の上部の「+」の形に微妙な違いがあります。

たとえ微妙な違いであっても,漢字の形がバラバラだと,どの形を使うべきか迷ったり,違和感をおぼえたり,不安に感じたりする人がいるようです。また,住民から「この書類に印字された漢字の形は正しくないのでは?」という質問が行政機関に寄せられることもあると聞きます。しかし,今のところ,漢字の形を確認するための国の標準が存在しないため,住民からの申請や届出の審査に時間がかかったり,別の行政機関と漢字データを正確に情報交換できなかったりすることがあります。

図1 文字情報収集システムの画面例
図1 文字情報収集システムの画面例

2.行政用の漢字を統一する

以上の問題を解決するために,国立国語研究所,情報処理学会,日本規格協会の 3 者が協力しながら,共同研究を推進しています(このプロジェクトは,経済産業省からの委託によるものです)。最終目標は,総務省住民基本台帳統一文字,法務省戸籍統一文字の電子化にかかわる文字(延べ約 8 万字)について,微妙な字形の違いなどを統一し,行政情報処理の標準となる文字情報集積体(文字情報データベース)を構築することにあります。これは,図書館,公文書館,歴史資料館,郷土資料館などの文字資料の電子化(デジタル・アーカイブ化)にも貢献すると期待されています。

3.文字情報集積体のあらまし

■国立国語研究所の役割

国立国語研究所は,総務省や法務省から公的に提供された行政漢字データに対して,学術的な検討をくわえて整理し,字体,読み,国語施策,文字コード番号などの体系化を行っています。

■日本規格協会の役割

行政用の漢字を統一するには,行政情報処理で利用されている文字の形の特徴を詳しく調査し,デザインなどを統一する必要があります。そのために,日本規格協会は,字の形についての標準パターンを作成しています。

この文字パターンは,平成明朝(みんちょう)体という書体に基づいて統一的にデザインされた高品質なデジタル画像情報の集合体です。その例を図 1 に「デザイン統一文字」として示しました。このようなデザイン統一文字が,6 万字種ほど作られる予定です。

■情報処理学会の役割

情報処理学会は,文字情報集積体のシステム開発を担当しています。

文字情報公開システムについて

だれでも,いつでも,利用できることを目指して,インターネット閲覧ソフト(ブラウザ)で必要な文字情報を検索できるようにしました。漢字の専門知識を持たない人であっても,簡便迅速に目的の文字を検索できるよう,次のような仕組みを装備しています。

○解字検索機能

部首・読みなどが分からない文字については,よく知られた文字を入力し,その文字を分解して取り出した構成部品を検索に用いることができるようになっています。これを「解字検索」といいます。この機能を実現するため,すべての登録文字について文字の構成部品を用意しました。解字検索の例を図 2 に示します。

図2 解字検索の画面例
図2 解字検索の画面例

○関連字表示機能

読みと意味は同じなのに,形だけが異なる漢字を「異体字」といいます。異体字の関係にある文字の一覧を表示する機能もあります。その例を図 3 に示します。

これを見れば,行政機関の窓口で提出された書類の姓名・住所欄に見慣れない漢字があったとしても,その漢字が行政情報処理システムで扱えるかどうか,すぐに確認できます。なお,図 3 の「辺」の異体字は,100種類近くも存在するようなので,現在も調査を続行中です。

図3 「辺」の異体字一覧(想定例)
図3 「辺」の異体字一覧(想定例)

4.これからの展開

漢字問題は国民生活や行政業務に直接影響するため,境界的・融合的な色彩が濃く,単独の府省庁では対処しきれない側面を含んでいます。そこで,複数省庁が協力して,学界の垣根を越えて公的機関の連合体を組織し,大学や産業界の応援のもとに,漢字の形に関する国家標準を形成しようとしたのが,このプロジェクトです。ここで構築された漢字情報集積体は,文字符号の国際標準化に必要な資料として活用されることが期待されています。

(横山 詔一)

『国語研の窓』は1999年~2009年に発行された広報誌です。記事内のデータやURLは全て発行当時のものです。