第40号(2009年7月1日発行)
漢字情報データベースは,行政の文字情報処理で必要とされる漢字を,広く収集したものです。近年,パソコンやインターネットなど情報機器の発達を受けて,「電子政府」「電子自治体」の構築が進行中です。これは,さまざまな行政文書をコンピュータで扱えるようにし,自宅のパソコンから,インターネットを介した電子申請の実現を目指しています。行政の文字情報処理では,個人の氏名,住所の地名,法人の名称を書き表すために,学校教育での学年別配当漢字(教育漢字)1,006字や,一般社会での「目安」とされる常用漢字1,945字の範囲を越えて,多種多様な漢字が必要とされます。
これらの多種多様な漢字を,コンピュータで扱えるように,そして,現在よりも高度な「電子政府」「電子自治体」を実現するために,国立国語研究所と情報処理学会と日本規格協会が連合体を組んで,行政の文字情報処置で必要とされる漢字の基礎調査研究を行いました(経済産業省委託「汎用電子情報交換環境整備プログラム」,平成14~21年)。国立国語研究所はことばとしての漢字,情報処理学会は情報としての漢字,日本規格協会は目に見えるデザインとしての漢字を,それぞれの特性を活かして,多角的に検討しました。この三者の調査研究成果を集積するための器として,国立国語研究所は漢字情報データベースを構築しました。
漢字情報データベースは,異なり約68,000字の漢字を収録しています。これは,戸籍の電算化に必要とされる戸籍統一文字約55,000字,住民基本台帳ネットワークシステムを動かすための住基統一文字約19,000字,登記簿のシステムに運用される登記統一文字約66,000字から,それぞれに共通する漢字を整理した和集合です。
漢字情報データベースには,一つ一つの漢字に対して,部首・画数・読みなどの基本情報,国語施策や戸籍行政に関する行政情報,コンピュータでの文字情報交換に関する文字コード情報,『大漢和辞典』の親字番号などの辞書情報が記載されています(図参照)。これらの諸情報は,文字情報交換の基盤である文字コード規格(国際規格ISO/IEC 10646)を整備していくための基礎資料として活用されています。
(高田 智和)
図:漢字情報データベースの検索例
『国語研の窓』は1999年~2009年に発行された広報誌です。記事内のデータやURLは全て発行当時のものです。