ことばの波止場

Vol. 11 (2022年3月発行)

特集 : 表記情報と書誌形態情報を加えた日本語歴史コーパスの精緻化

広領域連携型基幹研究プロジェクト
特集 : ②そのほか基幹プロジェクト・基礎研究

異分野融合による「総合書物学」の構築

このプロジェクトは、国文学研究資料館、国立歴史民俗博物館、国際日本文化研究センター、国立国語研究所の4機関による共同研究「異分野融合による「総合書物論」の構築」のもとで実施されました。国立国語研究所は、書物に書かれた文字言語を媒介に、言語と書物とをつなぐための研究を行いました。

具体的には、表記上の特徴がある古典作品を対象として、コーパスを作成し公開しました。「人情本コーパス」では当て字、「延喜式祝詞コーパス」では宣命書き、「訓点資料訓読文コーパス」ではヲコト点などの訓点についてそれぞれ構造化記述の方法を考案し、『日本語歴史コーパス』に収録されました。

また、コンピュータで表現しにくい文字であった変体仮名を、情報処理推進機構との連携により、国際文字コード規格Unicode に追加提案する活動も行いました。2017年6月に出版されたUnicode 10.0に変体仮名286文字が新たに収録されました。

Unicode 10.0 のコード表(1B000から1B0A2を表示)
Unicode 10.0 のコード表
(変体仮名部分の一部)

(高田智和/言語変化研究領域・教授)