ことばの波止場

Vol. 1 (創刊号 2017年3月発行)

特集 : コーパスで日本語の歴史を探る

PROJECT 04 通時コーパスの構築と日本語史研究の新展開。小木曽智信

言葉の歴史を探るには

日本語は現在まで千数百年の歴史をたどることができる、世界でも数少ない言語の一つです。言語変化研究領域では、日本語がこの長い歴史の中でどのように変化してきたかを研究しています。

古い時代の日本語を研究するには、残された文献を手がかりにするほかありません。文献から実際に使われた用例を集めて、当時その言葉がどのような意味で使われていたのかを実証的に明らかにしていきます。そのために、従来は紙の本の資料が使われてきたのですが、それでは調査できることに限界がありました。

『日本語歴史コーパス』

そこで、言語変化研究領域の「通時コーパス」プロジェクトでは、古典作品など日本語の歴史を研究するのに役立つ文献をコンピューター上で扱えるようにし、本文の全ての単語に読みや品詞などの情報を付けた『日本語歴史コーパス』を構築しています。これまでに平安時代、鎌倉時代、室町時代、明治・大正時代の資料をコーパス化してきました。

日本語歴史コーパス

「かわいい」と「うつくしい」

これを使うと、例えば「うつくしい」とか「かわいい」という言葉がいつ頃からどんな資料で使われているのか。また、それらはどんな場面でどんな言葉と一緒に使われるのか、といったことをたちどころに調べることができます。公開中のコーパスで実際に調べてみると、「うつくしい」は平安時代に270例、鎌倉時代に19例、室町時代に36例、明治・大正に1397例見つかりました(※一部コーパスの仕様により別の語の例が含まれている可能性があります)。一方、「かわいい」は平安時代にはなく、鎌倉時代に3例、室町時代に18例、明治・大正に402例ありました。「かわいい」のほうが後から使われるようになった言葉で、全時代を通じて「うつくしい」のほうが多く使われてきたことが分かります。一緒に使われている言葉を確認すると、平安時代には「稚児」「子ども」などを「うつくしい」といっていて、鎌倉時代になってから「妻」「女房」を「うつくしい」という例が見られます。この間に〈かわいらしい〉という意味から現代語の〈美しい〉の意味に変化したようです。コーパスの各用例からは原文や現代語訳にリンクがはられているので、これを使って個々の用例を調べることもできます。「かわいい」の用例を確認すると、鎌倉時代の例はいずれも〈かわいそう〉の意味、室町時代の例は〈いとしい〉といった意味のものでした。

新しい日本語史研究へ

このようにコーパスによって用例の収集がずいぶん楽になりましたが、それだけでなく、コンピューターで大量のデータを統計的に処理する新しい方法による研究も可能になりました。「通時コーパス」プロジェクトでは、上代から近現代まで、日本語の歴史を通して調べることのできるコーパスを構築し、これを活用した新しい日本語の歴史研究を進めていきます。

PROJECT 04 通時コーパスの構築と日本語史研究の新展開

特集 : 国語研では、いま、何を研究しているのか? 始動する「最先端基幹プロジェクト」

小木曽智信
OGISO Toshinobu
おぎそ としのぶ●言語変化研究領域 准教授。専門領域は日本語学、自然言語処理。明海大学講師、独立行政法人国立国語研究所研究員を経て2009年10月から現職。