ことばの波止場

Vol. 11 (2022年3月発行)

コラム : 「意味の語形変化」をめぐって(近藤泰弘)

「「意味の語形変化」をめぐって」近藤泰弘(KONDO Yasuhiro)
単語の意味が変化していくことはどんな言語にもあることだが、その変化を記述するのには、二つのやり方がある。一つは、例えば「おかし(い)」という語形の意味が〈情緒がある〉から〈笑える〉に変わるというような方法である。もう一つは、〈秋によく飛ぶ透明の羽のある虫〉のことは、昔は「あきつ」という語形で表現したが、今では「トンボ」と言う、というような方法である。前者は、語形の持つ意味の変化を記述し、後者は、ある意味にあたる語の語形の変化を記述している。これは単語の意味変化記述の裏表で、どちらの方法が正しいというものではないが、実際には前者の方がわかりやすく、よく使われる。『日本国語大辞典』(小学館)のような大型の通時的な辞書も当然前者のスタイルをとっている。『現古辞典』(河出書房)と言って、現代語から古語を検索するような辞書があり、これは後者の方向だが、抽象的な意味体系の歴史までを構築しているわけではない。最近、ある小型辞典の改訂版のキャッチフレーズに「「エモい」は「あはれ」の子孫です。」というのがあったが、これも、やや形を変えた『現古辞典』的な示し方である。

ソシュールのチェス盤の喩えで言えば、「意味」はある時点のチェスの盤面の配置から生じるのであって、いわば、それぞれの盤面の状態そのものである。複雑な盤面(文脈)から生まれる、そのような「意味」の方をメインに通時的現象を観察することは非常に難しいのは当然であろう。

しかし、近年になって、個々の単語が文脈において持っている情報(チェス盤の盤面全体の情報にあたる)をそのまま意味として算出する、「単語の分散表現」という方法が生まれてきた。Word2vec という名前を聞かれたことのある方も多いと思うが、それがそのひとつの方法である。これは単語の前後数十個の共起情報から、その単語の持つ意味情報を深層学習で計算し、数百次元のベクトルに表現するもので、かつて広く行われた意義素研究と少し似ている。意義素とは、単語の意味の弁別的特徴を文脈からいくつかの二項対立の特徴に還元する研究で(注1)、「寒い」は[ 快不快- ](=不快だ)だが、「涼しい」は[ 快不快+ ](=快適だ)、というような具合である。新しい分散表現研究とは、+か-かではなくアナログ的な数値を持って、かつ、各語形にその特徴が数百個あるイメージを考えていただくといいだろう。計算されたベクトルの各次元が何を表すかはわからないが、ベクトルの値が加減算できたりで、相互の意味の体系を知ることができるところに特徴がある。これを使えば、意味に関する通時的な研究を行うことができる可能性が出てきており、すでに、日本語の単語の「語形の持つ意味変化」の研究も始まっている。(注2

ここでは、それを「意味の体系の変化」に応用してみよう。たとえば、次の図1は、『源氏物語』のシク形容詞をWord2vec による100次元のベクトル表現とし、機械学習で次元圧縮して(いわゆる主成分分析)、2次元の散布図に展開したものである。図2も、同じように現代語の、シイを語尾とする形容詞を同様に処理したものである。比較しやすいように、どちらも「シイ」の現代語語形で表示した。古典語の「シク活用形容詞」は特に奈良時代では、一般に感情表現を担うという説(注3)が有力であるが、二つを通覧すると、同じシク活用の中でもやや意味が異なる部分があることがわかる。2色に色分けしてあるのは、教師なし機械学習のK-Means で2クラスタに分けたものだが、2図見比べていただくと、おおよそ似た体系になっており、左側(青丸)がより主観的な表現であり、右側(赤丸)がやや客観的な表現になっていることがわかる。また、古典語では目盛りの数値を見るとわかるように狭い範囲に分布しているのに対し、現代語では、左の固まり(主観的部分が集中)と、それ以外とで分離した状態になっていて、元のシク活用形容詞の意味領域が広範囲に拡大していることがわかる。また、個別には、例えば「美し(い)」が、古典語では主観的(青)の方にあるのに対し、現代語では、客観的(赤)の方に位置しているのも、「美し(い)」の一般の語史研究(「可愛らしい」から「美的である」への変化)と整合する。

図1と図2

時代ごとにこのように分散表現のモデルを作って並べていき、ある程度その枠組みが見えて、その枠組みの形の変化や所属語形を記述できるようになれば、それがこの場合〈「主観性」に関わる意味体系の語形の変化〉ということになる。この枠組みをさらに細分化していくことで、今まで非常にとらえにくかった、意味の類型の通時的な変化が、コンピュータとコーパスを駆使して記述できる方向が見えてきた。非常に発展性のある研究分野であると考えている。(注4

  • (注1)国広哲弥「日英温度形容詞の意義素の構造と体系」(『国語学』60集・1965)など。
  • (注2)相田太一他「単語分散表現の結合学習による単語の意味の通時的変化の分析」(言語処理学会・26回年次大会・発表論文集・2020)などが日本語研究における一例である。
  • (注3)山本俊英「形容詞ク活用・シク活用の意味上の相違について」(『国語学』23集・1955)が最初の研究。
  • (注4)なお、本コラムの研究の詳細は、『メタファー研究3』(ひつじ書房)に掲載予定である。また、学術振興会科学研究費(基盤C)19K00629の研究成果の一部を含む。データとしては、国語研のBCCWJ とCHJの原データを用いた。
近藤泰弘
近藤泰弘
KONDO Yasuhiro
こんどう やすひろ●青山学院大学 教授。
専門は日本語学・日本語史・コーパス言語学。