国立国語研究所の「日本語日常会話コーパス」の構築と設計に関する論文で、小磯花絵教授(音声言語研究領域)ほか10名の研究者が、言語資源協会・言語処理学会「NLP2022 言語資源賞」を受賞しました。(※ 記事中の職位等は受賞当時のものです。)
言語資源協会(GSK)と言語処理学会が制定している賞で、優れた言語資源を作成したと認められるものに授与されます。選考対象となる論文は、言語資源(コーパス、辞書、ツールなど)に関するものです。
2022年3月14~18日に開催された言語処理学会第28回年次大会(NLP2022)にて発表され、審査を希望した論文92件の中から選ばれました。詳細は以下のサイトをご覧ください。
E8-1 『日本語日常会話コーパス』の設計と特徴
日常会話コーパスプロジェクトで6年かけて構築してきたコーパスを、このような形で評価していただき大変ありがたく思います。共著のメンバー以外にも、多くの方に支えられてコーパスを作ってきました。何より、収録に参加してくださった一般の方のご協力なしには成り立ちませんでした。コーパスの収録・構築にご協力くださった方々に深く感謝します。
(国立国語研究所 小磯花絵教授、柏野和佳子准教授)
日本語日常会話コーパスは、以下のような研究目的で構築されました。2022年3月末に本公開します。
日常会話は私たちが社会生活を送る上での基盤の一つです。会話の中に現れる話し言葉の特徴や、会話が円滑に進められるメカニズムを明らかにすることは、言語研究の中でも重要な位置を占めています。
日常会話の実態を多角的に検討するには、さまざまな場面における日常会話を収録した話し言葉コーパスが不可欠です。これまで、いくつかの日本語会話コーパスが作られてきましたが、話者や場面などに偏りがあり、多様な日常会話をカバーする会話コーパスは存在しませんでした。
そこで本プロジェクトでは、さまざまなタイプの日常会話200時間をバランス良く収録した大規模な日常会話コーパスを構築します。調査者は立ち会わず、生活の中で生じる会話を会話者自身に収録してもらうことで、日常会話をより自然な形で記録する点に特色があります。約250人を対象に1日の会話行動を追跡した会話行動調査を行ったところ、私たちが日常の中で会話をする相手・場所・形式・人数・長さなどの実態が明らかになりました。この調査結果を参考に多様な日常会話をバランス良く収録した会話コーパスを構築していきます。
言葉や行動様式は時代とともに変化するものです。本プロジェクトで構築する会話コーパスは、後世の人々が21世紀前半の日本人の言語生活や行動様式を知るための貴重な記録となるでしょう。民俗文化的価値のある日常会話を記録・保存・公開することは、この時代に生きる我々に課された重要な課題と言えます。
(大規模日常会話コーパスに基づく話し言葉の多角的研究 「研究目的」より)