Vol. 4 (2018年9月発行)
研究情報発信センターは、国立国語研究所の研究成果の公表、国立国語研究所が実施した調査資料の蓄積と保存、研究文献情報の発信を行っています。研究者コミュニティーに向けて、国立国語研究所の共同利用事業を推進するためのセンターです。
国立国語研究所の研究成果である報告書や論文は、国立国語研究所学術情報リポジトリ(https://repository.ninjal.ac.jp/)で公開しています。「国立国語研究所報告」や「国立国語研究所年報」をはじめ、「国立国語研究所論集」の収録論文や「NINJALフォーラムシリーズ」などの研究成果を、オープンアクセスで提供しています。
国立国語研究所の研究成果には、報告書や論文以外にも、日本語研究・日本語教育に関する各種データ集があります。機械可読のものは、データベース、データセットと呼ばれます。研究情報発信センターは、データ集のWeb公開も行っています。
公開データには、次のようなものがあります。
これらのデータベースは、国立国語研究所ウェブサイト(https://www.ninjal.ac.jp/database/)で公開しています。
研究成果である報告書や論文、データ集の作成には、基礎調査が必要です。方言や言語生活の研究であれば、話者にインタビューをして調査票を作り、分析のための情報カードを作成します。近年は、インタビューの録音や録画を撮ります。
書き言葉の場合も同様で、新聞や雑誌の語彙調査では、語彙カードや集計表を作成します。
こういった研究成果に至る過程の調査資料(いわば中間段階の資料)も、国立国語研究所では収集・保存をしています。紙の資料はもちろん、録音のカセットテープや録画のビデオテープも含まれます。
国立国語研究所の調査資料は、研究資料室で集中管理をし、来館利用の形で、研究者に提供しています。来館利用の方法は、国立国語研究所のホームページ(https://www.ninjal.ac.jp/info/aboutus/material-room/)を参照してください。
また、調査資料の目録はWeb公開しています(「国立国語研究所研究資料室収蔵資料」https://rmr.ninjal.ac.jp/)。現在、約240の調査資料(資料群)を保存しています。
主な収蔵資料には次のようなものがあります。
1950年に山形県鶴岡市で実施した言語生活の実態調査です。日常の言語生活と社会環境との関わりや、共通語の普及状況を把握することが目的でした。鶴岡調査はその後20年間隔で、1971年、1991年、2011年に実施され、世界最長の実時間調査となりました。(報告書 : 『言語生活の実態―白河市および附近の農村における―』1951年ほか)
1956年発行の雑誌90種を対象とした、用語・用字の実態調査です。ランダムサンプリングの手法を導入し、言語の統計分析を開拓しました。(報告書 : 『現代雑誌九十種の用語用字』1962〜64年)
電子計算機を導入した最初の語彙調査です。1966年発行の新聞(朝夕刊1年分)を対象とし、電子計算機で日本語を分析する手法を開発しました。(報告書 : 『現代新聞の漢字』1976年)
幼児が言語・文字をどのように習得し、どのように使用するか、またその要因が何かを明らかにするため、1967〜74年に実施した調査研究です。(報告書 : 『幼児の読み書き能力』1972年ほか)
日本語学習者がどのような日本語を用いて日本語母語話者とコミュニケーションを行っているかを調査し、コミュニケーション障害の要因や誤用の背景を明らかにするため、1981〜84年に行った調査研究です。
2002〜06年に実施した「「外来語」言い換え提案」と、言い換え提案のための意識調査(全国調査)の資料です。(関連書籍:『分かりやすく伝える 外来語言い換え手引き』2006年、ぎょうせい)
医療従事者と患者・家族とのコミュニケーションの円滑化を目的とした、難解な医療用語の言い換え提案と、そのための意識調査、コーパス調査の資料です。(関連書籍:『病院の言葉を分かりやすく―工夫の提案―』2009年、勁草書房)
過去の調査研究で収集した録音音源と録画映像は、オープンリール、カセットテープ、8mmフィルム、ビデオテープなど、さまざまな記憶媒体で保存しています。総数はおよそ4万点です。
しかし、記憶媒体は経年劣化を起こします。また、再生用機材が生産中止になり、再生が難しくなったものもあります。そのため、録音音源と録画映像の保存と再利用のため、パソコンで視聴できるように、デジタル化を進めています。デジタル化音源・映像は、国立国語研究所内で利用できるよう、「所蔵音源・映像データベース」に蓄積しています。デジタル化音源・映像も、来館利用の形で、研究者に提供しています。
主な音源・映像資料には次のようなものがあります。
共通語による日常談話を分析するために、1952〜53年に録音しました。文字起こし原稿やKWICも作成されています。(報告書 : 『談話語の実態』1955年)
1963年に松江市のある市民の家庭内での一日の発話をすべて録音しました。文字化資料には文・文節・形態素の切れ目を付加し、コンピュータ処理にも利用しました。(報告書 : 『待遇表現の実態―松江24時間調査資料から―』1971年)
1976〜78年に東京と大阪で座談場面を録画しました。言語的・非言語的な観点から、言語行動様式を分析することを目的とした調査研究です。(報告書 : 『談話行動の諸相 : 座談資料の分析』1987年)
会社内での敬語意識と敬語使用を解明するために、1975〜77年に面接調査を行い、その様子を録音しました。(報告書 : 『企業の中の敬語』1982年)
1977〜85年度の文化庁調査「各地方言収集緊急調査」において、全国224地点の方言談話が録音・文字化されました。調査終了後、録音音源と作成資料は国立国語研究所に移管され、一部は『全国方言談話データベース日本のふるさとことば集成』(2001〜08年、国書刊行会)として刊行されています。
国立国語研究所は、創設以来、日本語研究と日本語教育に関する研究文献情報(論文や図書の書誌情報)を収集してきました。『国語年鑑』『日本語教育年鑑』として冊子を刊行してきましたが、これを引き継ぐ形で、2011年に「日本語研究・日本語教育文献データベース」(https://bibdb.ninjal.ac.jp/bunken/)を公開しました。
このデータベースには、1950年からの研究文献情報を収録し、データ件数は現在約23万件です。近年は、日本国内の学術雑誌だけでなく、韓国をはじめとして国外の研究文献情報の収集を進めています。
また、各大学・各学協会のリポジトリで、論文本文の公開も進んでいいます。「日本語研究・日本語教育文献データベース」には、これらの公開論文へのリンク情報を付与し、検索結果から論文本文へアクセスできるようにしています。
科学的な研究は、誰もが結果を検証できることが大切です。実態調査に基づいて研究成果を公表したとしても、研究成果に至る過程の調査資料も公表されていなくては、第三者が検証することはできません。
国立国語研究所は調査資料を保存してきましたが、調査資料の公表にはあまり熱心ではありませんでした。プライバシー保護のため、一部の調査資料に利用制限を設けるとしても、可能な範囲で検証可能な環境を整えていくことが、研究の発展に必要なことだと考えています。研究情報発信センターは、ことばの研究の「オープンサイエンス」を模索していきます。
高田智和
TAKADA Tomokazu
たかだ ともかず●准教授/専門は国語学。北海道大学大学院修了、博士(文学)。2005年に本研究所着任。