#コーパス

解説:現代の書き言葉はどのようにして確立したか

現代の書き言葉はどのようにして確立したか ―『太陽コーパス』の活用例から― 1.『太陽コーパス』とは 現代の書き言葉は,19世紀末期から20世紀初期に進んだ言文一致を通して,大 ...

研究室から:大規模書き言葉コーパスのオンライン試験公開

~KOTONOHA「現代日本語書き言葉均衡コーパス」~ 国立国語研究所は,明治から現代にいたる日本語の電子化資料をコンピュータ上で公開しようとするKOTONOHA計画を推進してい ...

研究室から:『日本語話し言葉コーパス』

1.必要性 およそ日本語にかぎらず言語研究の対象は,実際上その大部分が書き言葉であり,話し言葉の研究はかなり遅れています。その最大の原因はデータ作成のコストの高さにあります。 ...

研究室から:『現代日本語書き言葉均衡コーパス』進捗報告(3)

コーパスに取り込む文章は,すでに印刷されて世の中に出回っている本・雑誌・新聞等から選ばれます。公刊されているすべての文章には「著作権」があるため,著作権サブグループではサンプリング ...

研究室から:『現代日本語書き言葉均衡コーパス』進捗報告(2)

形態論情報の付与 言語研究では,例えば小説『明日の記憶』には,どの語がどのくらい使われているのか,「文化」という語は単独で使われることが多いのか,それとも「上方文化」のように他の ...

研究室から:『現代日本語書き言葉均衡コーパス』進捗報告(1)

現在,国立国語研究所研究開発部門では,『現代日本語書き言葉均衡コーパス』の構築を進めています。これは,現代日本語のさまざまな書き言葉をバランスよく集めた,1億語規模のデータベースで ...

研究室から:『現代日本語書き言葉均衡コーパス』の構築

1.『現代日本語書き言葉均衡コーパス』とは 『現代日本語書き言葉均衡コーパス』は,国立国語研究所が構築を進めている現代日本語の大規模なデータベースです。最終的な規模は1億語以上, ...

研究室から:「太陽コーパス」の構築と活用

1.「コーパス」とは? 近年の情報技術の進展によって,日本語研究の方法にもいくらか変容が見られます。なかでも,研究を大きく進展させる可能性をもつものとして,コーパスを用いて,精度 ...

研究者紹介 : 山崎 誠

──語彙に関する研究を大学時代から行ってきた,とのことですが。 今はコーパス(文章を大規模に集めてデータベース化したもの)がありますが,昔は文献を片っ端から見ていくことをして ...

研究者紹介 : 前川喜久雄

──音声学に長年関わっていらっしゃる印象があります。 学部の卒論から40年近く,音声学をやっています。400本近い論文を書きましたが,その9割弱は音声に絡んでいます。また,1 ...