#コーパス

事業の新展開:国語研コーパスの構想

国語研コーパスの構想〈国語辞典編集室〉 1 コーパスとは ことばの研究を高度に行うためには,質のよいデータを大量に用意する必要があります。一定の方針に沿って書きことばや話しこと ...

暮らしに生きることば

表題の言葉を見て,多くの方は”何か変な言い方だな”と感じたのではないでしょうか。ほとんどの人が「立派の人」という言い方はおかしく,「立派な人」とするべきだと思ったことと思います。一 ...

暮らしに生きることば

先ごろ《女子児童・生徒の約3割が「おまえ,いいかげんにしろよ!」を使う》という調査結果が発表されました(旺文社・平成21年4月)。「3割もいるのか」と驚いていた矢先,駅で女子学生が ...

国立国語研究所のコーパス ~ありのままの日本語を知るために~

ことばのデータベース「コーパス」: 日本語の科学的な研究だけではなく,音声認識などの,コンピュータを用いて日本語を扱う技術の開発の基礎にも,「コーパス」は活かされています。 そ ...

鼎談 : プロジェクトリーダーが語る 日本語の個性 ②

−先生方に共通する研究として, 「コーパスの開発」がありますが,そもそもコーパスとはなんでしょうか。 小木曽簡単に言えば,実際に使われた言葉のデータをたくさん集め ...

解説:全文検索システム『ひまわり』

国語研究所では,言葉に関する,さまざまな資料を電子的なテキストの形で一般に公開しています。例えば,20世紀初頭の総合雑誌『太陽』を収録した『太陽コーパス』や,類義語集である『分類語 ...

解説:現代の書き言葉はどのようにして確立したか

現代の書き言葉はどのようにして確立したか ―『太陽コーパス』の活用例から― 1.『太陽コーパス』とは 現代の書き言葉は,19世紀末期から20世紀初期に進んだ言文一致を通して,大 ...

研究室から:大規模書き言葉コーパスのオンライン試験公開

~KOTONOHA「現代日本語書き言葉均衡コーパス」~ 国立国語研究所は,明治から現代にいたる日本語の電子化資料をコンピュータ上で公開しようとするKOTONOHA計画を推進してい ...

研究室から:『日本語話し言葉コーパス』

1.必要性 およそ日本語にかぎらず言語研究の対象は,実際上その大部分が書き言葉であり,話し言葉の研究はかなり遅れています。その最大の原因はデータ作成のコストの高さにあります。 ...

研究室から:『現代日本語書き言葉均衡コーパス』進捗報告(3)

コーパスに取り込む文章は,すでに印刷されて世の中に出回っている本・雑誌・新聞等から選ばれます。公刊されているすべての文章には「著作権」があるため,著作権サブグループではサンプリング ...