ことばの疑問

日本語教育で使う例文を考えるとき、コーパスをどのように生かしたらいいですか

2018.10.23 中俣尚己

質問

日本語教育で使う例文を考えるとき、コーパスをどのように生かしたらいいですか。

日本語教育の例文作りにお悩みのあなたへ

回答

検索して出てきた例文をそのまま使うのではなく、ちょっと工夫を加えることが大事です。

日本語を母語としない方のための日本語教育の世界でも、「コーパス」という言葉を耳にすることが多くなってきました。まず、コーパスとは何か、そしてそのメリットについて確認しておきましょう。コーパスとは、「実際に使われた言語のデータを大量に集めた電子的なデータベース」のことです。そして、そのデータを利用するメリットとしては、「実際によく使われるパターンを見つけ出す」ことができる点にあります。

日本語教育では例文を示す機会が多々あります。しかし、教師が教科書だけを参考にしたり、頭の中で会話を作ろうとしたりすると、実際の生活では使わないような例を作ってしまうことがあります。例えば、私はかつて「てある」の授業で「ビールは冷やしてあります。」という例文を出したことがあります。この文に見覚えのある教師や学習者もいるかもしれませんね。しかし、胸に手を当てて考えてみると、こういう例文を実生活では使ったことがないことに気づきます。

そこでコーパスの出番です。コーパスにも色々とありますが、最も簡単に使えるのは、国立国語研究所が作成した『現代日本語書き言葉均衡コーパス』。これを文字列で検索できるwebアプリ「少納言」(https://shonagon.ninjal.ac.jp/)があります。「少納言」『現代日本語書き言葉コーパス』検索する、という関係になります。

少納言で「てある」を検索した結果
「てある」の検索結果。実は国会答弁の例ばかりが並んでいる。
さらに「4」の例は実は「ことだってある」の一部であり、動詞に接続する「てある」ではない。こういった点にも注意が必要である。

しかし、検索後に例文を考える際には注意が必要です。まず、少納言の検索結果は、検索件数が少ない時は良いのですが、500件以上の場合はランダムになります。しかもデフォルトではレジスター(文書の種類)によって並べられています。つまり、検索して、一番上に出てきた例を参考にするのは、なんとなく考えて一番最初に思いついた例文や、本棚の本を適当に手にとって、その最初に出てきた例文で授業をするのと変わらないということになります。

コーパスの強みは「よく使われる」パターンを見つけ出すことにあると述べました。その強みを活かすには、検索結果を集計する、つまり何が多いのかを調べるというステップを忘れてはいけないのです。といっても500の実例を見て、何が多いか調べるというのはなかなか面倒な作業です。少納言の検索結果の画面では一番上の「後文脈」などと書いてある箇所をクリックすることで並べ替えができるので、何かの参考にできるかもしれません。

名詞や動詞、副詞などの実質語について、どのように使われているのかを知るには、NLB(NINJAL-LWP for BCCWJ  http://nlb.ninjal.ac.jp/)というwebアプリを使う方法があります。これは、単語を1つ選べば、その語がどんな語と共に使われる(=共起する)ことが多いのかというコロケーション情報を教えてくれるサイトです。操作もとても簡単で、授業の前にちょっと確認という使い方もできます。

NLBでゆっくりと共起する動詞を調べた結果
NLBで「ゆっくり」と共起する動詞を調べた例。「ゆっくり歩く」「ゆっくり食べる」「ゆっくり走る」のように動作の動きが遅いことを表す意味と、「ゆっくり休む」「ゆっくり寝る」「ゆっくり過ごす」のようにリラックスした状態でいるという意味の2種類があることがわかる。個々の用例も見ることができる。

一方、「てある」や「かもしれない」のような機能語についてはNLBは対応していません。機能語のコロケーションを知るには、中納言(https://chunagon.ninjal.ac.jp)という高機能なwebアプリを使う必要があります。ただし、これはそれほど手軽ではなく、また、どれが多いかを集計するにはExcelなどの表計算ソフトを使ってデータを処理することが不可欠です。

ということで、コーパスを使うのが面倒な人のために、検索結果をまとめた本を作りました。中俣尚己(著)『日本語教育のための文法コロケーションハンドブック』は初級項目、中俣尚己(編)『コーパスから始まる例文作り』は中上級項目に対応した本で、文法項目の「よく使われるパターン」をまとめた本になります。これを使えば、自分で検索や集計をしなくても「その語はどのように使われるのか」を知ることができます。

例えば、先述の「てある」を例に挙げると、実は「書いてある」という例が圧倒的に多く、「置いてある」「はってある」のように空間の様子を表す際に多く用いられるということがわかります。

コーパスの検索結果をまとめた本

文法コロケーションハンドブック
日本語教育のための文法コロケーションハンドブック
中俣尚己(著)
(くろしお出版、2014年、1,800円+税)
コーパスから始まる例文作り
コーパスから始まる例文作り
中俣尚己(編)
(くろしお出版、2017年、2,400円+税)

コーパスを使って例文を作る際には、出てきた例をそのまま使うのではなく、何が多いかを調べることが重要だということを述べました。そして、もう1つ重要なのは、その多いパターンを使って、教師が自分で例文を考えるということです。これは自分でコーパスを使った場合でも、上で紹介した本を参考にした場合でも同じです。

というのも学習環境は学習者によってバラバラです。学習者がわかりやすい、身近に感じるものなどもバラバラだということです。つまり、学習者にとって最適な例文は、学習者のことを知っている人にしか作れないということです。学習者にとって身近な専門語や固有名詞などはどんどん使った方が、活き活きとした理解しやすい例文になります。

書いた人

中俣尚己

中俣尚己

NAKAMATA Naoki
なかまた なおき●京都教育大学 准教授。
一家そろってテレビゲーム好き(祖父母もハマッていました)。ゲームだけでなく、ゲームの攻略本を読むのも大好きで、モンスターのデータ集を自作したことも。日本語学習にも攻略本があったらいいな、という考えから『日本語教育のための文法コロケーションハンドブック』を作りました。デザインも自分で考えましたが、実はゲーム攻略本を意識しています。いつか日本語が学べるゲームを作りたいです。

参考文献・おすすめ本・サイト

  • 赤瀬川史郎、プラシャント・パルデシ、今井新吾(2016)『日本語コーパス活用入門 NINJAL-LWP 実践ガイド』大修館書店
  • 中俣尚己(2014)『日本語教育のための文法コロケーションハンドブック』くろしお出版
  • 中俣尚己(編)(2017)『コーパスから始まる例文作り』くろしお出版
  • 李在鎬、石川慎一郎、砂川有里子(2012)『日本語教育のためのコーパス調査入門』くろしお出版