国語研の窓

第4号(2000年7月1日発行)

研究プロジェクト紹介:対訳作文DB

「日本語学習者による日本語作文と、その母語訳との対訳データベース」

日本語教育センター第三研究室 宇佐美 洋

現在日本には、5万人あまりの留学生が学んでいます。その多くは、「日本語でレポートや論文を書く」という大変な課題を背負っています。日本語という「母語でない言語」で文章を書くということだけでもむずかしいのに、自分の考え出した新しい意見を、他の人に納得してもらえるようわかりやすく書かなければならないのです。その苦労は並大抵のことではありません。

真に実りある国際交流を目指すには、留学生の数を増やすだけでは十分ではありません。日本に来た留学生の苦労が少しでも減らせるように、日本語でいい論文が書けるように、さまざまな面で支援をする必要があるでしょう。どうやって日本語作文の書き方を指導したらいいか、どうやって作文を直すのが効果的か、というようなことについても、きちんとした調査研究をしておくことが必要です。

こうした調査研究の一環として、国立国語研究所では「日本語学習者による日本語作文と、その母語訳との対訳データベース」というものを作っています。このデータベースには、おもに以下のようなものを載せる予定です。

  1. 日本語学習者が書いた日本語作文(200~800字程度)
  2. その作文を、執筆者が自分の母語(またはその人にとっていちばん文章が書きやすい言語)に訳したもの
  3. 日本語作文を、日本語の先生が赤字で添削したもの

現在のところ1)の日本語作文は、アジア7か国から約800編のものが集まっています。これだけのデータがあれば、外国の人が日本語で作文を書くときどういう種類の間違いをしやすいのか、逆にどういう間違いは起こりにくいのか、というようなことを、さまざまな角度から分析することができます。このような分析を「誤用分析」といいます。

また、母語でない言語を使うとき、ついつい自分の母語の影響が出てしまうということがあります。たとえば日本語の「広い部屋」という言い方をそのまま英語に直訳して“wide room”と言ってしまうような例です(英語では“a large room”)。このような影響を「母語干渉」といいます。

日本語作文の中に間違いを見つけたとき、日本語だけを見ていたのでは「なぜ、そのような間違いが起こったのか」というところまではなかなかわかりません。そういうとき、母語訳の方をちらっと見ることで、なるほど、母語でのこういう言い回しを日本語に直訳したからこんなふうな書き方になったんだな、とわかることがあります。間違いの原因がわかるということは、教える側にとっても教えられる側にとっても非常に気持ちがいいことです。

さらに、何十人もの日本語の先生に作文を赤字で添削してもらい、それを画像ファイルとしてデータベースに載せる予定です。これは、作文の効果的な添削法について考えるのに役に立つでしょう。

他にもこのデータベースには、限られた紙面では書ききれないほどの使い道が用意してあります。アイディア次第で、使い道はさらに増えることと思います。

本年12月には国際シンポジウムを開催し、さまざまな国の方に、このデータベースに基づいた研究を発表していただくことになっています。また、来年のうちには、このデータベースを何らかの形で広く公開する計画です。多くの方々にこのデータベースを使っていただき、ご批判・ご助言をいただくことで、さらによいものへと発展させていきたいと関係者一同考えております。


まだ未完成ですが、これがデータベースのインデックス(索引)です。コンピュータ上でまずこのインデックスファイルを開き、画面上で下線の引かれた文字をクリックすると、必要なファイルが自動的に開けるようになっています。つまり、インターネットのホームページと同じ仕組みです。

この画面は、韓国語を母語とする人のデータを検索するためのインデックスです。

説明が英語になっていますが、これは、日本語の文字が組み込まれていないコンピュータでも表示できるように、という配慮によります。言うまでもなく、外国で買ったコンピュータだと普通、日本語の文字は入っていません。このデータベースは、外国の方々にも広く活用していただきたいのでこのようにしました。

将来的には画像なども組み込み、視覚的にももっときれいでわかりやすいインデックスにしたいと考えています。

対訳作文DB

1 ここをクリックすると、日本語作文のテクストファイルが開きます。

2 MTというのはmother tongue、つまり母語のことです。ここからは母語訳のテクストファイルが開けます。

3 ここは「執筆者情報」とリンクされています。作文を書いた人が、何年くらい日本語を勉強してきたか、日本で生活したことがあるか、という情報が、テクストファイルとして収録されています。もちろん、氏名や学校名などの個人情報は含まれていません。

4 ここは、作文の課題をあらわします。“1”は「あなたの国の行事について」、“2”は「たばこについて」という課題について書いていることをあらわしています。

5 ここからはpdfという形式のファイルが開けます。内容はテクストファイルと同じなのですが、pdfは「アクロバットリーダー4.0」という無料のソフトウェアがあれば、日本語の文字が組み込まれていないコンピュータでも読むことができます。

6 ここをクリックすると、学生の手書きの原稿をスキャナで取り込んだ画像が開けます。当然のことながら、学生がどういう漢字の間違いをしているかというようなことは、画像ファイルでないと見ることができません。

7 ここからは、母語のpdfファイルが開けます。ハングル(韓国の文字)がコンピュータに入っていなくても、韓国語文書をきれいに表示することができます。

8 この2箇所からは「添削者情報」が開けます。添削した先生がどこで生まれ育ち、日本語を何年くらい教えてきたか、というようなことが書かれています。

9 ここからは、日本語を母語としない先生(ここでは韓国人の先生です)が添削した作文の画像が開けます。NNSはNon-Native Speaker(「日本語を母語としない人」)のことです。このようにひとつの作文をできるだけ複数の先生方に、それも、日本語を母語とする先生とそうでない先生の両方にお願いすることにしています。

10 星印(*)は、その部分のデータがないことをあらわしています。現時点では予算の関係で、すべての作文に添削をお願いすることはできませんでしたが、今後少しずつ、できるだけたくさんの先生方に添削をお願いしていく計画です。

11 ここからは、日本語を母語とする先生が添削した作文を、画像として保存したファイルが開けます。NSはNative Speakerのことで、ここでは「日本語を母語とする人」という意味です。

  日本語学習者による言語運用とその評価をめぐる調査研究:http://jpforlife.jp/

『国語研の窓』は1999年~2009年に発行された広報誌です。記事内のデータやURLは全て発行当時のものです。