ことばの波止場

Vol. 4 (2018年9月発行)

摩訶不思議な《文字》の定義

平成28年2月29日,文化審議会国語分科会は,報告「常用漢字表の字体・字形に関する指針」を発表した。この報告は,ISBNが付いて,三省堂から一般書籍としても発行されている。

この報告,早稲田大学教授の笹原宏之さんと文化庁国語課の武田康宏さんが中心となって(まと)められた渾身の力作で,単に常用漢字に留まらず,戸籍や住民基本台帳などに用いられる人名用の漢字を論じる際にも依拠するに足る貴重な指針となっている。特に,「第1章2 常用漢字における字体・字形等の考え方」は,日本語学を専門としない一般の人びとにも分かりやすく,かつ,字体と字形の議論の層の違いが明確に述べられており,まさに白眉と言えよう。

そもそも「改訂常用漢字表」を見ると,『表の見方及び使い方』の4の項に,「字体は文字の骨組みであるが」とさらりと触れられているだけで,詳細な定義など書かれていない。この指針では,この部分を,例示とともにずいぶん丁寧に説明してくれている。

指針の本文は,文化庁のホームページにも公開されているので,そちらを参照していただくこととして,ここでは,例示されている図だけを引用しておこう。

形状の違いにより違う字として認識されるものの例と,形状の違いがあっても音字漢字として認識されるものの例

この部分に目を通していて,ぼくは,何とも形容しがたい既視感(デジャヴ)を覚えた。う〜む,どこかで見たことがある。

しばらく黙考して,はたと思いついた。高田さんの論文だ。ずっと以前,高田智和さんから別刷りをもらった『日本語科学』23(2008年4月)95-110「行政用文字の調査研究―汎用電子情報交換環境整備プログラム―」(高田智和,井出順子,虎岩千賀子共著)に掲載されている図と同じ《学》の字が例として挙げられているのだ。

字種・字体・字形の階層構造

もしかしたら,学界では,字体と字形の違いを論ずる際,《学》の字を用いることがお作法として定着しているのかもしれないが,高田さんの図は,IPA(情報処理推進機構)の報告書などに随分と引用させてもらった。

この文化審議会の報告の元となった文化審議会の審議会資料も,渡りに船と利用させてもらって,JST(科学技術振興機構)が発行していた『情報管理』誌に「字体と字形の狭間で」という小論を書いた(注1)。

そうしたら,何かの会合の後,武田さんが,えらくこの駄文を褒めてくれた。

この《字体》と《字形》の関係は,高田論文や文化審議会報告などを読んで,分かってしまえば何と言うこともないのだが,世上ではこの違いが混同され,本来《字体》レベルでなされてしかるべき議論に,《字形》レベルの相違が紛れ込んで,議論を錯綜させることがしばしばある。また,具体的な字形の相異を,同一字体内の微細な差異と捉えるか,字体レベルの差異と捉えるかは,その用途や文化的な背景によって随分と異なる。極言すると,論者が10人いたら,議論は100通りある,といった塩梅になる。

一つだけ卑近な例を挙げておくと。小学生でも知っている《次》の字。

ユニコードのIVD(注2)に登録されているAdobeのAJ1collectionと文字情報基盤事業のMoji_Joho collectionの《次》の字のところを見ると。

印刷業界ではデファクトスタンダードとして定着しているAJ1-6のcollectionでは,次のように3種類の異なる字体が掲げられている。

6B21

それに対して,筆者も係わってきた文字情報基盤整備事業の成果物であるMoji_Joho collectionでは,2種類の字体のみが掲げられている。

6B21

ここで筆者は,「3種類の字体」「2種類の字体」という書き方をしたが,内実は,「AJ1-6では次の字を3種類の字体に区別し」「MJでは《次》の字を2種類の字体に区別している」というのが正確なところであろう。

ちなみに,(漢籍ではなく)日本で用いられてきた漢字という側面に注目して編纂された新潮社の『日本語漢字字典』で《次》の項を見ると。

次

この辞書は,JISの符号化文字集合の策定にも係わった新潮社校閲部の小駒勝美さんの力作なのだが,《旧字》《別体》という用語を使い分けて,字体差に係わる面倒な議論からうまく逃れている。《字体》と《字形》という言葉は,面白いことに,日本の工業標準(JIS)X0213では,下記のように,あえて対応する英語表記を避けて,ローマ字表記のみを記している。

i)字体(ZITAI)図形文字の図形表現としての形状についての抽象的概念。

h)字形(ZIKEI)字体を,手書き,印字,画面表示などによって実際に図形として表現したもの。

ぼく自身は,《字体》をglyph(文字の抽象的な図形概念),《字形》をglyph image(個々の文字の具体的な可視化表現)に対応付けて用いているが,いずれにしても,冒頭に挙げた指針の字体,字形概念と大きく食い違っているわけではない。

ところで,いわゆる符号化文字集合の世界には,《字体》《字形》の区別どころか,《文字》というわけの分からない存在がある。英語では,character。

現在では,スマートフォンからネットワーク上の大規模データベースまで,文字情報のやりとりには,いわゆるユニコードが使われている。公的規格としては,ISO/IEC JTC1/SC2(注3)が策定しているUCS(注4)が相当する。

この翻訳規格である,JIS X 0221を見ると,《文字》の定義は,下記のようになっている。

「文字(character)データの構成,制御又は表現に用いる要素の集合の構成単位」

なんのことやら。

さらにやっかいなことに。

「図形記号は,文字の代表的な可視化表現とみなさなければならない。この規格群は,各文字の形を正確に規定しようとするものではない。文字の形は,採用するフォントデザインに左右されるものであり,この規格群の適用範囲外とする」(17 第2パラグラフ)

ここで,《図形記号》はgraphic symbolの訳で,graphic symbolは,図形文字(graphic character)または合成列(composite sequence)の視覚表現。

これまた,なんのことやら。

蛮勇をふるってまとめると。

符号化文字集合にとって大切なのは,《文字》の具体的な形ではなく,対象となる文字集合の中で,文字集合を構成する要素(=文字)が排他的に他の要素と区別出来ること。

規格票に印刷されている図形は,《文字》に対応付けられる《字形》の一例で,単なる参考情報。

要は,情報技術的に区別する必要があるものが区別出来ればいいわけで,社会生活上必要のない微細な差異には拘泥する必要がない,ということなのだろう。

とはいえ,この「社会生活上必要」という言葉が,また厄介者で,国や地域によっても,使われる文脈によっても,さらには個人的なコノテーションによっても異なってくる。

高田さんの論文や文化審議会報告によって,《字体》と《字形》の理論的な区別はよく分かったが,その区別がどう適用されるかは,時と場合によって異なるという,言葉を対象として議論する際に忘れてはならない要諦にまいもどってしまった。

注)

  1. https://www.jstage.jst.go.jp/article/johokanri/58/3/58_176/_html/-char/ja
  2. Ideographic Variation Database。同一の符号位置に統合される複数の字体を区別するためのメカニズムであるVS(Variation Selector)を統合漢字に適応し,基底文字とVSの組をIVS(Ideographic VariationSelector)として登録するためのデータベース。
  3. 国際標準化機構(ISO)と国際電気標準会議(IEC)が共同で運営している合同技術委員会(JTC1)の下で活動している第2小委員会(SC2)
  4. ISO/IEC 10646 Universal Multi-Octet Coded Character Set。翻訳規格として,JIS X 0221国際符号化文字集合がある。

摩訶不思議な《文字》の定義

小林龍生
KOBAYASHI Tatsuo
こばやし たつお●文字情報促進協議会 会長