ことばの研究

かな漢字変換辞書の製作

ATOK2005 NHK新用字用語辞書

現代の日本語は、これまでにない大きな変化の時代に入っている。1978年のワープロ専用機の発売以来、電子的に日本語を書く技術が進展し、個人でもパソコンを使ってものを書くという作業が定着してきた。

その際に使用する基本的なプログラムが「かな漢字変換ソフト」である。

『NHK新用字用語辞典第3版』に準拠した日本語表記を実現するために、ジャストシステム(株)の「ATOK2005」の基本辞書に対し、NHKの表記法を適用したものを開発した。

この作業の中で、現代日本語のおよそ46%が一般的な名詞であり、39%が人名や地名などの固有名詞であることがわかった。

動詞や形容詞などの用言は8%あまりであるが、この部分の表記が複数あることと、外来語の表記についても同様であった。

これら複数の表記があったり、誤った表記が登録されたりしている場合は適切な変換に導くようにコメントを加える作業を行った。

対象語数は30万語程度であり、手作業でチェックを行うことは難しいために、今回はプログラムを作り、常用漢字表以外の漢字のチェックや、音訓表にない読みの拾い上げを行い、効率的にしかももれなくチェックする方法を開発した。

また、放送に欠かせない地名の読み方や、同音異義語の使い分けについても、漢字変換時にコメントを表示することができた。

問題点としては、日本語の中に定着した慣用句などで表外漢字を使用しているものや、数詞の表記が漢数字になるか算用数字になるかは論が分かれるところであり。今後の日本語全体の動きを見なければならない。

しかし、電子的な道具として、今後個人や企業が使う社会的な日本語については強力な助けになることはまちがいないと考えるので、さらに改良を加えてゆく。

(メディア研究部・放送用語 柴田 実)