ことばウラ・オモテ

機械のことば

最近、道を歩いていてどきっとすることがある。夜道で向こうから来る人の顔がボーっと青白く光り始めるのです。「幽霊か!」と思うと、携帯電話を使っていてその明かりで顔がわずかに明るく照らされているのに気づきます。

また、人けがないのに声がするのです。誰かいるのかと思うと、自動販売機がしゃべっているのです。

機械がしゃべるというのは相当以前からありましたが、人が近づくとセンサーで音声が出るのは善し悪しだと感じます。

ある電機メーカーが、エアコンにこの音声機能を付けて売り出したところ、「便利だ」というユーザーの声よりも「うるさい」「気持ち悪い」という反応が多くて機能を変更したというエピソードも聞きました。

電話がまだ電電公社の時代、天気予報や番号変更案内に自動音声を導入しました。
よく聞くと、番号は1つずつの数字を読んだ元テープをつなぎ合わせるようにして流していました。不自然ですが、明瞭に読み上げているので、役には立っていたのですが、いつも同じ声、同じ抑揚であまり人気がありませんでした。

機械で音声を作り出すのは、はじめは録音したものを、何パターンか用意しておいて、状況に応じて録音を流すという方法でした。数字の発音をつないでひとまとまりの音として流すのは次の時代に「切り貼り」という方法が考え出されてからです。

現在ははるかに進んで、声そのものを機械的に作り出す研究も行われています。
場面に応じた文章を用意して、自然に聞こえるようにするのは大変です。
日本語は、多くの場合、文頭から文末に流れるように下がっていくイントネーション(抑揚)があると言われていますが、実際の会話では実にさまざまな抑揚が使われています。
また、音のつながりかたにより微妙に発音が違います。典型的な例は鼻濁音と言われる「ガ行」です。語の中のガ行音は鼻にかかった「ンガ」の音になることが多いのですが、語のはじめでは「ガ」と強い音になります。日本語の音は112ぐらいだと言われていますが、音の並びなどで自然に聞こえるようにするためには5~10万の音の断片を組み合わせなければならないという人もいます。

実際には、自動車のカーナビゲーションシステムや、鉄道の案内、自動販売機などは、ごく自然に聞こえます。音を1つずつ組み合わせる完全な合成に頼るのではなく、「切り張り法」中間的な方法で声のバランスを取っているようです。

合成音声で使われる語のアクセントも問題になります。カーナビゲーションシステムでは地名が出てくることが多く、固有な地名のアクセントはどうか、製作会社はずいぶん苦労をしたそうです。

音声合成を開発している人から、「ふだん何気なくしゃべっている声やことばが、こんなに複雑なことをやっているのかと驚く」という話を聞きました。
技術としてはまだまだ改良され、進化していくのでしょうが、冒頭に述べたように「びっくり箱的音声」はなるべく登場して欲しくないものです。

私たちが使う日本語には、文字にすることばと、声にすることばがあります。
文字にする場合は、手紙・書式のある書類・メモ・ポスターなどの区別をしてことばや文字を選びます。声の場合は、会話・演説・スピーチ・勧誘などさまざまです。
しかしいずれも人間どうしが使うのが基本です。
機械から人間へのことばはどのようなものであればいいのか?

文章語、口語などと並んで「機械語」という分野を真剣に考えなければいけない時代になったようです。

「機械語」を考える場合には機械のほうにも少し肩入れしてやらなくてはならないかもしれません。

機械が作り出す音声の宿命として、必ず人間の肉声と比べられること、何度も繰り返して(場合によるとミスも)送り出されることがあります。

「機械的な繰り返し」でよい場合と、避けたほうがよい場合など、受け手の人間の心理状態も考えなければなりません。
「機械語」の将来は私たちのことばやコミュニケーションをもう一度見直す所から始まるのかもしれません。

<蛇足>

「機械語」というのはすでに使われていることばです。コンピューターに命令を与えるときに「プログラミング言語」という人間がわかる範囲の特殊な記述方法(言語)と、人間には理解しにくいけれど演算装置には与えやすい、1~16までの数字で表した「F0 AA CB 86 32 0A 0D」のようなものを「機械語(マシン語)」と言っています。これは人間から機械への橋渡しをする「機械語」です。

(メディア研究部・放送用語 柴田 実)