写真:世木 寛之

音声合成を用いた株式市況・気象通報の自動放送システム

ヒューマンインターフェース研究部 世木 寛之

音声合成では、あらかじめ人が発話した音声を分割してデータとして蓄えておき、合成したい内容に応じて音声データを組み合わせて合成します。合成したい内容に該当音声データが蓄積されていない場合に一番近いデータを信号処理して合成するため、放送で利用するには発話の自然さが低下してしまいます。このため技研では、音声合成の用途に必要な音声データの収集と組み合わせ方を工夫することにより、アナウンサーの声とほぼ同じ高い品質の音声を実現できる音声合成技術の研究を進めてきました。研究した成果は、2010年3月からNHKラジオ第2の番組「株式市況」において利用されています。

音声合成の対象の拡大

今回、同じNHKラジオ第2の番組「気象通報」の音声合成化について検討を行い、音声合成の対象を広げることが可能になりました。気象通報には、地名や数字、方角などの要素を含む定型化された文が多いという特徴があります。そこで、気象通報の内容を定型的な文章パターン(テンプレート)で表現し、テンプレートの内容に該当する音声データが必ず含まれる音声データベースを構築しました。様々なテンプレートを含む音声データベースの中から類似するテンプレートを組み合わせることにより、気象通報についても高品質な合成音の生成が可能となりました。

音声合成を用いた自動放送システム

株式市況と気象通報の2種類の番組について自動放送が可能なシステムを新たに開発しました。開発した自動放送システムでは、図に示すように、2つの音声合成部がそれぞれ外部から受信した株価および気象データを解析し、対応する合成音をファイルとして出力します。いずれかの音声合成部から合成音がファイルとして出力されると、音声送出部が自動的に読み込んで待機し、番組開始時刻に自動で送出します。音声送出部はオンエアに直接関わる部分で高い信頼性が求められるため、これまでの株式市況で運用実績のあった音声送出部を新システムにおいても共有して利用することにより、それぞれの安定送出を確保しました。音声送出部は、事前に決められた番組の長さに合うように話速変換*によって話速と間を調整しながら作成した合成音ファイルを再生することが可能で、番組を開始してからの終了時刻の変更にも対応できます。

株式市況と気象通報に対応したこの自動放送システムは、2014年3月から「株式市況」の放送で利用され、「気象通報」の放送については運用テストを進めています。今後も、音声合成化が可能な新たな番組の検討を進めていきます。

* 話速変換:音質を劣化させることなく、話す速さ(話速)と間の長さを変更できる技術

図:株式市況・気象通報自動放送システムの概要