【報道資料】 2020年10月21日

新たな日本語音声合成システムを開発

~原稿から変換した「仮名文字と韻律記号」をAI学習に用いる~

PDFダウンロード

NHK放送技術研究所では、AI(人工知能)を活用して、より流暢で自然な発声を実現する新たな音声合成技術1)を開発しました。

これまで日本語の音声合成方式では、「漢字仮名交じり文」をそのまま入力データとしても、漢字に複数の読み方が存在するためAIがうまく学習できないという課題がありました。

今回の開発では、「漢字仮名交じり文」から「仮名文字と韻律記号2)」を自動的に生成し、それを「系列変換モデル3)」の入力データとすることで大量のデータを効率的に学習させ、合成音声の品質を向上させることに成功しました。

また、仮名文字と韻律記号を簡単に編集できるユーザーインターフェースや、口調をニュース調や会話調などに切り替えられる技術も開発し、さまざまな番組の演出要件への対応も可能にしました。

今回の研究成果は、10月17日にBS1で放送した「ワールドニュース特集」で使用しました。今後も、より自然で使いやすい音声合成を実現する研究を進めます。

1)NHKの第2世代音声合成システム。NHK「ヨミコの部屋」で使用されてきたNHK第1世代音声合成システムを改善。

2)韻律記号:アクセントや間などの情報を表す記号

3)系列変換モデル:読み上げる原稿とその音声を大量かつ効率的にAIに学習させ、原稿を音声に変換するニューラルネットワーク。近年、英語の音声合成で用いられている。

図 本システムの概要図