【報道資料】 2020年10月21日

新たな日本語音声合成システムを開発

～原稿から変換した「仮名文字と韻律記号」をAI学習に用いる～

NHK放送技術研究所では、AI（人工知能）を活用して、より流暢で自然な発声を実現する新たな音声合成技術^1）を開発しました。

これまで日本語の音声合成方式では、「漢字仮名交じり文」をそのまま入力データとしても、漢字に複数の読み方が存在するためＡＩがうまく学習できないという課題がありました。

今回の開発では、「漢字仮名交じり文」から「仮名文字と韻律記号^２）」を自動的に生成し、それを「系列変換モデル^３）」の入力データとすることで大量のデータを効率的に学習させ、合成音声の品質を向上させることに成功しました。

また、仮名文字と韻律記号を簡単に編集できるユーザーインターフェースや、口調をニュース調や会話調などに切り替えられる技術も開発し、さまざまな番組の演出要件への対応も可能にしました。

今回の研究成果は、10月17日にBS１で放送した「ワールドニュース特集」で使用しました。今後も、より自然で使いやすい音声合成を実現する研究を進めます。