AI技術を活用した放送サービスへの取り組み

自動音声認識字幕の利用イメージ

地域放送局向け自動音声認識字幕

NHKでは聴覚に障害のある方や音声が聞こえにくい高齢の方に向けて、ニュースをより分かりやすくご覧いただくための字幕制作を行っています。東京の放送センターや地域拠点局では、アナウンサーの音声を認識し、認識誤りを人手で修正するシステムによるニュース字幕の制作が増えてきました。今後、地域放送局でのニュース字幕制作の拡充を目指して、2月4日から福島・静岡・熊本の3県の夕方のニュース番組で、AI技術を活用した音声認識技術により、生放送の音声認識結果を字幕とし、スマートフォンなどにインターネット配信する実験を始めました*。カメラ付きスマートフォンなどでテレビ画面を映すと、放送画面に重ねて字幕を見ることができます。

アナウンサーによる明瞭な発話では、9割以上の高い音声認識率が得られます。また、不明瞭な発話や外国語、方言などが原因で正しい音声認識結果が期待できない部分を自動的に推定して、一時的に字幕を停止するなど、認識誤りが視聴を大きく妨げない工夫もしています。今回の取り組みで、どの程度正しい字幕を出せるかを検証するとともに、誤った字幕が出た場合に視聴者にどの程度受け入れていただけるかをアンケート調査し、今後の実用化を検討していきます。詳細はホームページをご覧ください。
http://www.nhk.or.jp/jimaku-trial/

* 期間は8月30日までを予定(設備保守などによる休止期間あり)

AIアナウンサー

3月4日~8日、25日~29日に甲府放送局のラジオ第一放送で、気象庁から配信される気象データを基に自動で原稿を作成し、AI技術を活用した合成音声で気象情報を読み上げるトライアル放送を実施しました。NHKのアナウンサーが実際に読んだ大量の気象情報から、文脈に応じたイントネーションや間の取り方などを学習し、AIアナウンサーの自動音声で自然な発話を再現しました。NHKのアナウンサーは、最新の気象データ(注意報、予報、雨量、気温、週間天気など)から、伝える内容の優先順位を考え、放送時間に収まるように原稿を組み立てています。今回、このような実際のアナウンサーが行う作業も自動化しました。今後、AIアナウンサーによる放送サービスの充実・強化に向けて、発話の高度化に取り組むとともに、全国の気象情報への対応を検討し、早期の実用化を目指します。

AIアナウンサーによる気象情報の放送の流れ