スマートプロダクション

生放送番組における自動字幕制作

地域放送局の字幕サービス拡充

写真:全景

展示概要

地域放送局における字幕サービスの拡充に向けて、生放送番組の自動字幕制作のための技術を開発しています。AIを活用した音声認識により、生放送の音声から自動的に字幕を制作し、インターネット配信するトライアルサービスを福島・静岡・熊本の3県で実施しています。

図:音声認識による生放送番組の自動字幕の概要

特長

地域放送番組への自動字幕付与の試行

音声認識を利用した字幕放送では、認識の誤りを人手で修正して正確な字幕を放送していますが、そうした専門性の高い要員を確保することが困難であるという課題があります。地域放送番組を聴覚に障害のある方にも届けるため、AIを活用して音声認識した結果をそのまま字幕としてインターネット配信するサービスを試行し、視聴者の番組理解をどこまで支援できるか検証しています。

音声認識の誤りが発生しやすい区間の検出

生放送での、不明瞭な発話や方言まじりの発話など、音声認識の誤りが発生しそうな発話区間を自動検出する手法を新たに開発しました。音声認識の誤りが発生しそうな発話には、もともと文字スーパー(オープンキャプション)が付与されていることが多いため、音声認識による自動字幕を付与せずに、明瞭な発話部分のみに字幕を付与することで番組理解を支援します。

地域放送番組の認識精度の向上

地域放送番組では、全国ニュースの認識に用いている辞書には入っていない地域独自の地名や名称などの単語が発話されることも少なくありません。そのためDNNを使い、地域放送局ごとに過去1年分の番組原稿データを学習することにより、認識精度の向上を図っています。

脚注

  1. ディープニューラルネットワーク:多層構造の脳神経回路をモデルにした機械学習の一種

展示動画

詳しく知りたい方へ