5 生字幕制作のための音声認識 展示概要
聴覚に障害のある方をはじめ、多くの方に文字で番組を楽しんでいただける字幕放送の拡充を目指して、音声認識の研究を進めています。音声認識は、ニュースやスポーツ番組などの字幕制作で利用されていますが、さらに情報番組での認識性能を改善する技術を開発しました。


特長
字幕制作で活躍する音声認識
字幕放送は、事前収録番組だけでなく、生放送でも年々拡充が進んでいます。ニュース番組では、アナウンサーや記者の音声を直接認識(ダイレクト方式)し、スポーツ番組や情報番組では、字幕キャスターが言い直した音声を認識(リスピーク方式)することで、リアルタイムに字幕が制作されています。

情報番組の話題と話者に適応化
話題が多様に変化する情報番組の字幕を効率よく制作するため、料理や園芸などの話題に追従して音声認識の言語モデル(単語の出現確率)を適応化する技術と、数十分で交替する字幕キャスターの声の変化に追従して音響モデル(母音・子音の声の特徴)を適応化する技術を開発し、認識性能を改善しました。
今後の予定
多くの番組の字幕制作に利用できるよう、言語モデルと音響モデルの適応化技術をさらに改善し、音声認識性能をいっそう高めていきます。
話題と話者に適応化する音声認識
※ リスピーク方式 : 番組の出演者とは別の話者(字幕キャスター)が言い直した音声を認識する方式で、複数の出演者や背景雑音の大きい番組にも、字幕を付与できる方法

5月24日(木)から27日(日)午前10時から午後5時まで
展示項目