NHK放送技術研究所
English Sitemap Toppage
研究所概要 研究紹介 刊行物 イベント情報
ユースフル・ユニバーサルサービスの実現
高質感・空間再現メディアの実現
ユースフル・ユニバーサルサービスの実現現
デジタル放送の高度化
放送と通信の連携サービス
人にやさしい放送サービス
高度コンテンツ制作環境の実現

音声認識による字幕制作

音声認識による字幕制作の研究

聴覚障害者への字幕放送を拡充するため、音声認識を使って放送番組にリアルタイムに字幕を付与する研究を進めています。また、放送番組の音声から、効率的に番組関連情報を生成する研究を進めています。さらに、原稿の読み上げだけでなく、自由に発声された音声の認識性能をいっそう向上させるため、不明瞭な発声や自由発話特有の言い回しに対する音響・言語処理の高度化の研究にも取り組んでいます。

自由発話音声認識


アナウンサーの声を即座に文字(字幕)に変換する音声認識技術は、これまでニュースの一部やスポーツ、情報番組などの生放送番組の字幕制作に使われ、好評を博してきました。音声認識を利用した「生」字幕制作には、スタジオ・アナウンサーの原稿読み上げ部分や実況アナウンスに限定して、番組音声を直接認識するダイレクト方式と、大相撲やプロ野球、オリンピックなどでは、字幕キャスターがわかりやすく言い直した音声を認識するリスピーク方式があります。また、この両方式をニュース項目に応じて使い分ける、新しいハイブリッドな方式の研究を進めており、従来よりも低コストのシステム開発を目指しています。

ダイレクト方式の音声認識システム

ダイレクト方式の音声認識システム


リスピーク方式の音声認識システム

リスピーク方式の音声認識システム


ハイブリッド方式の音声認識システム

ハイブリッド方式の音声認識システム


ページトップへ戻る