NHK INFORMATION
技術情報

  ◆音声認識による「字幕放送画面制作システム(NeON−II)」を開発 〜聴覚障害者にやさしい字幕放送100%をめざして〜
(平成12年9月20日)

○NHKは、音声認識による「字幕放送画面制作システム〈NeON−II〉(*1)」をIBMと共同開発しました。これは音声認識技術を利用して、VTRに収録されたアナウンサーなどの音声を自動的に文字(字幕)に変換し、小型のパソコンで字幕放送画面を制作する装置です。変換された文字(字幕)と映像、および音声が同時に画面上に表示されます。このため、映像と音声をプレビューしながら、文字(字幕)をワープロ感覚で修正編集することができます。字幕制作に必要な作業時間を大幅に短縮でき、字幕放送に対応する番組の数を増やすことが可能になります。

○これまで字幕制作は、人の手だけで作業を行っており、30分の番組に字幕を付けるために4〜5日間の日数を必要としていました。放送の2〜3日前にでき上がるような番組には字幕を付けることが難しく、60%(*2)程度の字幕放送しかできませんでした。

○今回開発した装置を利用することで、自動的に文字(字幕)を制作でき、修正編集が容易に行えるため、大幅に作業時間を短縮することができます。番組内容にもよりますが、30分の番組に字幕を付けるのに、1〜2時間程度で行うことができます。

○なお、この装置を利用して10/19〜29のシドニー・パラリンピック「ハイライト番組」の字幕制作を試験的に行い、皆さまにご覧いただくことにしています。

○今後、音声認識が難しいドラマや娯楽番組にも修正編集作業が少なくてすむように、バージョンアップを図っていきます。

○NHKでは、耳の不自由な方への放送サービスとして、字幕放送は欠くことの出来ない放送サービスのひとつだと考えており、今後もこの装置などを用い字幕放送を積極的に進めていく予定です。これからも「人にやさしい技術」の開発を積極的に進めていきます


(*1) NeON(ネオン)
公共放送のNHKとして、字幕サービスなどの放送を通して、耳の不自由な視聴者の方々に「一筋の光」を与えたいとの願いからネオン(NeON)と名づけた。語彙的には、“ NHK Excellent Onsei Ninshiki ”の略。

(*2) 字幕化率
7〜24時の時間帯で生番組を除いた字幕放送の割合。



<報道資料>

図.システム構成、および画面イメージ

表.システムの特徴
 
特  徴
ハードウェア
・1台のパソコン(Windows)のみで動作する
・NAB(字幕放送画面)フォーマットで出力できる
・音声認識したアナウンスコメントを逐次,修正/要約作業を行うことができる
ソフトウェア
・MPEG映像/音声と同期を取りながら,自動的に音声認識し,テキスト(文字)化する
・テキスト部をクリックすると,その位置から字幕スーパーをモニターできる
・NABフォーマットの字幕放送データをインターネットやアーカイブスなどに適したテキストファイルに変換できる
・指定した区間の映像と音声を繰り返しモニターでき,文字の修正や要約作業を効率的に行うことができる
・字幕のページ分割やページ間の結合など,細かな編集も可能である
辞書 日本語変換
・文脈を考慮した高度なシソーラス変換(※) (ViaVoice Ver.8)により,テキスト(文字)化できる
・放送に使用可能な用語や用法を,NeON−IIのなかで即座にチェックできるように,「新NHK用語用字辞典」の電子化を進めている
(※) シソーラス: 言葉の意味分類のこと
 言葉の意味を利用すれば,「むすこは,はしで,ごはんをたべる。」のように音声認識したテキストデータを「息子は橋でご飯を食べる」と変換せずに,「息子は箸でご飯を食べる」のように変換可能











技術情報一覧
Copyright NHK (Japan Broadcasting Corporation) All rights reserved. 許可なく転載を禁じます