文研ブログ

メディアの動き 2018年12月13日 (木)

#158 生放送の字幕を自動生成しスマホに配信、民放24局で実験 ~字幕放送の"最適"を探る~

メディア研究部(メディア動向) 越智慎司

全国11エリアの民放24局で、生放送の番組の音声から字幕を自動生成しスマートフォンに配信する実証実験が、11月19日~30日の間に行われました。民放でこのような規模で字幕放送の実験が行われるのは初めてだということです。
実験には、在阪民放5社で構成する「マルチスクリーン放送協議会」が開発したシステム「字幕キャッチャー」が使われ、各局はそれぞれ5日間、夕方のニュースなどの音声から自動生成した字幕をスマホに配信しました。このシステムにはNHK放送技術研究所や情報通信研究機構(NICT)の音声認識の技術が導入されています。また、多くの人が利用しやすいよう、ダウンロードが必要なアプリではなく、スマホに標準搭載されているウェブブラウザーを使ったということです。協議会は実験後、字幕を受信した障害者や高齢者から感想や意見を集めています。

字幕放送については、総務省が2018年2月に策定した指針で、民放の県域局(独立U局を除く)では、2027年度までに字幕付与の対象番組のすべて、少なくとも80%以上につけるという目標が示されています。しかし、地域の民放各局は字幕放送の人手や費用が限られ、どう対応するかが課題となっています。

 158-1212-1.png
「字幕キャッチャー」のデモンストレーション、Inter BEE 2018

実証実験の直前に、放送機器展「Inter BEE 2018」(11月14~16日、千葉市)で行われた「字幕キャッチャー」のデモンストレーションを取材しました。生放送の字幕は、間違いがないよう人の手で入力や修正を行うため、実際の音声から大きく遅れることが多いですが、協議会によると「字幕キャッチャー」での遅れは5秒程度だということです。一方、自動で作られた字幕は、文意は読み取れるものの、漢字などが正しく表示されないケースが散見されました。

協議会は、字幕の自動生成の実用化には、間違いがあっても字幕が有用だという視聴者の声、その声を国などが後押しし、社会の理解を得ること、完璧でない字幕を送ることについての放送局の判断、などが重要だと考えています。このため、今回の実験で字幕放送を見た人たちからリアルタイム性や表示の正確さをどの程度必要としているか聞くことにしています。今、どのくらいであれば視聴者に受け入れてもらえるのか、協議会と地域の民放各局は、字幕放送の“最適”を探ろうとしています。