文研ブログ

2022年5月19日

調査あれこれ 2022年05月19日 (木)

#395 新しい技術を実用化するときの課題とは?

計画管理部(計画) 柳憲一郎

 世界中で開発が進められているAI(人工知能)を利用した車の自動運転技術。技術的な側面以外にも、AIが間違えた時の社会倫理や法律的な不備が議論されたりするなど、人文・社会科学の分野でも研究が進んでいます。自動運転のような新しい技術が実用化される時に、従来の法律では想定していない事態が発生したり、新しい倫理規範が必要になったりするなどの課題は、ELSI(エルシー:Ethical, Legal and Social Issues)と呼ばれ、「倫理的・法的・社会的課題」と訳されます。 

 NHK放送技術研究所(技研)も、AIを利用した様々な新しい技術を開発しています。このブログでは、地域放送局のニュース番組の音声をAIが認識して、自動で字幕を制作・表示する研究を例として紹介します。

 字幕放送は、聴覚障害者や高齢者など音声が聞き取りにくい方の番組視聴を支援するために、テレビ番組出演者の言葉を文字にして伝えるサービスです。ところが、生放送のニュース番組では、人力だけで作業をすると、言葉と字幕を表示するタイミングが大きくずれてしまいます。そこで、AIの「音声認識技術」を利用する事にしました。

 ところが、AIが音声を100%の精度で認識することは困難です。音声だけでは人名の漢字表記が判別できなかったり、方言が聞き取りにくかったりすることなどがあるためです。

 NHKは現在、東京のスタジオで制作するニュース番組に関しては、AIの間違いをオペレーターが修正をして放送しています。しかし全国すべての地域放送局で同様に実施することは、オペレーターの確保、人的コストや設備整備の点で、極めて難しいといわれます。そのために現状では、地域放送局での字幕放送は、事前収録した番組などに限定されています。 

  そこで技研は、地域放送局での字幕放送の拡充に向けて、オペレーターの修正なしに字幕を制作する、高精度なAIの音声認識技術を研究しています。音声だけでは漢字表記が分からない「人名」であるとAIが判断した場合にはカタカナで表記する技術や、言葉が不明瞭であったり、方言がまじったりして、音声認識の誤りが発生しやすい発話を自動的に検出し、それ以外の明瞭な部分のみに字幕を付与する手法も開発しました。

  しかし、技術をどんなに発展させたとしても、AIが間違える可能性は残ります。その時に起こりうる放送倫理や法律、社会的な影響などの「倫理的・法的・社会的課題(ELSI)」を、事前に検討しておく事が欠かせません。

 文研と技研は共同で、ELSIについての研究を去年4月からはじめました。まずは技研の研究者に、「今後の課題」等についてインタビューをしました。その結果、「AIの公平性、信頼性の担保」「プライバシー、人格権、肖像権への考慮」などの課題が判明。今後は、ユーザーや外部の専門家と連携しながら課題解決に向けて研究を進めることになりました。

 文研と技研のこの取り組みは、「放送研究と調査」3月号(ユニバーサルサービスの社会実装における課題~倫理的・法的・社会的課題(ELSI)の視点から~)に掲載されています。まだ研究途上のため、わずか4頁の短い調査研究ノートですが、ご一読頂ければ幸いです。