写真:都木 徹

人にやさしい放送サービスを実現する技術(1回/全5回)

誰にも便利で聞き取りやすい話速変換技術

人間・情報科学研究部 主任研究員 都木 徹

連載「人にやさしい放送サービスを実現する技術」では、高齢者や視聴覚障害者などを含めたすべての方々に放送サービスを楽しんでいただくために技研で研究開発している技術を紹介します。

技研では、高齢者の方からの「放送の音声が早口に感じて聞き取りにくい」というお問い合わせに応えるために、放送の音声をゆっくりした速さの音声に変換する話速変換技術の研究を行っています。音声をゆっくりにするといっても、元の音質を保つことや、放送の特徴である即時性を損なわないよう番組の時間枠に収めることが実用化の課題でした。

そこで、各センテンスの始めや声が高くなったところを部分的にゆっくりさせる一方で、ポーズ区間を短縮することで時間枠に収める“適応的な話速制御”を考案しました。これにより、60~80歳代の方々による聴取実験では、約70%の方々から聞きやすくなったという回答を得ることができました。この技術を内蔵し、ゆっくりした速さの音声に変換して聞くことができるラジオやテレビを2002年から2004年にかけて商品化したところ*1、高齢者にやさしい商品として話題となりました。

話速変換技術は、さまざまな応用が考えられます。2004年からは放送後のNHKラジオ第1放送のニュースを、「ふつう」、「ゆっくり」、「はやい」の3種類のスピードでインターネットで提供しています(図1)。「はやい」は実時間の6割の時間で再生しますが、適応的な話速制御で聞きやすい高速再生を実現しています(図2)。高速再生の人気は高く、アクセス数で「ゆっくり」を上回っています。その日のニュースを短時間で聞きたいというニーズが高いものと思われます。

視覚障害者の方々は、スクリーンリーダー*2 や録音図書*3 を使い、Webや出版物の文字情報を音声で取得しています。その際、最大3倍程度の高速再生によって効率的に聴いておられ、上記の“適応的な話速制御”が注目されています。現在、(財)NHKエンジニアリングサービスと連携して、録音図書の高速再生などへの応用を進めています。また、NHKラジオ第2放送の「株式市況」で株価を音声合成で読み上げる検討をしていますが、その際の時間長の自動調整技術としての活用や、ご家庭でハードディスクレコーダーに録画したテレビ番組を好みの速さで視聴していただける方式(図3)など、今後も話速変換を目的に応じて誰にでも便利に使っていただける技術として発展させていきたいと考えています。

*1 日本ビクター株式会社に技術協力
*2 画面に表示される情報を合成音声によって出力するソフトウェア
*3 書籍を読み上げた録音データを音声メディアに記録したもの

図1: NHKのホームページでのサービス画面
(左上に話速を選択するボタンがある)
http://www.nhk.or.jp/r-news
図2: 適応的な話速制御による高速再生
(原音声に対する短縮率は一様に短縮した場合と同じ6割)
図3: ハードディスクに録画した番組を
好みの速さで視聴できる実験装置の画面
(下部のスライダーで、再生倍率や適応的話速制御による高速再生の聞きやすさを調整)