オブジェクトベース音響

視聴者の好みや視聴環境に適応した音声サービス

視聴者の好みや視聴環境に合わせて番組の音声をカスタマイズできる,オブジェクトベース音響の研究を進めている。オブジェクトとは,番組の音を構成する,実況・解説や背景音,効果音などの音の素材を指す。従来の放送では,番組制作現場で音の素材をミキシングし,完成した番組の音を家庭に伝送している(チャンネルベース音響方式)。オブジェクトベース音響では,番組制作現場から音の素材と,それらの構成や再生位置などの情報(音響メタデータ)を家庭へ伝送し,各テレビ受信機で目的に合わせて合成することで,番組の音を完成させる(1図)。

オブジェクトベース音響により,新たな音声サービスの実現が期待できる。例えば,家庭のスピーカーの数や位置に合わせて,音声信号をレンダラー(信号処理装置)により生成することで,より高い音質で番組を楽しむことができる。スポーツ番組では,実況と背景音の音量をそれぞれ好みに応じて調整することで,高齢者が実況をより聞き取りやすくすることができる。また,背景音を応援するチームへの声援のみにすることで,チームのサポーターと現地で一緒に応援しているような臨場感を楽しむこともできる。

このように,音声による多様な放送サービスの実現を目指し,当所では,オブジェクトベース音響の音声信号を家庭でリアルタイムに再生するための音響メタデータ送出装置を開発した(2図)。この装置では,音響メタデータを時系列の表現形式にして,音声信号と同期させて伝送することができる。3図のように,番組全体の情報が記述された音響メタデータから各フレームの音声信号の再生に必要なメタデータのみを抽出し,音声信号と同期させて送出する。この装置により,ライブ制作された音声信号にも逐次メタデータを付与することが可能になり,生放送でも上述のような音声サービスを提供できるようになる。

音響メタデータの時系列の表現形式についてはITU-R(国際電気通信連合 無線通信部門)で,伝送方式についてはSMPTE(米国映画テレビ技術者協会)で国際標準化を進めており,これらの技術が世界的に広く利用できる環境が整いつつある。

今後は,複数言語の音の素材を自動的に制作する技術などの研究を進め,オブジェクトベース音響の実用化を目指す。

1図 オブジェクトベース音響方式
2図 音響メタデータ送出装置
3図 音響メタデータ送出装置の信号構成