地上放送高度化技術

地上波によるスーパーハイビジョン放送実現に向けた伝送技術の探究

VVC (Versatile Video Coding)

VVCは、次世代映像符号化方式として、世界中の企業や研究機関などが参加する国際標準化機関によって標準化が進められ、2020年7月に第1版の標準化が完了しました。5Gネットワークによるストリーミングでの利用や、IoTにおける映像利用の拡大などに伴い、映像圧縮技術のニーズが高まっています。こうした背景のもと、VVCはこれまでのSDR(Standard Dynamic Range)映像に加えてHDR(High Dynamic Range)映像や全天周(360°)映像の符号化にも対応した、汎用性のある符号化方式となっています。

新4K8K衛星放送で用いられている映像符号化方式であるHEVC(High Efficiency Video Coding)と比較すると、同程度の画質となるように符号化した場合、下表に示すとおりVVCはHEVCに比べて伝送レートを40%程度削減することができます。また、同程度の伝送レートで比較した場合は、下図のようにHEVCに比べて、より高画質な映像が得られます。

表1 HEVCを基準としたVVCの符号化性能改善率と演算量
映像解像度 符号化性能改善率
4K(2160p) -44.7 %
2K(1080p) -41.7 %
エンコーダ演算量 約 8.0 倍
デコーダ演算量 約 1.6 倍
図1 HEVCとVVCの画質劣化の比較

※同画質を実現する伝送レートが基準方式に比べてどれだけ削減されたかを示す指標。マイナス値が大きいほど性能が高い。

MPEG-H 3D Audio BLプロファイルを用いたリアルタイム音声符号化・復号装置

MPEG-H 3D Audioは、ナレーションの音量だけを増減したり好みの言語に切り替えたりといった、視聴者の好みに合わせたテレビ視聴を可能にする、オブジェクトベース音響※1に対応した音声符号化方式です。地上放送高度化の検討においては、LCプロファイルより実装負荷の軽い最新のプロファイル※2であるBLプロファイルを採用し、22.2ch音響に対応可能なレベル4を世界で初めてリアルタイム音声符号化・復号装置に実装して実用性の検証を進めています。

図2 オブジェクトベース音響の仕組み
図3 開発したリアルタイム音声符号化装置(左)とリアルタイム音声復号装置(右)
表2 開発したリアルタイム音声符号化・復号装置の仕様
項目 仕様
入出力I/F MADI (AES10)
入力音声信号数 最大56ch(例:22.2ch背景音+12言語)
出力音声信号数 最大24ch(例:22.2ch音響)
入力音響メタデータ 音響定義モデルのシリアル形式※3
多重化ストリーム形式 MMT/IP
レンダリング可能な音声フォーマット モノ、ステレオ、5.1ch、7.1ch、22.2ch、5.1.2ch、5.1.4ch、7.1.4ch※4
圧縮効率 512kbit/sで22.2ch音響を圧縮可能※5
  1. 個々の音声信号(音声オブジェクト)を音響メタデータで制御して伝送し、レンダラー(音響メタデータと視聴環境の情報に基づいて音声信号を変換する装置)で再生する方式
  2. 符号化ツールのサブセット
  3. 勧告ITU-R BS.2125-0に準拠
  4. 5.1.2、5.1.4、7.1.4については中層.LFE.上層のチャンネル数を示す
  5. 勧告ITU-R BS.1548-7規定の放送品質を達成