写真:近藤 雄一 研究員

VVCにおける4K・8K映像向けレート制御手法の検討

テレビ方式研究部 近藤 雄一 研究員

2019年NHK入局。同年より放送技術研究所に所属。以降、映像符号化の研究開発に従事。趣味は散歩と美術館めぐり。

2020年7月に最新の映像符号化方式VVC(Versatile Video Coding)が、MPEG*1とITU-T*2により合同で標準化されました。当所では、より高品質な映像サービスを目指して、VVCにおけるレート制御の研究を進めています。

映像符号化におけるレート制御とは

テレビやインターネットにおける映像サービスでは、限られた伝送レートの中でなるべく高品質な映像を届けるために、高効率に圧縮を行う映像符号化技術が不可欠です。VVCでは非常に多くの符号化手段が準備されており、映像の特徴に応じて適切な符号化手段の組み合わせ(符号化モード)を選択する必要があります。

レート制御は、限られた伝送レートの範囲内で映像品質を最大化する符号化モードを選択する処理です(図1)。例えば、符号化した後のデータ量が伝送レートを超えてしまうと、伝送できないフレームが生じて映像が乱れます。一方、伝送レートより小さいデータで符号化すると、その分だけ本来送ることができる品質の映像と比較して映像品質の劣化(ひずみ)が生じます。こうしたことが起きないように、レート−ひずみ最適化(Rate Distortion Optimization, RDO)と呼ばれる技術を用いて、想定する伝送レートからのずれとひずみをともに小さくする符号化モードを選択することを、レート制御と呼びます。

図1 符号化モードごとのレートとひずみがとり得る値(概念図)

レート-ひずみ最適化による映像品質改善手法の検討

RDOでは、最適な符号化モードを決定するために、レートとひずみの関係(RD曲線)を利用します(図2)。RD曲線を求めるには多様な符号化モードで符号化した結果を必要とし、事前に最適な曲線を求めることが難しいため、実用上は近似曲線を利用します。そこで今回、VVCにおける4K・8K高精細映像に適したRD曲線の近似方法を検討しました。

その結果、動きが激しい映像や絵柄が細かい映像など、特に符号化が難しい映像では、従来の双曲線による近似よりも、対数関数による近似の方がよい、という見通しが得られました。そこで、対数関数を用いたRDO手法を新たに開発し、効果を検証したところ、映像品質を改善することができました。

レート制御は、テレビだけでなく360度映像やAR/VRなどあらゆる映像サービスに必要な技術です。より高品質な映像サービスを目指して研究を進めます。

図2 RDOによる符号化モード選択手順
  1. MPEG(Moving Pictures Experts Group):映像や音声の圧縮符号化や伝送方式の標準化活動を行う国際標準化機構と国際電気標準会議のグループ。
  2. ITU-T(International Telecommunication Union - Telecommunication Standardization Sector):国際電気通信連合の電気通信 標準化部門。