3次元音響の客観的ラウドネス測定法の標準化とラウドネスメーターの開発

大出 訓史 入江 健介* 小森 智康 小野 一穂 佐々木 陽 長谷川 知美 澤谷 郁子
* NHK放送技術局

現行のデジタル放送では,放送チャンネルを切り替えたり,番組が切り替わったりしたときに,主観的な音の大きさ(ラウドネス)が大きく変化しないように,ITU-R(国際電気通信連合無線通信部門)において定められた客観的ラウドネス測定法に基づいて,各番組音声のレベル管理が行われている。本稿では,4K・8K放送の22.2マルチチャンネル音響(22.2ch音響)においても現行放送と同様に番組音声のレベル管理を行うために開発した22.2ch音響用のラウドネスメーターと,標準化の経緯について報告する。

1. はじめに

視聴者が放送チャンネルを切り替えたり,同じチャンネル内で番組が切り替わったりしたときに,主観的な音の大きさ(ラウドネス)が大きく変化することがある。この問題は,「ラウドネスジャンプ」として世界各国で問題視され,ITU-R(International Telecommunication Union - Radiocommunication Sector:国際電気通信連合無線通信部門)において,番組音声のラウドネスを推定する客観的ラウドネス測定法1) と番組交換時のターゲットラウドネス値2) が規定されることになった。日本国内では,電波産業会(ARIB:Association of Radio Industries and Businesses)において,ITU-R勧告を基に技術資料ARIB TR-B323) が策定されている。現行の日本のデジタル放送は, ITU-R勧告BS.1770-2(2011年発行)に定められた客観的ラウドネス測定法を用いて,番組交換時のターゲットラウドネス値である-24 LKFS(Loudness K-weighting Full Scale)*1に調整して放送するように,各番組音声のレベル管理が行われている。

ITU-R勧告BS.1770-2に規定されている客観的ラウドネス測定法は,勧告化以降,海外でも広く用いられているが,チャンネル数としては最大で5.1マルチチャンネル音響(以下, 5.1ch音響)までしか対応していなかった。一方,先進的音響システムを規定するITU-R勧告BS.2051-14) や,北米を中心とする次 世代放送規格であるATSC(Advanced Television Systems Committee)3.0や映画業界などで,上方にもスピーカーを設置する音響システムが導入され,日本の4K・8Kスーパーハイビジョンにおいても,22.2マルチチャンネル音響(以下,22.2ch音響)が採用されている。そのため,22.2ch音響を含む3次元音響においても,現行のデジタル放送と同様に番組音声のレベル管理を行うために,客観的ラウドネス測定法を拡張する必要が生じていた。

本稿では,ITU-R勧告BS.1770-3(2012年発行)を22.2ch 音響を含む任意の3次元音響に対応できるように拡張した客観的ラウドネス測定法の開発経緯と,国際勧告(ITU-R 勧告BS.1770-4,2015年発行)として標準化した経緯について報告する。また,同勧告に準拠した22.2ch音響対応のラウドネスメーターの概要を紹介する。

2. 客観的ラウドネス測定法の3次元音響対応アルゴリズムへの拡張

本章では,ITU-R勧告BS.1770-3に規定される5.1ch音響用の客観的ラウドネス測定法を,任意の3次元音響方式のラウドネス値を推定できるように拡張した提案手法について述べる。

2.1 既存の客観的ラウドネス測定法

ITU-R勧告BS.1770-3に規定される客観的ラウドネス測定法は,5.1ch音響までに対応している(1図)。本測定法では,低域効果用チャンネルを除く5chの音声信号を100msずつずらしながら400msの区間を切り出して,切り出し区間ごとに客観的ラウドネス値を求める。まず,切り出した音声信号に,K特性フィルターを適用する。K特性フィルターは,頭部の影響による周波数特性と,騒音測定に用いられたB特性*2 を修正して聴覚特性を模倣した周波数特性の2種類のフィルターを組み合わせたものである。次に,音声信号のパワーを求めるために,切り出した音声信号ごとに二乗平均値を求める。さらに,二乗平均値にチャンネルによって値の異なる重み係数G(1表)を乗じて足し合わせ,対数表記にすることで,切り出し区間におけるラウドネス値を求める。番組全体のラウドネス値は,切り出し区間ごとのラウドネス値を,番組全体で平均することにより求める。このとき,あまりにも小さい値はヒトが感じる主観的な音の大きさに影響しないため,一定の閾値以下の値となる切り出し区間は切り捨てるという絶対閾値によるゲーティング処理を行う。さらに,同ゲーティング処理後の平均値から10dB以下の値となる切り出し区間は切り捨てるという相対閾値によるゲーティング処理を行う。

1図 5.1ch音響用の客観的ラウドネス測定法(従来法)
1表 5.1ch音響用客観的ラウドネス測定法の重み係数G
チャンネル名 L R C Ls Rs
重み係数 1.00(±0.00dB) 1.41(+1.50dB)

2.2 提案した客観的ラウドネス測定法

提案した客観的ラウドネス測定法は,5.1ch音響までの測定アルゴリズムとは互換性を確保しつつ,任意のチャンネル 数,スピーカー配置に拡張したものである(2図)。5.1ch 用の測定アルゴリズムが,チャンネルによって異なる重み係 数Gを乗じる以外はチャンネルに依存しない処理を行っているため,提案法では,入力数を任意のチャンネル数に拡張し,重み係数だけを検討することにした。任意のスピーカー配置に適用するため,チャンネルごとに乗じる重み係数Gを音声信号が再生される位置(方位角θと仰角Φ)に基づいて規定することとした。

方向ごとの重み係数は,頭部形状による方向ごとの到達音圧レベル差から算出した。まず,無響室内で,ヒトの頭部模型の耳に測定用マイクロホンを設置し,同じ信号を頭部模型の耳の高さにおけるさまざまな方向から再生し,方向による到達レベル差を測定した(2表)。次に,有響室では残響によって方向による到達レベル差が小さくなるため5),最大到達レベルが+1.50dBとなるように各到達レベルを正規化した。さらに,規定を単純化するために0.00dB,±1.50dBの3段階に量子化した。2表から,5.1ch音響のL,R,Cチャンネルは前方30度以内であるため重み係数は1.00,Ls,Rsのサラウンドチャンネルは側方110度であるため重み 係数は1.41となり,2表に基づいて角度から重み係数を規定することで,既存勧告との互換性が担保できる。さらに再生する音源の高さを変えて方向別の重み係数を算出し,当初はこれらの結果を基に,3表に示す重み係数をITU-R勧告BS.1770-3の改訂案として提案した。

なお,ITU-R勧告BS.1770-3では,Ls,Rsのサラウンドチャンネルが後方に位置するため(3図(c)参照),前方に音源がある場合より音が大きく感じられるという理由で,1.41 の重み係数を乗じていた。しかし2表の測定結果からは,後方(180度)はむしろ音が小さく到達するため0.71の重み係数を乗じる必要があり,Ls,Rsのサラウンドチャンネルに1.41の重み係数を乗じる必要がある理由は,側方(90度)に近い方向に位置しているからであると考えられる。これは,Sivonenらによって主観評価実験でも確かめられている6)

2図 3次元音響用の客観的ラウドネス測定法(提案法)
2表 正面を基準としたときの方向別の到達音圧レベル差
方位角 30° 60° 90° 110° 135° 180°
到達レベル 0.00dB 1.36dB 4.47dB 5.22dB 4.46dB 0.84dB -8.25dB
正規化レベル 0.00dB 0.39dB 1.29dB 1.50dB 1.28dB 0.24dB -2.37dB
3段階量子化 0.00dB 0.00dB 1.50dB 1.50dB 1.50dB 0.00dB -1.50dB
重み係数 1.00 1.00 1.41 1.41 1.41 1.00 0.71
3表 最初に提案した方向別重み係数G
仰角(Φ) 方位角(θ)
|θ| < 45° 45° ≦|θ|<120° 120°≦|θ|<150° 150°≦|θ|≦180
|Φ|<30° 1.00 (±0.00 dB) 1.41 (+1.50 dB) 1.00 (±0.00 dB) 0.71 (-1.50 dB)
30°≦Φ<70° 1.00 (±0.00 dB) 0.71 (-1.50 dB)
70°≦Φ 1.00 (±0.00 dB)
Φ≦-30° 1.00 (±0.00 dB) -- -- --
3図 実験に用いた音響方式

3. 主観評価実験

提案した客観的ラウドネス測定法によるラウドネス値の推 定精度を確認するために,主観評価実験を実施した。本章では,その実験の手法と結果について述べる7)。実験では, 評価者に,基準音と評価音源の音の大きさが同じになるように評価音源の再生レベルを調整させた。その後,基準音と調整された評価音源の信号レベルの差と,客観的ラウドネス測定法によって推定した基準音と評価音源のラウドネス値の差とを比較した。

3.1 実験手法

主観評価実験は,ITU-R勧告BS.11168) に準拠した音響評価室(6.4m(W)×8.0m(D)×4.5m(H))で実施した。音響評価室内の半径2.5mの円柱上に,26個のスピーカー(低域効果チャンネル用2個を含む)を3層(上層:高さ2.9m(仰角31度),中層:1.4m(仰角0度),下層:0m(俯角29度))に配置した。スピーカー配置は,ITU-R勧告BS.2051-14) に規定される22.2ch音響(System H),7.1ch音響(System C), 5.1ch音響(System B),Stereo(System A)およびMono(1ch)の計5種類の音響方式とした(3図)。

評価音源は,22.2ch音響で制作されたドラマ,ドキュメンタリー,スポーツ,音楽番組などの19個の番組音声から10秒程度を切り出し,標準規格ARIB STD-B329) に規定された係数に従って各音響方式にダウンミックスした計100音源とした。なお,1番組だけ,再生レベルが異なる2種類の音源を準備した。実験で使用した音源は,すべて48kHz サンプリング,16bitのPCM(Pulse Code Modulation)音声信号である。

基準音は,女性のダイアログ(英語)のMono音源であり, 再生レベルを60dB(A特性*3)とした。評価音源は,基準音に対して±10dB程度の範囲でそれぞれ異なる値となるように再生レベルの初期値が設定され,評価者によって順不同で提示された。

評価者は,22歳から39歳までの正常な聴力を有する男女20名とした。評価者は,基準音と音の大きさが同じになるように評価音源の再生レベルを調整するように教示を受け,ループ再生されている基準音と評価音源を自由に切り替えて,納得がいくまで評価音源の再生レベルをフェーダー操作で調整した(0.1dB単位)。

3.2 実験結果

今回の実験では,前述のように,同じ番組から切り出した音源を異なる再生レベルで提示した1組の評価音源を含めた。この評価音源に対する主観評価実験では,全く同じ再生レベルになるように調整されなければならない。評価実験の信頼性を確保するために,この評価音源の調整後の再生レベル差が5種類すべての音響方式で3dB以内に収まっていれば,その実験結果に信頼性があると見なし,ポストスクリーニングを行った。その結果,20名中12名のデータで解析を行った。

各評価音源の主観評価値(調整値)の平均と,12名分の標準偏差を4表に示す。標準偏差は2~3dB程度,最大でも6.5dBと個人差は小さかった。標準偏差の大きさは評価音源によって異なったが,特定の音響方式の標準偏差が大きくなるなどの明確な傾向は見られなかった。

次に,主観評価値(評価音源を基準音と同じ音の大きさ となるように調整したレベル差)と客観評価値(評価音源と基準音の客観的ラウドネス測定法によるラウドネス値の差) の関係を音響方式ごとに示す(4図)。対角線上にプロット されている場合に,提案したアルゴリズムによって推定したラウドネス値の精度(以下,推定精度)が高いことを示している。主観評価値と客観評価値の相関係数Rと平均誤差(主観評価値と客観評価値の差の絶対値の平均),最大誤差(主観評価値と客観評価値の差の絶対値の最大値)を5表に示す。3次元マルチチャンネル音響方式である22.2ch 音響,7.1ch音響の推定精度は,相関係数でそれぞれ0.963,0.948と,5.1ch音響,Stereo,Monoの0.961,0.953,0.961 と比べて同程度であった。なお,22.2ch音響の平均誤差が1.99dB,最大誤差が6.38dBと,5.1ch音響の1.68dB,4.63dBに比べて大きかったが,これらの推定誤差は主観評価値の 標準偏差と同程度であり,各音響方式とも十分な推定精度 が得られていると考えられる。以上の実験結果から,提案 手法によって,22.2ch音響や7.1ch音響のような3次元音響方式であっても,5.1ch音響よりチャンネル数の少ない音響方式と同程度の推定精度で客観的なラウドネス値を算出で きることが示された。

4表 各評価音源の調整値の平均と標準偏差
4図 実験結果
5表 主観評価値と客観評価値の相関係数および誤差
相関係数R 平均誤差(dB) 最大誤差(dB)
Mono 0.961 1.62 3.81
Stereo 0.953 1.91 4.96
5.1ch音響 0.961 1.68 4.63
7.1ch音響 0.948 2.27 5.91
22.2ch音響 0.963 1.99 6.38

4. 22.2マルチチャンネル音響のラウドネスメーターの開発

4.1 標準化された客観的ラウドネス測定法

標準化にあたり,3章で述べた実験に加え,評価音源やスピーカー配置を変えた実験が実施され,チャンネル数,スピーカー配置によらず,推定誤差は同程度であることが示された10)。重み係数の標準化にあたっては,3表で1未満の重み係数を乗じることで,ラウドネス値を下げるために必要以上に後方に信号を割り当てる懸念があること,重み係数に関する規定を単純にすること,単純化しても測定精度には大きな差が生じないことなどが考慮され,最終的に6表に示す方向別の重み係数が標準化された1)3表6表とでは,22.2ch音響以外の音響方式については,最初に提案した重み係数と同じ係数となるため,22.2ch音響についてのみ,標準化された係数と,最初に提案した係数による測定値の違いを,3章で実施した実験結果に基づいて検証した(7表)。方向別重み係数による測定誤差は,平均誤差で0.01dB,最大誤差で0.66dBと,若干の増加が見られた。しかし,7表の測定誤差の増加は,主観評価実験における評価者による誤差(4表の標準偏差)に対して十分に小さ いため,ほとんど影響はないと思われる。

また,番組交換時のターゲットラウドネス値に関するITU-R勧告も見直され,チャンネル数やスピーカー配置によらず,放送番組は一定のラウドネス値(-24 LKFS)に調整することになった2)。これを受けて,国内規格であるARIB TR-B32も1.5版3) として改定され,22.2ch音響と7.1ch音響の重み係数が追記された。

6表 規格化された方向別重み係数G1)
仰角(Φ) 方位角(θ)
|θ|<60° 60°≦|θ|<120° 120°≦|θ|≦180°
|Φ|<30° 1.00 (±0.00 dB) 1.41 (+1.50dB) 1.00 (±0.00 dB)
その他 1.00 (±0.00 dB)
7表 22.2ch音響における方向別重み係数による推定精度の違い
相関係数R 平均誤差(dB) 最大誤差(dB)
提案当初の係数 0.963 1.99 6.38
勧告化された係数 0.959 2.00 7.04

4.2 ラウドネスメーターの概要

NHKでは,22.2ch音響対応のラウドネスメーターの開発をソフトウエアベースで進め,標準化以前から試作機を開発し,8Kスーパーハイビジョンの番組制作時に使用している(5図)。このラウドネスメーターは,音声卓から出力された 多重音声信号をMADI音声インターフェース(Multichannel Audio Digital Interface)(最大64ch)経由でパソコンに取り込み,22.2ch音響,5.1ch音響,Stereoの各音響方式の ラウドネス値を算出することが可能である。このとき入力トラックごとに,音響方式,チャンネル名,重み係数を指定する。また,複数の音響方式を同時に制作する体制に備え,22.2ch音響を5.1ch音響やStereoにダウンミックスしたときの ラウドネス値も算出可能である。さらに,100msごとに算出される各時刻におけるラウドネス値と,番組開始時刻から測定時刻までのゲーティング処理付きのラウドネス値を算出し,それらの値の時間経過をグラフとして表示することができる。この機能により,24本のレベルメーターを見る代わりに,生放送で番組全体のレベル管理を行うツールとしても用いられている。ラウドネス値だけではなく,各チャンネルのレベルメーターや,各信号間の相関度の表示など,番組制作に役立つ各種のモニター機能も兼ね備えている。

5図 開発した22.2ch音響対応ラウドネスメーター

5. むすび

8Kスーパーハイビジョンの22.2ch音響においても,現行放送と同様に,番組音声のレベルを客観的ラウドネス値で管理できるように,22.2ch音響対応ラウドネスメーターを開発した。本稿では,その概要と標準化の経緯,推定精度を確認する実証実験の結果について報告した。

本稿で提案した客観的ラウドネス測定法は,チャンネル数やスピーカーの配置に依存しないため,22.2ch音響を含む任意の3次元音響での実用化が期待される。現在のラウドネスメーター試作機は,各入力信号に対して方向別重み係数を指定する仕様になっているが,今後,汎用的に使用する場合は,音声信号に再生位置のメタデータを付与するなどの方法により,方向別重み係数を自動的に指定する機能の導入が望まれる。

本稿は,Audio Engineering Society 138th Convention に掲載された以下の論文を元に加筆・修正したものである。
T. Komori, S. Oode, K. Ono, K. Irie, Y. Sasaki, T. Hasegawa and I. Sawaya:“Subjective Loudness of 22.2 Multichannel Programs,” AES 138th Convention,Convention Paper 9219 (2015)