高齢者にも聞き取りやすい音声提示技術

空間的なマスキング解除を利用した音響再生方法の検討

小森 智康 都木 徹*
*(一財)NHKエンジニアリングシステム

高齢者は,聴力レベルの低下などの原因により,番組の背景音のためにナレーションやセリフなどのダイアログ(対話)が聞き取りにくくなることがある。背景音を小さくすることで,ダイアログは聞き取りやすくなるが,その場合,若年者には番組演出の効果が小さくなる。そこで,ダイアログと背景音の再生方向を変えた場合に生じる空間的なマスキング解除を用いた再生手法について,聞き取りの正答率を調査した。その結果,背景音がある場合に,その再生レベルを維持したままで,高齢者にも聞き取りやすい音響提示ができるという知見を得たので報告する。

1.まえがき

高齢者は,番組の背景音がうるさく感じて,ナレーションやセリフなどのダイアログが聞き取りにくくなることがある。この原因としては,加齢による聴力レベルの低下や,背景音がある場合に聞き取りの能力が変わることなどが挙げられている。このような状況や今後の高齢化社会を考えると,個人に適応した「音声に関わる音バリアフリー」1) を目指したサービスが重要となる。「音バリアフリー」とは,広義には「音に関わることで障害者・高齢者および健常者が快適な生活ができる設計」と定義されており,あまねく視聴者に放送サービスを提供するNHKにとっても重要な設計指針である。わが国が世界で最も早く超高齢化社会を迎えることからも,高齢者を主な対象として,ダイアログにより伝えられる「番組の内容となる情報」と,背景音により表現される「番組の文脈や情景となるシーン」を,聴覚情報として受け取れるようにすることは重要な課題である。

番組のダイアログが聞き取りにくい場合の改善方法としては,背景音のレベルを小さくミキシングする方法や,ダイアログの音響的な特徴量を強調する方法などがある。これまでに,番組の背景音のレベルを6dB程度下げることで,高齢者にとって番組音声が聞きやすくなることが確認された2)。そして,この知見に基づいて,主音声と比べて背景音のレベルを6dB小さくミキシングした番組音声を副音声放送としてサービスする取り組みが行われた。また,リアルタイムにミキシングバランスを客観評価する装置の開発3) により,背景音の大きさを高齢者に適したレベルに調整することを容易にする取り組みが行われた。他にも,信号処理によって受信機側で背景音を小さくする方法などが検討されてきた。これらの方法は,現在最も多く放送されているステレオ番組を主な対象としており,番組の内容となる情報を取得するためだけであれば,極めて効果的な方法である。

しかし,背景音レベルを小さくミキシングする方法は,番組の演出効果を小さくしすぎてしまう場合がある2)。そのような演出効果の減少は,若年者にとっては音響品質の低下と感じられる場合があり,若年者と高齢者が同時に楽しめる番組音を実現するためには妨げとなる。すなわち,音バリアフリーな番組音を実現しようとすると,演出効果や音質に妥協が生じる可能性があり,1種類の番組音声のみで若年者と高齢者を同時に十分満足させることは困難である。そこで,演出効果を最大限に保ちつつ高齢者にとっての聞こえを良くする方法が必要となる。理想的には,背景音とダイアログのバランスを変えずに,音質も劣化させずに,聞き取りだけを良くする方法が望ましい。

一方,近年,3次元立体音響方式(以下,3D音響方式)と呼ばれる,視聴者の上方向にもスピーカーを配置する番組音再生方式が,放送や映画で採用されつつある。3D音響方式は,水平面のみでなく,上下方向にもスピーカーを配置することで,3次元的な音の再生が可能な,より自由度の高い音響方式であると言える。3D音響方式には,例えば22.2マルチチャネル音響4) などの方式がある。当所では,この3D音響方式の特徴を活用した聞き取りやすい再生方法の検討を行った。

Saberiらの先行研究5) によれば,ノイズとクリック音の再生方向を3次元的に変えることによって,ノイズによるマスキング効果*1 が小さくなり,クリック音が聞き取りやすくなることが示されている。このように,マスキング効果が小さくなる,あるいはなくなる現象を「マスキング解除」と呼ぶ。このマスキング解除の効果を利用することにより,ダイアログと背景音の再生方向を変えることで,聞き取りを改善できると考えられる。

そこで当所では,再生する音源位置の自由度が増える3D音響方式の特徴と,聴覚の持つマスキング解除の効果を利用して,ダイアログを聞き取りやすくする方法を検討した。この検討においては,若年者と高齢者でマスキング解除の効果に違いがあるか,また,番組の内容となる情報がダイアログで,背景音が音楽などの場合にも有効であるか,を検証する必要がある。そこで,若年者および高齢者を対象として,ダイアログと背景音の再生方向を変えた場合のダイアログの聞き取りの正答率を調査した。その際,放送番組や映画の演出上,ダイアログを仰角方向に変えることは,水平方向に変えるよりも自然であることから,仰角方向のマスキング解除の効果に着目して実験を行い,水平方向のマスキング解除の効果との比較を行った。この実験の結果から,仰角方向のマスキング解除の効果により,高齢者にも聞き取りやすい再生方法を実現できるかを検討した。

本稿では,上記の検討の結果について報告する。2章では,3次元配置の上方のスピーカーからダイアログを再生し,聞き取りを改善する実験について述べる。3章では,2章の結果を受け,ダイアログの評価には単語を,再生方向の評価には水平方向を加えて行った実験について述べる。そして,4章でマスキング解除の効果について考察し,5章で検討結果をまとめるとともに,今後の課題を述べる。

2.仰角方向のマスキング解除

2.1 絶対閾値とマスキング解除に関する先行研究

水平面にスピーカーを配置した場合のマスキング解除に関する研究としては,Santonの研究6) や,無響室*2でのHirshの研究7) があり,水平面内に配置された音源について,マスクする音源(以下,マスカー)とマスクされる音源(以下,マスキー)の水平角を変えることによって,ダイアログの明瞭度が改善することが知られている。

一方,垂直方向に音源の仰角が変わる場合のマスキング解除に関する研究としては,Saberiらの研究5) がある。Saberiらは,防音室*3 で,マスカーとなるホワイトノイズを評定者の前方向の水平角0°,仰角0°(以下,正面方向)に配置し,マスキーとなるクリック音の垂直方向の仰角を変えて,マスキングの解除量を調査した。その際に,クリック音に関する垂直方向の仰角ごとの絶対閾値*4 ,およびその絶対閾値と正面方向の絶対閾値との差分を調査した。その結果,正面方向を基準とすると,仰角30°では絶対閾値は0.5dB程度低くなり(感度は0.5dB程度高くなり),仰角60°では0.5dB程度,90°では2dB程度,絶対閾値は高くなった(感度は低くなった)。一方,正面方向のマスカーに対するマスキングの解除量は,仰角30°では4dB,60°では7dB,90°では5dBとなり,仰角60°で最大となった。すなわち,どの仰角方向においても,絶対閾値の差分よりも,マスキングの解除量の方が大きな値となった。また,正面方向よりも感度が低くなる仰角60°と90°においても,マスキングの解除量はそれぞれ7dBと5dBとなり,マスキーが聞きとりやすくなるという結果が得られている。

本研究では,このマスキング解除による効果を,マスカーには音楽やノイズ,マスキーには単語や単音節を使用して検討した。

2.2 ダイアログ再生の仰角方向を変えた場合のマスキング解除の効果(実験1)

前節で述べたように,Santonの研究6) などにより,マスキング解除の効果に関して,ダイアログと背景音の水平方向の角度を変えた場合に,ダイアログの明瞭度を改善できることが報告されている。一方,ダイアログの仰角方向の角度を変えた場合に,明瞭度が改善するかどうかは明らかにされていない。そこで当所では,背景音の再生方向とレベルを固定して,ダイアログの仰角方向の角度を変えることで,ダイアログの明瞭度が改善できるかを実験(以下,実験1)により調査した。

実験1に使用したスピーカー(BOSE:M3)の配置を1図に示す。実験1では,マスキーとなる単音節は,前方仰角V が−30°,0°,15°,30°,45°,60°,90°となる7方向から再生し,マスカーとなる音楽は,ステレオ再生におけるスピーカーの基本配置であるLとRの位置(1図のFLCとFRC,水平角H=±30°)から再生した。

評定者は,若年者(21~25歳)15名,高齢者(61~74歳)12名とし,単音節を背景音環境下で聞き取る評価実験を実施した。番組のダイアログを想定したマスキーには,聴覚医学会57-S語表検査音源*5 から50単音節表を使用した。番組の背景音を想定したマスカーには,ドラマやドキュメンタリー番組の背景音として使いやすい楽曲の代表として,クラシック音楽のブランデンブルグ協奏曲第5番を選択し,曲の冒頭部分の4秒間を使用した。そのスペクトログラム*62図に示す。2図では,明るい色ほど音が大きく,暗い色ほど音が小さいことを示しており,この音源は,スペクトルの山と谷がはっきりしたトーン性の信号(特定の周波数にエネルギーが集中した信号)であることが分かる。

実験では,評定者の頭部位置において,単音節は60dBA*7 (通常会話レベル)で提示し,音楽は63dBA(ダイアログ比+3dB)で再生した。すなわち頭部位置において,ダイアログを信号S,音楽をノイズNとしたときのSN比を常に一定となるようにして,ダイアログの明瞭度を,単音節の聞き取りの正答率により評価した。

評定者には,ダイアログの再生方向ごとに,50試行分の回答を書き取るよう指示した。ただし,単音節は1試行につき1回のみ再生した。単音節については,57-S語表(5個の表)の単音節音源を繰り返し使用した。

1図 実験1に使用したスピーカー配置
2図 実験1に使用した背景音(クラシック音楽)のスペクトログラム

2.3 実験1の結果

実験1の結果を3図に示す。仰角30°で,若年者・高齢者ともに,正答率が最も高くなった。また,若年者では15°から90°の範囲で,高齢者では15°から60°の範囲で,仰角0°と比べて正答率が高くなる傾向があった。マスカーとなる音楽にはステレオ音源を使用したが,音源の重心となる方向は正面方向である。

2.1節で述べたように,Saberiらの先行研究5) によれば,マスカーが正面方向の場合,マスキー(クリック音)に対するマスキングの解除量は,仰角0°から90°の範囲では,60°で最大となる。実験1で単音節の正答率が最大になる仰角(30°)と,先行研究でマスキングの解除量が最大となる仰角(60°)は異なるが,マスキーの仰角を上方向に変えることで単音節の明瞭度が改善するという点では共通しており,実験1の結果から,マスキングの解除量が増加する効果により,ダイアログの明瞭度が改善していると考えられる。

3図 単音節の正答率(ダイアログ再生の仰角方向を変えた場合)

3.マスカーおよびマスキーの音源と提示方向を変えた場合のマスキング解除実験(実験2)

実験1の結果から,正面方向の背景音(音楽)に対して,ダイアログ(単音節)の再生方向を仰角方向に変えることで,聞き取りを改善できることが示された。ただし,3D音響方式を用いてダイアログを聞き取りやすくする方法を検討するためには,ダイアログを単語とした場合の評価や,背景音を音楽以外とした場合の評価も必要である。また,ダイアログの提示方向を仰角方向に変えた場合と水平方向に変えた場合とのマスキング解除の効果の差も,再生方式の検討のためには有用な知見となる。そこで,実験2では,マスカーおよびマスキーとなる音源の種類を増やし,それぞれの音源を再生する方向の水平角と仰角を変えて実験を実施した。

3.1 実験2の実験条件

実験2では,3次元配置のスピーカーを使用して,単音節および単語を背景音環境下で聞き取る評価実験を実施した。

マスキーとなるダイアログとしては,聴覚医学会57-S語表検査音源から50単音節表,および,一般的な日本人に知られている度合いを表す“親密度”に応じてあらかじめ4分類された単語表FW038) の2番目に親密度の高い表から900単語(女性スピーチ,1個の表当たり50単語,計18個の表)を実験に使用した。FW03は,単語表を開発する際に,表に含まれる漢字単語の読み能力を年齢群別に調査しており,含まれている単語の知識量(それぞれの単語の読み方を知っているかを調べたテスト結果)に関しては,加齢変化による差はないことが示されているため9),聴力による差を評価するのに適した音源である。ただし,FW03の表の数には制限があり,比較できる条件は,その表の数に制限されるので,音源や再生方向の条件を絞り,実験を実施した。

マスカーとなる背景音には,スペクトルの山と谷がはっきりしたトーン性の信号として実験1で使用したクラシック音楽(ブランデンブルグ協奏曲第5番)と,さらに,スペクトルのなだらかなノイズ性の信号として4秒間のピンクノイズ*8 を使用した。

実験では,評定者の頭部位置において,単音節および単語は60dBA(通常会話レベル)で再生し,ノイズおよび音楽は63dBA(ダイアログ比+3dB)で再生した。

先行研究5) では,マスキングの解除量は,マスカー(ホワイトノイズ)とマスキー(クリック音)の間の仰角方向の成す角を変えた場合よりも,水平方向の成す角を変えた場合の方が大きいことが示されている。そこで,実験2では,ダイアログ(単音節および単語)に対しても同様の効果が得られるのかを調査するために,マスカーとマスキーを再生する仰角と水平角を変えて比較した。

実験2で使用したスピーカー配置を4図に示す。実験条件を絞るために,実験2ではスピーカーの数を3つとし,再生方向は,基準となる前方向,仰角を考慮した上方向,水平角を考慮した横方向の3種類とした。マスカーとマスキーの間の仰角方向の成す角は,実験1で高齢者において一番正答率の悪かった90°とした。この条件(仰角90°)でマスキング解除の効果が得られれば,ダイアログの再生方向を仰角方向に変える方法の有効性を示すことができると考えた。また,仰角を変えた場合と水平角を変えた場合の比較のために,水平角を前方向から90°変えた横方向のスピーカーを配置した。この配置により,横方向のスピーカーと,前方向や上方向のスピーカーとの間で,左右の両耳間時間差および両耳間レベル差を最も大きくすることができる。

マスキーとなる単音節・単語,およびマスカーとなるノイズは,前方向・上方向・横方向の3方向から再生した。ただし,音楽をマスカーとする実験では,マスキーであるダイアログを仰角方向に変化させるため,マスカーは前方向・横方向の2方向から再生した。

評価実験で用いた単音節・単語と背景音の組み合わせ条件は,単音節・単語とピンクノイズの組み合わせで9通り(3方向×3方向),単音節・単語とクラシック音楽の組み合わせで6通り(3方向×2方向),単音節・単語と背景音無しの組み合わせで3通りの計18通りとし,単音節・単語の聞き取りの正答率を調査した。音源の再生には防音室に設置したスピーカー(BOSE:M3)を使用し,上記の組み合わせ条件ごとに,50試行分の回答を,聞こえたとおりに書き取るよう指示した。ただし,単音節・単語は,1試行につき1回のみ再生した。18通りの組み合わせ条件において,単音節に関しては,57-S語表(5個の表)の単音節音源を繰り返し使用した。また,単語に関しては,各組み合わせ条件に対して,すべて異なる単語表を使用した。

評定者は,若年者(20~25歳)15名,高齢者(60~73歳)14名とした。若年者と高齢者の聴力図*95図に示す。この図は,若年者と高齢者の各グループについて,周波数ごとの聴力レベルの平均値と95%信頼区間*10 を示している。赤のアスタリスクは,有意な差があることを示す。この図から,2kHz以上の周波数では,若年者と比較して,高齢者の聴力が有意に悪くなっていることが分かる。

4図 実験2に使用したスピーカー配置
5図 聴力図

3.2 実験2の結果

ダイアログの明瞭度に関して,単音節と単語の聞き取りの正答率により評価した。背景音を前方向から再生する条件における,ダイアログの提示方向別の正答率,および正答率の95%信頼区間を6図に示す。背景音を前方向から再生する条件では,次の傾向が示されている。

  • 若年者・高齢者ともに,ダイアログ(単音節・単語)を前方向から再生するよりも,前以外(横・上)の方向から再生する方がダイアログを聞き取りやすい。
  • 背景音が音楽の場合,若年者に比べ,高齢者はダイアログを聞き取りにくい。
  • 若年者は,背景音がノイズの場合に比べて,音楽の方が,ダイアログを聞きとりやすい。
  • 単語と音楽の組み合わせでは,ダイアログの再生方向を上方向に変えることで,前方向と比べて,高齢者で25%以上,若年者で15%以上,正答率が改善した。

背景音とダイアログを,同じ方向から再生した場合と,異なる方向から再生した場合とに分け,単音節と単語の正答率を平均した値を7図に示す。背景音が無ければ,若年者・高齢者ともに正答率は高いが,背景音がある場合に正答率が低くなる。特に,背景音とダイアログを同じ方向から再生した場合には正答率が低くなり,異なる方向から再生した方が聞き取りやすくなる傾向が示されている。また,背景音が音楽の場合は,若年者と比較して,高齢者の正答率が低くなる傾向が示されている。

背景音を横方向から提示する条件における,ダイアログの提示方向別の正答率,および正答率の95%信頼区間を8図に示す。背景音を横方向から再生した場合も,ダイアログと背景音の再生方向を変えることで,ダイアログが有意に聞き取りやすくなる組み合わせがあることが示されている。

以上の結果から,背景音とダイアログのバランスを変えずに,音質も劣化させずに,再生方向を変えるだけで,高齢者の聞き取りだけを良くする音響再生方法として,マスキング解除を活用する方法が有効であることを確認した。

6図 評価結果(背景音を前から提示)
7図 評価結果(平均値)
8図 評価結果(背景音を横から提示)

3.3 高齢者の聞き取りにくい音韻

高齢者は若年者と比較すると,背景音が音楽の場合に,ダイアログの聞き取りの正答率が低くなる傾向がある。そこで,高齢者の聞き取りにくい音韻*11 に関して,不正答数と回答結果に着目して解析を行った。

1表(a)は,ダイアログ(単音節)と背景音(音楽)の両方を前方向から再生した場合の,単音節ごとの不正答数を示す。高齢者と若年者を比較して,高齢者による不正答数の方が多い単音節を示す欄を,その差が大きい場合には,より濃いオレンジ色で塗りつぶして示した。濃いオレンジ色の欄の単音節ほど,高齢者には聞き取りにくいことを示している。その結果,カ行,サ行,ヤ行などに加えて,単音節「バ,ム,ラ」を異聴する(聞き間違える)高齢者が多いことが示された。また,若年者の不正答数の方が多い単音節を示す欄は,薄い緑色とした。 単音節の「ホ」や「ワ」を異聴する若年者が多いことが示された。

2表は,ダイアログ(単語)と背景音(音楽)の両方を前方向から再生した場合の実験結果のうち,高齢者の不正答数が若年者より5名以上多くなった単語,その単語をどのような単語に異聴したか,およびその回答数を示す。この結果から,高齢者は単語中の音韻のうち,ガ行(トシガイの“ガ”,ギンバンの“ギ”など)やサ行(サカダルの“サ”など),他にも「ハ,バ」(アカハジの“ハ”,ギンバンの“バ”など)を異聴する傾向が高いことが分かる。

1表(b)は,背景音(音楽)を前方向から再生し,ダイアログ(単音節)を前方向または上方向から再生した場合の,高齢者の単音節ごとの不正答数を示す。ダイアログの再生方向で比較して,前方向より上方向で不正答数の少なくなる単音節を示す欄を,その差が大きいほど濃いオレンジ色で塗りつぶして示した。すなわち,濃いオレンジ色の欄の単音節ほど,ダイアログを上方向から再生することで聞き取りやすくなることを示している。逆に,ダイアログを上方向から再生した場合に不正答数が多くなり,聞き取りにくくなる単音節を示す欄は,薄い緑色とした。先行研究5) によれば,前方向と比べると,上方向の絶対閾値は2dB大きくなる(感度は2dB下がる)。すなわち,絶対閾値だけを考慮すると,上方向からのダイアログは前方向より2dB小さく知覚されることになり,すべての単音節で上方向の正答率が低くなるはずである。実際には,上方向から再生することで19個の単音節で正答率が低くなり,21個の単音節で正答率が高くなった。また,高齢者にとって,単音節「バ,ム,ヤ」などの正答率が顕著に改善することが示された。この3つの単音節は,1表(a)でもオレンジ色の欄で示されている。この結果は,ダイアログと音楽の両方を前方向から再生する条件では,高齢者の正答率が低くなる単音節があり,その中に,ダイアログの再生方向を上方向に変えることで,聞き取りやすくできる単音節があることを示している。

また,若年者を対象として,ダイアログ(単音節)と背景音(ノイズ)を前方向から再生した場合に,どのような音韻を異聴するのかを調査した。その結果,異聴する単音節は「ゴ・サ・シ・ジ・ス・ヤ・ユ」などであった。これらの単音節は,高齢者がダイアログ(単音節)と背景音(音楽)を前方向から再生した場合に異聴する傾向が高い単音節と共通である。一方,若年者で背景音を音楽とした場合には,「ド・メ・ワ」などの単音節を異聴することが示された。

1表 音節別の不正答数
2表 高齢者が聞き間違えやすい単語の例(背景音は音楽)
単語 若年者 不正答の数 高齢者 不正答の数
アカハジ アカカギ 1
アカハギ 4
オナジミ オヤジニ 1 オヤジニ 5
オヤジミ 1 オヤジミ 1
オヤズミ 1
ギンバン ギンガミ 1 ・・ドン 1
ギンドン 1 ジュンバン 2
ジンダイ 1 ビンラン 1
ブンダン 3
リンダン 1
リンバン 1
サカダル サカガミ 1 カタガミ 2
サカバル 1 カタグレ 1
カタダル 1
サカタル 1
サザナミ 2
タカザル 1
トシガイ イシバシ 1
カワウソ 1
ジョシダイ 3
トシガエ 1

4.考察

本章では,マスカーとマスキーの再生方向を仰角方向に変えた場合のマスキング解除の効果について考察する。

マスカーとマスキーの再生方向を水平方向に変えた場合,例えば横方向から再生されるマスキーに対して,左右の両耳間時間差と両耳間レベル差を利用することで,マスキーに近い耳でのレベルが大きく,時間的に速く届くというキュー*12 によって,マスキーを検知しやすくなることが考えられる。しかし,マスカーとマスキーの再生方向が前方向と上方向の組み合わせとなる場合は,マスカーとマスキーが両耳から等距離となるため,これらのキューは使用できない。

マスカーとして音楽を前方向で再生し,マスキーとしてダイアログを前方向と上方向から再生した場合の単音節の正答率(1表(b))をバ行に着目して比較すると,ダイアログを上方から再生した場合の正答率が高くなる傾向がある。単語の正答率についても,一音節目にバ行の子音が出てくる単語の誤りが減る傾向が見られた。ただし,バ行と似た音響的な特徴を持つガ行やダ行の誤りは減らない。ガ・ダ・バの違いを周波数分析で示すことは難しいが,単音節のバとダを信号波形で比較すると,バは唇の間から短時間で息を吹き出すことで発声することから,音声信号の立ち上がりが急峻になっている。先行研究5)でマスキーとして使われたクリック音も急峻な立ち上がりのある音源と考えられることから,仰角方向のマスキング解除の効果の1つとして,再生方向を変えることで,時間的な変化である音声信号の急峻な立ち上がりを検出しやすくなる効果があると考えられる。

次に,マスキングおよびマスキング解除による効果が若年者と高齢者で異なる理由について考察する。5図は,若年者と高齢者とで,2kHz以上では聴力レベルに差があり,高齢者の方が大きな音でないと聞き取れないことを示している。一方,1表(a)では,背景音が音楽の場合に,カ行やサ行の音を,高齢者は若年者と比較して異聴する傾向が高いことが示されている。[k]や[s]の子音は,9図で示すように,母音と比べると全体のレベルは低いが,母音は2kHz以下にエネルギーが集中しているのに対し,子音は相対的に4kHz以上の周波数のエネルギーのレベルが高い。したがって,[k]や[s]の子音は,聴力の良い若年者には聞き取れるが,高齢者には聞き取りにくいために異聴したと考えられる。単語についても,ガ行やサ行などを高齢者が異聴しているのは,同様の理由によると考えられる。

若年者に関して,マスカーがノイズと音楽の場合で比較すると,マスカーが音楽の場合に聞きとりやすくなる理由として,スペクトルの山と谷がはっきりしたトーン性の信号と,スペクトルのなだらかなノイズ性の信号に対するマスキングの違いが影響していると考えられる。今回マスカーとしたクラシック音楽に含まれる弦楽器等の音は,トーン性の信号を多く含んでいるため,ノイズ性の信号よりも周波数軸上で谷間に当たる周波数成分の音は聞き取りやすくなっていることが予想される。若年者の場合には,その谷間の周波数成分の音をキューにして,ダイアログの聞き取りが改善できていると考えられる。ただし,音楽に含まれる2kHz以上の周波数帯域には,ダイアログに含まれる音と似た成分が含まれる場合もあり,その場合には,若年者の方が異聴しやすくなる場合もあり,高齢者の方が正答率の高くなる単音節もあったと考えられる。

一方,高齢者に関しては,トーン性の信号である音楽をマスカーとした場合と,ノイズ性の信号であるピンクノイズをマスカーとした場合とで比較すると,聞き取りの改善は見られない。一般に,難聴者は周波数の選択性が悪くなることが報告されており10),高齢性難聴者にも同様の傾向がある可能性がある。その結果,音楽に含まれるトーン性の信号も,聴覚中枢では周波数帯域が広がった信号として処理されることで,若年者には聞き取れている周波数軸上の谷間に当たる周波数成分の音がマスクされている可能性がある。その結果,高齢者の場合は,トーン性の音楽に対しても,ノイズと同程度のマスキングが起こっていることが考えられる。

次に,話者の映像とダイアログの再生位置との関係について考察する。映画では,上方からダイアログを再生する演出もある。話者の映像が画面内にある場合,画面内の話者とダイアログの再生位置が大きく異なる場合には,腹話術効果*13 による発話位置の融合は難しいという先行研究がある。一方,放送番組においては,画面に話者の出ないナレーションを使用するケースが多くある。また,画面に話者が出る場合,顔画像があることにより,ダイアログだけを再生した場合と比較して音声明瞭度が改善することが示されている。この場合,顔画像とダイアログの再生位置が異なっても,音声明瞭度を改善する効果はあると考えられる。今後,このような知見を番組制作手法に適用していくことも検討していきたい。

5.まとめと今後の課題

高齢者と若年者を対象に,ダイアログとして単音節および単語,背景音としてノイズおよび音楽を使用して,ダイアログの聞き取り実験を行った。

3次元配置のスピーカーにより,ダイアログと背景音の再生方向を変えて,単音節と単語の正答率を調査する実験を行った結果,背景音とダイアログを同じ方向から再生するよりも,異なる方向から再生した方が,正答率が高くなった。この場合,背景音とダイアログの再生方向の組み合わせを変えることで,有意に正答率が高くなる組み合わせが多く存在した。この結果は,高齢者に対して,マスキング解除の効果を利用してダイアログの聞き取りを改善できる可能性があることを示している。

一方,背景音とダイアログを同じ方向から再生し,背景音をノイズまたは音楽として比較すると,高齢者と若年者の正答率に差がある場合があった。この結果は,高齢者にとって音楽は,ノイズと比較して,よりダイアログを妨害する音源であることを示している。

また,上方向や横方向を含めて,背景音とダイアログの再生方向を変えることで,ダイアログの聞き取りやすさを改善できることを示すことができた。ただし,単音節を使った実験結果からは,再生方向を変えるだけでは,明瞭度を改善できない場合もあることが示された。

一方,単語を使った実験結果においても,正答率を,若年者で15%,高齢者では25%以上改善できる組み合わせがあることから,背景音とダイアログの再生方向を変えることが,ダイアログの聞き取りを改善する再生方法として,十分に効果的であることを示すことができた。

本稿では,背景音とダイアログのバランスを変えずに,音質も劣化させずに,聞き取りだけを良くする音響再生方法として,マスキング解除を活用する方法を検討し,有効性を確認したが,家庭などで再生する際には,背景音を小さくする方法や,音韻を強調する方法と併用することが考えられる。例えば,単純に背景音を12dB小さくするよりも,背景音は6dB小さくし,再生方向を変える方法と組み合わせて,聞き取りを改善する方法も考えられる。

今後は,最適なダイアログと背景音の再生方向の組み合わせや,背景音のレベル調整,ダイアログの音韻強調など,高齢者の聞き取りを改善する手法を組み合わせ,番組のダイアログをより聞き取りやすくする放送サービスの実現を目指す予定である。

謝辞 本報告をまとめるにあたり適切なアドバイスをいただいた早稲田大学及川靖広教授に感謝いたします。

本稿は,映像情報メディア学会誌に掲載された以下の論文を元に加筆・修正したものである。
小森,都木,及川:“空間的なマスキングリリースを利用した高齢者にも聞きとりやすい音響再生方法の検討,”Vol.71,No.5,pp.J172-J178(2017)