8K SHV 概要 8K SHV  カメラ 8K SHV 圧縮 8K SHV 衛星放送 8K SHV 地上放送 8K SHV ケーブル伝送 8K SHV MMT
Hybridcast IP 立体 ホログラム立体 字幕技術 やさしい日本語 手話CG 話速変換技術

 話速変換とは、声の質や高さを変えずに、その人がそのままゆっくり、または早く話したかのように、再生するスピードを制御する技術です。2025年には、65歳以上のお年寄りが人口の1/3を占める本格的な高齢化社会を迎えます。一方、IT・デジタル技術の活用で情報があふれる時代では、情報を詰め込み短い時間で伝達することが求められ、アナウンサーなど話し手の話すスピードが早まる傾向にあります。
 このような状況の中、主に加齢により、言語を理解する能力である語音識別速度が低下し、早口についていけず、必要な情報を得られにくくなっているお年寄りが増えているのです。

 受信機または再生機で、音を自由なスピードに変換できれば、各人が一番聞きやすいスピードで聞くことができるようになります。音声は母音と子音、そして無音からなり、そのうち母音は1つの波形の繰り返しで構成されます。ここで、テープレコーダーを思い出してみてください。ゆっくり再生すると波形がそのまま伸びるため、声の高さ(ピッチ)が低くなって誰の声だか分からくなってしまいます。
 話速変換技術では、デジタル信号処理を用いて、ゆっくりにする時には母音を構成する繰り返し波形の一部を新たに挿入し、早くする時には逆に削除することで声の高さは変わりません。この時、余計なノイズを発生させないため、母音、子音、無音の区間を正確に判別することが重要です。
 個人差はありますが、発声時間を2割ほど長くすると聞き取りやすいと言われるお年寄りが多いことがわかりました。この時、例えば5分のニュースの場合、6分近くになってしまいます。録音・再生であればなんら問題はありませんが、放送の場合、1分前にニュースは終わってしまいます。ゆっくりになってもリアルタイムで刻一刻と変わる放送番組への適用は難しいのです。
 ここで、話速変換技術の一番の特徴である「尺(発声時間)を変えずにゆっくり聞こえる」技術の登場です。ミソは、話し始めをゆっくりにし、徐々に話すスピードを早くして、発声時間を見ながらゆっくり・早くを巧みに繰り返す所にあります。もちろん、文と文の間の無音区間もゆっくり感に影響を与えない程度に短くする処理も行います。ゆっくりと早くを繰り返す方法は、一律にゆっくりするより、自然に聞こえることもわかりました。
 この技術は、英語、中国語、フランス語など多くの外国語にも効果があるため、外国語学習や外国人との日常会話にも応用できます。さらには、話速を早くすることで、短時間で発声内容を理解しやすくするなど、時間の有効活用や要約技術への応用など、幅広い応用の可能性が期待されています。
【 話速変換の波形処理 】
【 尺を伸ばさずにゆっくり聞こえるには 】
TOPへもどる