videocalling
Illustration of AEC(音響エコーキャンセレーション) in video calling

AEC(音響エコーキャンセレーション)

技術

音声ストリームから自分の声のエコーを除去する技術。

音響エコーキャンセレーションとは?

音響エコーキャンセレーション(AEC)は、リアルタイムの音声・ビデオ通信で使用される重要なデジタル信号処理技術です。遅延(エコー)を伴って自分の声が戻ってくるのを防ぐことを目的としています。

エコーは、スピーカーからの音(遠端信号)が同じ部屋のマイクロフォン(近端)に拾われ、元の話者に送り返されるときに発生します。AECがなければ、ユーザーは自分の発話の遅延した繰り返しを聞くことになり、自然な会話がほぼ不可能になります。

AECの仕組み

AECは音響環境(室内インパルス応答)の数学的モデルを作成することで動作します。スピーカーに送信される音声(参照信号)を常に監視し、その音声がマイクロフォンに拾われたときにどのように聞こえるかを予測します。

AECアルゴリズムは、この予測信号を実際のマイクロフォン入力から差し引きます。その結果、リモートユーザーのエコーが除去された、ローカルユーザーの音声のみを含むクリーンな音声ストリームが得られます。

エコーキャンセレーションの課題

  • ダブルトーク: 両者が同時に話す場合が最も困難なシナリオです。AECは近端の音声を歪ませることなく、遠端の音声を素早くフィルタリングする必要があります。
  • レイテンシ: 高いレイテンシ(ネットワーク遅延)は、エコーをより知覚しやすく、不快にさせます。
  • 動的環境: 部屋の中を移動したりデバイスを変更したりすると音響経路が変わり、AECフィルターの迅速な再収束が必要になります。

WebRTCにおけるAEC

最新のブラウザ(Chrome、Firefox、Safari)は、WebRTCスタック(多くの場合GoogleのWebRTC音声処理モジュールに基づく)の一部として、高度に洗練されたAECエンジンを内蔵しています。これにより、Webベースのビデオ通話アプリは、ユーザーにヘッドフォンの装着を要求することなく高品質な音声を提供できます。ただし、エコーに対する最良の物理的防御手段はヘッドフォンです。