音声通話機器では受話側のスピーカーからマイクに音声が到達したり、 部屋の反響によって音響エコーが送話側に戻ります。
通信回線を廻って戻る音響エコーは遅延時間が長く、 音量が大きいと著しく会話がしにくくなるため、音声通話システムでは、 通常、音響エコーの抑制、除去の目的でエコーキャンセラーやエコーサプレッサーが利用されています。
上の図は、全二重の音声通話システムで送話者が話した時に音響エコーが発生、 伝達する経路を模式化したものです。
送話側で話した音声はマイクに入力され送話信号が通話回線を通して受話側のスピーカーで再生されます。 受話側で再生された音声は受話側の空間を伝搬し受話側のマイクを通して送話側に送信され、 送話側では通信回線を廻った時間と受話側の空間を伝搬した時間が経過した自身の話した声が再生されます。
受話側がスピーカー通話機器のように大きな音声で再生されている場合には、 受話側の部屋で反響した残響音も大きく付加されて送話側に送られます。 これらの受話側のスピーカーからマイクの間で伝搬する音が音声通話機器の音響エコーです。
スピーカーとマイクはハンドセットや携帯電話などの本体に内蔵されているものから、 会議システムなどのように別々に接続される場合まであり、反響の大きさや音の遅延時間、音の伝搬は様々です。
スピーカーやマイクから離れた位置で通話するTVを利用した通話やハンズフリーのスピーカー通話を行う機器は、 スピーカーが大きな音量を出力し、マイクは広い指向性で感度が高めで使用されるため、 音響エコーの音量が大きく反響、残響音も長く聞こえることになります。
会議システムのようにスピーカーの音量が大きくマイク感度が高い状態で利用される機器では、 音響エコーの発生とともに、エコーが双方を廻ってハウリングを起こすようなケースもあります。 会議システムなどには、受信した音量を適正化するAGC(自動利得制御)を持つ場合があり、 音響エコーが大きく残こるとAGCによってエコーの音量を増幅して再生され、 送話側で再度エコーとなって受話側に戻るというフィードバックループが形成されるためです。
音声に対して正帰還が形成されないとこのようなハウリングにはなりませんが、 遅延時間と音声の周波数の条件が適合する可能性があるため、エコーを抑制するしくみが必要になります。
音響エコーは、自分の話した声が大きく遅れて聞こえ、話者が話しにくくなる性質を持ちます。 音声通話機器では会話をしやすくするため、エコーキャンセラーやエコーサプレッサーなどの技術によって音響エコーを抑制しています。
音響エコーのように反響や大きな遅れを持った音声が聞こえるのは話にくいのですが、 自分の話している声が聞こえない場合もまた話にくいため、 接話型のハンドセットや携帯電話、ヘッドセット型の通話機器では、 トークバックによって送話音声を少し受話口に戻して聞こえるようにされています。
離れた位置でスピーカー通話する場合にはトークバックは必要ないのですが、 放送のように話者自身にモニター音としてトークバックされる場合もあります (放送ではあまりスピーカーを通した通話は用いられないので通話機器のトークバックとは主目的が異なりますが)。
トークバックは、ほぼ遅延時間を持たず、意識せずに話しやすい音声レベルに調整されてされています。 一方、同じ送話音声であっても、音響エコーは音量や遅延時間が長いと著しく話にくくなるため抑制する必要があります。
ここまで述べたように、音声通話システムの音響エコーは、会話にとって邪魔な存在であるため、 音響エコーを抑制、キャンセルする技術が使われています。 エコーを抑制する仕組みとしては、 大別すると、エコーサプレッサーと適応型エコーキャンセラーの2種類の方式が利用されています。
エコーサプレッサーとエコーキャンセラーは、 どちらも、音声通話システムで音響エコーを抑制する目的の機能です。
エコーサプレッサーは、送話受話の音量を比較し、 送話音声の音量が大きい時に受話回線の音量を下げることで音響エコーを目立たない音量に抑える仕組みです。
エコーサプレッサーは古くに発明され古い電話器で採用されていました。 交互に話している場合には、あまり問題がありませんが、同時通話時には相手の音声が聞こえなくなるため、 全二重回線に適した技術ではありませんが、 簡易な回路、信号処理で実現可能なため、ディジタルになっても通信機器などで使われています (NLP / Non-Liner Processorと呼ばれている場合もあります)。
エコーキャンセラーは、適応フィルタを用いてエコー以外の音を通過させ、 エコー成分のみを抑制しようとする仕組みです。
電話のような双方向通話(全二重通信)で同時に会話をすると、 エコーサプレッサーの仕組みでは、回線の音量自体を下げるために同時通話に対応できません。
会話は交互に話すだろうと考える方もいらっしゃるかもしれませんが、 相槌や笑い声など、相手の話を遮るような話し方をしなくても、 会話には同時に発声しているケースは普通に存在しています。 相槌や笑い声などのリアクションであっても、そのまま聞こえた方が良いことは言うまでもありません。
最初の音響エコーの発生を表した模式図に適応型エコーキャンセラーを加えると次の図のようになります。
理想的には、エコーキャンセラーが音響エコーのみを完全にキャンセルし、 送信信号には受話側で発生した環境音や音声のみが送信されるように機能する状態ですが、 適応フィルターは、音響エコーを推定によってキャンセルしているため、 現実にはどのような方式であっても推定誤差は存在し、僅かに音響エコーが残ります。
一般にエコーを抑制する性能は、抑制されるレベルをdBの単位でエコーキャンセル量と表現されます。
エコーキャンセラーは受話側の機器に装備されます。 受話側に装備することで、スピーカーやマイクの特性、通話装置の特性に適した回路、信号処理にすることができることや、 エコーキャンセラーの処理の後、環境ノイズを抑制するためのノイズ・サプレッサーの処理を行ったり、 音質補正をするなどの処理に適しているからです。 適応フィルターは非線形ひずみが発生している場合、ひずみ成分は原理的に除去されませんので、 ゲインコントロールによる音量の適正化などの調整もエコーキャンセラーより後段で処理するのが適しています。
アナログ回線の場合は回線路の影響、 ディジタル回線でも音声コーデックによる影響やパケット通信による事情などがない法が音響エコーの除去に適するため、 音響エコーが発生している受話側の機器でエコーが抑制されます。
エコーキャンセラーの仕組みについては「03.エコーキャンセラーのしくみ」に、 同時通話や環境雑音などの影響と性能については「04.外乱とダブルトーク性能」に 詳細がありますので併せてご覧ください。
エコーキャンセラー・ソフトウェア製品についてご不明な点などございましたら、 ARI Artifit Voice担当までお気軽にお問い合わせください。 お客様の秘守に関しましては機密保持契約(NDA)を締結させていただいた上でご相談賜ります。