TVやビデオなどのAV機器に搭載されるインターネット電話機能に対応する エコーキャンセラーArtifit Voiceシリーズは、 TV電話の通話時に求められる性能にマッチした ノイズリダクション機能やAGC機能を統合した 音声通話用のモジュールになっています。
TV電話、TVやビデオ機器に搭載されるTV電話機能は、 TVのスピーカーとTVに設置されるマイクやカメラを使い、 Skypeのようなインターネットを介してって通話されるハンズフリー通話の機能が採用されます。 エコーキャンセラー通話モジュールに求められる性質として以下のような特性が必要となります。
TVの電話機能は、家庭用のTV本体付近に設置されたマイクとTVのスピーカーを用いた通話となり、 大きな音量のエコーがスピーカーとマイクの間で発生し、発生したエコーをエコーキャンセラーが抑制します。
話者とマイクの距離はTV試聴時程度の距離となるため、 一般にスピーカー通話で想定される分野の中では比較的離れており、 話者の音声がマイクに入力される音声は、小さくなるケースもあり、 通話音声を良好にするためには、大きな音量となるエコーの除去、環境ノイズの抑制、通話音量の確保など、 エコーキャンセラーと共にノイズ・サプレッサーなどのスピーカー通話のための機能が不可欠です。
ヘッドセットや通話用に配線したマイクとスピーカによって利用される場合もありますが、 TV本体にカメラやマイクを取り付け、 TV本体のスピーカーから相手の音声が流れるような利用方法が主流です。 この状態を通話機器として見るとスピーカ、マイク共に数mの離れた位置で通話する スピーカー通話(ハンズフリー通話)機器ということになります。
ハンズフリーで利用される固定電話のスピーカー通話の場合、電話を操作するため、 このようなTVでの通話より、近い位置で利用される可能性が高く、 電話でのスピーカー通話より人との距離があるため、話者の声が相対的に小さくなります。
一方、スピーカーとマイクは本体についているため、話者よりも近く、 スピーカーの音声は離れた位置にいる人が聴きやすい音量に設定されています。
マイクはビームフォーミングなどによってまわりの環境雑音はできるだけ拾わないように設計されていることが多いでしょうが、 指向性は前方方面に絞っても、前方については人のいる位置をあまり特定できないため、 ある程度広い指向性にして、話者が離れているためマイク感度は高目でしょう。
TVには背面に音声を出力して後ろの壁面からの反射を利用するものまで考えられますが、 前面スピーカーであっても、その指向性は広く、 TVとは別のメーカーのマイクを使用する場合もあるため、 スピーカーからの音をマイクで拾わない機器の組み合わせには期待が持てません。
従って、TVの通話時に発生する、スピーカーからマイクに直接到来する音と 室内で反響してマイクに入るエコー成分を合わせたものが音響エコーの音量レベルは高い状態になります。
TV電話のスピーカーとマイク間で発生した音響エコーは、 受話側のTVに搭載している適応型エコーキャンセラーによってエコーが除去されます。
適応型のエコーキャンセラーは、 スピーカから出力している送話側(相手)の音声が、 受話側空間を伝搬してマイクに到達する特性(伝達関数)を推定し、 マイクから入力された信号からスピーカーから到達している音響成分を抑制する働きをします。
室内の状況やスピーカーとマイクの間に生まれる空間の特性は個々の利用状況によって異なり、 通話時に逐次推定しながら動作しています(適応フィルター)。
音声通話機器は、一般に話者の音量は安定しないため、 通話音声の音量を適性化するためにAGC(Auto Gain Control / 自動利得制御)を搭載しています。 AGCは入力された信号の音量に応じて出力の音量を適正化する働きをしますが、 感度やゲインなどは機器の特性や用途に応じて様々です。
話者の音量やマイクとの距離は逐次変化する可能性があり、 機器で求められる適性音量への制御とその感度はノイズリダクションと併せて難易度がある調整項目です。
音響エコーはエコーキャンセラーによる抑制機能によって克服されますが、 周りの環境雑音、リビングのエアコンなど外部騒音などは適応フィルターでは抑制されません。 音声の通話回線に環境ノイズが含まれていると、声が聴き取りにくいため、 多くの通話機器では、ノイズ・サプレッサーなどによって環境ノイズが低減化されています。
アーティフィット・ボイスのTV用エコーキャンセラーシステムでは エコーキャンセラーと統合連動するノイズ・リダクションを搭載し、 通話時の環境ノイズの低減に対応できるようになっています。
Skypeの評価試験にはTV電話のようなハンズフリーのスピーカー通話の機器に対して条件が厳しい項目が含まれています。
1つは、マイクから4m離れたポイントにおけるエコーの削減効果を評価する項目があります。 TVから4m離れた場所で小さい声の人が話している通話品質を確保しようという基準です。
小さい声の人がやや離れた場所で話している音量を想定した音声レベルの時、 AGC(オートゲインコントロール/自動利得制御)で送話音声の音量を確保しながら、 発生する音響エコーを抑圧し、通話音声品質を確保する必要があります。
送信音声はAGCによってゲインアップされているため、受話側では十分な音量がスピーカーから出力され、 小さな声で話しているにも関わらず音響エコーは大きな音声の時と同様に発生しています。 このエコーを抑制して通話品質を確保することが求められます。
さらに、距離があり小音量の場合に同時に条件が厳しくなる点ですが、 送話音声のS/Nを一定以上確保することが求められます。
元の送話音量が低い状態でAGCによって音量を確保していると、 環境ノイズのレベルも同時にゲインアップされるため、 その音声品質を確保するためにS/N(Sound/Noise比)を確保する条件が厳しくなります。 このためにAGCでゲインを上げている状態でも十分にS/Nが確保できるようなノイズ・サプレッサーが必要になります。
音声通話装置で利用されるノイズ・サプレッサーの機能は色々な手法で実現されていますが、 ノイズ・サプレッサーの効果を強力に働かせると本来の音声の音質が犠牲になりやすく、 環境のノイズが低下する代わりに音声が劣化して二次的に発生するノイズを回避できず、 このような条件下ではS/Nを確保するのが難しくなりやすい部分です。
これらの適応型エコーキャンセラーやノイズ・サプレッサーを単純に組み入れても十分にクリアすることが 難しい条件が含まれるため、廉価で販売されることが多いSkype対応機器では、エコーサプレッサーによって 音響エコーを回線ごと抑圧する方式がとられていることはめずらしくありません。 これにはエコーサプレッサーが簡易な処理で実現できるからという理由もあります。
エコーサプレッサーは、単純にエコーを含む回線の音量を下げる働きのため、 強く効果がかかると(通常は強く使われます)、受話側の音声が送話側では再生されない状態になります。 このため双方が同時に話すダブルトーク時に相手の音声が途切れて聞こえない半二重回線のような動作になります。
アーティフィット・ボイス シリーズは、これらの課題に対して、 適応フィルタのエコーキャンセラーコアやAGCと統合連動する ノイズリダクションブロックによって、音声品質と音量の確保を両立させることができます。
エコーキャンセラー・ソフトウェア製品についてご不明な点などございましたら、 ARI Artifit Voice担当までお気軽にお問い合わせください。 お客様の秘守に関しましては機密保持契約(NDA)を締結させていただいた上でご相談賜ります。