JP2012105115A - Echo canceller, echo cancellation program, and telephone apparatus - Google Patents
Echo canceller, echo cancellation program, and telephone apparatus Download PDFInfo
- Publication number
- JP2012105115A JP2012105115A JP2010252518A JP2010252518A JP2012105115A JP 2012105115 A JP2012105115 A JP 2012105115A JP 2010252518 A JP2010252518 A JP 2010252518A JP 2010252518 A JP2010252518 A JP 2010252518A JP 2012105115 A JP2012105115 A JP 2012105115A
- Authority
- JP
- Japan
- Prior art keywords
- echo
- signal
- unit
- state
- far
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 claims description 96
- 230000003321 amplification Effects 0.000 claims description 20
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 20
- 230000000694 effects Effects 0.000 claims description 18
- 239000000203 mixture Substances 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 9
- MATGKVZWFZHCLI-LSDHHAIUSA-N (-)-matairesinol Chemical compound C1=C(O)C(OC)=CC(C[C@@H]2[C@H](C(=O)OC2)CC=2C=C(OC)C(O)=CC=2)=C1 MATGKVZWFZHCLI-LSDHHAIUSA-N 0.000 description 43
- 230000003044 adaptive effect Effects 0.000 description 33
- 230000005540 biological transmission Effects 0.000 description 27
- 238000000034 method Methods 0.000 description 23
- 230000002457 bidirectional effect Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 11
- 230000006854 communication Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 11
- 230000007423 decrease Effects 0.000 description 10
- 230000002238 attenuated effect Effects 0.000 description 9
- 238000002592 echocardiography Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000007175 bidirectional communication Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
Description
この発明は、エコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置に関し、例えば、ハンズフリー機能に対応した電話装置に適用し得る。 The present invention relates to an echo canceller, an echo cancellation program, and a telephone device, and can be applied to, for example, a telephone device that supports a hands-free function.
近年VoIPの普及により、通話料が安価になるとともに通信速度が高速になったことで従来はそれほど一般的ではなかった電話会議装置やテレビ電話装置が急速に普及している。 In recent years, with the spread of VoIP, call charges have become cheaper and communication speeds have become faster, so telephone conference devices and videophone devices, which have not been so common in the past, are rapidly spreading.
このような電話装置が普及するにともない、利用者が増えることで新たな技術的要求が生まれている。従来は、電話会議はあくまでも高価で特殊な利用方法であったから、そのような装置を利用できる利用者の使う装置は利用者の使い勝手を重視し、今日のような一般的な利用者が用いるよりもずっと大規模で高価な会議システムが用いられてきた。 As such telephone devices become widespread, new technical demands are generated as the number of users increases. Conventionally, since teleconference was an expensive and special method of use, devices used by users who can use such devices emphasize the convenience of users, rather than those used by general users like today. However, much larger and more expensive conference systems have been used.
これらの会議システムを高価にしてしまう原因のひとつにハンズフリー機能の実現がある。これは、非特許文献1に記載されるようにスピーカの音がマイクに再入力されてハウリングを発生してしまい、通話が不可能になってしまうのを防止する機能を導入する必要があるからである。
One of the reasons for making these conference systems expensive is the implementation of a hands-free function. This is because, as described in
また、会議電話を行いたい一方で、使い勝手よりもむしろコスト面を重視するような利用者も存在する。例えば、会議場への集合のためのコストを第一優先し、利用者の使い勝手の優先度を下げるような場合があげられる。この場合、上述のような高価な装置を用いない代わりに、ハンズフリーの状態を実現したい利用者が、会議中にずっとヘッドセット付けて会議をおこなっていた。しかし、ヘッドセットは装着すると、違和感のために疲労がつよくでたり、イヤーパッドなど耳に触れる部分のこすれによって皮膚を傷めたりするなど、利用者への相当の負担があった。 There are also users who want to make a conference call but attach importance to cost rather than usability. For example, there is a case where the cost for the meeting place is given first priority and the user's usability is lowered. In this case, instead of using an expensive apparatus as described above, a user who wants to realize a hands-free state has been holding a conference with a headset during the conference. However, wearing a headset puts a considerable burden on the user, such as fatigue due to a sense of incongruity, and damage to the skin caused by rubbing the earpad and other parts that touch the ear.
会議中の利用者は、会議中のメモを取ったり、配布された資料の一部に書き込みを加えるなどの作業をする場合もあり、両手を自由にするハンズフリー機能の必要性は自然かつ必須な機能なのであり、今後もその要求は途絶えることはない。 Users during the meeting may take notes during the meeting or write down some of the distributed materials, so the need for a hands-free function that frees both hands is natural and essential It's a feature, and the demand will never stop.
さらに、近年、働き方の多様性、効率性の観点や、各種災害時における企業の業継続の確保の観点から、職場に通わず在宅や自宅近隣のサテライトオフィスで仕事を行ういわゆるテレワークが普及し始めている。これらテレワークの普及は今後急速に広がることが考えられる。このようなテレワークの場合、会議の主な形式は直接対話よりむしろ通信機を経由した電話会議、テレビ会議がおもになることが十分予想される。 Furthermore, in recent years, so-called telework, which does not go to the workplace and works at satellite offices near homes, has become widespread from the viewpoints of diversity and efficiency of work styles and ensuring business continuity of companies in the event of various disasters. I'm starting. The spread of telework can be expected to spread rapidly in the future. In the case of such telework, it is fully expected that the main form of the conference will be telephone conference and video conference via a communication device rather than direct dialogue.
また、すでに職場同士を映像や音声で常時接続してオフィスの地理的分断感を解消するシステムも利用され始めており、ますます遠隔の利用者同士が自然なコミュニケーションを行いたいという要求が高まることが予想される。しかし、その一方で、たとえば従来技術の延長では、会議中だけヘッドセットを装着すればよかった利用者は、始終ヘッドセットを装着する必要に迫られてしまう。 In addition, systems that always connect offices with video and audio to eliminate the sense of geographical division in the office have begun to be used, and there is an increasing demand for remote users to communicate naturally. is expected. On the other hand, for example, in the extension of the prior art, a user who only needs to wear a headset only during a meeting is required to wear the headset all the time.
上述のような常時接続でハンズフリーの状態を維持するなら、利用者のすべてが常時ヘッドセットの装着を強いられるか、高価な装置の利用を強いられてしまう。このような問題への対策として従来、非特許文献2に記載されるような音声スイッチが用いられてきた。 If a hands-free state is maintained with the above-described constant connection, all users are forced to wear a headset at all times or use an expensive device. Conventionally, a voice switch as described in Non-Patent Document 2 has been used as a countermeasure to such a problem.
非特許文献2に記載された音声スイッチは、送信・受信の各信号線のパワーを比較し、パワーの大きいほうの信号を透過させ、パワーの小さい方の信号を遮断されるものであった。非特許文献2の音声スイッチを用いた方法は比較的安価に装置を作成することができ、現在も広く安価なハンズフリー装置の実現に役立っている。 The voice switch described in Non-Patent Document 2 compares the power of each signal line for transmission and reception, transmits the signal with the higher power, and blocks the signal with the lower power. The method using the voice switch of Non-Patent Document 2 can create a device at a relatively low cost, and is currently useful for realizing a wide and inexpensive hands-free device.
しかしながら、非特許文献2に記載されている音声スイッチの技術では、必然的に片方向通話の切り替えが基本であるから、検出切替えの反応時間までの間、片方の通話は遮断される。通常会話は交互になされるので、通話方向が反転するまでの反転検出切り替えの検出時間までは直前の通話方向が維持されるので、発話の最初の部分の欠損が発生してしまうことが多かった。この欠点を改善するため、特許文献1には送信状態、受信状態のほかにその中間の中間状態という状態を設け、発話の最初及び最後の欠損を軽減しようとする技術が開示されている。
However, the voice switch technology described in Non-Patent Document 2 inevitably involves switching of a one-way call, so that one of the calls is blocked until the detection switching reaction time. Since normal conversations are alternated, the previous call direction is maintained until the detection time of reversal detection switching until the call direction is reversed, so the first part of the utterance is often lost. . In order to remedy this drawback,
しかしながら、この特許文献1の記載技術では、上述の中間状態で、送信経路、受信経路の両方に減衰を加えるものであった。つまり発話の最初及び最後の欠損を軽減する代償として本来透過すべき信号にも減衰を加えるので、通話音声は音量が激しく上下することになり、聞きづらさがともない利用者の疲労感が伴うものであった。
However, in the technique described in
この一方で、音声スイッチの発話の最初の部分が欠損するという欠点を解消できるエコーキャンセラ技術もすでに公知のものである。エコーキャンセラは信号処理プロセッサなどで構成される適応フィルタをもち、受信信号とマイクロホンに再入力されたエコーを用いて計算処理で擬似エコーを作成し、エコーと擬似エコーを相殺してスピーカからマイクロホンに再入力された信号を除去し、ハウリングを除去するものである。 On the other hand, an echo canceller technique that can eliminate the defect that the first part of the speech of the voice switch is lost is already known. The echo canceller has an adaptive filter composed of a signal processor, etc., creates a pseudo echo by calculation processing using the received signal and the echo re-input to the microphone, cancels the echo and the pseudo echo, and transmits from the speaker to the microphone. This removes the re-input signal and removes howling.
しかし、エコーキャンセラは適応フィルタが上記のスピーカからマイクロホンにいたるまでの音響経路(エコーパス)が固定であることを大前提にしている。したがって、従来のエコーキャンセラでは、話者が身じろぎをしたり、移動したりの原因でエコーパスが変化するとエコー打消し性能がひどく劣化し、再学習するまでエコーを消せなくなるなどの欠点があった。さらに、従来のエコーキャンセラでは、エコーと話者の音声が混在すると音声までも劣化させてしまうため、非常に高精度の通話状態判定機能を併せ持つ必要があり、通話状態判定機能によって適応フィルタのフィルタ係数更新を停止するなどの必要があった。 However, the echo canceller presupposes that the acoustic path (echo path) from the adaptive filter to the microphone is fixed. Therefore, the conventional echo canceller has a drawback in that if the echo path is changed due to the speaker's comforting or moving, the echo cancellation performance is severely deteriorated and the echo cannot be erased until re-learning. Furthermore, since the conventional echo canceller mixes echo and the voice of the speaker, even the voice is degraded. Therefore, it is necessary to have a highly accurate call state determination function. There was a need to stop the coefficient update.
さらに、従来のエコーキャンセラは、エコーと受信信号の両方が精度良く入手できて初めて擬似エコーを作成できるので、マイクロホン側(近端側)の背景雑音が大きいときは効果が大きく劣化する問題がある。 Furthermore, since the conventional echo canceller can create a pseudo echo only when both the echo and the received signal can be obtained with high accuracy, there is a problem that the effect is greatly deteriorated when the background noise on the microphone side (near end side) is large. .
上述のような問題を解決する技術として、従来特許文献2〜4の記載技術がある。 As a technique for solving the above problems, there are conventional techniques described in Patent Documents 2 to 4.
特許文献2には、音声スイッチとエコーキャンセラの両方の利点を利用しようという技術が開示されている。 Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for utilizing the advantages of both a voice switch and an echo canceller.
また、特許文献3には、エコーキャンセラと音声スイッチを併用してエコーキャンセラの性能劣化分をエコーキャンセラの出力後段に設けた普声スイッチによって補う技術が開示されている。
さらに、特許文献4には、音声スイッチだけを用いる方法ではあるが、会話音声の性質を利用して音声スイッチの切り替え特性を改良し通話の自然性を確保しようとする技術が開示されている。 Further, Patent Document 4 discloses a technique that uses only the voice switch but improves the switching characteristics of the voice switch by using the nature of the conversational voice to ensure the naturalness of the call.
しかし、特許文献2の方法ではエコーキャンセラからみて、エコー経路上に音声スイッチを設けているのでエコーキャンセラにとってエコー経路が激しく非線形変動することになり、結局、音声スイッチと併用したエコーキャンセラの効果がなくなってしまい、双方向通話を実現するのが困難であった。 However, in the method of Patent Document 2, since the voice switch is provided on the echo path as seen from the echo canceller, the echo path is severely non-linearly changed for the echo canceller. Consequently, the effect of the echo canceller combined with the voice switch is effective. It was difficult to realize a two-way call.
また、特許文献3の記載技術では、ダブルトーク時以外ではエコーキャンセラと音声スイッチが従属接続されている。したがって、特許文献3の記載技術では、前段のエコーキャンセラにおいてエコー経路変動におけるエコー打消し量の劣化と、本当のダブルトーク音声(反対方向であるマイク側の話者音声)による打ち消し量の劣化との区別がつかないため、エコー経路の変化で発生したエコー消し残りパワーはそのままエコーキャンセラ出力パワーとみなされてしまう。結果、特許文献3の記載技術では、エコー経路の変動で発生したエコーはマイク側話者音声と区別なく、なんら抑圧処理を受けずにそのまま遠端側に送信されてしまうという問題があった。この間題点は常時接続通信における音響エコー抑圧やハウリング防止策としては、音響エコー経路が動くことは必ず発生するので通信系の安定に致命的な欠点となってしまうものであった。
In the technique described in
さらに、特許文献4の記載技術では、音声中の切り替えばたつきを軽減することは可能となるが、依然として同時通話が不可能であるという音声スイッチの宿命的な欠点を回避できるものではなかった。 Furthermore, although the technique described in Patent Document 4 can reduce switching flutter during voice, it has not been possible to avoid the fatal drawback of the voice switch that simultaneous calls are still impossible.
そこで、上述のような問題点に鑑みて、電話装置において発生するエコーを安定継続して除去することができるエコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置が望まれている。 Therefore, in view of the above-described problems, an echo canceller, an echo cancellation program, and a telephone device that can stably and continuously remove echoes generated in the telephone device are desired.
第1の本発明は、近端入力信号からエコー成分を除去するエコーキャンセラにおいて、(1) 擬似エコー生成手段により生成した擬似エコーを用いて、上記近端入力信号の上記エコー成分を打消した信号を生成するエコー打消し手段と、(2)上記近端入力信号を減衰器により減衰させた信号を生成する音声スイッチ手段と、(3)上記エコー打消し手段が生成する打消し後信号、又は上記音声スイッチ手段が生成する信号のいずれかを選択して、遠端側へ送出するスイッチ手段と、(4)遠端入力信号と上記近端入力信号とを利用して、遠端話者と近端話者との間の通話状態を判定する通話状態判定手段と、(5)上記通話状態判定手段の判定結果に応じて、上記スイッチ手段を制御するスイッチ制御手段とを有することを特徴とする。 The first aspect of the present invention is an echo canceller for removing an echo component from a near-end input signal. (1) A signal obtained by canceling the echo component of the near-end input signal by using a pseudo echo generated by a pseudo-echo generating means. (2) a voice switch means for generating a signal obtained by attenuating the near-end input signal by an attenuator, and (3) a post-cancellation signal generated by the echo cancellation means, or A switch unit that selects one of the signals generated by the voice switch unit and transmits the signal to the far end side; and (4) a far-end speaker using the far-end input signal and the near-end input signal. A call state determination unit that determines a call state with a near-end speaker, and (5) a switch control unit that controls the switch unit according to a determination result of the call state determination unit. To do.
第2の本発明のエコーキャンセルプログラムは、近端入力信号からエコー成分を除去するエコーキャンセラに搭載されたコンピュータを、(1)擬似エコー生成手段により生成した擬似エコーを用いて、上記近端入力信号の上記エコー成分を打消した信号を生成するエコー打消し手段と、(2)上記近端入力信号を減衰器により減衰させた信号を生成する音声スイッチ手段と、(3)上記エコー打消し手段が生成する打消し後信号、又は上記音声スイッチ手段が生成する信号のいずれかを選択して、遠端側へ送出するスイッチ手段と、(4)遠端入力信号と上記近端入力信号とを利用して、遠端話者と近端話者との間の通話状態を判定する通話状態判定手段と、(5)上記通話状態判定手段の判定結果に応じて、上記スイッチ手段を制御するスイッチ制御手段として機能させることを特徴とする。 The echo cancellation program according to the second aspect of the present invention provides a computer installed in an echo canceller that removes an echo component from a near-end input signal by using (1) a pseudo echo generated by a pseudo-echo generating means, and Echo canceling means for generating a signal obtained by canceling the echo component of the signal; (2) voice switch means for generating a signal obtained by attenuating the near-end input signal by an attenuator; and (3) the echo canceling means. Switch means for selecting one of the post-cancellation signal generated by the voice signal or the signal generated by the voice switch means and sending it to the far end side; and (4) the far end input signal and the near end input signal. A call state determination unit that determines a call state between a far-end speaker and a near-end speaker, and (5) controls the switch unit according to a determination result of the call state determination unit. Characterized in that to function as switch control means.
第3の本発明の電話装置は、第1の本発明のエコーキャンセラを搭載したことを特徴とする。 A telephone device according to a third aspect of the present invention includes the echo canceller according to the first aspect of the present invention.
本発明によれば、電話装置において発生するエコーを安定継続して除去することができる。 According to the present invention, echo generated in the telephone device can be stably and continuously removed.
(A)第1の実施形態
以下、本発明によるエコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置の第1の実施形態を、図面を参照しながら詳述する。
(A) First Embodiment Hereinafter, an echo canceller, an echo cancellation program, and a telephone device according to a first embodiment of the present invention will be described in detail with reference to the drawings.
(A−1)第1の実施形態の構成
図1は、第1の実施形態の電話装置10の全体構成を示すブロック図である。
(A-1) Configuration of the First Embodiment FIG. 1 is a block diagram showing the overall configuration of the
電話装置1は、エコーキャンセラ10、ディジタル・アナログ変換器(以下「D/A」という)20、アナログ・ディジタル変換器(以下、「A/D」という)30、スピーカ40、マイクロホン50を有している。
The
図1では、左側が遠端側、右側が近端側を表している。又、図1においては図示を省略しているが、電話装置1には、電話発信するためのプッシュボタン等、電話装置として必要な他の構成を備えているものとする。また、図1において、電話装置1は、ハンズフリーに対応した電話装置であるものとして説明するが、電話装置1に適用する電話装置の種類は限定されないものである。
In FIG. 1, the left side represents the far end side, and the right side represents the near end side. Although not shown in FIG. 1, the
エコーキャンセラ10は、CPU、ROM、RAM、EEPROM、ハードディスクなどのプログラムの実行構成(1台に限定されず、複数台を分散処理し得るようにしたものであっても良い。)に、実施形態のエコーキャンセルプログラム等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図1のように示すことができる。例えば、電話装置1が、パソコンや携帯電話端末等の情報処理装置上で、いわゆるソフトフォンとして構築されたものである場合には、その情報処理装置に、実施形態のエコーキャンセルプログラム等をインストールすることにより、エコーキャンセラ10を構築するようにしても良い。
The
遠端側から電話装置1が受信した遠端入力信号x(n)は、受信入力端子Rin、受信出力端子Routを介して、D/A変換器20に入力され、D/A変換器20においてアナログ音声信号に変換される。そして、スピーカ40は、D/A変換器20から与えられた電気信号を、音響信号に変換し、近端話者に供する。なお、x(n)における「n」はサンプル順を表わしている。また、以下において、同様に信号を表現する際に用いる「n」も同様にサンプル順を表わすものである。
The far-end input signal x (n) received by the
近端話者が発声することにより、マイクロホン50に音響信号が入力されると、マイクロホン50は、その音響信号を電気信号に変換し、その電気信号は、A/D変換器30に与えられる。そして、A/D変換器30では、マイクロホン50から与えられた電気信号(アナログ信号)が、ディジタル変換され、近端入力信号として、送信入力端子Sinを介して、エコーキャンセラ10に入力される。そして、エコーキャンセラ10では、近端入力信号は、送信入力端子Sinを介してエコーキャンセラ10に入力され、エコーキャンセラ10によりエコー抑制処理が行われたのち送信出力端子Soutを介して、遠端側へ向けて出力される。
When an acoustic signal is input to the
スピーカ40から出力された音響信号は反射されたり、空間を伝播したりする経路(エコー経路)を経由して、近端話者の発声した音声と共にマイクロホン50に入力(混入)されてしまう。
The acoustic signal output from the
マイクロホン50に混入されたエコーは、音響電気変換でアナログ電気信号に変換され、A/D変換器30でディジタル変換されてエコーy(n)となり、エコーキャンセラ10に入力される。エコーキャンセラ10では、近端入力信号に混入されるこのエコーy(n)の成分を、抑制する処理を行う。
The echo mixed in the
次に、エコーキャンセラ10の内部構成について説明する。
Next, the internal configuration of the
エコーキャンセラ10は、加算器101、適応フィルタ(以下、「ADF」ともいう)102、双方向通話検出器(以下、「DTD」ともいう)103、制御部104、遅延器105、遅延器106、減衰器107、及びスイッチ108を有している。
The
加算器101は、後述する処理により、適応フィルタ102で生成された擬似エコーy’(n)と、A/D変換器30から出力される近端入力信号に混入されたエコーy(n)を加算相殺し、エコーy(n)の成分を抑制した信号e(n)を、双方向通話検出器103、遅延部106、及び適応フィルタ102に与える。
The
遅延部106は、加算器101から与えられた信号e(n)を所定時間保持して遅延させてから、スイッチ108に与えるものである。
The
遅延部105は、A/D変換器30から供給された、エコーy(n)が混入された近端入力信号を、所定時間保持して遅延させた信号yd(n)を、減衰器107に与える。
The
減衰器107は、遅延部105から与えられたyd(n)を、所定の減衰量分減衰させた信号att(n)を生成して、スイッチ108に与える。
The
スイッチ108は、遅延部106から与えられる信号、又は、減衰器107から与えられる信号のいずれかを切替えて、遠端側(送信出力端子Sout)に向けて送出するものである。
The
スイッチ108では、端子a1が遅延部106の出力と接続している。また、スイッチ108では、端子b1が、減衰器107の出力と接続している。さらに、スイッチ108では、端子c1が、送信出力端子Soutと接続している。すなわち、スイッチ108では、端子c1に対する接続が、端子a1又は端子b1のいずれかに切り替えられる。スイッチ108は、制御部104によって、上述の切替えを行う。
In the
制御部104は、後述する双方向通話検出器103から与えられる判定結果に応じて、スイッチ108の切替えを制御するものであるが、具体的な制御内容については、後述する動作説明において詳述する。
The
次に適応フィルタ102の詳細について説明する。
Next, details of the
図2は、適応フィルタ102内部の機能的構成について示したブロック図である。
FIG. 2 is a block diagram showing a functional configuration inside the
適応フィルタ102は、擬似エコー作成部201、係数更新量計算部202、及びステップゲイン計算部203を有している。
The
擬似エコー作成部201は、遠端入力信号x(n)及び係数更新量計算部202で求められたフィルタ係数を利用して擬似エコーy’(n)を生成するものであり、擬似エコー作成部201は、保持レジスタ2011、積和演算部2012、及び係数部2013を有している。なお、擬似エコー作成部201の処理については後述する動作説明において詳述する。
The pseudo echo creation unit 201 generates a pseudo echo y ′ (n) using the far-end input signal x (n) and the filter coefficient obtained by the coefficient update
係数更新量計算部202は、擬似エコー作成部201(保持レジスタ2011)からフィードバックされる内容と、ステップゲイン計算部203が求めたステップゲインとを利用して、擬似エコー作成部201に供給するためのフィルタ係数を求める。なお、係数更新量計算部202の処理については後述する動作説明において詳述する。
The coefficient update
ステップゲイン計算部203は、後述する双方向通話検出器103による判定結果と、信号e(n)とを利用して、係数更新量計算部202に供給するステップゲインを求める。なお、擬似エコー作成部201の処理については後述する動作説明において詳述する。
The step
次に、双方向通話検出器103について説明する。
Next, the
双方向通話検出器103は、遠端入力信号x(n)と、加算器101からの信号e(n)を用いて電話装置1における通話状態(遠端話者と近端話者との間の通話状態)を判定し、その判定結果を、適応フィルタ102及び制御部104に供給する。
The two-
双方向通話検出器103は、遠端話者の音声だけがある状態(x(n)だけが有音の状態;以下「遠端シングルトーク状態」又は「ST」という)、遠端話者及び近端話者の両方が話している状態(x(n)及びe(n)が有音の状態;以下「ダブルトーク状態」又は「DT」という)、近端話者だけが話している状態(e(n)だけが有音状態の場合;以下「近端トーク状態」又は、「NT」という)、双方とも話していない状態(x(n)及びe(n)が無音状態の場合;以下「無音状態」又は「IDL」という)のいずれかを検出する。
The two-
また、双方向通話検出器103は、エコー経路の変動があった状態(以下、「エコー経路変動状態」又は「EPC」という)についても検出する。
The two-
双方向通話検出器103による、これらの状態の検出は、例えば、「特開2009−33344号公報」(参考文献1)の記載技術を用いることができるが、これに限定されず、その結果を正しく利用できる方法であれば他の方法を用いてもよいのは当然である。
The detection of these states by the two-
一般に、双方向通話検出器の送信側の入力に加算器の出力を用いると、エコー成分を大まかに除去した上で送信信号(すなわち近端話者信号)の検出が可能になるので、単純に送信経路、受信経路での信号パワーを比較するような通話状態検出方法と比較すると、劇的に通話状態検出の精度が向上することが知られている。これはマイクロホンに入力される信号がエコーも近端話者信号も共に人間の音声であることを考えれば、エコーを区別して除去したうえでの近端信号検出を行うことが有利であるのは自然なことである。 In general, if the output of the adder is used as the input on the transmission side of the two-way call detector, it becomes possible to detect the transmission signal (ie, the near-end speaker signal) after roughly removing the echo component. It is known that the accuracy of call state detection is dramatically improved as compared with a call state detection method in which signal powers in a transmission path and a reception path are compared. Considering that both the echo and the near-end speaker signal are human speech signals, it is advantageous to detect the near-end signal after distinguishing and removing the echo. It is natural.
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の電話装置1におけるエコーキャンセラ10の動作を説明する。
(A-2) Operation of the First Embodiment Next, the operation of the
(A−2−1)適応フィルタ102の動作について
まず、受信側入力端子Rinから入力された遠端入力信号x(n)は、適応フィルタ102の保持レジスタ2011に格納され、以下の(1)式に示すようなデータベクトル(以下、「受信信号ベクトル」ともいう)として扱われる。以下の(1)式において、Lは適応フィルタ102のタップ数である。(ここではではL=1024としたが限定されないものである)。また、以下の(1)式において、tは行列の転置を表している。以下の(1)式は、現在の時刻nを開始時点とし、過去のLサンプルまでを保持した受信信号x(n)データの集まりが、式(1)の受信信号ベクトルを構成していることを表している。
(A-2-1) Operation of
X(n)=[x(n)、x(n−1)、…、x(n−L+1)]t …(1)
一方、係数部2013には、係数更新量計算部202から供給されたフィルタ係数(L個の係数値により構成されている)のデータが格納されている。フィルタ係数を構成する係数値は後述するように、例えば、NLMS(Normalized Least Mean Square)アルゴリズムを用いて係数更新量計算部202で時々刻々と更新される。係数部2013のL個の係数値も、上記(1)式のように1つの係数ベクトルとして扱われ、以下の(2)式のように示される。
X (n) = [x (n), x (n−1),..., X (n−L + 1)] t (1)
On the other hand, the
H(n)=[h(0)、h(1),…、h(L−1)]t …(2)
上記(2)式でも、Lはフィルタのタップ数である。積和演算部2012では、係数部2013の係数ベクトルと、保持レジスタ2011のデータベクトルを用い、以下の(3)式のようにベクトルの積y’(n)を計算するが、このy’(n)が、擬似エコーのサンプルデータとなる。なお、y’(n)は1つの値を持つスカラー値データである。
H (n) = [h (0), h (1),..., H (L−1)] t (2)
In the above equation (2), L is the number of filter taps. The product-
y’(n)=Ht(n)×(n) …(3)
上述のように作成された擬似エコーy’(n)は、加算器101に供給される。加算器101では、上述したようにスピーカ40からマイクロホン50を経由しディジタル変換されたエコーy(n)が入力されている。
y ′ (n) = H t (n) × (n) (3)
The pseudo echo y ′ (n) created as described above is supplied to the
そして、加算器101は、以下の(4)式のように信号を加算相殺した残差信号e(n)を、送信出力端子Soutに出力する。
Then, the
e(n)=y(n)−y’(n) …(4)
そして、e(n)は、送信出力端子Soutを介して、遠端側へ向けて送出される。
e (n) = y (n) −y ′ (n) (4)
Then, e (n) is sent out toward the far end via the transmission output terminal Sout.
一方、加算器101の出力であるe(n)は、ステップゲイン計算部203を経由して係数更新量計算部202に供給される。そして、更新量計算部202では、e(n)と、保持レジスタ2011から出力される信号x(n)とを用いて、例えば、以下の(5)式のような公知のNLMSアルゴリズムにより、適応フィルタ102のフィルタ系数が更新される。
上記(5)式は、サンプルe(n)、x(n)から、次回の擬似エコー作成に用いるための適応フィルタ102係数ベクトルが作成されることを示している。ここでαはステップゲインであり、0≦α≦2の定数である。αが大きいときは収束時間は短いが、定常的なエコー消去性能は劣る。αが小さいと定常的なエコー消去性能は大きいが収束時間は長くなる。
The above equation (5) indicates that an
ただし、ステップゲイン計算部203に対して、双方向通話検出器103から、遠端シングルトーク状態(ST)、エコー経路変動状態(EPC)以外の信号が入力されたときは、ステップゲイン計算部203は、α=0として係数更新量計算部202に出力し、係数の更新を停止する。
However, when a signal other than the far-end single talk state (ST) and the echo path fluctuation state (EPC) is input from the
ここでは、係数更新量計算部202において、α=0の場合係数更新を停止するようにしたが、他にもスイッチを設けてe(n)を遮断して係数更新を停止するようにしてもよく、係数更新停止の方法はα=0とすることに限定されない。
Here, in the coefficient update
上述のように作成した係数ベクトル(フィルタ係数)は、係数更新量計算部202から係数部2013に出力され、入力ベクトルX(n)とともに上記の(3)式による擬似エコーの作成に用いられる。
The coefficient vector (filter coefficient) created as described above is output from the coefficient update
時刻が進むとともに上記(5)式の計算が何回か実行されて係数更新が進行すると、上記(4)式により求められるe(n)は、徐々に小さくなる。やがて十分にe(n)が小さくなると、上記(5)式の係数更新での係数更新は、ほとんど発生しなくなる。適応フィルタ102の収束後は、以後継続的に加算器101で精度よくエコーを打ち消すことが可能になる。
As the time advances, the calculation of the above equation (5) is executed several times and the coefficient update proceeds, and e (n) obtained by the above equation (4) gradually decreases. When e (n) becomes sufficiently small in the future, the coefficient update in the coefficient update of the above equation (5) hardly occurs. After the convergence of the
ここでは、適応フィルタ102の係数更新アルゴリズムに上述のようなNLMSアルゴリズムを用いたが、エコー推定アルゴリズムはエコーを推定できればどのようなアルゴリズムでもよくとくにNLMSに限定されないのは当然である。
Here, the NLMS algorithm as described above is used as the coefficient update algorithm of the
(A−2−2)双方向通話検出器103の動作について
双方向通話検出器103は、上述の通り、遠端からの音声信号x(n)と、加算器101からの信号e(n)を用いて、電話装置1について、遠端シングルトーク状態(ST)、ダブルトーク状態(DT)、近端トーク状態(NT)、無音状態(IDL)、エコー経路変動状態(EPC)を検出する。
(A-2-2) Operation of
そして、第1の実施形態では、双方向通話検出器103による、遠端シングルトーク状態(ST)の検出がとくに重要である。第1の実施形態では、人間の会話が主に交互におこなわれることに着目し、従来とは異なり、適応フィルタ102と加算器101で構成される擬似エコーを用いてエコーを打消す構成(以下、「エコーキャンセラ部」ともいう)と、遅延部105と減衰器107で構成される近端入力信号を減衰させる構成(以下、「音声スイッチ」ともいう)を従属接続するのではなく、両者を並列に接続している。
In the first embodiment, detection of the far-end single talk state (ST) by the two-
これにより、第1の実施形態では、遠端シングルトーク状態(ST)の場合には、エコーの除去に主に音声スイッチ部を利用して強力にエコーを減衰してハウリングを防止している。一方、双方向通話が必要な一瞬(ダブルトーク状態(DT)の場合)など、エコーキャンセラ部を用いて双方向性を確保する。このようにすると、音響信号の循環経路にエコーキャンセラ部が介在する時間を非常に短くできるので、たとえエコーキャンセラ部が多少不安定な動作に陥ったとしてもそのままエコーが通話経路を無限に巡回し始めてハウリングに成長するのを防止することができるのである。 As a result, in the first embodiment, in the far-end single talk state (ST), howling is prevented by strongly attenuating the echo mainly using the voice switch part for the removal of the echo. On the other hand, bidirectionality is ensured by using an echo canceller, such as for a moment when a two-way call is necessary (in the case of a double talk state (DT)). In this way, the time for the echo canceller to intervene in the circulation path of the acoustic signal can be very short, so even if the echo canceller falls into a somewhat unstable operation, the echo circulates indefinitely along the call path. You can prevent it from growing for the first time.
(A−2−3)制御部104、スイッチ108、及び減衰器107の動作について
次に、制御部104、スイッチ108、及び減衰器107の動作について説明する。
(A-2-3) Operations of
双方向通話検出器103は、電話装置1の通話状態の検出結果を、制御部104に供給する。
The two-
制御部104は、双方向通話検出器103から遠端シングルトーク状態(ST)が与えられたときは、スイッチ108に対して、端子c1を端子b1の側に接続をさせるように制御信号を与える。
When the far-end single talk state (ST) is given from the two-
第1の実施形態では、制御部104は、遠端シングルトーク状態(ST)以外の場合、スイッチ108に対して、端子c1を端子a1の側に接続するように制御信号を出力する。特に、制御部104は、遠端シングルトーク状態(ST)が終了した時点では、必ずスイッチ108に対して、端子c1を端子a1の側に接続するように制御するものとする。
In the first embodiment, the
ただし、例えば、近端側の背景ノイズが無い環境などの場合、制御部104によるスイッチ108の制御処理は、これに限定しない。このような場合、制御部104は、例えば、無音状態(IDL)、エコー経路変動状態(EPC)のときにも、スイッチ108に対して、端子c1を端子b1の側に接続させるようにしても良い。なぜなら、無音状態(IDL)のときに、減衰器107を挿入しても通話行為自体は無害であるし、エコー経路変動状態(EPC)のときには適応フィルタ102の追従劣化で、適応フィルタ102の打ち消し効果よりも減衰器107によるエコー抑圧が好ましい場合があるからである。
However, for example, in an environment where there is no near-end background noise, the control processing of the
ただし、上述したように、遠端シングルトーク状態(ST)の時に、制御部104は、スイッチ108に対して、必ず端子c1を端子b1の側に接続させることが望ましい。またスイッチ108の初期状態としては、端子c1が端子a1の側に接続されていることが望ましい。
However, as described above, in the far-end single talk state (ST), it is desirable that the
すでに述べたように遅延部105には、信号y(n)が供給されていて、遅延部105で、双方向通話検出器103の状態判定に必要な時間と同じ量の遅延を加えてyd(n)とし、減衰器107に供給する。
As already described, the
減衰器107ではハウリング防止に必要な減衰を加え信号att(n)としてスイッチ108の端子b1に出力する。
The
ここでは、減衰器107の減衰量を10dBとするが、これに限定されない。ただしハウリングの防止効果を得るために、少なくともエコー経路の利得を相殺する程度の減衰を設定することが望ましい。
Here, the attenuation amount of the
上述したように、特に、制御部104は遠端シングルトーク状態(ST)が終了したときにはかならず端子をa1に接続するようにスイッチ108を制御する。
As described above, in particular, the
ここで、遅延部106について述べておくと、遅延部106は、近端側から見て、エコーキャンセラ部の出力(加算器101)の後段に設けることが望ましい。また、遅延部105は、近端側から見て、減衰器107の前段に設けることが望ましい。
Here, the
遅延部106を、エコーキャンセラ部の出力(加算器101)の後段、すなわち、双方向通話検出器103の入力点の後段に設けるのは、双方向通話検出器103の判定を遅らせないためである。また、遅延部105を減衰器107の前段に設けるのは、先行した双方向通話検出器103の判定結果に応じて、通話状態を反映して信号に減衰を加えるためである。
The reason why the
(A−2−4)エコーキャンセラ10全体の動作について
ここまで詳細に説明してきたように、エコー及びハウリングを抑制するのを目的としたエコーキャンセラ10は、人同士の会話において、基本的に音声のやり取りが交互に行われることに着目したものである。
(A-2-4) Overall Operation of the
従来のエコーキャンセラでは、単純に物理的に信号のパワーを検出し、基本的に信号の存在はどちらにでも均等に発生することを前提としている。そのため、従来のエコーキャンセラでは、誤検出を承知の上であっても、検出精度を非常な高感度に設定する必要があったり、または送信受信側のどちらの通話状態でもない中立の状態を設定し、中立状態の次に発生する音声の発生を常時待ち構えるかわりに、この中立状態では双方向通話の音声の減衰してハウリングを防止する代わりに音質を犠牲にするものであった。 In the conventional echo canceller, it is assumed that the signal power is simply detected physically, and basically the presence of the signal occurs evenly in either case. For this reason, the conventional echo canceller needs to set the detection accuracy to a very high sensitivity even if it is aware of the erroneous detection, or sets a neutral state that is neither the call state on the transmission / reception side. However, instead of always waiting for the voice to be generated next to the neutral state, in this neutral state, the voice of the two-way call is attenuated and the sound quality is sacrificed instead of preventing howling.
これに対し、第1の実施形態のエコーキャンセラ10では、上述のように、人の会話は言葉のやり取りが交互に行われることが多いという基本的な人の会話の性質に着目し、これを利用しており、遠端からの信号だけがあった状態(ST)の後には、近端の話者がそれに応答する状態(NT)になるであろうことを、スイッチ108動作に反映し、これを交互に繰りかえすのである。
On the other hand, in the
すなわち、遠端シングルトーク状態(ST)の後は、近端話者が遠端話者の言葉に応じるであろうから、遠端シングルトーク状態(ST)の後は必ず、制御部104は、スイッチ108の端子c1を端子をa1の側に接続させ、近端話者の音声が発生しても音切れのないエコーキャンセラ部側の信号e(n)を選択するように処理する。もし、このとき仮定に反して、もう一度継続して遠端話者が話し、遠端シングルトーク状態(ST)になったとしても、多少なりともエコーキャンセラ(加算器101及び適応フィルタ102)によるエコー打消しが、加算器101で行われるので問題は発生しない。
That is, after the far-end single talk state (ST), the near-end speaker will respond to the words of the far-end talker. The terminal c1 of the
一方で想定するように、電話装置1で近端トーク状態(NT)が発生しても、スイッチ108では、エコーキャンセラ部側の信号e(n)が選択(遠端側へ送信)されるので問題はない。さらに、一瞬会話衝突であるダブルトーク状態(DT)が発生しても、どのみち双方向通話検出器103から制御部104に、ダブルトーク状態(DT)が入力され、スイッチ108では、端子c1を端子a1の側に接続するように制御される。
On the other hand, as expected, even if the near-end talk state (NT) occurs in the
そのため、双方向通話信号のうち、遠端からの音声(遠端入力信号)は透過され、近端話者の音声信号(送話信号)として、エコーキャンセラ部側の信号(信号e(n))が選択される。そして、適応フィルタ102のフィルタ係数は、上述したようにダブルトーク状態(DT)の時には、凍結(更新停止)されるため、加算器101でエコーが軽減された信号が、遠端側に送信される。これにより、エコーキャンセラ10では、遠端側へ送信する音声信号の音質はさほど劣化させないようにすることができる。
Therefore, the voice from the far end (far-end input signal) is transmitted among the two-way call signals, and the signal (signal e (n)) on the echo canceller side is used as the voice signal (transmission signal) of the near-end speaker. ) Is selected. Since the filter coefficient of the
(A−3)第1の実施形態の効果
(A−3−1)エコーキャンセラ10において、双方向通話検出器103で、遠端シングルトーク状態(ST)が検出された場合には、スイッチ108を制御して、音声スイッチ部(遅延部105及び、減衰器107)からの信号att(n)を遠端側に出力する。一方、双方向通話検出器103で、遠端シングルトーク状態(ST)以外の状態が検出された場合には、スイッチ108を制御して、エコーキャンセラ部(加算器101、適応フィルタ102)からの信号e(n)を遠端側に送信する。
(A-3) Effect of First Embodiment (A-3-1) In the
特に、エコーキャンセラ10では、遠端シングルトーク状態(ST)が終了した時点では必ずスイッチ108の端子c1を端子a1に接続するようにした。これにより、人同士の会話の交互のやり取りにおいて、遠端シングルトーク状態(ST)の時には、確実に通話経路に減衰が挿入されてエコー感を防止するとともに、仮に成長中の準ハウリング信号成分があっても、これを遠端シングルトーク状態(ST)のたびに減衰できる。そして、そのほかの通話状態、たとえば近端トーク状態(NT)では、エコーキャンセラ部(加算器101)の出力を選択するので発話の最初及び最後の途切れを防止し、安定継続的にエコーを除去することができる。
In particular, in the
また、エコーキャンセラ10では、通話の最中に一瞬発生するダブルトーク状態(DT)のときにも、送話状態では適応フィルタ102側の打ち消し加算器101の出力を選択するので発話の最初及び最後の途切れや、極端な音量の上下がなく安定的で自然な通話が可能となる。
The
(A−3−2)エコーキャンセラ10で重要なのは、シングルトーク状態(ST)でのエコー除去の主体を、音声スイッチ部(遅延部105及び減衰器107)にして、エコーy(n)に、一定量の減衰が確実に加わるようにすることである。なぜなら、通話を不可能にするハウリングは、通話経路のレベル配分設定が悪いときに発生する現象である。具体的には、この減少は、非特許文献1に記載されているように、音響信号の一巡経路の利得が1.0以上であるときに発生する。しかし、実際には、通信経路の巡回利得が1.0をはじめから大きく上回ることは、さほど多くはない。このようなときハウリングは、いきなり発生するのではなく、信号が何回も巡回した結果として、最終的にハウリングにいたることが多いのである。エコーキャンセラはエコー経路の変動などがあると、エコー打消し性能の劣化があったり、シングルトーク状態のときでも背景ノイズレベルまでがエコー打ち消しの限界であることが制約となり、巡回するエコーの成分を1.0以下に押さえ込めないことがある。
(A-3-2) What is important in the
しかし、第1の実施形態のエコーキャンセラ10では、少なくとも遠端シングルトーク状態(ST)の検出中では、必ず強制的に通信経路上に減衰器107の効果を取り入れる時間が発生する。つまり、徐々に成長するハウリング原因信号、いわば「準ハウリング信号」を、遠端シングルトーク状態(ST)、のたびに成長前の状態に引き戻すことができ、ハウリングの発生頻度を下げることができる。
However, in the
(B)第2の実施形態
以下、本発明によるエコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置の第2の実施形態を、図面を参照しながら詳述する。
(B) Second Embodiment Hereinafter, an echo canceller, an echo cancellation program, and a telephone device according to a second embodiment of the present invention will be described in detail with reference to the drawings.
(B−1)第2の実施形態の構成
図3は、第2の実施形態の電話装置1Aの全体構成を示すブロック図であり、上述した図1との同一、対応部分には同一、対応符号を付して示している。
(B-1) Configuration of the Second Embodiment FIG. 3 is a block diagram showing the overall configuration of the telephone device 1A of the second embodiment, which is the same as FIG. A reference numeral is attached.
以下、第2の実施形態について、第1の実施形態との差異を説明する。 Hereinafter, the difference between the second embodiment and the first embodiment will be described.
電話装置1Aでは、エコーキャンセラ10が、エコーキャンセラ10Aに置き換わっている点で第1の実施形態と異なっている。また、エコーキャンセラ10Aは、減衰量計算部109、エコーロス推定部(以下、「ELE」ともいう)110、及び減衰器111が追加されている点で、第1の実施形態とは異なっている。また、双方向通話検出器103による通話状態の判定結果が、エコーロス推定部110にも供給されている。
The telephone device 1A is different from the first embodiment in that the
なお、減衰量計算部109、エコーロス推定部110、及び減衰器111の詳細については、後述する動作説明において説明する。
Note that details of the
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の電話装置1Aにおけるエコーキャンセラ10Aの動作を説明する。
(B-2) Operation | movement of 2nd Embodiment Next, operation | movement of 10 A of echo cancellers in 1 A of telephone apparatuses of 2nd Embodiment which has the above structures is demonstrated.
(B−2−1)エコーロス推定部110(ELE)の動作について
エコーロス推定部110には遠端入力信号x(n)と、A/D変換器30からのエコーy(n)の成分を含む近端入力信号が供給されている。エコーロス推定部110は、以下に説明する方法でエコーロス、すなわち信号が受信出力端子Routから送信入力端子Sinにいたるエコーパスを経由したときのエコー経路減衰量(あるいは増幅量)を計算する。
(B-2-1) Operation of Echo Loss Estimator 110 (ELE) The
エコーロス推定部110は、双方向通話検出器103から遠端シングルトーク状態(ST)の判定結果が供給されているときだけ、以下のように動作する。エコーロス推定部110は、双方向通話検出器103から、その他の判定結果を入力されたときには何もしないので、ない場合と同じ状態となる
エコーロス推定部110は、双方向通話検出器103から遠端シングルトーク状態(ST)の判定結果が入力されているとき、以下の(6)式のように遠端入力信号x(n)のパワー平滑値P_av(n)を計算する。双方向通話検出器103から遠端シングルトーク状態(ST)の判定結果が入力されているときに、以下の(6)式を用いて計算することは、最もエコー経路の信号増減を正確に計算する上で望ましい。なお、以下の(6)式において、δpavは平滑の度合いを決定する0<δpav<1.0の定数である。
The echo
P_av(n)=δpav×x(n)2
+(1.0−δpav)×P_av(n) …(6)
また、エコーロス推定部110は、以下の(7)式のように、エコーy(n)のパワー平滑値EC_av(n)を計算する。
P_av (n) = δpav × x (n) 2
+ (1.0−δpav) × P_av (n) (6)
Further, the echo
EC_av(n)=δpav×y(n)2
+(1.0−δpav)×EC_av(n) …(7)
上記(7)式において、δpavが大きければ信号の急な変化に対応するが、ノイズの影響を受けやすくなり、逆に小さければ信号の大まかな変化に対応し、ノイズの影響を受けにくくなる。ここでは、δpav=0.01を用いるものとするが、この値に限定されないものである。
EC_av (n) = δpav × y (n) 2
+ (1.0−δpav) × EC_av (n) (7)
In the above equation (7), if δpav is large, it corresponds to a sudden change in the signal, but it is easily affected by noise, and conversely, if it is small, it corresponds to a rough change in the signal and is hardly affected by noise. Here, δpav = 0.01 is used, but it is not limited to this value.
エコーロス推定部110は、所定期間T_ELE(例えば、10秒の期間)で、P_av(n)、EC_av(n)のそれぞれの最大値P_MAX(k)、EC_MAX(k)を求める。なお、T_ELEに適用する期間の長さは限定されないものである。なお、この場合、kは10秒ごとの順番を表す整数であるものとする。
The echo
図4は、P_MAX(k)、EC_MAX(k)の例について示した説明図である。 FIG. 4 is an explanatory diagram showing examples of P_MAX (k) and EC_MAX (k).
上述したように、エコーロス推定部110では、上記(6)式でスピーカ40から出力される遠端入力信号x(n)のパワー推移、すなわちP_av(n)が計算される。そして、ここでは、P_av(n)をグラフで示すと、図4(a)のようになったものとする。そして、エコーロス推定部110では、T_ELEの期間内でのP_av(n)の最大値P_MAX(k)が求められる。
As described above, the echo
本来エコーy(n)は、スピーカ40から出力された遠端入力信号x(n)が、エコー経路を介して、マイクロホン50に戻ってしまい、再び観測される信号である。したがって、エコー経路に背景ノイズがなければ、エコーy(n)は、スピーカ40から放射されて空間伝播でパワーが降下し、マイクロホン50に入力される信号である。つまり、EC_av(n)の値は、図4(a)に示すように、通常はP_av(n)が幾分小さくなった値となる。
Originally, the echo y (n) is a signal that the far-end input signal x (n) output from the
すなわち、エコーロス推定部110で求めたいエコー経路の減衰は、単純に、以下の(8)式で求められるP_av(n)とEC_av(n)との差分diff_EL(n)、又は、以下の(9)式で求められるP_av(n)とEC_av(n)との比ratio_EL(n)で表すことができる。
That is, the echo path attenuation desired by the echo
diff_EL(n)=P_av(n)−EC_av(n) …(8)
ratio_EL(n)=P_av(n)/EC_av(n) …(9)
しかし、現実において、エコー経路は、近端話者側の電話装置1Aのスピーカ40やマイクロホン50が置かれる実環境であるから、背景ノイズが皆無ということはほとんど無い。そこで、背景ノイズとして、図4(b)のように、時間軸ではパワーが一様な背景ノイズ(黒塗りで表わされた成分;以下「BGN」ともいう)がある場合を考える。すると、図4(a)で示したEC_av(n)と背景ノイズBGN、エコーロスの推定値ELE_EST(k)の関係は図4(c)のようになる。つまり、図4(c)からわかるように、遠端入力信号x(n)のパワーが小さい部分はそれに応じてエコーy(n)のパワーも小さくなるから、エコーy(n)は、場合によって背景ノイズBGNのパワーより小さくなり、背景ノイズBGNに埋もれてしまうことになる。
diff_EL (n) = P_av (n) −EC_av (n) (8)
ratio_EL (n) = P_av (n) / EC_av (n) (9)
However, in reality, since the echo path is a real environment where the
このような場合、単純に上記(8)式、上記(9)式を計算しても、実際にはEC_av(n)を観測すべきところ、パワーが打ち勝った背景ノイズBGNのパワーを計算してしまうため、真のエコー経路のロスを求めることができないことになる。 In such a case, even if the above formulas (8) and (9) are simply calculated, the EC_av (n) should actually be observed, but the power of the background noise BGN that has overcome the power is calculated. Therefore, the loss of the true echo path cannot be obtained.
そこで、エコーロス推定部110では、後述するように、エコーロス推定値ELE_EST(k)を求め、ハウリング防止を担う2つの減衰器107、111の動作に反映させる。
Therefore, as will be described later, the echo
エコーロス推定部110は、上記(7)式に示すEC_av(n)の所定期間T_BG(例えば、T_ELEと同じ10秒間)の最小値としてBGN’(k)を計算する。kは、上記(7)式と同様に期間区切りの順番(フレーム)を表す整数である。なお、ここでは、BGN’(k)を求める際の期間を10秒としたが、これに限定されない。
The echo
なお、初期状態から(例えば、エコーキャンセラ10で、信号処理を開始してから)10秒間が経過していないうちは所定の初期値を用いるようにしても良い。ここでは、上述の初期値として−45dBm0(0dBm0は国際規格ITU−TG.711の0dBm0基準信号を用いるようにしても良い)を設定したものとして説明するが、これに限定されない。また、BGN’(k)として、初期状態から、現時点までの期間内での最小値を用いるようにしてもよい。 Note that a predetermined initial value may be used as long as 10 seconds have not elapsed from the initial state (for example, after signal processing is started by the echo canceller 10). Here, description will be made assuming that −45 dBm0 (0 dBm0 may use the 0 dBm0 reference signal of the international standard ITU-TG.711) as the initial value described above, but is not limited thereto. Further, as BGN '(k), the minimum value within the period from the initial state to the present time may be used.
図4(d)では、EC_av(n)とBGN’(k)関係の例について示している。また、図4(e)では、図4(d)のグラフにさらにP_av(n)を重ねて表示した例について示している。 FIG. 4D shows an example of the relationship between EC_av (n) and BGN ′ (k). FIG. 4 (e) shows an example in which P_av (n) is further superimposed on the graph of FIG. 4 (d).
図4(d)では、エコー成分を表わすEC_av(n)の多くの部分が、背景ノイズBGNの成分に埋もれてしまい、BGN’(k)がBGNのレベルと一致する様子を示している。つまり、図4(d)では、EC_av(n)が本当のエコーのレベルを表せるのは、レベルとしてはBGN’(k)を超えた部分だけとなっている。 FIG. 4D shows a state in which many parts of EC_av (n) representing the echo component are buried in the background noise BGN component, and BGN '(k) matches the BGN level. That is, in FIG. 4D, EC_av (n) can represent the true echo level only in the portion exceeding BGN '(k).
なかでも、最も確からしく浮き出したエコーロスを推定することが出来そうなのは、図4(e)において、スピーカ40出力側の信号(遠端入力信号x(n))のピーク値を示す付近、すなわちP_MAX(k)を示す点と、EC_MAX(k)との差分をあらわす部分であるのがわかる。このことは、スピーカ40から放射された音声信号(遠端入力信号x(n))の包絡線の最大部分が、エコーy(n)としても最大部分となることを考え合わせれば自然なことである。 Among them, the echo loss that is most likely to be estimated is likely to be estimated in the vicinity of the peak value of the signal on the output side of the speaker 40 (far-end input signal x (n)), that is, P_MAX in FIG. It can be seen that this is a portion representing the difference between the point indicating (k) and EC_MAX (k). This is natural considering that the maximum portion of the envelope of the audio signal radiated from the speaker 40 (far-end input signal x (n)) becomes the maximum portion even as the echo y (n). is there.
上述のように、電話装置1Aを、例えば、ハンズフリー通話装置に適用した場合、当該ハンズフリー通話装置が置かれた音環境においては、ハウリングの発生有無は、エコーロスが増幅系かどうかに左右される。この場合、当該ハンズフリー通話装置において、そのエコーロスを推定計算するためには、当該ハンズフリー通話装置の設置された音環境において、背景ノイズBGNのパワーと、エコーのパワーとの関係が重要である。 As described above, when the telephone device 1A is applied to, for example, a hands-free call device, in a sound environment where the hands-free call device is placed, whether or not howling occurs depends on whether echo loss is an amplification system. The In this case, in order to estimate and calculate the echo loss in the hands-free call device, the relationship between the power of the background noise BGN and the power of the echo is important in the sound environment where the hands-free call device is installed. .
基本的にはエコーロスは、スピーカ40から出力する信号に係るレベルP_av(n)(最大値はP_MAX(k))と、エコー経路を経由してマイクロホン50に入力されるエコーに係るレベルEC_av(n)(最大値はEC_MAX(k))がわかれば計算が可能である。
Basically, the echo loss includes the level P_av (n) (the maximum value is P_MAX (k)) related to the signal output from the
ただし、実際にはエコーレベルと紛らわしい背景ノイズBGN’(k)のレベル(パワーと言い換えても同じである)の影響を考慮する必要がある。エコーロス推定部110は、P_MAX(k)、EC_MAX(k)、BGN’(k)の大小関係を比較して、検出した音環境の状態に係る判定を行い、その判定結果等を、後述する減衰量計算部109に与える。
However, in practice, it is necessary to consider the influence of the level of the background noise BGN ′ (k) that is confusing with the echo level (the same is true for power). The echo
図5、図6は、エコーロス推定部110による、音環境に係る判定動作について示した説明図である。
FIGS. 5 and 6 are explanatory diagrams showing the determination operation related to the sound environment by the echo
図5、図6では、縦軸はパワーの大きさ、横軸は、エコーロス推定部110で用いる音環境状態の状態種別と状態番号(以下、「EP_STAT」ともいう)を表している。
5 and 6, the vertical axis represents the power magnitude, and the horizontal axis represents the state type and state number (hereinafter also referred to as “EP_STAT”) of the sound environment state used in the echo
エコーロス推定部110では、音環境状態を、状態1(EP_STAT:1、状態種別:良好状態)、状態2(EP_STAT:2、状態種別:ノイズ状態)、状態3(EP_STAT:3、状態種別:不適状態)、状態4(EP_STAT:4、状態種別:増幅状態)のいずれかと判定する。以下、状態1〜状態4のそれぞれについて説明する。
In the echo
[状態1(状態種別:良好状態、状態番号(EP_STAT):1)の場合]
エコーロス推定部110は、スピーカ40から放射される信号に係るパワー最大値P_MAX(k)と、エコーに係るパワー最大値EC_MAX(k)、推定背景ノイズパワーBGN’(k)が順に小さくなっている場合に、音環境状態を、状態1(良好状態)と判定する。なお、状態1(良好状態)における、P_MAX(k)、EC_MAX(k)、BGN’(k)の関係は、図5(a)に図示されている。すなわち、状態1(良好状態)は、スピーカ出力信号よりも、エコーが小さく、さらにその下に背景ノイズがある状態といえる。
[In the case of state 1 (state type: good state, state number (EP_STAT): 1)]
In the echo
このとき、以下の(10)式に示すように、P_MAX(k)とEC_MAX(k)の差diff_POW(k)は、エコー経路の減衰の量を正確に表している。そして、このdiff_POW(k)は、以下の(10)式に示すように、エコーロスAECHO(k)を正しく表している。 At this time, as shown in the following equation (10), the difference diff_POW (k) between P_MAX (k) and EC_MAX (k) accurately represents the amount of attenuation of the echo path. The diff_POW (k) correctly represents the echo loss AECHO (k) as shown in the following equation (10).
AECHO(k)=diff_POW(k)
=P_MAX(k)−EC_MAX(k) [dB] …(10)
また、上記(10)式では、P_MAX(k)とEC_MAX(k)の差分を用いてdiff_POW(k)を求めたが、以下の(10)’式に示すように、線形比で求めるようにしても良い。以下の(10)’式を用いてとしても、上記(10)式と意味するところは同じである。ここでは、説明を簡易にするため、AECHO(k)は、上記(10)式のような差分の表現で説明するが、これに限定されないのは当然である。
AECHO (k) = diff_POW (k)
= P_MAX (k) -EC_MAX (k) [dB] (10)
In the above equation (10), diff_POW (k) is obtained by using the difference between P_MAX (k) and EC_MAX (k). However, as shown in the following equation (10) ′, it is obtained by a linear ratio. May be. Even if the following expression (10) ′ is used, the same meaning as the above expression (10) is the same. Here, in order to simplify the description, AECHO (k) will be described using a differential expression such as the above equation (10), but it is natural that the present invention is not limited to this.
AECHO(k)=diff_POW(k)
=EC_MAX(k)/P_MAX(k) …(10)’
すなわち、状態1(良好状態)のとき、エコー経路を通過する事で、スピーカ40から放射された音信号は、減衰を受けることを示している。上述の通り、このようなエコー経路の系構成では、エコーは通信経路循環で発散に向かうことはないから、エコーが成長してハウリングは発生しない。
AECHO (k) = diff_POW (k)
= EC_MAX (k) / P_MAX (k) (10) '
That is, in the state 1 (good state), the sound signal radiated from the
そして、エコーロス推定部110は、状態1(良好状態)を検出すると、状態1(良好状態)を表すEP_STAT=1とdiff_POW(k)を減衰量計算部109に与える。
Then, when detecting the state 1 (good state), the echo
[状態2(状態種別:ノイズ状態、状態番号(EP_STAT):2)の場合]
推定背景ノイズパワーBGN’(k)が、エコーに係るパワー最大値EC_MAX(k)を上回る強さの場合、エコーロス推定部110は、音環境状態を状態2(ノイズ状態)と判定する。なお、状態2(ノイズ状態)における、P_MAX(k)、EC_MAX(k)、BGN’(k)の関係は、図5(b)に図示されている。状態2(ノイズ状態)の場合、EC_MAX(k)はBGN’(k)に埋もれてしまい、本当のエコーロスは背景ノイズのために観測が不可能な状態である。
[In the case of state 2 (state type: noise state, state number (EP_STAT): 2)]
When the estimated background noise power BGN ′ (k) has a strength exceeding the power maximum value EC_MAX (k) related to the echo, the echo
しかし、その一方で、状態2(ノイズ状態)の場合には、P_MAX(k)に比較してEC_MAX(k)が相当小さいという事実を反映しており、たまたま真のAECHO(k)が計算できないに過ぎず、やはりハウリングが発生しない安全な状態である。 On the other hand, however, in the case of state 2 (noise state), it reflects the fact that EC_MAX (k) is considerably smaller than P_MAX (k), and it is impossible to calculate true AECHO (k) by chance. This is a safe state where no howling occurs.
状態2(ノイズ状態)の場合、BGN’(k)の意味合いとしては、EC_av(n)の最小値を追尾したものであるから、EC_MAX(k)とBGN’(k)が同じように見えてしまっており、実際にはEC_MAX(k)=BGN’(k)となっている。したがって、状態2(ノイズ状態)の場合に、上記(10)式を計算することは、実際にはP_MAX(k)−BGN’(k)を求めるのと同じであるが、エコーロス値としては減衰方向の値が計算される。 In the case of state 2 (noise state), the meaning of BGN ′ (k) is the result of tracking the minimum value of EC_av (n), so EC_MAX (k) and BGN ′ (k) look the same. Actually, EC_MAX (k) = BGN ′ (k). Therefore, in the case of state 2 (noise state), calculating the above equation (10) is actually the same as obtaining P_MAX (k) −BGN ′ (k), but the echo loss value is attenuated. A direction value is calculated.
エコーロス推定部110は、状態2(ノイズ状態)を検出すると、状態2(ノイズ状態)を表すEP_STAT=2と、diff_POW(k)を減衰量計算部109に与える。
When detecting the state 2 (noise state), the echo
[状態3(状態種別:不適状態、状態番号(EP_STAT):3)の場合]
状態2(ノイズ状態)から、さらに推定背景ノイズパワーBGN’(k)が増加し、P_MAX(k)を超えると、エコーロス推定部110は、音環境状態を状態3(不適状態)と判定する。なお、状態3(不適状態)における、P_MAX(k)、EC_MAX(k)、BGN’(k)の関係は、図5(c)に図示されている。
[In the case of state 3 (state type: inappropriate state, state number (EP_STAT): 3)]
When the estimated background noise power BGN ′ (k) further increases from state 2 (noise state) and exceeds P_MAX (k), the echo
状態3(不適状態)では、P_MAX(k)よりもマイクロホン50に入力されるBGN’(k)のほうが大きいことを意味している。状態3(不適状態)は、言い換えれば、近端話者の置かれた状態としては、周囲の強力な背景ノイズの中でスピーカ40から放射された相手音声を懸命に聞き取るような状態のはずである。したがって、電話装置1Aにおける通話手段として、ハンズフリー通話の利用は、本来不適な状態であるといえる。当然このような状態ではもはや正しいAECHO(k)の推定は不可能である。
In state 3 (unsuitable state), it means that BGN ′ (k) input to the
エコーロス推定部110は、状態3(不適状態)の場合であっても、上記(10)式を用いて、AECHO(k)を求める計算は行うが、エコーと背景ノイズの関係は、状態2(ノイズ状態)と同様である。
The echo
そして、エコーロス推定部110は、状態3(不適状態)を検出すると、状態3(不適状態)を表すEP_STAT=3とdiff_POW(k)を減衰量計算部109に与える。ただし、状態3(不適状態)の場合、diff_POW(k)は減衰の量ではなく、むしろ増幅の量を表す値として計算される。すなわち、状態3(不適状態)の状態では、ハウリングが発生する危険度が高いといえる。
Then, when detecting the state 3 (unsuitable state), the echo
[状態4(状態種別:増幅状態、状態番号(EP_STAT):4)の場合]
エコーロス推定部110は、スピーカ40から放射される信号に係るパワー最大値P_MAX(k)より、エコーに係るパワー最大値EC_MAX(k)が大きい場合、すなわち、スピーカ40から放射された信号のパワーが、エコー経路で増幅している場合に、音環境状態を、状態4(増幅状態)と判定する。
[In the case of state 4 (state type: amplification state, state number (EP_STAT): 4)]
The echo
通常、空気伝播の結果で自然に音のパワーが増加することはない。このような場合の多くではマイクロホン50からエコーロス推定部110に至るエコー経路のどこかに、設計者の意図しない人工的な増幅機能が混入しているのがほとんどである。この状態を放置した場合、電話装置1Aにおいて、音声信号が巡回しつつパワー上昇をつづけ、確実にハウリングを発生する。すなわち、状態4では、電話装置1Aにおいて、ハウリングが発生する危険度が極めて高い。
Usually, the sound power does not increase naturally as a result of air propagation. In many cases, an artificial amplification function not intended by the designer is mixed in somewhere in the echo path from the
なお、図6(a)では、BGN’(k)がP_MAX(k)よりも小さい場合を「状態4」と図示し、図6(b)では、BGN’(k)がP_MAX(k)よりも大きい場合を「状態4’」と図示している。しかし、EC_MAX(k)の方が、P_MAX(k)より大きい状態においては、その区別はあまり重要でないので、以下では、上述の「状態4」及び「状態4’」を、まとめて「状態4」として説明する。 In FIG. 6A, the case where BGN ′ (k) is smaller than P_MAX (k) is illustrated as “state 4”, and in FIG. 6B, BGN ′ (k) is derived from P_MAX (k). Is also shown as “state 4 ′”. However, in the state where EC_MAX (k) is larger than P_MAX (k), the distinction is not so important. Therefore, hereinafter, “state 4” and “state 4 ′” are collectively referred to as “state 4”. ".
そして、エコーロス推定部110は、状態4(増幅状態)を検出すると、状態4(増幅状態)を表すEP_STAT=4と、diff_POW(k)を減衰量計算部109に与える。
Then, when detecting the state 4 (amplification state), the echo
(B−2−2)減衰量計算部109の動作について
減衰量計算部109は、エコーロス推定部110から与えられる音環境状態の状態番号EP_STATに応じて、減衰器107、111に設定する減衰量を決定する。
(B-2-2) Operation of attenuation
以下、与えられるEP_STATの値ごとに、減衰量計算部109の動作を説明する。
Hereinafter, the operation of the attenuation
[状態1(良好状態)、又は、状態2(ノイズ状態)の場合]
まず、エコーロス推定部110から与えられた判定結果が、EP_STAT=1(状態1、良好状態)、又は、EP_STAT=2(状態2、ノイズ状態)の場合の、減衰量計算部109の動作について説明する。上述の通り、状態1又は状態2の場合には、電話装置1Aにおいてハウリングが発生する危険度は少ない。
[In the case of state 1 (good state) or state 2 (noise state)]
First, the operation of the
状態1又は状態2の場合、減衰量計算部109は、エコー感(近端話者にとってエコーによる違和感を感知する程度)の軽減のために、減衰器107に第1の実施形態で適用した減衰量と同様の減衰量を通知する。そして、減衰器107は減衰量計算部109から通知された減衰量の減衰を、信号yd(n)に与えてatt(n)を出力する。
In the case of the
また、状態1又は状態2の場合、減衰量計算部109は、減衰器111には何も通知しないようにしても良いし、減衰を行わない旨を示す値(例えば、gain=0等)を通知するようにしても良い。このとき減衰器111は、エコーy(n)を含む近端話者信号を、透過する(減衰を行わないようにする)。
Further, in the case of the
[状態3(不適状態)の場合]
次に、エコーロス推定部110から与えられた判定結果が、EP_STAT=3(状態3、不適状態)の場合の、減衰量計算部109の動作について説明する。
[In case of state 3 (unsuitable state)]
Next, the operation of the attenuation
上述の通り、電話装置1Aを、ハンズフリー通話機器に適用した場合、状態3(不適状態)は、利用が不適な状態である。すなわち、状態3(不適状態)の場合には、近端側の背景ノイズのために、遠端話者と近端話者の音声によるやり取りが困難になっている可能性が大きい。さらに、上述の通り、エコーロス推定部110において計算されたdiff_POW(k)は、AECHO(k)を表しているとは限らない。
As described above, when the telephone device 1A is applied to a hands-free calling device, the state 3 (unsuitable state) is a state in which use is inappropriate. That is, in the case of the state 3 (unsuitable state), there is a high possibility that the voice communication between the far-end speaker and the near-end speaker is difficult due to background noise on the near-end side. Furthermore, as described above, diff_POW (k) calculated by the echo
状態3(不適状態)の場合には、上述の状態4’においてEC_MAX(k)=BGN’(k)となった特殊な場合と考えることもできる。すなわち、状態3(不適状態)の場合の減衰量計算部109の動作は、状態4(増幅状態)の時の動作に順ずる。状態4(増幅状態)の時の減衰量計算部109の動作については後述する。
The state 3 (unsuitable state) can be considered as a special case where EC_MAX (k) = BGN '(k) in the state 4' described above. That is, the operation of the attenuation
[状態4(増幅状態)の場合]
次に、エコーロス推定部110から与えられた判定結果が、EP_STAT=4(状態4、増幅状態)の場合の、減衰量計算部109の動作について説明する。
[In case of state 4 (amplification state)]
Next, the operation of the attenuation
上述の通り、電話装置1Aをハンズフリー通話機器に適用した場合、状態4(増幅状態)は、ハウリングが発生する危険度が極めて高い状態である。 As described above, when the telephone device 1A is applied to a hands-free calling device, the state 4 (amplified state) is a state in which the risk of occurrence of howling is extremely high.
状態4(増幅状態)の場合、減衰量計算部109は、減衰器107に第1の実施形態と同様の減衰量を通知する。また、状態4(増幅状態)の場合、減衰量計算部109は、減衰器111に対しては、減衰器107に通知した増幅(減衰)を打ち消す減衰量を通知する。上述したように、状態4(増幅状態)の場合、diff_POW(k)の値は実際には減衰の量ではなく、差分計算の順序のために、増幅の量を表す値となっている。しがたって、減衰量計算部109は、diff_POW(k)の正負を反転して、gain=−diff_POW(k)と変換し、減衰器111に通知する。さらに、減衰量計算部109は、減衰器111の減衰のマージンとして、δatt20(たとえば、6dB)の減衰量を追加した減衰量を、減衰器111に通知するようにしても良い。なお、このマージンの減衰量δatt20は6dBに限定されないものである。
In the state 4 (amplification state), the
状態4(増幅状態)の場合、上述のように減衰量計算部109及びエコーロス推定部110を動作させると、減衰器111の減衰で、BGN’(k)のパワーは少なくともP_MAX(k)−δatt20(上述のマージンの減衰量)以下のレベルまで下がり、受信出力端子Routから、加算器101にいたるまでのエコー経路は必ず減衰経路となる。
In the state 4 (amplification state), when the
また、減衰量計算部109から減衰器111に通知する減衰量に、上述のマージンの減衰量δatt20(6dB)を加えることにより、一層送信方向の信号(近端入力信号)のレベルを、P_MAX(k)以下に限定できる。これにより、適応フィルタ102が収束するまでの間、双方向通話検出器103がエコーy(n)と送信話者信号を、誤判定するのを防止することができる。
Further, by adding the above-mentioned margin attenuation amount δatt20 (6 dB) to the attenuation amount notified from the attenuation
すなわち、エコーキャンセラ10Aでは、遠端側で、極端な信号の増幅帰還がない限り、ハウリングの発生を防止できる。 That is, in the echo canceller 10A, occurrence of howling can be prevented unless there is an extreme signal amplification feedback on the far end side.
さらに、エコーキャンセラ10Aでは、第1の実施形態と同様に、スイッチ108で、音声スイッチ部側(遅延部105及び減衰器107)の経路を選択されたときの動作で、エコーy(n)が、減衰器107で減衰される。したがって、予めエコー経路の様子を知ることができない場合であっても、ハウリングの発生をより確実に防止する事ができる。
Further, in the echo canceller 10A, as in the first embodiment, the echo y (n) is generated when the
(B−3)第2の実施形態の効果
第2の実施形態によれば、以下のような効果を奏することができる。
(B-3) Effects of Second Embodiment According to the second embodiment, the following effects can be achieved.
エコーキャンセラ10Aでは、エコーロス推定部110で、スピーカ40を経由して出力される受信信号の最大パワー値P_MAX(k)と、エコーの最大パワー値EC_MAX(k)と、マイクロホン50側の背景ノイズの推定値BGN’(k)とを計算している。
In the echo canceller 10A, the echo
そして、エコーロス推定部110では、エコー経路における信号の増減や背景ノイズといった周囲環境に応じて、減衰器111でマイクロホン50の出力(近端入力信号)を減衰するようにしている。これにより、エコーキャンセラ10Aでは、予め知ることができないエコー経路の中に増幅の要素があったときにも、特段の熟練設計者の設定を必要とせずに、エコーの増幅分を自動的に減衰器111で相殺してハウリングを防止することができる。
The echo
(C)第3の実施形態
以下、本発明によるエコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置の第3の実施形態を、図面を参照しながら詳述する。
(C) Third Embodiment Hereinafter, an echo canceller, an echo cancellation program, and a telephone device according to a third embodiment of the present invention will be described in detail with reference to the drawings.
第1、第2の実施形態のエコーキャンセラ10、10Aでは、上述の通り、人同士の会話のやり取りが、基本的にはフレーズが交互にやり取りされることで会話が成り立っていることに着目し、遠端からの信号があるとき(遠端入力信号x(n)が有音状態の場合)には、遠端側の音声(遠端入力信号x(n))を劣化させないように、受信側の経路の信号を透過してスピーカ40に出力し、送信側(近端から遠端への方向の信号送信)では、音声スイッチ部により、減衰を挿入する経路を選択することで、ハウリングを確実に防止している。そして、第1、第2の実施形態のエコーキャンセラ10、10Aでは、遠端からの信号が終了(遠端入力信号x(n)の有音状態が終了)すると同時に、自動的に送信側経路として、一旦減衰なしの経路(音声スイッチ部を経由しない経路)を選択することで、近端話者が発話しても発話の最初及び最後の欠損がおこらないようにしている。
In the
そして、第1、第2の実施形態のエコーキャンセラ10、10Aでは、一瞬発生する双方向通信状態(ダブルトーク状態(DT))、又は、送信状態(近端トーク状態(NT))においてのみ、エコーキャンセラ部(適応フィルタ及び加算器)の出力(信号e(n))を選択して遠端側へ送信している。これにより、第1、第2の実施形態のエコーキャンセラ10、10Aでは、エコー経路減衰の確保よりも、発話の最初及び最後の欠損防止を優先させている。
And in the
これは、音声スイッチ部特有の、近端話者の音声が強力な減衰を受けたり、減衰の程度が激変することで遠端話者が聞き取りにくくなって会話が破綻することを防止するものである。 This is unique to the voice switch section and prevents the voice of the near-end speaker from being strongly attenuated, or the degree of attenuation drastically changing, making it difficult for the far-end speaker to hear and disrupting the conversation. is there.
そこで、第3の実施形態では、さらに通話品質を向上するため、音声スイッチ部の利用頻度をやや下げ、よりエコーキャンセラ部の出力を利用する機会を多くして、通話品質を向上する構成となっている。 Therefore, in the third embodiment, in order to further improve the call quality, the frequency of use of the voice switch unit is slightly lowered, the opportunity to use the output of the echo canceller unit is increased, and the call quality is improved. ing.
(C−1)第3の実施形態の構成
図7は、第3の実施形態の電話装置1Bの全体構成を示すブロック図であり、上述した図3との同一、対応部分には同一、対応符号を付して示している。
(C-1) Configuration of the Third Embodiment FIG. 7 is a block diagram showing the overall configuration of the telephone device 1B of the third embodiment, which is the same as FIG. A reference numeral is attached.
以下、第3の実施形態について、第2の実施形態との差異を説明する。 Hereinafter, the difference between the third embodiment and the second embodiment will be described.
電話装置1Bでは、エコーキャンセラ10Aが、エコーキャンセラ10Bに置き換わっている点で第2の実施形態と異なっている。 The telephone device 1B is different from the second embodiment in that an echo canceller 10A is replaced with an echo canceller 10B.
また、エコーキャンセラ10Bでは、エコー減衰量計算部(以下、「ACOM」ともいう)112、ハウリング危険度判定部(以下、「HWM判定部」ともいう)113、及びエコーキャンセラ効果判定部(以下、「EC判定部」ともいう)114が追加されている点で、第2の実施形態と異なっている。また、エコーキャンセラ10Bでは、制御部104、スイッチ108、及びエコーロス推定部110が、制御部104B、スイッチ108B、及びエコーロス推定部110Bに置き換わっている点で、第2の実施形態と異なっている。
In the echo canceller 10B, an echo attenuation amount calculation unit (hereinafter also referred to as “ACOM”) 112, a howling risk determination unit (hereinafter also referred to as “HWM determination unit”) 113, and an echo canceller effect determination unit (hereinafter, referred to as “AWM”). The second embodiment is different from the second embodiment in that an “EC determination unit” 114 is added. The echo canceller 10B is different from the second embodiment in that the
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の電話装置1Bにおけるエコーキャンセラ10Bの動作について、第2の実施形態との差異を説明する。
(C-2) Operation of the Third Embodiment Next, the difference between the operation of the echo canceller 10B in the telephone device 1B of the third embodiment having the above configuration and the second embodiment will be described. .
まず、エコーロス推定部110Bの動作について、第2の実施形態との差異を説明する。 First, the difference between the operation of the echo loss estimation unit 110B and the second embodiment will be described.
エコーロス推定部110Bの動作は、第2の実施形態とほぼ同様であるが、推定した背景ノイズ推定値BGN’(k)をEC判定部114にも与える点が異なっている。
The operation of the echo loss estimation unit 110B is substantially the same as that of the second embodiment, except that the estimated background noise estimated value BGN '(k) is also given to the
次に、EC判定部114の動作について説明する。
Next, the operation of the
EC判定部114には、加算器101から信号e(n)が供給されている。そして、EC判定部114は、後述するように、エコーキャンセラ部の性能が、背景ノイズに応じた適正値まで性能を発揮しているか否かを判定して、良好状態であると判定したときにはHWM判定部113に対し、性能良好を示すエコーキャンセル成功信号convを出力し、それ以外のときにはなにも出力しない。
The
EC判定部114は、エコーロス推定部110Bからの背景ノイズ推定値BGN’(k)のほかに、加算器101から信号e(n)が供給されている。EC判定部114では、第2の実施形態でのエコーロス推定部110と同様に、e(n)について、双方向通話検出器103からの通話状態判定結果が、遠端シングルトーク状態(ST)の時だけ、BGN’(k)と同期間(例えば上述のT_ELEと同期間)で、以下の(11)式のように、e(n)の平滑値Err_av(n)を計算する。そして、EC判定部114は、さらにその所定期間T_ELEでの、Err_av(n)の最大値ERR_MAX(k)を計算する。以下の(11)式において、n、kおよび、δpavの意味合いは第2の実施形態と同じである。
The
Err_av(n)=δpav×e(n)2
+(1.0−δpav)×Err_av(n) …(11)
そして、EC判定部114は、計算したERR_MAX(k)と、エコーロス推定部110Bから与えられたBGN’(k)を、以下の(12)式のように比較する。ここでは、以下の(12)式において、δec_m=2dBと設定するものとして説明するが、δec_mの値はこれに限定されない。
Err_av (n) = δpav × e (n) 2
+ (1.0−δpav) × Err_av (n) (11)
Then, the
ERR_MAX(k)≦BGN’(k)+δec_m …(12)
次に、上記(12)式の意味について説明する。
ERR_MAX (k) ≦ BGN ′ (k) + δec_m (12)
Next, the meaning of the above equation (12) will be described.
一般に適応フィルタと加算器を用いたエコーキャンセラ部のエコー除去性能は、エコーと同時にマイクロホンに入力した背景ノイズパワー(レベル)までが限界となることが公知である。通常エコーキャンセラ部は、精度よくエコー打消しができるようになるためには、第1の実施形態で説明したように、適応フィルタのフィルタ係数の更新を繰りかえす必要があり、最初のうちは上記(12)式のような関係は成立しない。したがって、双方向通話検出器103からの状態検出が、遠端シングルトーク状態(ST)の時に、上記(12)式が成立するということは、適応フィルタ102の係数更新が進行し、加算器101の出力パワーが、背景ノイズパワーBGN’(k)近くまで小さくなったということであり、δec_mは効果確認のマージン閾値であると把握できる。
It is known that the echo cancellation performance of an echo canceller using an adaptive filter and an adder is generally limited to the background noise power (level) input to the microphone simultaneously with the echo. In order for the normal echo canceller to be able to cancel the echo with high accuracy, it is necessary to repeat the update of the filter coefficient of the adaptive filter as described in the first embodiment. The relationship as in equation 12) does not hold. Therefore, when the state detection from the two-
したがって、EC判定部114は、上記(12)式を満足したとき、HWM判定部113に対して、エコーキャンセル成功信号convを供給し、それ以外はなにも供給しない。
Therefore, the
次に、ACOM112の動作について説明する。
Next, the operation of the
ACOM112には、受信入力端子Rinからの遠端入力信号x(n)と、加算器101の出力信号e(n)が供給されている。そして、ACOM112は、エコーロス推定部110と同様に、上記(6)式によりP_av(n)を求め、求めたP_av(n)における期間T_ELEの最大値P_MAX(k)を求める。さらに、ACOM112は、上述のEC判定部114と同様に、信号e(n)の平滑値Err_av(n)を上記(11)式で求め、さらに、求めたErr_av(n)における所定期間T_ELEの最大値ERR_MAX(k)を求める。
The
なお、ACOM112では、上述の通り、上記(6)式、及び、上記(11)式を計算しているが、ERR_MAX(k)、P_MAX(k)を計算する構成(処理)を、EC判定部114、ELE23と共通にして、計算結果だけをEC判定部114、ELE23から取得するようにしてもよい。
As described above, the
そして、ACOM112は、エコー総合減衰量ACOM_E(k)を、以下の(13)式のように計算して、HWM判定部113に与える。
Then, the
ACOM_E(k)=P_MAX(k)
−ERR_MAX(k)[dB] …(13)
次に、HWM判定部113の動作について説明する。
ACOM_E (k) = P_MAX (k)
-ERR_MAX (k) [dB] (13)
Next, the operation of the
HWM判定部113は、ACOM112から与えられたACOM_E(k)と、閾値δacomを比較する。ここでは、δacomは、6dBとして説明するが、これに限定されないものである。
The
そして、HWM判定部113は、ACOM_E(k)≧δacomを満たし、かつ、EC判定部114からの信号convが供給されている間、ハウリング危険度小信号NO_HW(ハウリングの危険度が小さいことを示している信号)を、制御部104Bに供給する。一方、HWM判定部113は、それ以外のときは、制御部104Bに対して何も出力しない。
Then, the
制御部104Bは、HWM判定部113から、NO_HWが与えられているとき、スイッチ108Bに対して、端子c1を端子a1側に接続させる制御を行う。
When NO_HW is given from the
制御部104BはHWM判定部113からNO_HWが与えられているときは、双方向通話検出器103から遠端シングルトーク状態(ST)の通知がされても、HWM判定部113からの信号を優先し、スイッチ108Bの状態をそのまま(端子c1を端子a1の側に接続させたままの状態)にする。制御部104Bは、それ以外の状態では、スイッチ108Bに対して、第1の実施形態と同様の制御を行う。
When NO_HW is given from the
(C−3)第3の実施形態の効果
第3の実施形態によれば、以下のような効果を奏することができる。
(C-3) Effects of Third Embodiment According to the third embodiment, the following effects can be achieved.
以上説明したように、第3の実施形態では、ACOM112、HWM判定部113、及びEC判定部114を設けて、スイッチ108Bを制御し、エコーキャンセラ部側の出力(加算器101の出力)を用いる機会を増やすようにした。以下、第3の実施形態の効果の詳細について説明する。
As described above, in the third embodiment, the
第1、第2の実施形態では双方向通話検出器103の状態検出の結果、遠端話者だけが話す遠端シングルトーク状態(ST)になると、スイッチ部により必ず遠端側へ送信する信号に減衰が入り、逆に遠端話者が話し終わると、減衰がなくなる(エコーキャンセラ部の出力を遠端側へ送信する)構成であった。第1、第2の実施形態では確かにハウリングを防止でき、ダブルトーク状態(DT)でも、発話の最初及び最後の欠損を防止することができる。
In the first and second embodiments, when the far-end single talk state (ST) in which only the far-end speaker speaks as a result of the state detection of the two-
しかしその一方で、第3の実施形態の遠端話者からしてみれば、場合によっては、以下に説明するように、耳障りな現象を起こすことがある。すなわち、遠端話者にとっては、自分が話すタイミングに一致して近端側の背景ノイズがひどく増減するように聞こえる場合があるのである。この現象は会話中に気づくと、遠端側の利用者によっては、大きな違和感を訴える場合がある。 On the other hand, however, from the viewpoint of the far-end speaker of the third embodiment, an unpleasant phenomenon may be caused in some cases as described below. That is, the far-end speaker may sound that the background noise on the near-end side increases or decreases significantly in accordance with the timing when he / she speaks. When this phenomenon is noticed during a conversation, some users at the far end may complain of great discomfort.
第3の実施形態では、そのことに鑑みたものであり、エコーキャンセラ部側の性能が十分発揮できてハウリングを防止できるときは、エコー除去の主体をエコーキャンセラ部に担わせ、そうでないときは、第1、第2の実施形態と同様に、スイッチ部の強力な減衰器に、エコー除去の主体を担わせるようになっている。 In the third embodiment, in view of that, when the performance of the echo canceller unit side can be sufficiently exhibited and howling can be prevented, the echo canceller unit is responsible for echo cancellation, and otherwise As in the first and second embodiments, the strong attenuator of the switch unit is made to play the main role in echo cancellation.
つまり、EC判定部114では、背景ノイズのレベルまで、エコーキャンセラ部によるエコー打消しが成功しているかどうかを検出することにより、遠端話者が受け取るエコーを少なくできているかどうかを主に検出している。一方で、ACOM112とHWM判定部113で、エコーキャンセラの打消しの結果、ハウリングを起こさない状態を確保できているかどうかを主に検出するようにしている。
That is, the
例えば、電話装置1Bの立ち上げ時において、エコーキャンセラ部の適応フィルタ102では、フィルタ係数が成長(収束)していない。この場合、エコーキャンセラ部は、ハウリングに対して効果を発揮できないが、適応フィルタ102の係数が成長(収束)すれば、むしろ音声スイッチ部よりも聴感が自然なままエコー除去とハウリング防止を行えるようになる。第3の実施形態では、そのような状態を自動検出し、音声スイッチ部よりもエコーキャンセラ部の使用が好ましい場合は、自動的にエコーキャンセラ部の出力を選択し、装置の内部状態が許す限り、送信信号レベルの急変がない自然な音声を遠端話者への通話信号として供することができる。
For example, when the telephone device 1B is started up, the filter coefficient does not grow (converge) in the
(D)第4の実施形態
以下、本発明によるエコーキャンセラ及びエコーキャンセルプログラム、並びに電話装置の第4の実施形態を、図面を参照しながら詳述する。
(D) Fourth Embodiment Hereinafter, an echo canceller, an echo cancellation program, and a telephone device according to a fourth embodiment of the present invention will be described in detail with reference to the drawings.
第1〜第3の実施形態のエコーキャンセラ10、10A、10Bでは、主に近端側のエコー経路で発生するエコーが、遠端側に送信する信号に漏れこんでいくのを防止するのと同時に、エコーが遠端側に送信する信号に漏れこんで、遠端側と近端側を巡回しながら成長して発生するハウリングを防止するものであった。
In the
ここまで述べてきたように、一般的には、音声スイッチ部(遅延部及び減衰器によりエコーを抑制する構成)とエコーキャンセラ部(適応フィルタにより生成した擬似エコーを用いて加算部によりエコーを打ち消す構成)は、共にエコー信号を抑圧する目的で用いられる技術である。しかし実際には、エコー対策としては、エコーキャンセラ部のほうが音声スイッチ部よりも好まれることが多い。エコーキャンセラ部は、マイクロホンに漏れこんでくるエコーを、高度なアルゴリズムで計算によって求め、擬似エコーを作成し、加算器で反転相殺するので、通話状態の判定(例えば、双方向通話検出器103のような判定処理)がうまくいく場合は、エコーだけをうまく除去できて通話品質がよい。これに対して、音声スイッチ部は、送信または受信の信号線上に設けられた減衰器の減衰を挿抜して信号の音量を変化させる。すなわち、音声スイッチ部は、本発明でいう遠端シングルトーク状態(ST)のときに、送信信号線上の減衰器に大きな減衰を入れてエコー感をなくすものである。 As described so far, generally, an audio switch unit (a configuration in which echo is suppressed by a delay unit and an attenuator) and an echo canceller unit (a pseudo echo generated by an adaptive filter is used to cancel the echo by an adder unit) Configuration) is a technique used for the purpose of suppressing echo signals. However, in practice, the echo canceller is often preferred over the voice switch as an echo countermeasure. The echo canceller unit calculates the echo leaking into the microphone by calculation with an advanced algorithm, creates a pseudo echo, and reverses and cancels it with an adder. If such a determination process is successful, only the echo can be removed well and the call quality is good. On the other hand, the voice switch unit inserts and removes attenuation of an attenuator provided on the transmission or reception signal line to change the volume of the signal. That is, the voice switch unit eliminates the feeling of echo by adding a large attenuation to the attenuator on the transmission signal line in the far-end single talk state (ST) referred to in the present invention.
しかし、音声スイッチ部は、原理的に単純に信号線上に減衰を加えるのであるから、仮に通話状態の判定処理(例えば、双方向通話検出器103のような判定処理)でどれほど精密に遠端シングルトーク状態(ST)状態の検出に成功しても、音声スイッチ部の処理では、エコー以外の信号(近端側の背景ノイズ等)も一緒に減衰してしまう。 However, since the voice switch section simply attenuates the signal line in principle, it is assumed that how far the far end single is accurately determined by a call state determination process (for example, a determination process such as the bidirectional call detector 103). Even if the talk state (ST) state is successfully detected, signals other than echoes (such as background noise on the near end side) are also attenuated together in the processing of the voice switch unit.
さらに、第1〜第3の実施形態で説明した、エコーキャンセラ部と音声スイッチ部の切り替えにおいても、近端側の背景ノイズの状態によっては、音声スイッチ部の出力(減衰器からの出力)を、エコーキャンセラ部側の出力に切り替えるとき、加えた減衰切り替えのために、遠端側に送信する信号においては、背景ノイズの成分の大きさが急変するという現象が発生する場合がある。 Furthermore, also in the switching between the echo canceller unit and the voice switch unit described in the first to third embodiments, the output of the voice switch unit (output from the attenuator) depends on the state of background noise on the near end side. When switching to the output on the echo canceller side, a phenomenon that the magnitude of the background noise component suddenly changes may occur in the signal transmitted to the far end due to the added attenuation switching.
この現象は、遠端話者にとってみれば実に不自然なことであり、遠端話者自身が話すたびに、相手側の背景ノイズが急に断続するように聞こえる。これにより、遠端話者は、常時不自然な違和感を持ちながら、近端話者と通話することを強いられてしまう。 This phenomenon is very unnatural for the far-end speaker, and every time the far-end speaker speaks, the other party's background noise sounds like suddenly intermittent. As a result, the far-end speaker is forced to talk with the near-end speaker while always having an unnatural feeling.
この不自然感は、遠端話者と近端話者との間で、要件伝達のため一時的に利用すればよいハンズフリー電話装置や、せいぜい会議の開催中のみ使えればよい会議電話装置では許容される場合も多い。 This unnatural feeling can be caused by a hands-free telephone device that can be used temporarily to communicate requirements between the far-end speaker and the near-end speaker, or a conference phone device that can be used only during a conference. In many cases, it is acceptable.
しかし近年普及しているテレワーク環境や、SOHO環境ではハンズフリー通話装置を近端側及び遠端側の双方で、常時接続して利用する形態が増え、事情が異なっている。すなわち、このような新しい使い方では、上述のような発話と同時に発生する相手側背景ノイズの急変は、遠端側の話者にとって強く違和感を訴える。なぜなら、常時接続するハンズフリー通話装置の場合、いままで説明してきた「背景ノイズ」は場合によっては単なる余分なノイズではなく、相手側の状態変化や環境変化、雰囲気の手がかりになる「背景音」あるいは「背景環境音」として遠端側の話者に聞き取られている場合があるからである。 However, in a telework environment and a SOHO environment that have become widespread in recent years, the number of forms in which hands-free communication devices are always connected and used on both the near end side and the far end side is increasing, and the circumstances are different. That is, in such a new usage, the sudden change in the other party background noise that occurs simultaneously with the utterance as described above strongly appeals to the far-end speaker. This is because, in the case of hands-free communication devices that are always connected, the “background noise” that has been explained so far is not just extra noise in some cases, but “background sound” that is a clue to the other party's state change, environmental change, and atmosphere. Alternatively, it may be heard by the far-end speaker as “background environmental sound”.
一方で、エコーキャンセラ部に関しては、適応フィルタの係数更新に加算器の出力フィードバックを用いる構造上、エコーを近端背景ノイズレベルまでにしか除去できないという公知の性質がある。したがって近端側の背景ノイズ(音)が大きいときには、会話の最中に十分エコーを除去できないという問題が発生してしまう。特に、人間はノイズ交じりであっても人間の音声を聞き分けられることが多く、遠端話者の発話の最後の部分のエコーが遠端話者自身にとって耳障りになることがおおい。 On the other hand, the echo canceller has a known property that the echo can be removed only to the near-end background noise level because of the structure in which the output feedback of the adder is used to update the coefficient of the adaptive filter. Therefore, when the background noise (sound) on the near end side is large, there arises a problem that the echo cannot be sufficiently removed during the conversation. In particular, humans can often hear human voices even if they are mixed with noise, and the echo at the end of the far-end speaker's utterance is often harsh to the far-end speaker.
従来の「特開平3−254530号公報」(参考文献2)には、エコーキャンセラ部の性能が発揮できないとき、帯域制限したガウスノイズを送信代替信号とする技術が開示されているが、単なる送信信号の挿げ替えでは、上述の遠端話者が持つ違和感は、むしろ大きくなってしまうおそれがあった。 The conventional “Japanese Patent Laid-Open No. 3-254530” (reference 2) discloses a technique that uses band-limited Gaussian noise as a transmission substitute signal when the performance of the echo canceller cannot be exhibited. When the signal is replaced, the discomfort of the far-end speaker described above may rather increase.
そこで、第4の実施形態では、背景ノイズが大きいときには、確実にエコーを抑圧できる音声スイッチ部を用いつつも、背景ノイズが不自然で急激な増減を起こさないようにする。これにより、第4の実施形態では、エコーキャンセラ部と、音声スイッチ部を併用して遠端側へ送信する信号を切り替えても、遠端側へ送信する信号における背景ノイズ成分の急激な増減をなくすことができる。さらに、第4の実施形態では、第3の実施形態のように、音声スイッチ部を使わなくても、エコーキャンセラ部だけで、エコーを除去できる程度に背景ノイズが小さい場合には、エコーキャンセラ部を主体にエコーを除去し、ハウリングを防止することができる。 Therefore, in the fourth embodiment, when the background noise is large, the voice switch unit that can reliably suppress the echo is used, but the background noise is not unnatural and suddenly increases or decreases. Thus, in the fourth embodiment, even if the echo canceller unit and the voice switch unit are used together to switch the signal to be transmitted to the far end side, the background noise component in the signal to be transmitted to the far end side is rapidly increased or decreased. Can be eliminated. Further, in the fourth embodiment, as in the third embodiment, when the background noise is small enough to remove the echo by using only the echo canceller without using the voice switch, the echo canceller Echoes can be removed mainly to prevent howling.
(D−1)第4の実施形態の構成
図8は、第3の実施形態の電話装置1Bの全体構成を示すブロック図であり、上述した図7との同一、対応部分には同一、対応符号を付して示している。
(D-1) Configuration of the Fourth Embodiment FIG. 8 is a block diagram showing the overall configuration of the telephone device 1B according to the third embodiment, which is the same as FIG. A reference numeral is attached.
以下、第3の実施形態について、第2の実施形態との差異を説明する。 Hereinafter, the difference between the third embodiment and the second embodiment will be described.
電話装置1Cでは、エコーキャンセラ10Bが、エコーキャンセラ10Cに置き換わっている点で第3の実施形態と異なっている。 The telephone device 1C is different from the third embodiment in that an echo canceller 10B is replaced with an echo canceller 10C.
また、エコーキャンセラ10Cでは、減衰器111が省略されている点で、第3の実施形態と異なっている。
The echo canceller 10C is different from the third embodiment in that the
さらに、エコーキャンセラ10Cでは、遅延部106、減衰器107、及び減衰量計算部109、が、遅延部106C、減衰器107C、減衰量計算部109Cに置き換わっている点で、第3の実施形態と異なっている。さらにまた、エコーキャンセラ10Cでは、スイッチ108Bが、時変加重平均部116に置き換わっている点で、第3の実施形態と異なっている。また、エコーキャンセラ10Cでは、減衰器107Cと時変加重平均部116との間に信号混合部115(以下、「N_MIX」ともいう)が設けられている。なお、信号混合部115による処理の詳細については、後述する動作説明において説明する。
Further, in the echo canceller 10C, the
図9は、信号混合部115内部の機能的構成について示したブロック図である。 FIG. 9 is a block diagram illustrating a functional configuration inside the signal mixing unit 115.
信号混合部115は、スイッチ制御部301、スイッチ302、スイッチ303、擬似背景ノイズ保持部304、混合部305、擬似背景ノイズパワー計算部306、実背景ノイズパワー計算部307、変動分ノイズパワー計算部308、及び混合比計算部309を有している。なお、信号混合部115の各部の構成(処理)については後述する動作説明において詳述する。
The signal mixing unit 115 includes a
(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態の電話装置1Cにおけるエコーキャンセラ10Cの動作について、第3の実施形態との差異を説明する。
(D-2) Operation of the Fourth Embodiment Next, the difference between the operation of the echo canceller 10C in the telephone device 1C of the fourth embodiment having the above-described configuration and the third embodiment will be described. .
まず、減衰量計算部109Cの動作について説明する。 First, the operation of the attenuation calculation unit 109C will be described.
減衰量計算部109Cは、第3の実施形態と同様に、一旦減衰量gainを計算する。 The attenuation amount calculation unit 109C calculates the attenuation amount once as in the third embodiment.
そして、減衰量計算部109Cは、予め定めた所望エコー減衰量acom_4(例えば、50dB減衰とする)と、gainとを比較して、減衰がacom_4に到達するための不足分の減衰量を追加した量を、新たな減衰量gain4として、信号混合部115及び減衰器107Cに通知する。なお、acom_4に設定する値は、限定されないものである。
Then, the attenuation amount calculation unit 109C compares a predetermined desired echo attenuation amount acom_4 (for example, 50 dB attenuation) with gain, and adds an attenuation amount that is insufficient for the attenuation to reach acom_4. The amount is notified to the signal mixing unit 115 and the
すなわち、減衰器107Cに適用される減衰量は、第1〜第3の実施形態で設定される減衰量よりも相当に大きいものとなる。たとえば所望エコー減衰量acom_4を、50dB減衰とし、さらに、減衰量計算部109Cにおいて、gein=10dBの減衰が算出された場合は、gain4=40dB(減衰)となる。言い換えると、第4の実施形態では、スピーカ40とマイクロホン50の間の音響エコー経路での増減と、減衰器107Cによる減衰をあわせたときに、必ず所望エコー減衰量acom_4が達成されるべく計算された減衰量gain4が、減衰器107Cに通知されることになる。
That is, the attenuation applied to the
次に、信号混合部115の動作について説明する。 Next, the operation of the signal mixing unit 115 will be described.
信号混合部115には、減衰量計算部109Cからgain4(例えば、−40dB)が通知されている。また、信号混合部115には、減衰器107Cから信号att(n)が供給されている。さらに、信号混合部115には、双方向通話検出器103からの通話状態判定の結果が供給されている。そして、信号混合部115が生成する信号mix(n)は、時変加重平均部116に供給されている。
The signal mixing unit 115 is notified of gain4 (for example, −40 dB) from the attenuation calculation unit 109C. The signal mixing unit 115 is supplied with the signal att (n) from the
次に、上述の図9を用いて、信号混合部115の各部の動作を説明する。 Next, the operation of each unit of the signal mixing unit 115 will be described with reference to FIG.
スイッチ制御部301は、双方向通話検出器103から通知された通話状態の判定結果が無音状態(IDL)であると、スイッチ302を閉じて、遅延部106Cの出力信号を擬似背景ノイズ保持部304に供給するように制御する。
When the call state determination result notified from the two-
擬似背景ノイズ保持部304は、リングバッファで構成されており、遅延部106Cから供給される信号について、一定期間分(たとえば、10秒分)のデータを保持し、それを超えた場合は一番古いデータを新しいデータで上書きしていくようにしても良い。ここでは、擬似背景ノイズ保持部304のデータ保持期間を10秒にしたが、この期間は限定されないものである。
The pseudo background
スイッチ制御部301は、双方向通話検出器103から通知される通話状態の判定結果が、無音状態(IDL)以外のときはスイッチ302を開放して、擬似背景ノイズ保持部304への信号の供給をさせない。
The
したがって、擬似背景ノイズ保持部304に保持される信号のデータは、遠端話者も近端話者も発話していない無音状態で、マイクロホン50に入力された信号、すなわち近端側の背景ノイズを示す信号のデータとなる。
Therefore, the signal data held in the pseudo background
擬似背景ノイズ保持部304で保持された信号のデータは、擬似背景ノイズパワー計算部306に供給される。
The signal data held by the pseudo background
擬似背景ノイズパワー計算部306は、供給された信号のデータから、予め定めた期間T_bn(例えば、1秒であるものとする)ごとのパワーp_pad_nを計算して、変動分ノイズパワー計算部308に与える。なお、擬似背景ノイズパワー計算部306では、保持した信号のデータが1秒分未満のときは、保持分のパワーを計算するようにしても良い。
The pseudo background noise
一方、スイッチ制御部301では、双方向通話検出器103から、通話状態の判定結果として、遠端シングルトーク状態(ST)が入力されると、スイッチ303を閉じて、混合部305に、擬似背景ノイズ保持部304で保持した信号のデータが供給されるようにする。なお、このスイッチ303は、遠端シングルトーク状態(ST)以外では、スイッチ制御部301の制御により開放されるものとする。
On the other hand, when the far-end single talk state (ST) is input from the
混合部305では、上述の通り、スイッチ303を経由した擬似背景ノイズ保持部304からの信号のデータが供給される。
As described above, the
次に、実背景ノイズパワー計算部307の動作について説明する。
Next, the operation of the actual background noise
実背景ノイズパワー計算部307は、双方向通話検出器103から、通話状態の判定結果として、遠端シングルトーク状態(ST)が入力されたときだけ、加算器101から供給される信号e_d(n)を用いて、実ノイズパワーp_real_nを、一定期間T_bn分だけ計算し、その計算結果を、変動分ノイズパワー計算部308に供給する。
The actual background noise
変動分ノイズパワー計算部308では、実ノイズパワーp_real_nと擬似背景ノイズパワーp_pad_nの比率dif_pad_nが計算される。詳細については後述するが、これは、擬似背景ノイズパワー計算部306で保持したデータを取得した時点の背景ノイズのレベルと、実際に遠端シングルトーク状態(ST)が発生しているときの背景ノイズのレベルに近いエコーキャンセラ部の加算器101の出力との差分を、混合部305の処理に反映させるためである。
The fluctuation noise
混合比計算部309では、減衰器107Cから供給される信号と、擬似背景ノイズ保持部304から供給される信号の混合比を、例えば次のように計算する。
The mixing
例えば、混合比計算部309に、減衰量計算部109Cから、gain4が供給されている場合には、減衰器107Cにおいてyd(n)がどれだけ減衰されてatt(n)が作成されたか計算できることになる。例えば、減衰量計算部109Cにおいて、gain4=40dBと算出されて、混合比計算部309に供給されたとき、gain4を線形の比率で考えると倍率を0.01倍にしたことに相当する。
For example, when gain 4 is supplied from the attenuation amount calculation unit 109C to the mixing
混合比計算部309では、供給されたgain4を、線形の比率値δsに変換してから、擬似背景ノイズ保持部304の出力との混合比δnを、以下の(14)式により決定する。
The mixing
δn=(1.0−δs) …(14)
この場合、gain4は、もともと1倍であった信号をδs=0.01倍に縮小しものであり、擬似背景ノイズ保持部304出力信号を、0.99倍したものと混合すれば、信号パワーはもとのままで、エコーの成分比だけが小さな信号を作成できることになる。
δn = (1.0−δs) (14)
In this case, the gain 4 is obtained by reducing the signal that was originally 1 time to δs = 0.01 times, and if the pseudo background
さらに、混合比計算部309には、変動分ノイズパワー計算部308の出力dif_pad_nが供給されており、擬似背景ノイズ保持部304にデータを保持した時点の背景ノイズと、現在エコーキャンセラ部(加算器101)が出力している残差信号との、パワーの食い違いを修正する。
Further, the output ratio dif_pad_n of the fluctuation noise
すなわち、以下の(15)式のように、混合する擬似背景ノイズの量を、遠端シングルトーク状態(ST)が発生している現時点の近端側の背景ノイズ量に即したものにする。これにより、遠端シングルトーク状態(ST)の時には、エコーキャンセラ部が、背景ノイズのレベルまで、エコーを除去していることに鑑み、混合部305が混合する擬似背景ノイズbn(n)の量を調整することができる。
That is, as shown in the following equation (15), the amount of pseudo background noise to be mixed is set in accordance with the current near-end background noise amount in which the far-end single talk state (ST) occurs. Thus, in the far-end single talk state (ST), the amount of the pseudo background noise bn (n) mixed by the mixing
なお、dif_pad_n=1.0(データを保持したときと遠端シングルトーク状態(ST)が発生している現時点の加算器出力のパワーが同じ)の場合には、δn=(1.0−δs)のままである。 In the case of dif_pad_n = 1.0 (the power of the adder output at the time when the far-end single talk state (ST) is generated is the same as when data is held), δn = (1.0−δs) ).
δn=(1.0−δs)×dif_pad_n …(15)
そして、混合部305は、以下の(16)式により、mix(n)を生成して、生成したmix(n)を時変加重平均部116に供給する。
δn = (1.0−δs) × dif_pad_n (15)
Then, the
mix(n)=δn×bn(n)+δs×att(n) …(16)
最後に、時変加重平均部116に関して説明する。
mix (n) = δn × bn (n) + δs × att (n) (16)
Finally, the time-varying weighted average unit 116 will be described.
時変加重平均部116は、第1〜第3の実施形態におけるスイッチ108(108B)に相当する機能を担うものである。具体的には、時変加重平均部116は、遅延部106Cから端子a2を介して供給される信号e_d(n)、又は、信号混合部115から端子b2を介して供給される信号mix(n)のいずれかの信号を、双方向通話検出器103から供給される通話状態の判定結果に基づいて選択し、選択した信号を、端子c2を介して遠端側(送信出力端子Sout)に送信するように状態を遷移させる。なお、図8においては、図示を省略しているが、時変加重平均部116には、双方向通話検出器103からの通話状態の判定結果が供給されている。
The time-varying weighted average unit 116 has a function corresponding to the switch 108 (108B) in the first to third embodiments. Specifically, the time-varying weighted average unit 116 receives the signal e_d (n) supplied from the delay unit 106C through the terminal a2, or the signal mix (n) supplied from the signal mixing unit 115 through the terminal b2. ) Is selected based on the determination result of the call state supplied from the
時変加重平均部116は、以下の(17)式のように、遅延部106Cから供給される信号e_d(n)と、信号混合部115から供給される信号mix(n)とを時間的に重み配分した信号sout(n)を生成して、送信出力端子Soutに出力(遠端側へ送信)する。以下の(17)式において、δechoは時間的な重み配分の係数である。 The time-varying weighted average unit 116 temporally combines the signal e_d (n) supplied from the delay unit 106C and the signal mix (n) supplied from the signal mixing unit 115 as shown in the following equation (17). A weight-distributed signal sout (n) is generated and output to the transmission output terminal Sout (transmitted to the far end side). In the following equation (17), δecho is a temporal weight distribution coefficient.
時変加重平均部116は、遅延部105から端子b2を選択する制御信号をうけたときは、δecho=0.0とする。その場合、以下の(17)式の結果は、以下の(18)式のようになり、第1〜第3の実施形態において、スイッチ108(108B)の端子c1を端子b1と接続した場合と同じ結果となる。
When the time-varying weighted average unit 116 receives a control signal for selecting the terminal b2 from the
そして、時変加重平均部116は、遅延部105から端子a2を選択する制御信号をうけたときは、δecbo=1.0とする。その場合、以下の(17)式の結果は、以下の(19)式のようになり、第1〜第3の実施形態において、スイッチ108(108B)の端子c1を端子a1と接続した場合と同じ結果となる。
When the time-varying weighted average unit 116 receives a control signal for selecting the terminal a2 from the
sout(n)=δecho×e_d(n)
+(1.0−δecho)×mix(n) …(17)
sout(n)=mix(n) …(18)
sout(n)=e_d(n) …(19)
時変加重平均部116は、遠端シングルトーク状態(ST)が終了すると、かならず端子a2の重みが大きくなるように動作するが、δecho=0.0からδecho=1.0に移るまでに予め定めた期間たとえば0.5秒を掛けて滑らかに重みが変化するように動作するようにしても良い。
sout (n) = δecho × e_d (n)
+ (1.0−δecho) × mix (n) (17)
sout (n) = mix (n) (18)
sout (n) = e_d (n) (19)
When the far-end single talk state (ST) ends, the time-varying weighted average unit 116 operates so that the weight of the terminal a2 is always increased. However, the time-varying weighted average unit 116 is required in advance to shift from δecho = 0.0 to δecho = 1.0. The operation may be performed so that the weight changes smoothly over a predetermined period, for example, 0.5 seconds.
たとえば背景ノイズが大きいとき、前述したようにエコーキャンセラ部では、背景ノイズのレベルまでしかエコーを除去できない。そのため、急に強力な信号減衰をした信号であるmix(n)から、加算器101の出力信号を遅延したe_d(n)へと遷移すると、エコーキャンセラ部の消し残りとなった、遠端話者の発話の最後の部分のエコーが際立ってしまう。そのため、上述のように時変加重平均部116を設けて、信号の切替えを滑らかに(徐々に)行うことにより、上述の遠端話者の発話の最後の部分のエコーが際立ってしまうような現象を防止することができる。
For example, when the background noise is large, as described above, the echo canceller can only remove the echo up to the background noise level. For this reason, when the output signal of the
(D−3)第4の実施形態の効果
第4の実施形態によれば、以下のような効果を奏することができる。
(D-3) Effects of the fourth embodiment According to the fourth embodiment, the following effects can be achieved.
(D−3−1)エコーキャンセラ10Cでは、音声スイッチ部に信号混合部115を設けている。信号混合部115では、無音状態(IDL)のときの近端入力信号(エコーの混入していないノイズ)を擬似背景ノイズとして保持し、遠端シングルトーク状態(ST)の時に、減衰器107Cから出力されるatt(n)に、保持していた擬似背景ノイズを混合した信号mix(n)を出力する。そして、信号混合部115では、信号の混合を行う際の混合比を、mix(n)のパワーが、音声スイッチ部による減衰前の近端入力信号パワーを保つような値に設定している。
(D-3-1) In the echo canceller 10C, the signal mixing unit 115 is provided in the voice switch unit. The signal mixing unit 115 holds the near-end input signal (noise not mixed with echo) in the silent state (IDL) as pseudo background noise, and from the
これにより、第4の実施形態では、遠端話者の聴感上、背景ノイズレベルは現在の近端話者周囲ノイズの様子を模擬しつつ、エコー信号だけを抑圧することができる。すなわち、エコーキャンセラ10Cでは、遠端側へ送出する信号の品質を向上させることができる。 As a result, in the fourth embodiment, the background noise level can suppress only the echo signal while simulating the current state of the near-end speaker ambient noise in terms of the audibility of the far-end speaker. That is, the echo canceller 10C can improve the quality of the signal transmitted to the far end side.
(D−3−2)エコーキャンセラ10Cでは、時変加重平均部116を設けて、音声スイッチ部の出力(信号混合部115の出力)と、エコーキャンセラ部の出力(加算器101の出力)とが、時間的に滑らかに切り替わるようにしている。これにより、第4の実施形態では、遠端シングルトーク状態(ST)のあと、かならずエコーキャンセラ部側に、遠端側へ送出する信号の選択を切り替えたとしても、直ちに音声スイッチ部の出力信号の減衰が0にならないので、遠端話者の発話による発話の最後の部分のエコーが遠端側に戻ってしまうことも防止できるようになる。 (D-3-2) In the echo canceller 10C, a time-varying weighted average unit 116 is provided, and an output of the voice switch unit (output of the signal mixing unit 115) and an output of the echo canceller unit (output of the adder 101) However, it is designed to switch smoothly in time. As a result, in the fourth embodiment, after the far-end single talk state (ST), even if the selection of the signal to be sent to the far-end side is always switched to the echo canceller side, the output signal of the voice switch unit is immediately Therefore, it is possible to prevent the echo of the last part of the utterance due to the utterance of the far-end speaker from returning to the far-end side.
また、エコーキャンセラ10Cでは、時変加重平均部116を設けたことにより、音声スイッチ部とエコーキャンセラ部の出力の切り替えにともなう、遠端話者が感じる近端側の背景ノイズの急変も防止できるようになる。これにより、第4の実施形態では、通信路のなかに所望減衰を確実に挿入できるようになるので、ハウリングをおこさない自然な通話が可能なエコーキャンセラを提供することができる。 Further, in the echo canceller 10C, by providing the time-varying weighted average unit 116, it is possible to prevent a sudden change in the background noise on the near end side felt by the far end speaker due to the switching of the outputs of the voice switch unit and the echo canceller unit. It becomes like this. Accordingly, in the fourth embodiment, desired attenuation can be surely inserted into the communication path, so that it is possible to provide an echo canceller capable of a natural call without howling.
(E)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(E) Other Embodiments The present invention is not limited to the above-described embodiments, and may include modified embodiments as exemplified below.
(E−1)第3の実施形態において、減衰量計算部109、エコーロス推定部110B、減衰器111は省略するようにしても良い。すなわち、第1の実施形態に、第3の実施形態の特徴となる構成(ACOM112、HWM判定部113、EC判定部114等)を追加した構成としても良い。ただし、その場合、第3の実施形態でEC判定部114がエコーロス推定部110Bから取得している内容を、EC判定部114で求めることができるようにする必要がある。
(E-1) In the third embodiment, the
(E−2)第4の実施形態において、時変加重平均部116を、第1〜第3の実施形態と同様のスイッチに置き換えるようにしても良い。また、逆に、第4の実施形態の時変加重平均部116を、第1〜第3の実施形態に適用するようにしても良い。 (E-2) In the fourth embodiment, the time-varying weighted average unit 116 may be replaced with the same switch as in the first to third embodiments. Conversely, the time-varying weighted average unit 116 of the fourth embodiment may be applied to the first to third embodiments.
さらに、第4の実施形態の信号混合部115を、第1〜第3の実施形態に適用するようにしても良い。ただし、その場合、第4の実施形態で、信号混合部115が減衰量計算部109Cから取得している内容を、信号混合部115で求めることができるようにする必要がある。 Furthermore, the signal mixing unit 115 of the fourth embodiment may be applied to the first to third embodiments. However, in that case, in the fourth embodiment, it is necessary that the signal mixing unit 115 can obtain the content acquired by the signal mixing unit 115 from the attenuation amount calculation unit 109C.
(E−3)第2の実施形態ではエコーロス推定部110は双方向通話検出器103から、遠端シングルトーク状態(ST)を入力されたときだけ動作するようにしたが、無音状態(IDL)、近端トーク状態(NT)のときにはエコーが発生していないので、この状態の間にマイクロホン50周辺の背景ノイズBGN’(k)を計算するようにしてもよい。
(E-3) In the second embodiment, the echo
(E−4)第3の実施形態では受信入力(遠端入力信号x(n))と、加算器101の出力とからエコー減衰量を計算して、エコー経路の総合減衰量を計算するようにしたが、加算器101の前後の信号を入力してパワー消去分を計算し、これとは別にエコーロス推定部110Bで計算したエコー経路の減衰量と合算した減衰の量でACOM112全体の計算をするようにしてもよい。
(E-4) In the third embodiment, the echo attenuation amount is calculated from the received input (far-end input signal x (n)) and the output of the
(E−5)第3の実施形態でHWM判定部113は、「ACOM_E(k)≧δacom」の成立とエコーキャンセル成功信号convがあることの両方を満たしてハウリング危険度小信号NO_HWを出力するようにしたが、エコー感の多少を気にしなくてもよい場合は、上記判定の不等式の成立だけでハウリング危険度小信号NO_HWを出力するようにしてもよい。
(E-5) In the third embodiment, the
(E−6)第3の実施形態で、エコー経路の状態に応じた減衰量の付加を減衰器111に施し、一方で通話状態に応じた減衰量の付加を減衰器107に分割して施すようにしたが、これらの減衰量を減衰器107ひとつで加えるようにしてもよい。
(E-6) In the third embodiment, addition of attenuation according to the state of the echo path is applied to the
また、第3の実施形態で、双方向通話検出器103の検出遅延が無視できるほどに小さいときには、同様に減衰器111ひとつで減衰させるようにしてもよい。
Further, in the third embodiment, when the detection delay of the
(E−7)第4の実施形態において、信号混合部115内部に、擬似背景ノイズパワー計算部306、実背景ノイズパワー計算部307、変動分ノイズパワー計算部308を設けて、データ保持時点のノイズ量と、遠端シングルトーク状態(ST)発生中のノイズ量との乖離を縮小するようにした。しかし、背景ノイズの変動がさほど重大でないときは、擬似背景ノイズパワー計算部306、実背景ノイズパワー計算部307、変動分ノイズパワー計算部308を省略して、擬似背景ノイズbn(n)と減衰器107Cの出力信号att(n)を混合するようにしてもよい。
(E-7) In the fourth embodiment, a pseudo background noise
1…電話装置、20…D/A変換器、30…A/D変換器、40…スピーカ、50…マイクロホン、10…エコーキャンセラ、101…加算器、102…適応フィルタ、201…擬似エコー作成部、2011…保持レジスタ、2012…積和演算部、2013…係数部、202…係数更新量計算部、203…ステップゲイン計算部、103…双方向通話検出器、104…制御部、105…遅延部、106…遅延部、107…減衰器、108…スイッチ、a1、b1、c1…端子。
DESCRIPTION OF
Claims (13)
擬似エコー生成手段により生成した擬似エコーを用いて、上記近端入力信号の上記エコー成分を打消した信号を生成するエコー打消し手段と、
上記近端入力信号を減衰器により減衰させた信号を生成する音声スイッチ手段と、
上記エコー打消し手段が生成する打消し後信号、又は上記音声スイッチ手段が生成する信号のいずれかを選択して、遠端側へ送出するスイッチ手段と、
遠端入力信号と上記近端入力信号とを利用して、遠端話者と近端話者との間の通話状態を判定する通話状態判定手段と、
上記通話状態判定手段の判定結果に応じて、上記スイッチ手段を制御するスイッチ制御手段と
を有することを特徴とするエコーキャンセラ。 In an echo canceller that removes echo components from the near-end input signal,
Echo canceling means for generating a signal obtained by canceling the echo component of the near-end input signal using the pseudo echo generated by the pseudo echo generating means;
Voice switch means for generating a signal obtained by attenuating the near-end input signal by an attenuator;
Switch means for selecting either the signal after cancellation generated by the echo cancellation means or the signal generated by the voice switch means and sending it to the far end side;
Call state determination means for determining a call state between a far end speaker and a near end speaker using the far end input signal and the near end input signal;
An echo canceller comprising: switch control means for controlling the switch means in accordance with a determination result of the call state determination means.
上記近端入力信号全体のパワー、上記エコー成分のパワー、及び上記近端入力信号に含まれる近端側の背景ノイズ成分のパワーの比較を行うパワー比較手段と、
上記近端入力信号に対して、設定された量の減衰を与えた信号を生成し、生成した信号を、上記エコー打消し手段及び上記音声スイッチ手段に供給する信号減衰手段と、
上記エコー経路特性算出手段の計算結果と、上記パワー比較手段の比較結果とを利用して、上記信号減衰手段に設定する減衰量を求める減衰量計算手段と、
をさらに備えたことを特徴とする請求項1〜4のいずれかに記載のエコーキャンセラ。 Echo path characteristic calculating means for calculating an attenuation amount or an amplification amount of an echo path related to the echo component;
Power comparison means for comparing the power of the entire near-end input signal, the power of the echo component, and the power of the background noise component on the near-end side included in the near-end input signal;
A signal attenuating means for generating a signal giving a set amount of attenuation to the near-end input signal, and supplying the generated signal to the echo canceling means and the voice switch means;
Attenuation amount calculating means for obtaining an attenuation amount to be set in the signal attenuating means using the calculation result of the echo path characteristic calculating means and the comparison result of the power comparing means,
The echo canceller according to claim 1, further comprising:
上記スイッチ制御手段は、上記ハウリング発生危険度判定手段で、ハウリングが発生する危険度が所定以上と判定された場合に、上記スイッチ手段に対して、上記音声スイッチ手段が生成した信号を選択するように制御する
ことを特徴とする請求項1〜5のいずれかに記載のエコーキャンセラ。 In the near-end input signal and the far-end input signal, further comprising howling occurrence risk determination means for determining a risk that howling based on the echo component occurs,
The switch control means selects the signal generated by the voice switch means for the switch means when the howling occurrence risk judgment means determines that the risk of howling is greater than or equal to a predetermined value. The echo canceller according to any one of claims 1 to 5, wherein
上記通話状態判定手段により、上記遠端話者だけが発話している遠端シングルトーク状態と判定されている間の、上記遠端入力信号のパワーと、上記エコー打消し手段が生成する打消し後信号のパワーとを利用して、上記エコー打消し手段が生成する打消し後信号に残存する上記エコー成分のパワーを計算するエコー減衰量計算部と、
少なくとも上記エコー減衰量計算部の計算結果を利用して、ハウリングが発生する危険度を判定するハウリング発生危険度判定部と
を有することを特徴とする請求項6に記載のエコーキャンセラ。 The above-mentioned howling occurrence risk determination means is:
The far-end input signal power and the cancellation generated by the echo cancellation means while the speech state determination means determines that only the far-end speaker is speaking a far-end single talk state. Using the power of the post-signal, an echo attenuation amount calculation unit for calculating the power of the echo component remaining in the post-cancellation signal generated by the echo cancellation means;
The echo canceller according to claim 6, further comprising: a howling occurrence risk level determination unit that determines a risk level of howling using the calculation result of the echo attenuation amount calculation unit.
上記エコー打消し手段が生成する打消し後信号と、近端側の背景ノイズ成分のパワーとを比較し、その比較結果に基づいて、上記エコー打消し手段による上記エコー成分の打消しが成功しているか否かを判定するエコー打消効果判定部をさらに有し、
上記ハウリング発生危険度判定部は、上記エコー打消効果判定部の判定結果も利用して、ハウリングが発生する危険度を判定する
ことを特徴とする請求項7に記載のエコーキャンセラ。 The above-mentioned howling occurrence risk determination means is:
The signal after cancellation generated by the echo cancellation means is compared with the power of the background noise component on the near end side, and based on the comparison result, the cancellation of the echo component by the echo cancellation means is successful. It further has an echo cancellation effect determination unit that determines whether or not
The echo canceller according to claim 7, wherein the howling occurrence risk determination unit determines a risk level of howling using the determination result of the echo cancellation effect determination unit.
上記音声スイッチ手段が生成する信号と、上記エコー打消し手段が生成する打消し後信号とを、時間的に重み配分した信号を生成して、遠端側へ送出する時変加重平均部と、
上記時変加重平均部に対して、上記エコー打消し手段が生成する打消し後信号に対する重み付けと、上記音声スイッチ手段が生成する信号に対する重み付けとを、上記スイッチ制御手段の制御に応じて更新する重み付け更新部と
を有することを特徴とする請求項1〜8のいずれかに記載のエコーキャンセラ。 The switch means includes
A time-variant weighted average unit that generates a signal weighted and distributed to the far end side of the signal generated by the voice switch unit and the signal after cancellation generated by the echo cancellation unit;
For the time-varying weighted average unit, the weighting for the post-cancellation signal generated by the echo cancellation unit and the weighting for the signal generated by the voice switch unit are updated according to the control of the switch control unit. The echo canceller according to claim 1, further comprising: a weight update unit.
上記通話状態判定手段で、上記遠端入力信号及び上記近端入力信号がともに無音状態と判定されているときの上記近端入力信号を、擬似背景ノイズ信号として保持する擬似背景ノイズ保持手段と、
上記通話状態判定手段で、上記遠端入力信号だけ有音状態と判定されている間に、上記減衰器から出力される信号と、上記擬似背景ノイズ保持手段が保持している擬似背景ノイズとを混合した信号を、当該音声スイッチ部が出力する信号として生成する信号混合手段と、
上記信号混合手段に設定する混合比を決定するものであって、その混合比を、上記擬似背景ノイズ保持手段が保持している擬似背景ノイズのパワーと、上記近端入力信号のパワーとを利用して決定する混合比決定手段と
を有することを特徴とする請求項1〜9のいずれかに記載のエコーキャンセラ。 The voice switch part
Pseudo background noise holding means for holding the near end input signal as a pseudo background noise signal when both the far end input signal and the near end input signal are determined to be silent in the call state determination means;
While the speech state determination means determines that only the far-end input signal is in a sound state, the signal output from the attenuator and the pseudo background noise held by the pseudo background noise holding means Signal mixing means for generating a mixed signal as a signal output by the voice switch unit;
The mixing ratio to be set in the signal mixing means is determined, and the mixing ratio is obtained by using the power of the pseudo background noise held by the pseudo background noise holding means and the power of the near-end input signal. The echo canceller according to claim 1, further comprising: a mixture ratio determining unit that determines the ratio.
擬似エコー生成手段により生成した擬似エコーを用いて、上記近端入力信号の上記エコー成分を打消した信号を生成するエコー打消し手段と、
上記近端入力信号を減衰器により減衰させた信号を生成する音声スイッチ手段と、
上記エコー打消し手段が生成する打消し後信号、又は上記音声スイッチ手段が生成する信号のいずれかを選択して、遠端側へ送出するスイッチ手段と、
遠端入力信号と上記近端入力信号とを利用して、遠端話者と近端話者との間の通話状態を判定する通話状態判定手段と、
上記通話状態判定手段の判定結果に応じて、上記スイッチ手段を制御するスイッチ制御手段と
して機能させることを特徴とするエコーキャンセルプログラム。 A computer installed in an echo canceller that removes the echo component from the near-end input signal.
Echo canceling means for generating a signal obtained by canceling the echo component of the near-end input signal using the pseudo echo generated by the pseudo echo generating means;
Voice switch means for generating a signal obtained by attenuating the near-end input signal by an attenuator;
Switch means for selecting either the signal after cancellation generated by the echo cancellation means or the signal generated by the voice switch means and sending it to the far end side;
Call state determination means for determining a call state between a far end speaker and a near end speaker using the far end input signal and the near end input signal;
An echo canceling program that functions as a switch control unit that controls the switch unit according to a determination result of the call state determination unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010252518A JP2012105115A (en) | 2010-11-11 | 2010-11-11 | Echo canceller, echo cancellation program, and telephone apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010252518A JP2012105115A (en) | 2010-11-11 | 2010-11-11 | Echo canceller, echo cancellation program, and telephone apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012105115A true JP2012105115A (en) | 2012-05-31 |
Family
ID=46394995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010252518A Pending JP2012105115A (en) | 2010-11-11 | 2010-11-11 | Echo canceller, echo cancellation program, and telephone apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012105115A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015002460A (en) * | 2013-06-17 | 2015-01-05 | 沖電気工業株式会社 | Echo suppression device and program |
JP2016019263A (en) * | 2014-07-11 | 2016-02-01 | ヤマハ株式会社 | Voice communication apparatus and program |
-
2010
- 2010-11-11 JP JP2010252518A patent/JP2012105115A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015002460A (en) * | 2013-06-17 | 2015-01-05 | 沖電気工業株式会社 | Echo suppression device and program |
JP2016019263A (en) * | 2014-07-11 | 2016-02-01 | ヤマハ株式会社 | Voice communication apparatus and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8311234B2 (en) | Echo canceller and communication audio processing apparatus | |
US7092516B2 (en) | Echo processor generating pseudo background noise with high naturalness | |
US6961422B2 (en) | Gain control method for acoustic echo cancellation and suppression | |
US7856097B2 (en) | Echo canceling apparatus, telephone set using the same, and echo canceling method | |
JP5061853B2 (en) | Echo canceller and echo cancel program | |
EP1022866A1 (en) | Echo elimination method, echo canceler and voice switch | |
US8160239B2 (en) | Echo canceller and speech processing apparatus | |
JP5223576B2 (en) | Echo canceller, echo cancellation method and program | |
US8090093B2 (en) | Echo canceller | |
JP4457639B2 (en) | Echo canceller | |
JP3420705B2 (en) | Echo suppression method and apparatus, and computer-readable storage medium storing echo suppression program | |
JP4410819B2 (en) | Echo canceller | |
JP2012105115A (en) | Echo canceller, echo cancellation program, and telephone apparatus | |
JP2006080660A (en) | Communication terminal having echo canceler and echo cancellation method | |
JPH0614101A (en) | Hand-free telephone set | |
JP4877083B2 (en) | Residual echo suppression control device, method and program | |
JPH09116469A (en) | Echo noise cancellor and echo noise canceling method | |
JP4544040B2 (en) | Echo cancellation device, telephone using the same, and echo cancellation method | |
JPH1023172A (en) | Echo canceler | |
JP3355594B2 (en) | Echo canceller device | |
JP5297396B2 (en) | Loudspeaker | |
JP3180543B2 (en) | Echo canceller | |
JP2000341178A (en) | Hands-free communication device | |
JPH11284550A (en) | Voice input-output device | |
US20090154718A1 (en) | Method and apparatus for suppressor backfill |