JP4395105B2 - 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 - Google Patents
音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP4395105B2 JP4395105B2 JP2005172318A JP2005172318A JP4395105B2 JP 4395105 B2 JP4395105 B2 JP 4395105B2 JP 2005172318 A JP2005172318 A JP 2005172318A JP 2005172318 A JP2005172318 A JP 2005172318A JP 4395105 B2 JP4395105 B2 JP 4395105B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- acoustic coupling
- coupling amount
- reception
- transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Description
図6は特許文献1で開示された従来技術の音響結合量推定方法の構成図である。従来技術の音響結合量推定方法は、受話レベル計算部101と、受話検出部102と、送話レベル計算部103と、音響結合量計算部601と、時間平滑部602により構成される。
受話レベル計算部101は、受話信号x(t)を時間平均し、受話レベルR(t)を求める。この計算は、たとえば式(1)に示す過去の値との重み付け和を用いて行われる。
R(t)=a・R(t-1)+(1-a) ・|x(t)| 式(1)
ただし、aは平滑化係数であり、0<a<1の値をあらかじめ設定する。aが1に近いほど、より緩やかなレベル変化となる。
送話レベル計算部103は、受話レベル計算部101と同様に、過去の値との重み付け和を用いて、送話レベルS(t)を求める。
音響結合量計算部601は、受話レベルR(t)と送話レベルS(t)との比から、推定音響結合量の瞬時値AC'(t)を求める。これを式で表せば、式(2)となる。
AC'(t)=S(t)/R(t) 式(2)
時間平滑部602は、推定音響結合量の瞬時値AC'(t)を時間平滑化して、より正確な推定音響結合量AC(t)を求める。ただし、送話音声と受話音声の両方が存在するダブルトーク時においては送話信号に送話音声成分と受話音声成分が混合しているので、推定音響結合量の瞬時値AC'(t)は、真の値よりも大きな値となってしまう。この影響を少なくするため、ディップホールドを用いた時間平滑化が行われる。このディップホールドを用いた平滑化は、例えば式(3)により実現される。式(3)によれば条件式に従ってレベルが低下する方向には速やかに応動し、レベルが上昇する方向には緩やかに応動する動作を呈する。この動作をここではディップホールドと称している。
AC(t)=c・AC(t-1)+(1-c) ・AC'(t) for AC(t-1)< AC'(t) 式(3)
つまり、bは推定音響結合量増加時の平滑化係数であり、cは推定音響結合量減少時の平滑化係数であり、それぞれ0<b,c<1の値をあらかじめ設定する。b>>cとなるように設定すれば、推定音響結合量減少時は高速に応動し、推定音響結合量増加時は非常に緩やかな値の上昇となり、ディップホールドの効果が得られる。以上示した方法により、従来技術では音響結合量の推定が行われる。
本発明の目的は、音響結合量推定に要する演算量を削減することにある。
上記課題を解決するために、本発明では、推定音響結合量と受話レベルを乗じた推定エコーレベルを算出し、この推定エコーレベルと送話レベルを比較して、推定音響結合量の更新を逐次行う手法により、割り算を用いない音響結合量推定を実現し、演算量を削減する。さらに、推定送話ノイズレベルと推定受話ノイズレベルを、送話レベルと受話レベルから各々減算することで、音響結合量の推定精度を向上する。
上記課題を解決するために、本発明では、送話状態を判定し、送話と判定された場合には、音響結合量の更新を停止するか、更新量を小さくすることで、送話音声混合による音響結合量の推定誤差の影響を小さくし、推定精度を向上する。
コンピュータに本発明による音響結合量推定装置として機能させる場合、コンピュータには少なくとも受話レベル計算部と、受話検出部と、音響結合量更新部と、音響結合量記憶部と、送話レベル計算部とを構築し、特に音響結合量更新部では音響結合量記憶部に記憶されている推定音響結合量AC(t-1)と受話信号レベルR(t)を乗算して、推定エコーレベルAC(t-1)・R(t)を求め、次にこの推定エコーレベルと送話レベルとを比較し、推定レベルが大きいAC(t-1)・R(t)>S(t)の場合は、推定音響結合量が真の結合量よりも大きいと推定されるので、AC(t-1)に1より小さい定数pを乗じて小さい値に更新する。
本実施例の音響結合量推定装置は、受話レベル計算部101と、受話検出部102と、送話レベル計算部103と、音響結合量更新部104と、音響結合量記憶部105により構成される。
本発明では、推定音響結合量AC(t-1)に受話レベルR(t)を乗じた推定エコーレベルAC(t-1)・R(t)と、送話レベルS(t)を比較して、送話レベルS(t)が大きい場合には推定音響結合量を増加させ、推定エコーレベルが大きい場合には推定音響結合量を減少させる逐次更新により、割り算を用いない音響結合量推定を実現し、演算量を削減する。
受話レベル計算部101は、受話信号x(t)を時間平均し、受話レベルR(t)を求める。この計算は、例えば式(4)に示す過去の値との重み付け和を用いて行われる。
R(t)=a・R(t-1)+(1-a)・|x(t)| 式(4)
ただし、aは平滑化係数であり、0<a<1の値をあらかじめ設定する。aが1に近いほど、より緩やかなレベル変化となる。また、スピーカ、マイク間の応答の残響時間を模擬するため、レベル上昇時の平滑化係数を小さくし、下降時の平滑化係数を大きくするという方法も用いられる。これは式(5)により表される。
R(t)=e・R(t-1)+(1-e) ・|x(t)| for R(t-1)<|x(t)| 式(5)
ただし、dはレベル増加時の平滑化係数であり、eはレベル減少時の平滑化係数でありそれぞれ0<e,d<1の値をあらかじめ設定する。d<eとなるように設定すれば、レベルの減少が上昇に比べ緩やかとなり、残響を含んだレベルを模擬的に求めることができる。
受話検出部102は、あらかじめ設定した固定閾値TRと受話レベルR(t)を比較し、受話レベルが大きい場合(R(t)>TR)に受話と判定する。
次に、音響結合量更新部104は、受話検出部102において受話が検出された場合に音響結合量の更新を行う。音響結合量更新部104は、音響結合量記憶部105に記憶されている推定音響結合量AC(t-1)と受話信号レベルR(t)を乗算して、推定エコーレベルAC(t-1)・R(t)を求める。ただし、推定音響結合量の初期値AC(0)は事前に設定される。次にこれを送話レベルS(t)と比較し、推定エコーレベルが大きいAC(t-1)・R(t)>S(t)の場合には、推定音響結合量が真の結合量よりも大きいと推定されるので、AC(t-1)に1より小さい定数pを乗じて、小さい値に更新する。また、AC(t-1)・R(t)<S(t)の場合には、推定音響結合量が真の結合量よりも小さいと推定されるので、AC(t-1)に1より大きい定数qを乗じて大きい値に更新する。これらを式で表せば、式(6)となる。
AC(t)=q・AC(t-1) for AC(t-1)・R(t)<S(t) 式(6)
ただし、定数p,qは事前設定される。また、送話音声と受話音声の両方が存在するダブルトーク時には送話信号に送話音声成分とエコー成分が混合しているため、送話レベルS(t)がエコーのみの場合よりも大きい値となり、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数qは1に近い値に設定し、音響結合量が上昇する場合の更新量を小さくする。
本実施例の音響結合量推定装置は、本発明の第1の実施例に、受話ノイズレベル推定部201と、送話ノイズレベル推定部202を追加した構成である。
受話ノイズレベル推定部201は受話信号のノイズレベルを推定する。ノイズレベルNr(t)は、受話レベルR(t)をディップホールド処理することで推定することができる。これは例えば式(7)を用いて行われる。
Nr(t)=R(t) for Nr(t)>R(t)
Nr(t)=u・Nr(t-1)+(1-u)・R(t) for Nr(t)<R(t) 式(7)
ここで、uは1未満の定数であり事前に設定する。uは推定ノイズレベル上昇時の平滑化係数であり0<u<1の値をとる。uが1に近いと緩やかなノイズレベル上昇となり、ディップホールドの効果が得られる。
受話検出部102は、あらかじめ設定した固定閾値TRと、ノイズレベルNr(t)にあらかじめ設定した定数を乗じた閾値TNの2つの閾値を用いる。これらの閾値TR及びTNと受話レベルR(t)を比較し、両方の閾値TR及びTNよりも受話レベルR(t)が大きい場合(R(t)>TR and R(t)>TN)に受話と判定する。ノイズレベルを基準とした閾値TNを導入したことにより、受話ノイズレベルが高い場合にも、音声区間のみを抽出することができる。
AC(t)=q・AC(t-1) for AC(t-1)・{R(t)-Nr(t)}<{S(t)-Ns(t)} 式(8)
ただし、定数p,qは事前設定される。また、ダブルトーク時には送話信号に送話音声成分とエコー成分が混在しているため、送話レベルS(t)がエコーのみの場合よりも大きい値となり、正確な音響結合量の更新が行えなくなってしまう。この影響を少なくするには、定数qは1に近い値に設定し、音響結合量が上昇する場合の結合量を小さくする。
この他の部分に関しては、本発明の実施例1と同様であるので、説明を省略する。
本実施例の音響結合量推定装置は、本発明の第1または2の実施例を複数の周波数帯域に分割し、周波数帯域ごとの音響結合量を求める。
本実施例の音響結合量推定装置は、受話短時間フーリエ変換部301と、送話短時間フーリエ変換部302と、N個の音響結合量推定部1061〜106Nから構成される。
受話短時間フーリエ変換部301と送話短時間フーリエ変換部302は、それぞれ受話信号と送話信号をN個の周波数帯域の信号に分割する。
図4に示される本実施例は、本発明の第1の実施例または第2の実施例に送話検出部401を追加した構成であり、図5に示される本実施例は、本発明の実施例3に送話検出部401を追加した構成である。
送話検出部401は、受話信号と送話信号と音響結合量から、送話の検出をする。送話検出は、送話レベルがあらかじめ与えた固定閾値および送話ノイズレベルを定数倍した閾値を超え、さらに、音響結合量に受話信号のレベルを乗じた推定音響エコーレベルを定数倍した閾値を超えた場合に送話と判定する。
これにより、送話信号に含まれる送話音声成分及び受話音声成分の影響を軽減し、より正確な音響結合量推定を実現する。
以上説明した本発明による音響結合量推定方法及び装置はハードウェアによって構成することができる。然し乍ら、最も簡素に実現するには本発明で提案する音響結合量推定プログラムをコンピュータにインストールし、コンピュータに上述した各実施例の手順に従って音響結合量推定方法を実現させることにより、音響結合量推定装置として機能させる実施形態が最良の実施形態である。
102 受話検出部 302 送話短時間フーリエ変換部
103 送話レベル計算部 401 送話検出部
104 音響結合量更新部 601 音響結合量計算部
105 音響結合量記憶部 602 時間平滑部
106、1061〜106N 音響結合量推定部
201 受話ノイズレベル推定部
202 送話ノイズレベル推定部
Claims (10)
- 受話信号のレベルを計算する受話レベル演算ステップと、
前記受話信号のレベルとあらかじめ設定した固定閾値とを比較し、固定閾値よりも受話信号のレベルが大きい場合に受話と判定する受話検出ステップと、
送話信号のレベルを計算する送話レベル演算ステップと、
あらかじめ設定された初期値から逐次更新される音響結合量を記憶する音響結合量記憶ステップと、
前記受話検出ステップで受話と判定された場合に、前記記憶されている音響結合量に前記受話信号のレベルを乗じた推定エコーレベルと、前記送話信号のレベルとを比較し、送話信号のレベルが大きい場合には前記記憶されている音響結合量にあらかじめ設定した1より大きい定数を乗じて更新し、推定エコーレベルが大きければ前記記憶されている音響結合量にあらかじめ設定した1より小さい常数を乗じて更新し、新たな音響結合量の出力とする音響結合量更新ステップと、
を含むことを特徴とする音響結合量推定方法。 - 受話信号のレベルを計算する受話レベル演算ステップと、
前記受話信号のレベルから受話信号のノイズレベルを推定する受話ノイズレベル推定ステップと、
前記受話信号のノイズレベルにあらかじめ設定した定数を乗じた閾値および、あらかじめ設定した固定閾値と、受話信号のレベルを比較して、これら両方の閾値よりも受話信号のレベルが大きい場合に受話と判定する受話検出ステップと、
送話信号のレベルを計算する送話レベル演算ステップと、
前記送話信号のレベルから送話信号のノイズレベルを推定する送話ノイズレベル推定ステップと、
あらかじめ設定された初期値から逐次更新される音響結合量を記憶する音響結合量記憶ステップと、
前記受話検出ステップで受話と判定された場合に、前記受話信号のレベルから前記受話ノイズレベルを減じた値に前記記憶されている音響結合量を乗じた推定エコーレベルと、前記送話信号のレベルから前記ノイズレベルを減じた推定送話レベルとを比較し、推定送話レベルが大きい場合には前記記憶されている音響結合量にあらかじめ設定した1より大きい定数を乗じて更新し、推定エコーレベルが大きければ前記記憶されている音響結合量にあらかじめ設定した1より小さい定数を乗じて更新し、新たな音響結合量の出力とする音響結合量更新ステップと、
を含むことを特徴とする音響結合量推定方法。 - 請求項1又は2の何れかに記載の音響結合量推定方法において、前記受話信号をN帯域の周波数領域に変換する受話短時間フーリエ変換ステップと、
送話信号をN帯域の周波数領域に変換する送話短時間フーリエ変換ステップと、
前記帯域分割された受話信号と帯域分割された送話信号を各々入力とし、周波数帯域間に音響結合量を推定するN個の音響結合量推定ステップと、
を含むことを特徴とする音響結合量推定方法。 - 請求項1乃至3記載の音響結合量推定方法の何れかにおいて、前記送話検出ステップは、前記音響結合量と受話信号のレベルと送話信号のレベルとから、送話区間を検出し、
前記音響結合量更新ステップは、前記送話検出ステップにおいて送話区間と判定された場合に、更新を停止、または更新量を小さくすることを特徴とする音響結合量推定方法。 - 受話信号のレベルを計算する受話レベル計算部と、
前記受話信号のレベルとあらかじめ設定した固定閾値を比較し、固定閾値よりも受話信号のレベルが大きい場合に受話と判定する受話検出部と、
送話信号のレベルを計算する送話レベル計算部と、
あらかじめ設定された初期値から逐次更新される音響結合量を記憶する音響結合量記憶部と、
前記受話検出部で受話と判定された場合に、前記記憶されている音響結合量に前記受話信号のレベルを乗じた推定エコーレベルと、前記送話信号のレベルとを比較し、送話信号のレベルが大きい場合には前記記憶されている音響結合量にあらかじめ設定した1より大きい定数を乗じて更新し、推定エコーレベルが大きければ前記記憶されている音響結合量にあらかじめ設定した1より小さい定数を乗じて更新し、新たな音響結合量の出力とする音響結合量更新部と、
を備えることを特徴とする音響結合量推定装置。 - 受話信号のレベルを計算する受話レベル計算部と、
前記受話信号のレベルから受話信号のノイズレベルを推定する受話ノイズレベル推定部と、
前記受話信号のレベルから受話信号のノイズレベルを推定する受話ノイズレベル推定部と、
前記受話信号のノイズレベルにあらかじめ設定した定数を乗じた閾値および、あらかじめ設定した固定閾値と、受話信号のレベルを比較して、これら両方の閾値よりも受話信号のレベルが大きい場合に受話と判定する受話検出部と、
送話信号のレベルを計算する送話レベル計算部と、
前記送話信号のレベルから送話信号のノイズレベルを推定する送話ノイズレベル推定部と、
あらかじめ設定された初期値から逐次更新される音響結合量を記憶する音響結合量記憶部と、
前記受話検出部で受話と判定された場合に、前記受話信号のレベルから前記受話ノイズレベルを減じた値に前記記憶されている音響結合量を乗じた推定エコーレベルと、前記送話信号のレベルから前記ノイズレベルを減じた推定送話レベルとを比較し、推定送話レベルが大きい場合には前記記憶されている音響結合量にあらかじめ設定した1より大きい定数を乗じて更新し、推定エコーレベルが大きくなれば前記記憶されている音響結合量にあらかじめ設定した1より小さい定数を乗じて更新し、新たな音響結合量の出力とする音響結合量更新部と、
を備えることを特徴とする音響結合量推定装置。 - 請求項5又は6の何れかに記載の音響結合量推定装置において、前記受話信号をN帯域の周波数領域に変換する受話短時間フーリエ変換部と、
送話信号をN帯域の周波数領域に変換する送話短時間フーリエ変換部と、
前記帯域分割された受話信号と帯域分割された送話信号を各々入力とし、周波数帯域間に音響結合量を推定するN個の音響結合量推定部と、
を備えることを特徴とする音響結合量推定装置。 - 請求項5乃至7記載の音響結合量推定装置の何れかにおいて、前記送話検出部は、前記音響結合量と受話信号のレベルと送話信号のレベルとから、送話区間を検出し、
前記音響結合量更新部は、前記送話検出部において送話区間と判定された場合に、更新を停止、または更新量を小さくすることを特徴とする音響結合量推定装置。 - コンピュータが解読可能なプログラム言語によって記述され、コンピュータに少なくとも請求項5乃至8の何れかに記載の音響結合量推定装置として機能させる音響結合量推定プログラム。
- コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項9記載の音響結合量推定プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005172318A JP4395105B2 (ja) | 2005-06-13 | 2005-06-13 | 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005172318A JP4395105B2 (ja) | 2005-06-13 | 2005-06-13 | 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006352239A JP2006352239A (ja) | 2006-12-28 |
JP4395105B2 true JP4395105B2 (ja) | 2010-01-06 |
Family
ID=37647649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005172318A Expired - Fee Related JP4395105B2 (ja) | 2005-06-13 | 2005-06-13 | 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4395105B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8488776B2 (en) | 2007-10-19 | 2013-07-16 | Nec Corporation | Echo suppressing method and apparatus |
DE102008039329A1 (de) * | 2008-01-25 | 2009-07-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts |
-
2005
- 2005-06-13 JP JP2005172318A patent/JP4395105B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006352239A (ja) | 2006-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2015240992B2 (en) | Situation dependent transient suppression | |
US9088336B2 (en) | Systems and methods of echo and noise cancellation in voice communication | |
EP2624254A1 (en) | Audio processing device and audio processing method for de-reverberation | |
KR101975251B1 (ko) | 오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법 | |
US9773510B1 (en) | Correcting clock drift via embedded sine waves | |
JP7325445B2 (ja) | ギャップ信頼度を用いた背景雑音推定 | |
JP6422885B2 (ja) | エコー抑圧 | |
JP2016503263A (ja) | エコー抑圧 | |
KR102190833B1 (ko) | 에코 억제 | |
CN111989934B (zh) | 回声消除装置、回声消除方法、信号处理芯片及电子设备 | |
JP6422884B2 (ja) | エコー抑圧 | |
WO2020252629A1 (zh) | 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备 | |
US11437054B2 (en) | Sample-accurate delay identification in a frequency domain | |
WO2012176932A1 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
US8406430B2 (en) | Simulated background noise enabled echo canceller | |
JP4413205B2 (ja) | エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 | |
JP4395105B2 (ja) | 音響結合量推定方法、音響結合量推定装置、プログラム、記録媒体 | |
KR100949910B1 (ko) | 스펙트럼 차감을 이용한 음향학적 반향 제거 방법 및 장치 | |
JP6638248B2 (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP2006323230A (ja) | ノイズレベル推定方法及びその装置 | |
US20130044890A1 (en) | Information processing device, information processing method and program | |
JP6180689B1 (ja) | エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム | |
JP6369192B2 (ja) | エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末 | |
JP5640393B2 (ja) | エコー除去装置、方法及びプログラム | |
JP4559914B2 (ja) | 音響結合量推定方法、その装置、そのプログラム及びその記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090918 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091006 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4395105 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |