[go: up one dir, main page]

JP4438720B2 - エコーキャンセラ及びマイク装置 - Google Patents

エコーキャンセラ及びマイク装置 Download PDF

Info

Publication number
JP4438720B2
JP4438720B2 JP2005236251A JP2005236251A JP4438720B2 JP 4438720 B2 JP4438720 B2 JP 4438720B2 JP 2005236251 A JP2005236251 A JP 2005236251A JP 2005236251 A JP2005236251 A JP 2005236251A JP 4438720 B2 JP4438720 B2 JP 4438720B2
Authority
JP
Japan
Prior art keywords
volume ratio
signal
audio
input signal
double talk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005236251A
Other languages
English (en)
Other versions
JP2007053512A (ja
Inventor
貴義 川口
洋平 櫻庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005236251A priority Critical patent/JP4438720B2/ja
Priority to US11/505,115 priority patent/US8913737B2/en
Priority to CN 200610149293 priority patent/CN100514982C/zh
Publication of JP2007053512A publication Critical patent/JP2007053512A/ja
Application granted granted Critical
Publication of JP4438720B2 publication Critical patent/JP4438720B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

本発明はエコーキャンセラ及びマイク装置に関し、特に音声入力信号に混入されるエコー成分を除去するための適応処理を行うエコーキャンセラと、このエコーキャンセラを具備するマイク装置に関する。
従来、テレビ会議システムに代表されるように、遠隔地間など多地点に設置された複数の端末を介して音声や映像などを送受することによって、多地点間で会議を行うことを可能にする会議システムがある。会議システムなどで用いるマイク装置(以下、マイクとする)には、マイクが集音した音声入力信号を処理する音声処理部が搭載されている。音声処理部では、音声入力信号に対し、自らのスピーカから出力した音声がマイクに回り込むエコーを除去する処理がエコーキャンセラによって施される。
このようなエコーキャンセラでは、音声入力信号に含まれるエコー成分を学習し、たとえば、適応フィルタなどを用いた適応動作を行って、エコーキャンセル処理の安定化を図っている。話者が単独で話しているシングルトークの状態では、適応動作は正常に働くが、自身を含む2以上の話者が同時に話しているダブルトークの状態では、他者の音声信号が混入するため、適応動作が正しく動作せず、ダブルトークの状態で適応処理を行うと、エコー成分ばかりでなく、話者の音声成分も打ち消してしまうように働く。このため、エコーキャンセラでは、ダブルトークであるかシングルトークであるかを識別し、ダブルトークの場合には適応処理のための学習を行わないよう制御がなされている。
シングルトークであるかダブルトークであるかを判別するための手法のひとつに、ゲイゲル(Geigel)アルゴリズムとして知られている手法がある。ゲイゲルアルゴリズムでは、スピーカから出力される音声信号の音量と、マイクが入力した音声信号の音量との比を算出し、比がある固定値以下ならシングルトークと判断し、固定値以上ならばダブルトークと判断する。
また、マイクから入力した音声入力信号が流れる経路と、スピーカなどに出力する音声出力信号が流れる経路とを監視し、両方の経路の音声信号がともに有音の状態が一定時間以上継続すればダブルトークと判定するエコーキャンセラがある(たとえば、特許文献1参照)。
特許第3579245号公報(段落番号〔0047〕〜〔0062〕、図6)
しかし、従来のエコーキャンセラでは、シングルトークとダブルトークの状態判定を間違ってしまう場合があるという問題点があった。
たとえば、ゲイゲルアルゴリズムでは、スピーカから出力される音声信号の音量と、マイクが入力した音声信号の音量との比を算出し、比がある固定値以下であるかどうかによってシングルトークかダブルトークであるかを判定しているため、スピーカの音量や、スピーカとマイクの位置関係によっては、判断を間違えてしまう可能性が大きい。
また、出力側と入力側の音声信号がともに有音であればダブルトークと見なす手法では、それぞれの音量を所定の閾値を比較することによって有音/無音の判別を行っている。このため、背景ノイズが大きい場合に有音と判定したり、話者がマイクから離れている場合や発声レベルが低い場合などに無音と判定するなど、有音/無音の判定を誤ってしまう可能性があり、結果として、ダブルトークとシングルトークの判定も誤ってしまう。
本発明はこのような点に鑑みてなされたものであり、ダブルトークであるかシングルトークであるかの判定を確実に行い、ダブルトーク制御を正しく行うことが可能なエコーキャンセラ及びマイク装置を提供することを目的とする。
本発明では上記課題を解決するために、音声入力信号に混入されるエコー成分を除去するための適応処理を行うエコーキャンセラであって、音量比学習手段、ダブルトーク検出手段及びエコーキャンセル処理手段を具備するエコーキャンセラが提供される。音量比学習手段は、外部へ音声出力された音声出力信号と、その音声出力の回り込みによってエコー成分が混入した音声入力信号の音量比を算出し、自装置における通常状態の音量比を学習する。ダブルトーク検出手段は、音量比学習手段によって今回算出された今回音量比が、これまでに音量比の学習から予測されるダブルトークの状態に適合するか否かによってダブルトークを検出する。エコーキャンセル処理手段は、ダブルトーク検出手段によるダブルトークの検出結果に基づき、適応処理のためのエコー成分の学習動作を制御する。
このようなエコーキャンセラによれば、音量比学習手段は、外部へ音声出力された音声出力信号と、その音声出力の回り込みによるエコー成分が混入した音声入力信号の音量比を算出するとともに、自装置における通常状態(シングルトーク)の音量比を学習する。ダブルトーク検出手段は、音量比学習手段が今回算出した音量比が、これまでの音量比の学習から予測されるダブルトークの状態に適合するかどうかに応じてダブルトークを検出する。すなわち、ダブルトークであれば、音量比は通常状態の音量比の範囲を超えていると予測されるので、今回算出された音量比と、学習された通常状態における音量比の範囲と比較し、ダブルトークを検出する。エコーキャンセル処理手段は、ダブルトーク検出手段の検出結果に応じて、適応制御のための学習動作を実行するかどうかを制御する。
また、上記課題を解決するために、音声入力信号に混入されるエコー成分を除去するための適応処理を含む音声信号処理を行って音声入力信号から話者の音声信号を取り出すマイク装置において、集音した音声をデジタル信号に変換して音声入力信号として出力する音声入力手段と、外部へ音声出力された音声出力信号と、音声出力の回り込みによってエコー成分が混入した音声入力信号の音量比を算出し、自装置における通常状態の音量比を学習する音量比学習手段と、音量比学習手段によって今回算出された今回音量比が、音量比の学習から予測されるダブルトークの状態に適合するか否かによってダブルトークを検出するダブルトーク検出手段と、ダブルトーク検出手段によるダブルトークの検出結果に基づき、適応処理のためのエコー成分の学習動作を含む音声入力信号から音声信号を抽出する前記音声信号処理を制御する音声信号処理手段と、を具備することを特徴とするマイク装置、が提供される。
このようなマイク装置によれば、音声入力手段が生成した音声入力信号は、音量比学習手段において音声出力信号との音量比が算出される。音量比学習手段は、算出された音量比に基づき、状況に応じて変動する音声入力信号と音声出力信号の通常状態(シングルトーク)における音量比を学習する。ダブルトーク検出手段は、今回算出された音量比が、これまで学習された音量比から予測されるダブルトークの状態に適合するか否かによってダブルトークを検出する。音声信号処理手段は、ダブルトークが検出された場合と検出されなかった場合のそれぞれのケースに応じてエコーキャンセルの適応処理を含む音声処理を行い、外部へ出力する音声信号を生成する。
本発明では、音声出力信号と音声入力信号の音量比を常時学習しており、音量比の学習から予測されるダブルトークの状態の音量比に基づいてダブルトークの検出を行うので、当該装置の状況に適した判定を行うことができる。したがって、ダブルトーク制御が正しく行えるという利点がある。
以下、本発明の実施の形態を図面を参照して説明する。まず、実施の形態に適用される発明の概念について説明し、その後、実施の形態の具体的な内容を説明する。
図1は、実施の形態に適用される発明の概念図である。
本発明に係るエコーキャンセラは、音声出力信号と音声入力信号との音量比を学習する音量比学習手段1、ダブルトークを検出するダブルトーク検出手段2及びエコーキャンセル処理を行うエコーキャンセル処理手段3を具備する。
音量比学習手段1は、スピーカなどから出力された音声出力信号と、マイクなどが集音した音声入力信号との音量比を算出し、自装置における通常状態の音量比を学習する。この音量比は、音声出力信号を出力するスピーカの音量、音声入力信号を生成するマイクの感度、マイクとスピーカの距離などのさまざまな要因で決まり、また、時間の経過とともに変動していく。そこで、音声入力信号と音声出力信号の音量比を常時観測し、現在の自装置における通常状態の音量比を学習する。なお、学習は、信号を所定の周波数領域に分割し、周波数領域ごとに独立して行う。以下、音量比は、周波数領域ごとに、
音量比=音声入力信号の信号レベル/音声出力信号の信号レベル ・・・(1)
によって算出することとする。また、音量比の算出では、音声出力信号が回り込みによって音声入力信号に混入するまでの遅延時間を考慮する。さらに、スピーカが音声出力しない周波数領域については、学習する必要がない。
なお、学習は、通常状態、すなわちシングルトークの状態で行われる。会議システムもしくは電話などにおける実際の会話では、通常、シングルトークまたは、話者がいない状態が大部分である。そこで、算出された音量比が急激に変化した場合などは、この音量比を学習に利用しないなどの処理を行って通常状態の音量比を学習する。さらに、たとえば、ゲイゲルアルゴリズムなどの従来のダブルトーク判定手法、すなわち、今回音量比が予め設定された閾値を超えたかどうかによるダブルトーク判定の結果に基づき、学習するか否かを制御するようにすれば、より正確に通常状態の学習を行うことができる。今回算出された音量比と、学習された音量比に関する情報は、ダブルトーク検出手段2へ出力される。
ダブルトーク検出手段2は、音量比学習手段1から取得した今回算出された音量比と、学習された音量比に関する情報に基づき、ダブルトークの状態であるか否かを検出する。上記のように、音量比学習手段1では、シングルトークの状態の音量比に関する学習が行われている。ダブルトークの状態では音声入力信号に他の話者の音声が重畳されており、式(1)で算出される音量比は、シングルトークの状態よりも高い値になる。したがって、音量比学習手段1によって学習されたシングルトークの状態の音量比範囲を超えた音量比であればダブルトークであるという予測ができる。そこで、シングルトークの状態の音量比の範囲に基づき、ダブルトークと見なす閾値を規定する。ダブルトーク検出手段2では、周波数領域ごとに、今回算出された音量比がシングルトークの状態の音量比の範囲から予測されるダブルトークの音量比に適合するかどうかを判定する。そして、所定の周波数領域でダブルトークが検出された場合、ダブルトークと判定する。判定結果は、エコーキャンセル処理手段3に通知される。
エコーキャンセル処理手段3は、音声入力信号を受け取ると、スピーカなどから出力された音声出力が回り込むことによって音声入力信号に混入したエコーを除去する。エコー成分は、会議システムや電話などにおいて、自身が検出し、相手側装置へ送信した音声信号が音声出力されることによって、また戻って音声入力された音声信号成分である。そこで、スピーカから出力された音声出力信号を用いて音声入力信号に含まれるエコー成分を学習し、学習結果から予測されるエコー成分を音声入力信号から除去する適応処理を行う。このとき、スピーカから出た音は少し時間がたってからマイクに到達するので、その遅延時間を考慮する。また、学習は、ダブルトーク検出手段2がダブルトークを検出していないとき、すなわちシングルトークの場合にのみ行う。ダブルトークの場合には、音声入力信号に他の話者の音声信号が混入しているので、正しく学習ができないからである。
このような構成のエコーキャンセラでは、音量比学習手段1は、周波数領域ごとに独立して、該周波数領域の音声出力信号と音声入力信号の信号レベルの比(音量比)を算出し、算出された音量比に基づき、シングルトークの状態における音量比の範囲を学習する。
図2は、シングルトークの状態における音声入力信号と音声出力信号の一例を示した図である。
音量比学習手段1は、周波数領域f1、f2、f3及びf4ごとに、それぞれ音声出力信号(以下、出力信号とする)21と、音声入力信号(以下、入力信号とする)22の信号レベルの比(音量比)を、式(1)にしたがって算出する。たとえば、図の例の周波数領域f1では、出力信号21の最大振幅レベルAと、入力信号22の最大振幅レベルA’の比は、およそ0.5になる。同様に、周波数領域f2、f3及びf4についても、音量比としておよそ0.5が得られる。このようにして周波数領域ごとに入力信号と出力信号の音量比を算出し、音量比を学習する。なお、学習は、ゲイゲルアルゴリズムなどによってシングルトークの状態と判定されたときに実行する。
以上の処理手順により、学習結果として、周波数領域f1、f2、f3、f4において、シングルトークの状態における音量比として、0.5近傍の値が得られたとする。
ダブルトーク検出手段2は、算出される音量比が0.5+α(αは、システムに応じて設定されるマージン)を超えたかどうかを判定し、超えていない場合は、シングルトークと判定する。シングルトークと判定された場合、エコーキャンセル処理手段3は、出力信号に基づきエコー成分を学習するとともに、学習結果の推定エコー成分に基づき、入力信号からエコー成分をキャンセルする処理を行う。
このような状態で、ダブルトークの状態が発生したとする。
図3は、ダブルトークの状態における音声入力信号と音声出力信号の一例を示した図である。
ダブルトークの場合、出力信号31は、図2と同様にスピーカなどから出力された音声であるが、入力信号32には、本来の入力信号(話者の音声信号+出力信号31が回り込んだエコー成分)に対し、さらに他の話者の音声信号が重畳されている。
音量比学習手段1は、周波数領域f1、f2、f3及びf4ごとに、それぞれ出力信号31と、入力信号32の信号レベルの比を、式(1)にしたがって算出する。図の例の周波数領域f1では、出力信号31の最大振幅レベルBと、入力信号32の最大振幅レベルB’の比は、およそ0.5で、図2に示したシングルトークの場合と同様である。しかしながら、周波数領域f3では、出力信号31の最大振幅レベルCと、入力信号32の最大振幅レベルC’の比は、およそ7であり、シングルトークの状態の0.5とは大きく異なる。
ダブルトーク検出手段2において、音量比学習手段1で算出された音量比と、学習されたシングルトークの状態の音量比範囲とを照合すると、周波数領域f1や周波数領域f2では、シングルトークの状態とほぼ変わらない音量比であるが、周波数領域f3において大きく異なり、音量比はシングルトークの状態の範囲を大きく超えている。したがって、この場合、ダブルトークであると判定される。ダブルトークと判定された場合、エコーキャンセル処理手段3は、出力信号に基づきエコー成分の学習を停止し、これまでに学習された推定エコー成分に基づき、入力信号からエコー成分をキャンセルする処理を行う。
話者の音声の周波数分布は、話者に応じて異なる場合が多い。たとえば、ダブルトークの状態で重畳される他の話者の音声レベルが小さい場合、信号全体の音量比で照合すると、ダブルトークを検出できない場合がある。そこで、周波数領域に分割し、その周波数領域ごとに処理を行うことによって、特徴のある周波数領域で違いを検出し、ダブルトークと判定することが可能となる。
以上のように、所定の周波数領域ごとに通常状態の入力信号と出力信号の音量比を学習し、学習結果から予測されるダブルトークの音量比と今回算出された音量比とを比較することによってダブルトークであるか否かを検出することにより、装置の状況に応じた最適な閾値でダブルトークを検出することができる。また、周波数領域ごとに算出するため、検出の精度を向上させることができるという効果も得られる。
なお、学習するかどうかの判断を、他のダブルトーク検出アルゴリズムを用いて行っているが、その判断を多少間違えた場合であっても、学習を継続することによって、最終的なダブルトークかどうかの判断の精度は向上する。
以下、実施の形態を、テレビ会議システムのマイクに適用した場合を例に図面を参照して詳細に説明する。
図4は、実施の形態のテレビ会議システムの構成図である。
実施の形態のテレビ会議システムは、テレビ会議システム本体(以下、本体とする)200に対し、マイク1(100)、マイク2(101)が通信路301、302と電源信号路311、312によってカスケード接続されている。また、本体200は、ネットワーク500を介して別室に設置される本体210とマイク10(103)から成るシステムに接続する。各マイクは同じ構成であるので、以下、マイク1(100)の場合で説明する。
マイク1(100)は、音声処理を行うDSP(Digital Signal Processor)110、電源処理を行う電源制御回路120とDC−DC変換器121、シリアル通信を制御するシリアルI/F FPGA(Field Programmable Gate Array)130及び音声を入力する集音部150とA/D変換器151を有する。以下、シリアルI/F FPGA130をシリアルI/F130と表記する。
DSP110は、ダブルトーク検出部111、エコーキャンセラ112、ノイズキャンセラ113、サプレッサ114及び加算器115を具備する。
ダブルトーク検出部111は、音量比を学習する音量比学習手段1と、ダブルトークを検出するダブルトーク検出手段2で構成され、周波数領域ごとの出力信号と入力信号の音量比を学習し、学習結果と今回算出された音量比とを用いて、ダブルトークが発生しているかどうかを検出し、エコーキャンセラ112、ノイズキャンセラ113及びサプレッサ114の音声処理手段へ出力する。エコーキャンセラ112は、エコー成分の予測を行ってエコー除去する適応制御を行っており、ダブルトーク検出部111によってダブルトークが検出された場合は、適応制御のための学習を行わない。ノイズキャンセラ113は、エコーキャンセラ112によってエコーが除去された入力信号からノイズを除去する。サプレッサ114は、入力信号に音声信号が含まれていない場合には、音声出力信号のサプレス処理を行う。ノイズキャンセラ113及びサプレッサ114は、必要に応じて、ダブルトーク検出部111によるダブルトークの検出結果を参照し、処理を行う。加算器115は、シリアルI/F130から入力されるカスケード接続された他マイクの音声情報と(Cascade In)、自マイクの音声信号を加算し、シリアルI/F130を介して送信する(Cascade Out)。また、図示しない制御部によって、シリアルI/F130を介して制御指令を入力し、指令に応じた処理を行う(Control I/O)。なお、DSP110は、シリアルI/F130を介して入力する下りデータに応じて動作クロックを発生させる。
電源制御回路120は、上流の本体200から供給されたDC電源をDC−DC121へ送るとともに、下流に電源を供給するかどうかを判断し、供給する場合は、電源信号路312を介してマイク2(101)へ電源を供給する制御を行う。このとき、自マイクに外部DC電源400が接続されているか否か、下流に接続する電源信号路の長短なども考慮し、下流に電源供給を行うかどうかを判断する。
シリアルI/F130は、本体200から送信される下りデータを入力し、所定の処理を行うとともに、下りデータを下流のマイク2(101)へ出力する。また、下流のマイク2(101)から入力された上りデータに対し音声情報に自マイクの音声信号を加算するなどの処理を行った後、上流の本体200に出力する。以下、通信される下りデータ及び上りデータを総称して通信コマンドとする。
集音部150は、外部の音声を入力してA/D変換器151へ送る。A/D変換器151は、集音部150の生成したアナログの音声信号をデジタル信号に変換してエコーキャンセラ112へ出力する。
本体200は、カスケード接続するマイク1(100)、マイク2(101)と通信コマンドを介して情報交換して、これらのマイクを管理する。また、スピーカ201を備え、音声出力を行う。
外部DC電源400は、必要に応じて、各マイクに接続され、電源を供給する。
以上の構成のテレビ会議システムの動作について説明する。ここでは、DSP110による音声処理を中心として、マイク及びマイクシステムの動作について説明する。
集音部150は、周囲の音声を入力し、音声に応じたアナログ信号を生成してA/D変換器151へ出力する。A/D変換器151は、音声に応じて生成されたアナログ信号をデジタル信号に変換し、音声入力信号としてDSP110に出力する。
DSP110では、ダブルトーク検出部111が、シリアルI/F130を介して入力する音声出力信号と、A/D変換器151を介して入力する音声入力信号のシングルトークの状態における音量比を学習するとともに、学習結果に応じてダブルトークを検出する。エコーキャンセラ112は、ダブルトーク検出部111によってダブルトークが検出されなければ、適応制御のための学習を行うとともに、A/D変換器151から入力された音声入力信号からエコー成分を除去し、音声信号を生成する。この音声信号は、さらに、ノイズキャンセラ113でノイズが除去され、サプレッサ114でサプレス処理が施され、加算器115へ出力される。加算器115は、サプレッサ114を介して入力する音声信号と、シリアルI/F13を介して入力する下流のマイクの音声信号(Cascade In)を加算し、出力する(Cascade Out)。
以上の説明の本実施の形態のマイク装置では、スピーカ201からの出力信号が回り込んで集音部150が拾う入力信号に混入したエコー成分を除去するエコーキャンセル処理を正確に実行するため、ダブルトークであるか否かによって動作制御を行っている。ダブルトーク検出部111は、出力信号と入力信号の音量比を周波数領域ごとに算出するとともに、シングルトークの状態における音量比を学習しておく。そして、算出された音量比を学習結果に照らし合わせ、ダブルトークを検出するので、スピーカ201の音量や集音部150の感度、もしくはスピーカ201と集音部150の位置関係によって通常状態の音量比が変動してもこれに合わせてダブルトーク検出を正しく行うことができる。また、周波数領域ごとに独立して判定するため、検出の精度が向上する。
実施の形態に適用される発明の概念図である。 シングルトークの状態における音声入力信号と音声出力信号の一例を示した図である。 ダブルトークの状態における音声入力信号と音声出力信号の一例を示した図である。 実施の形態のテレビ会議システムの構成図である。
符号の説明
1・・・音量比学習手段、2・・・ダブルトーク検出手段、3・・・エコーキャンセル処理手段

Claims (4)

  1. 音声入力信号に混入されるエコー成分を除去するための適応処理を行うエコーキャンセラにおいて、
    外部へ音声出力された音声出力信号と、前記音声出力の回り込みによってエコー成分が混入した前記音声入力信号とを入力して前記音声出力信号と前記音声入力信号とを所定の周波数領域に分割し、前記周波数領域ごとに前記周波数領域における前記音声出力信号の最大振幅の信号レベルと前記音声入力信号の最大振幅の信号レベルとの比を音量比として算出するとともに、通常状態と判定されるときに算出された前記音量比に基づいて自装置における通常状態の音量比の範囲を学習する音量比学習手段と、
    前記周波数領域ごとに前記音量比学習手段によって今回算出された今回音量比が、前記音量比の範囲の学習から予測される前記周波数領域ごとのダブルトークの音量比に適合するか否かを判定し、前記周波数領域ごとの判定結果に基づいて前記ダブルトークを検出するダブルトーク検出手段と、
    前記ダブルトーク検出手段による前記ダブルトークの検出結果に基づき、前記適応処理のための前記エコー成分の学習動作を制御するエコーキャンセル処理手段と、
    を具備することを特徴とするエコーキャンセラ。
  2. 前記音量比学習手段は、前記今回音量比が予め設定された閾値を超えたか否かによって判定されるダブルトーク判定の結果に応じて、学習を行うか否かを制御する、
    ことを特徴とする請求項1記載のエコーキャンセラ。
  3. 前記音量比学習手段は、前記音声出力信号が回り込みによって前記音声入力信号に混入するまでの遅延時間を加味して前記音量比の学習を行う、
    ことを特徴とする請求項1記載のエコーキャンセラ。
  4. 音声入力信号に混入されるエコー成分を除去するための適応処理を含む音声信号処理を行って前記音声入力信号から話者の音声信号を取り出すマイク装置において、
    集音した音声をデジタル信号に変換して音声入力信号として出力する音声入力手段と、
    外部へ音声出力された音声出力信号と、前記音声出力の回り込みによってエコー成分が混入した前記音声入力信号とを入力して前記音声出力信号と前記音声入力信号とを所定の周波数領域に分割し、前記周波数領域ごとに前記周波数領域における前記音声出力信号の最大振幅の信号レベルと前記音声入力信号の最大振幅の信号レベルとの比を音量比として算出するとともに、通常状態と判定されるときに算出された前記音量比に基づいて自装置における通常状態の音量比の範囲を学習する音量比学習手段と、
    前記周波数領域ごとに前記音量比学習手段によって今回算出された今回音量比が、前記音量比の範囲の学習から予測される前記周波数領域ごとのダブルトークの音量比に適合するか否かを判定し、前記周波数領域ごとの判定結果に基づいて前記ダブルトークを検出するダブルトーク検出手段と、
    前記ダブルトーク検出手段による前記ダブルトークの検出結果に基づき、前記適応処理のための前記エコー成分の学習動作を含む前記音声入力信号から前記音声信号を抽出する前記音声信号処理を制御する音声信号処理手段と、
    を具備することを特徴とするマイク装置。
JP2005236251A 2005-08-17 2005-08-17 エコーキャンセラ及びマイク装置 Expired - Fee Related JP4438720B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005236251A JP4438720B2 (ja) 2005-08-17 2005-08-17 エコーキャンセラ及びマイク装置
US11/505,115 US8913737B2 (en) 2005-08-17 2006-08-16 Echo canceller and microphone apparatus
CN 200610149293 CN100514982C (zh) 2005-08-17 2006-08-17 回声消除器和麦克风设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005236251A JP4438720B2 (ja) 2005-08-17 2005-08-17 エコーキャンセラ及びマイク装置

Publications (2)

Publication Number Publication Date
JP2007053512A JP2007053512A (ja) 2007-03-01
JP4438720B2 true JP4438720B2 (ja) 2010-03-24

Family

ID=37767355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005236251A Expired - Fee Related JP4438720B2 (ja) 2005-08-17 2005-08-17 エコーキャンセラ及びマイク装置

Country Status (3)

Country Link
US (1) US8913737B2 (ja)
JP (1) JP4438720B2 (ja)
CN (1) CN100514982C (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011114790A (ja) * 2009-11-30 2011-06-09 Kitakyushu Foundation For The Advancement Of Industry Science & Technology 検出システム
CN103606374A (zh) * 2013-11-26 2014-02-26 国家电网公司 一种瘦终端的噪音消除和回声抑制方法及装置
WO2016008159A1 (zh) * 2014-07-18 2016-01-21 华为技术有限公司 一种通信装置、系统及处理信号的方法
US9865278B2 (en) 2015-03-10 2018-01-09 JVC Kenwood Corporation Audio signal processing device, audio signal processing method, and audio signal processing program
CN107045872B (zh) * 2016-02-05 2020-09-01 中国电信股份有限公司 通话回声的识别方法和装置
CN107895582A (zh) * 2017-10-16 2018-04-10 中国电子科技集团公司第二十八研究所 面向多源信息领域的说话人自适应语音情感识别方法
KR102167469B1 (ko) * 2018-12-19 2020-10-19 주식회사 이엠텍 피드백 처리 방법
CN114648997A (zh) * 2020-12-21 2022-06-21 深圳市三诺数字科技有限公司 语音消噪方法、装置、计算机设备及存储介质
JP2022151366A (ja) * 2021-03-26 2022-10-07 株式会社トランストロン エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07231282A (ja) 1994-02-18 1995-08-29 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置
JPH07288493A (ja) 1994-04-18 1995-10-31 Fujitsu Ltd ダブルトーク検出装置
JPH07303072A (ja) 1994-05-06 1995-11-14 N T T Idou Tsuushinmou Kk ダブルトーク検出方法および装置
US5937060A (en) * 1996-02-09 1999-08-10 Texas Instruments Incorporated Residual echo suppression
EP0847180A1 (en) * 1996-11-27 1998-06-10 Nokia Mobile Phones Ltd. Double talk detector
US5793864A (en) * 1996-12-12 1998-08-11 At&T Corp. Nonintrusive measurement of echo power and echo path delay present on a transmission path
JP3579245B2 (ja) * 1998-03-31 2004-10-20 三洋電機株式会社 エコーキャンセラの制御方法およびエコー除去装置
US6766021B2 (en) * 2001-03-13 2004-07-20 Adaptive Digital Technologies Echo canceller
JP3922997B2 (ja) * 2002-10-30 2007-05-30 沖電気工業株式会社 エコーキャンセラ
JP2004289242A (ja) 2003-03-19 2004-10-14 Matsushita Electric Ind Co Ltd エコーキャンセル装置、エコーキャンセル方法、プログラムおよび記録媒体
US7046794B2 (en) * 2003-12-12 2006-05-16 Motorola, Inc. Double talk activity detector and method for an echo canceler circuit
EP1714398B8 (en) 2004-01-29 2009-08-12 Nxp B.V. Echo canceller with interference-level controlled step size
JP5071480B2 (ja) * 2007-08-24 2012-11-14 富士通株式会社 エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム

Also Published As

Publication number Publication date
CN100514982C (zh) 2009-07-15
US20070041576A1 (en) 2007-02-22
US8913737B2 (en) 2014-12-16
CN1949795A (zh) 2007-04-18
JP2007053512A (ja) 2007-03-01

Similar Documents

Publication Publication Date Title
KR101444100B1 (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
US9503569B1 (en) Methods and apparatus for performing echo cancellation for a communication device
JP4889810B2 (ja) エコーキャンセラ
US10121490B2 (en) Acoustic signal processing system capable of detecting double-talk and method
CN109716743B (zh) 全双工语音通信系统和方法
EP3605529B1 (en) Method and apparatus for processing speech signal adaptive to noise environment
US8913737B2 (en) Echo canceller and microphone apparatus
US9680999B2 (en) Apparatus and method for removing acoustic echo in teleconference system
WO2019239977A1 (ja) エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム
JPH08293820A (ja) 音響エコー抑制回路
CN106297816B (zh) 一种回声消除的非线性处理方法和装置及电子设备
JPH07264102A (ja) ステレオエコーキャンセラ
JP2005142756A (ja) エコーキャンセラ
JP5963077B2 (ja) 通話装置
JP4696776B2 (ja) 音声処理装置及びマイク装置
US10827076B1 (en) Echo path change monitoring in an acoustic echo canceler
JP4857652B2 (ja) ノイズキャンセラ及びマイク装置
JP2011172081A (ja) 拡声通話方法、拡声通話装置、拡声通話プログラム
JP2001189795A (ja) 通信装置
JPS62120733A (ja) 反響消去装置
JP2006014359A (ja) エコー抑制処理システム
US20140376732A1 (en) Device echo cancellation
JP2008160420A (ja) エコーノイズキャンセル装置及びエコーノイズキャンセル方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091215

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091228

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees