JP4321049B2 - 自動利得制御装置 - Google Patents
自動利得制御装置 Download PDFInfo
- Publication number
- JP4321049B2 JP4321049B2 JP2002334172A JP2002334172A JP4321049B2 JP 4321049 B2 JP4321049 B2 JP 4321049B2 JP 2002334172 A JP2002334172 A JP 2002334172A JP 2002334172 A JP2002334172 A JP 2002334172A JP 4321049 B2 JP4321049 B2 JP 4321049B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- input signal
- signal
- speech
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Control Of Amplification And Gain Control (AREA)
Description
【発明の属する技術分野】
本発明は、入力信号のレベルに応じて入力信号を増幅する際の利得を制御する自動利得制御装置に関するものである。
【0002】
【従来の技術】
電話等の通信分野では、有線と無線、あるいはアナログ通信とデジタル通信といった通信形態(伝送形態)により伝送損失が異なることが知られている。したがって、伝送損失の大小にかかわらずに安定した通信を行おうとした場合、例えば、話し手の声(発話音声)の大きさ(音量)によらずに聞き手に聞こえる音声の音量をほぼ一定にしようとした場合、音量を一定とするように音声信号を増幅する際の利得を制御する必要がある。このように音声信号に対する自動利得制御は、上記通信分野のみならず、音声認識システムのように入力音声の音量レベルによって認識率が変動してしまう場合、あるいは警報音等の音量を周囲の騒音レベルに応じて調整する場合というように様々な分野に用いられている。
【0003】
【非特許文献1】
財団法人電気通信端末機器審査協会資料 「電気通信端末機器等適合認定基準/技術的条件」 第3章 技術基準(端末設備等規則)の解説 3.2アナログ電話端末 第14条 送出電力 p.120
【0004】
【発明が解決しようとする課題】
ところで従来の自動利得制御装置では、図27に示すような入力信号のレベルに応じた利得の関係を示す利得関数Fを一つしか備えていないため、入力信号のレベル変動が大きい場合に出力信号のレベルを一定に保つ利得制御を行うことが困難であった(非特許文献1参照)。
【0005】
本発明は上記事情に鑑みて為されたものであり、その目的は、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能な自動利得制御装置を提供することにある。
【0006】
【課題を解決するための手段】
請求項1の発明は、上記目的を達成するために、入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音成分を検出する雑音検出部と、入力信号の16m秒程度の短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音成分の大きさに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部と、利得算出部で算出された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部とを備え、雑音検出部は、入力信号の前記短い時間を16倍した時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択してなり、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とする。
【0009】
請求項2の発明は、請求項1の発明において、長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とする。
【0010】
請求項3の発明は、請求項1又は2の発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とする。
【0011】
請求項4の発明は、請求項1の発明において、雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする。
【0012】
請求項5の発明は、請求項1〜4の何れかの発明において、短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とする。
【0013】
請求項6の発明は、請求項1〜5の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とする。
【0014】
請求項7の発明は、請求項1〜6の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とする。
【0015】
請求項8の発明は、請求項7の発明において、出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とする。
【0016】
請求項9の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とする。
【0017】
請求項10の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とする。
【0018】
請求項11の発明は、請求項5の発明において、前記利得変動補正部は、利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することを特徴とする。
【0019】
請求項12の発明は、請求項1〜11の何れかの発明において、入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とする。
【0020】
請求項13の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする。
【0021】
請求項14の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする。
【0022】
請求項15の発明は、請求項14の発明において、周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とする。
【0023】
請求項16の発明は、請求項13又は14の発明において、雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とする。
【0024】
請求項17の発明は、請求項13又は14の発明において、雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とする。
【0025】
【発明の実施の形態】
以下、図面を参照して本発明を実施形態により詳細に説明する。但し、以下に説明する各実施形態では音声信号を扱うシステムや機器に本発明の自動利得制御装置を適用した場合を例示しているが、対象となる入力信号の種類は音声信号に限定されるものではなく、信号を増幅する増幅器等を有するシステムや機器全般について本発明の技術思想が適用可能である。また、各実施形態ではデジタル信号に変換された入力信号を取り扱っているが、入力信号をアナログ信号のままで取り扱うことも可能である。ここで、本発明の実施形態を説明する前に、本発明と基本構成が共通する基本例について説明する。
【0026】
(基本例1)
本基本例の自動利得制御装置は、図1に示すように入力信号を一時的に記憶する入力信号バッファ部1と、入力信号(入力信号バッファ部1に記憶された入力信号)の比較的長い時間における時間平均を検出する長時間平均レベル検出部2と、入力信号(入力信号バッファ部1に記憶された入力信号)の比較的短い時間における時間平均を検出する短時間平均レベル検出部3と、長時間平均レベル検出部2で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数F1,F2,…,Fnのうちから何れか一つの利得関数Fi(i=1,2,…,n)を選択する利得関数選択部4と、短時間平均レベル検出部3で検出される入力信号の短時間平均値及び利得関数選択部4で選択された利得関数Fiから入力信号を増幅する際の利得を算出する利得算出部5と、利得算出部5で算出した利得と入力信号バッファ部1に記憶された入力信号とから出力信号を算出する、言い換えると入力信号を算出された利得で増幅する出力値算出部6とを備えている。
【0027】
入力信号バッファ部1では、例えば16ms程度の短い時間(以下、「バッファ時間」と呼ぶ)に入力された入力信号(入力データ)を記憶しており、短時間平均レベル検出部3では入力信号バッファ部1に記憶されているバッファ時間分の入力信号レベルの算術平均値(短時間平均値)を算出し、長時間平均レベル検出部2ではバッファ時間の定倍(例えば、16倍)の入力信号レベルの算術平均値(長時間平均値)を算出している。なお、長時間平均レベル検出部2では長時間平均値を算出するために入力信号バッファ部1のバッファ時間の定倍(例えば、16倍)のバッファ時間(容量)を有するバッファを具備している。
【0028】
利得関数選択部4は、図2に示すような3種類の利得関数F1,F2,F3のデータを保持している。図2に実線で示した利得関数F1は3種類のうちで利得(実線の傾き)が最も大きく、且つ入力レベルの上限値L1が最も小さくなっている。また、同図に破線で示した利得関数F3は3種類のうちで利得が最も小さく、且つ入力レベルの上限値L3が最も大きくなっている。さらに、同図に一点破線で示した利得関数F2は利得及び入力レベルの上限値L2が何れも3種類のうちの中間の値に設定されている。但し、これらの利得関数F1〜F3は一例であって、その種類や数は図2に示したものに限定されるものではない。
【0029】
次に本基本例の動作を説明する。
【0030】
長時間平均レベル検出部2で求めた入力信号の長時間平均値が利得関数選択部4に与えられ、利得関数選択部4では長時間平均値に応じた適切な利得関数Fi(i=1,2,3)を選択する。ここで、電話機等の通信機器による通話を例にとると、一般に長時間平均値は主に入力信号に含まれる雑音成分(音声以外の成分)によってそのレベルが決まり、短時間平均値は主に入力信号に含まれる信号成分(音声成分)によってそのレベルが決まると考えられる。したがって、長時間平均値が相対的に大きな値であれば入力信号に含まれる雑音成分が多く、反対に長時間平均値が相対的に小さな値であれば入力信号に含まれる雑音成分が少ないと判断できるから、利得関数選択部4では、長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択するとともに、相対的に中間レベルにあれば利得関数F2を選択する。利得算出部5では選択された利得関数Fiの入力レベルに短時間平均レベル検出部3で算出された短時間平均値を代入して出力レベルを求め、その出力レベルを入力レベル(短時間平均値)で除算することによって利得を算出する。
【0031】
そして、出力値算出部6において利得算出部5で算出した利得と入力信号バッファ部1に記憶されている入力信号とから出力値を算出する、言い換えると利得算出部5で算出した利得で入力信号を増幅することで出力信号を得ている。
【0032】
而して、入力信号に含まれる雑音成分、例えば電話機等の通信機器の周囲雑音が相対的に大きくなるに従って利得が減少し且つ入力レベルの上限値Li(i=1,2,3)が大きくなるように利得関数選択部4にて利得関数Fiを選択しているため、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、雑音成分のレベルによって決まる入力信号の長時間平均値に応じて利得関数Fiを選択し、さらに雑音成分以外の信号成分(音声成分)によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数Fiを選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。
【0033】
(基本例2)
本基本例は、図3に示すように短時間平均レベル検出部3にて短時間平均値を検出する際の単位時間(バッファ時間)内における入力信号のピーク値を検出する短時間ピーク検出部7と、短時間ピーク検出部7で検出されるピーク値が所定のしきい値を越える場合に利得算出部5で算出された利得を補正する利得補正部8とを備える点に特徴があり、これ以外の構成については基本例1と共通であるから説明を省略する。
【0034】
而して、基本例1においては、入力信号のピーク値がある程度大きくなった場合に出力値算出部6における出力値の算出時にオーバーフローが発生する可能性があり、仮に出力値算出部6でオーバーフローが発生すると所謂クリッピングノイズが生じて通話品質を劣化させてしまう虞がある。
【0035】
それに対して本基本例では、短時間ピーク検出部7で検出されるピーク値が所定のしきい値を越える場合、利得補正部8が利得算出部5で算出された利得を相対的に小さい値に補正するようにしている。その結果、しきい値を越えるようなレベルの高い入力信号が入力された場合でも出力信号にクリッピングノイズが生じたり、あるいは出力信号が歪むのを防止することができる。
【0036】
(基本例3)
本基本例は、図4に示すように入力信号が音声信号か否かを判別する入力信号判別部9を備え、入力信号判別部9の判別結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴があり、これ以外の構成については基本例2と共通であるから説明を省略する。
【0037】
入力信号判別部9は従来周知の技術を用いて実現可能であって、例えば、短時間平均レベル検出部3で求めた短時間平均値と、長時間平均レベル検出部2で求めた長時間平均値との比を所定のしきい値と比較することにより、入力信号が音声信号か否かを判別し、例えば音声信号であるときにH、音声信号でない(非音声信号)ときにLとなる2値信号(判別信号)を出力する。
【0038】
利得関数選択部4は、基本例1で説明したように長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択するとともに、相対的に中間レベルにあれば利得関数F2を選択するが、利得関数F1又はF2を選択した場合であっても、入力信号判別部9から出力される判別信号がL、つまり入力信号が非音声信号である場合には、選択した利得関数F1又はF2よりも利得の小さい利得関数F3に変更するようになっている。
【0039】
而して、入力信号が非音声信号のときに利得の大きい関数F1,F2を選択すると、非音声信号のレベルが必要以上に大きくなって通話上のノイズが増えてしまうことになるが、上述のように入力信号が音声信号か非音声信号かを判別し、非音声信号の場合には利得関数選択部4にて利得の小さい利得関数Fiに変更するようにしているから、非音声信号に対する利得が必要以上に大きくなるのを防いで入力信号の信号/雑音比の低下を抑えることができる。
【0040】
(基本例4)
本基本例は、図5に示すように入力信号が音声信号か否かを判別する入力信号判別部9と、入力信号判別部9により非音声信号と判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部10とを備えた点に特徴があり、これ以外の構成については基本例2と共通であるから説明を省略する。
【0041】
入力信号判別部9は基本例3と共通であって、例えば入力信号が音声信号であるときにH、非音声信号のときにLとなる判別信号を出力する。また、出力信号減衰部10は、入力信号判別部9から出力される判別信号がL、つまり入力信号が非音声信号である場合に出力値算出部6から出力された信号(出力信号)を減衰させるものである。なお、入力信号が音声信号である場合には出力信号減衰部10では出力信号を減衰させずにそのまま通過させる。
【0042】
而して、基本例3で説明したように入力信号が非音声信号のときに利得の大きい関数F1,F2を選択すると、非音声信号のレベルが必要以上に大きくなって通話上のノイズが増えてしまうことになるが、上述のように入力信号が音声信号か非音声信号かを判別し、非音声信号の場合には出力信号減衰部10によって出力信号を減衰させているから、音声信号以外の出力信号を減衰させることで雑音を低減することができる。
【0043】
ところで、入力信号が音声信号から非音声信号あるいは非音声信号から音声信号に切り換わる前後において、出力信号減衰部10による出力信号の減衰の有無に伴って出力信号のレベルが大きく変動するから、通話音声が途切れたり、急に大きくなる等して通話品質が低下してしまう虞がある。
【0044】
そこで、出力信号減衰部10においては、入力信号判別部9における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることが望ましい。例えば、図6(a)に示すような入力信号が入力され、同図(b)に示すように時刻t1で入力信号判別部9による入力信号の判別結果が非音声信号から音声信号に切り換わり、時刻t2で音声信号から非音声信号に切り換わると仮定する。このとき、同図(c)に示すように時刻t1,t2でそれぞれ出力信号減衰部10による減衰の有無を切り換えるのではなく、同図(d)に示すように時刻t1,t2から数ms〜数十msの間は入力信号が非音声信号のときの減衰量(図6中では「減衰量大」と表記)よりも小さい減衰量(図6中では「減衰量小」と表記)で出力信号を減衰させるのである。
【0045】
このように出力信号減衰部10による出力信号の減衰量を入力信号判別部9における判別結果が切り換わる際に段階的に変化させるようにすれば、入力信号が非音声信号から音声信号に切り換わったときに音声信号の先頭部分の音量が低下するといった不具合の発生を防いで通話品質の向上が図れる。
【0046】
(基本例5)
本基本例は、入力信号判別部9の構成に特徴があり、これ以外の構成については基本例3又は4と共通であるから図示並びに説明を省略する。
【0047】
本基本例における入力信号判別部9は、図7に示すように入力信号の長時間平均値及び短時間平均値の比率(=短時間平均値÷長時間平均値)を求める平均値比率算出部9aと、長時間平均値及び短時間平均値の差分を求めるとともその差分値を所定のしきい値と比較することで音声信号か否かを判別する平均値差分算出部9bと、平均値比率算出部9aで求めた平均値の比率に応じて平均値差分算出部9bにおけるしきい値を決定するしきい値決定部9cとを具備している。
【0048】
すなわち、従来周知の構成であれば、平均値比率算出部9a又は平均値差分算出部9bの算出値を所定のしきい値と比較することで入力信号が音声信号か否かを判別するのみであるが、平均値差分算出部9bにおけるしきい値を、平均値比率算出部9aで求めた平均値の比率に応じてしきい値決定部9cにて決定している点に本基本例の特徴がある。例えば、平均値比率算出部9aで算出した比率が1よりも大きい場合には入力信号が音声信号である可能性が高いと考えられ、反対に比率が1よりも小さい場合には入力信号が音声信号でない可能性が高いと考えられる。
【0049】
そこで本基本例においては、しきい値決定部9cが平均値比率算出部9aで算出した比率が1よりも大きい場合にしきい値を大きくし、反対に平均値比率算出部9aで算出した比率が1よりも小さい場合にしきい値を小さくすることによって、音声信号か否かの判別に対する入力信号の雑音成分(長時間平均値)の影響を低減するようにしている。
【0050】
なお、本基本例では、平均値比率算出部9aで求めた平均値の比率に応じて平均値差分算出部9bにおけるしきい値をしきい値決定部9cにて決定しているが、反対に平均値差分算出部9bで求めた差分値に応じて平均値比率算出部9aにおけるしきい値をしきい値決定部9cにて決定するようにしても構わない。あるいは、長時間平均値に応じて平均値比率算出部9a及び平均値差分算出部9bの各しきい値を適応的に決定するようにしても構わない。
【0051】
(基本例6)
本基本例は、図8に示すように入力信号の周波数分析結果から入力信号が音声信号か否かを判別する入力信号判別部11を備えた点に特徴があり、これ以外の構成は基本例4と共通であるから説明を省略する。つまり、基本例4における入力信号判別部9では、例えば短時間平均値と長時間平均値の比を所定のしきい値と比較することによって入力信号が音声信号か否かを判別するというように時間系列の信号から入力信号の判別を行っているのに対し、本基本例における入力信号判別部11では、入力信号を周波数分析した結果から入力信号の判別を行っている。
【0052】
入力信号判別部11は、図9に示すように入力信号を高速フーリエ変換(FFT)することで周波数分析する周波数分析部11aと、周波数分析部11aで得られる入力信号の周波数スペクトルを一時的に保存する遅延部11bと、非音声(例えば、相手の通信機器のマイクロホンで集音された周囲騒音)の成分の周波数スペクトルを推定する非音声成分スペクトル推定部11cと、周波数分析部11aで得られる入力信号の周波数スペクトルから非音声成分スペクトル推定部11cで推定された非音声成分の周波数スペクトルを減算するスペクトル減算部11dと、スペクトル減算部11dで求めた減算成分(差分)の周波数スペクトルのパワーを計算する減算成分パワー計算部11eと、減算成分パワー計算部11eで求めたパワー値が所定のしきい値を越えるときに音声信号、越えないときに非音声信号と判断して判別信号(例えば、音声信号のときに「H」、非音声信号のときに「L」となる2値信号)を出力する判別信号出力部11fとを具備している。
【0053】
非音声信号スペクトル推定部11cでは、判別信号出力部11fからLレベルの判別信号が出力されているとき、つまり入力信号が非音声信号と判別されているときに、その時点までに推定した非音声成分の周波数スペクトルと遅延部11bに保存されている入力信号の周波数スペクトルの平均を求め、その平均値をそれ以降における非音声成分の周波数スペクトルの推定値としている。なお、非音声成分の周波数スペクトルと入力信号の周波数スペクトルの平均を求める場合、単純な加算及び除算で求めることも可能であるが、それぞれに重み係数を乗算した後に加算及び除算して求めるようにしても良い。
【0054】
上述のように本基本例における入力信号判別部11は入力信号の周波数分析結果から音声信号か否かを判別するため、入力信号を時系列の信号として取り扱って音声信号か否かの判別を行う入力信号判別部9に比較して、音声信号か否かの判別の精度が向上するという利点がある。
【0055】
(実施形態1)
本実施形態は、図10に示すように利得補正部8で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部12を備えた点に特徴があり、これ以外の構成については、例えば基本例6と共通であるから説明を省略する。
【0056】
通常、入力信号は音声信号であるときの方が信号レベルが大きくなるから、出力信号を一定に保つためには音声信号のレベルが大きいほど利得は小さくなる傾向にある。一方、利得は、入力信号が非音声信号から音声信号あるいは音声信号から非音声信号に切り換わる時点で大きく変動すると考えられる。したがって、入力信号が音声信号から非音声信号に切り換わる時点では利得が大きく増大する傾向にあり、非音声信号に切り換わった後に利得が大きい値のままであると雑音が増幅されてしまう虞がある。
【0057】
そこで本実施形態では、利得変動補正部12によって利得補正部8で補正された利得の変動分を検出するとともに、検出した変動分が所定範囲を超える場合に、その変動を抑制する方向へ利得を補正するようにしている。例えば、利得変動補正部12は入力信号が音声信号から非音声信号に切り換わる時点を利得の変動分に基づいて検出し、非音声信号に切り換わった後の利得を補正して減少させるので、非音声信号(雑音)が大きく増幅されるのを抑えて入力信号の信号/雑音比の低下を防止することができる。なお、本実施形態では利得補正部8で補正された利得を利得変動補正部12で補正する構成としたが、利得算出部5で算出された利得を利得変動補正部12で補正する構成、例えば、基本例1の構成に利得変動補正部12を追加した構成であっても同様の効果を奏する。
【0058】
(実施形態2)
本実施形態は、図11に示すように入力信号から雑音成分を除去する雑音除去部13を備え、雑音除去部13の出力信号を短時間平均レベル検出部3の入力とした点に特徴があり、これ以外の構成は実施形態1と共通であるから説明を省略する。
【0059】
雑音除去部13は、図12に示すように入力信号をフーリエ変換して周波数スペクトルを求めるフーリエ変換部13aと、フーリエ変換部13aで得られる入力信号の周波数スペクトルを一時的に保存する遅延部13bと、非音声(例えば、相手の通信機器のマイクロホンで集音された周囲騒音)の成分の周波数スペクトルを推定する非音声成分スペクトル推定部13cと、フーリエ変換部13aで得られる入力信号の周波数スペクトルから非音声成分スペクトル推定部13cで推定された非音声成分の周波数スペクトルを減算するスペクトル減算部13dと、スペクトル減算部13dで求めた減算成分(差分)を逆フーリエ変換する逆フーリエ変換部13eとを具備しており、逆フーリエ変換部13eから出力される信号は入力信号から雑音成分(周囲騒音の成分)が除去された信号となる。ここで、非音声信号スペクトル推定部13cでは、入力信号判別部11からLレベルの判別信号が出力されているとき、つまり入力信号が非音声信号と判別されているときに、その時点までに推定した非音声成分の周波数スペクトルと遅延部13bに保存されている入力信号の周波数スペクトルの平均を求め、その平均値をそれ以降における非音声成分の周波数スペクトルの推定値としている。
【0060】
上述のように雑音除去部13により入力信号から雑音成分を除去した信号を短時間平均レベル検出部3の入力とすれば、雑音成分を除去した後の入力信号から短時間平均を検出することにより、雑音成分の影響を受けることなく的確な利得を算出することができる。
【0061】
(実施形態3)
本実施形態は、図13に示すように長時間平均レベル検出部2’が入力信号に含まれる雑音成分の推定値から長時間平均値を検出する点に特徴があり、これ以外の構成については実施形態2と共通であるから説明を省略する。
【0062】
本実施形態における長時間平均レベル検出部2’は、雑音除去部13の非音声成分スペクトル推定部13cで推定された非音声成分(周囲騒音)の周波数スペクトルを逆フーリエ変換により時間軸信号に戻し、その信号について長時間平均値を求める。
【0063】
而して、先の実施形態における長時間平均レベル検出部2では、入力信号の単純な算術平均を長時間平均値としているために雑音成分だけでなく音声成分が含まれる率が高くなっているが、本実施形態における長時間平均レベル検出部2’は入力信号に含まれる雑音成分の推定値から長時間平均値を求めているので、音声成分が含まれる率を大幅に低減することが可能となり、雑音成分のレベルによって決まる入力信号の長時間平均値を的確に検出することができて信号/雑音比の向上が図れる。また、長時間平均値が的確に検出可能となることによって、入力信号に含まれる雑音成分の増幅を抑えるように適切な利得を算出することができる。
【0064】
(実施形態4)
本実施形態は、図14に示すように長時間平均レベル検出部2”が短時間平均レベル検出部3で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出する点に特徴があり、これ以外の構成については実施形態2と共通であるから説明を省略する。
【0065】
基本例1〜6並びに実施形態1,2においては、図16(a)にしめすように入力信号バッファ部1が例えば128ビットのバッファ長を有するとしたとき、長時間平均レベル検出部2には、入力信号バッファ部1のx倍(例えば、16倍)のバッファ長(128×16=2048ビット)を持たせる必要があった。
【0066】
一方、本実施形態における長時間平均レベル検出部2”では、短時間平均レベル検出部3で検出された短時間平均値から長時間平均値を算出するので、図15(b)に示すように長時間平均レベル検出部2”のバッファにはx個(例えば、16個)の短時間平均値が格納可能であればよい。したがって、本実施形態では長時間平均レベル検出部2”のバッファ長を大幅(上述の例であれば2048ビットから16ビット)に低減することができ、長時間平均値を求める際の計算量やバッファ容量が減少するという利点がある。なお、合計x個の短時間平均値のうちからy個ずつについて求めた算術平均をバッファに格納し、それらy個の平均値を平均して長時間平均値を求めるようにすれば、長時間平均レベル検出部2”のバッファ容量をさらに低減することができる。
【0067】
(実施形態5)
本実施形態は、図17に示すように長時間平均レベル検出部2”が入力信号判別部11にて音声信号でない、つまり非音声信号と判別されたときにのみ入力信号の長時間平均を検出する点に特徴があり、これ以外の構成については実施形態4と共通であるので説明を省略する。
【0068】
而して、長時間平均レベル検出部2”は入力信号判別部11から出力される判別信号がHレベルのとき(入力信号が音声信号のとき)には長時間平均値の算出せず、判別信号がLレベルの時(入力信号が非音声信号のとき)に長時間平均値を算出するから、音声信号に含まれる背景雑音の成分を長時間平均値として検出することができ、背景雑音成分のレベルに応じた適切な利得関数の選択が可能となる。
【0069】
(実施形態6)
本実施形態は、入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を入力信号バッファ部1の前段に設けた点に特徴がある。但し、入力信号バッファ部1以降の構成並びに動作については基本例1と共通であるから説明は省略する。
【0070】
本実施形態における雑音成分除去手段は、図18に示すように時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部14と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部15と、非音声区間検出部14で検出される非音声区間に周波数変換部15で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部16と、周波数変換部15で求められた周波数スペクトルから非音声スペクトル推定部16で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部17と、周波数スペクトル減算部17で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部18とで構成される。
【0071】
非音声区間検出部14は従来周知の技術を用いて実現可能であって、例えば、入力信号に含まれる音声成分の瞬時パワーを推定するとともに非音声成分(背景雑音成分)のレベルを推定し、瞬時パワー推定値と非音声成分レベルの比に基づいて入力信号に音声成分が含まれていないと見なし得る区間(非音声区間)を検出する。また周波数変換部15は、フーリエ変換やウェーブレット変換等を用いて入力信号の周波数スペクトルを求めている。
【0072】
非音声スペクトル推定部16は、周波数変換部15で求めた入力信号の周波数スペクトルのうちで非音声区間検出部14で検出された非音声区間の入力信号に対応する周波数スペクトルの平均値を求め、その平均値を非音声信号の周波数スペクトル推定値とする。そして、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去することができる。それから、周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0073】
而して、本実施形態では、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。
【0074】
(実施形態7)
本実施形態は、図19に示すように実施形態6における非音声区間検出部14、周波数変換部15並びに非音声スペクトル推定部16からなる雑音検出部を長時間平均レベル検出部2の代わりに用いた点に特徴がある。但し、これ以外の構成並びに動作については基本例1及び実施形態6と共通であるから説明は省略する。
【0075】
本実施形態の非音声スペクトル推定部16では、非音声区間における周波数スペクトルのパワースペクトルを求め、さらに各帯域毎にパワースペクトルの平均値を算出している。ここで、非音声スペクトル推定部16で算出される前記パワースペクトルの平均値は入力信号に含まれる雑音成分によってそのレベルが決まるから、基本例1における長時間平均値の代わりに前記パワースペクトルの平均値に応じて利得関数選択部4が適切な利得関数Fi(i=1,2,3)を選択することができる。
【0076】
而して、入力信号に含まれる雑音成分、例えば電話機等の通信機器の周囲雑音が相対的に大きくなるに従って利得が減少し且つ入力レベルの上限値Li(i=1,2,3)が大きくなるように利得関数選択部4にて利得関数Fiを選択することにより、単一の利得関数のみで利得制御を行う従来例に比較して、基本例1と同様に入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、雑音成分のレベルによって決まる入力信号の非音声区間における周波数スペクトルのパワースペクトル平均値に応じて利得関数Fiを選択し、さらに雑音成分以外の信号成分(音声成分)によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数Fiを選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。なお、本実施形態では雑音成分除去手段の一部を雑音検出部と兼用しているために構成の簡略化が図れるという利点がある。
【0077】
(実施形態8)
図20に本実施形態のブロック図を示す。本実施形態は、基本例4における入力信号判別部9の代わりに非音声区間検出部14による非音声区間の検出結果を出力信号減衰部10に入力し、非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10で減衰させる点に特徴がある。なお、これ以外の構成及び動作は基本例4並びに実施形態7と共通であるから説明は省略する。
【0078】
而して、本実施形態では、基本例4と同様に非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10によって減衰させることにより、音声信号以外の出力信号を減衰させて雑音を低減することができ、しかも、雑音成分除去手段の一部を入力信号判別部9の代わりに用いることで構成の簡略化が図れるという利点がある。
【0079】
(実施形態9)
図21に本実施形態のブロック図を示す。本実施形態は、基本例3における入力信号判別部9の代わりに非音声区間検出部14による非音声区間の検出結果を利得関数選択部4に入力し、非音声区間検出部14の検出結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴があり、これ以外の構成については基本例3並びに実施形態8と共通であるから説明を省略する。
【0080】
而して、本実施形態では基本例3と同様に、非音声区間の入力信号に対しては利得関数選択部4が利得の小さい利得関数Fiに変更することにより、非音声信号に対する利得が必要以上に大きくなるのを防いで入力信号の信号/雑音比の低下を抑えることができ、しかも、雑音成分除去手段の一部を入力信号判別部9の代わりに用いることで構成の簡略化が図れるという利点がある。
【0081】
(実施形態10)
図22に本実施形態のブロック図を示す。本実施形態は、雑音成分除去手段を構成する非音声区間検出部14’が周波数変換部15から得られる入力信号の周波数スペクトルより入力信号に音声信号が含まれない非音声区間を検出する点に特徴があり、その他の構成及び動作については実施形態6と共通であるから説明を省略する。
【0082】
本実施形態における非音声区間検出部14’は、周波数変換部15で得られる入力信号の周波数スペクトルを、予め用意された非音声(周囲騒音など)の周波数スペクトルモデルと比較し、当該周波数スペクトルモデルと一致する程度に応じて帯域毎に音声か非音声かを判別し、一定数以上の帯域を非音声と判別した場合に当該区間を非音声区間と判断するとともに、非音声と判別した帯域の周波数スペクトルと周波数スペクトルモデルとの平均をとって非音声の周波数スペクトルモデルを更新する。但し、非音声区間検出部14’では、上述の方法により音声と判別した帯域が所望の帯域から外れる場合にはその帯域を非音声と判断する。以下、非音声区間検出部14’で検出された非音声区間の入力信号に対応する周波数スペクトルから非音声スペクトル推定部16にて非音声信号の周波数スペクトル推定値を求め、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去し、さらに周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0083】
而して、本実施形態においても実施形態6と同様に、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、本実施形態における非音声区間検出部14’では、入力信号の周波数スペクトルから周波数帯域毎に音声か非音声かを判別して非音声区間を検出しているから、実施形態6における非音声区間検出部14に比較して非音声区間の検出精度が高くなるという利点がある。
【0084】
(実施形態11)
図23に本実施形態のブロック図を示す。本実施形態は、周波数変換部15から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部14’に与えるスペクトル正規化部19を備えた点に特徴があり、これ以外の構成及び動作については実施形態10と共通であるから説明を省略する。
【0085】
スペクトル正規化部19は、周波数変換部15で求めた入力信号の周波数スペクトルのパワースペクトルを計算してその平均値を求め、さらにその平均値で各周波数帯域のパワースペクトル値を除算(正規化)する処理(パワー正規化処理)を行う。以下、非音声区間検出部14’で入力信号の非音声区間を検出し、非音声区間検出部14’で検出された非音声区間の入力信号に対応する周波数スペクトルから非音声スペクトル推定部16にて非音声信号の周波数スペクトル推定値を求め、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去し、さらに周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0086】
而して、本実施形態においても実施形態6や7と同様に、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、本実施形態においてはスペクトル正規化部19を備えているから、パワー正規化処理によって周波数スペクトルの形状における特徴(山の部分や谷の部分)が明確になり、非音声区間検出部14’による非音声区間の検出制度が向上できるという利点がある。
【0087】
(実施形態12)
図24に本実施形態のブロック図を示す。本実施形態は、実施形態11におけるスペクトル正規化部19、非音声区間検出部14’、周波数変換部15並びに非音声スペクトル推定部16からなる雑音検出部を長時間平均レベル検出部2の代わりに用いた点に特徴があり、これ以外の構成並びに動作については実施形態11及び実施形態7と共通であるから説明は省略する。
【0088】
而して、本実施形態では入力信号の非音声区間の検出精度を向上させることで利得関数選択部4における利得関数の選択ミスを防いで入力信号に含まれる雑音成分に応じた適切な利得関数を選択することができる。
【0089】
(実施形態13)
図25に本実施形態のブロック図を示す。本実施形態は、実施形態8と実施形態11を組み合わせたものであって、非音声区間検出部14’による非音声区間の検出結果を出力信号減衰部10に入力し、非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10で減衰させる点に特徴がある。なお、これ以外の構成及び動作は実施形態8並びに実施形態11と共通であるから説明は省略する。
【0090】
而して、本実施形態では、入力信号の非音声区間の検出精度を向上させることで出力信号減衰部10による音声信号以外の出力信号の減衰による雑音低減効果を高めることができるとともに構成の簡略化が図れるという利点がある。
【0091】
(実施形態14)
図26に本実施形態のブロック図を示す。本実施形態は、実施形態9と実施形態11を組み合わせたものであって、非音声区間検出部14’による非音声区間の検出結果を利得関数選択部4に入力し、非音声区間検出部14’の検出結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴がある。なお、これ以外の構成については実施形態9並びに実施形態11と共通であるから説明を省略する。
【0092】
而して、本実施形態では、入力信号の非音声区間の検出精度を向上させることで利得関数選択部4における利得関数の選択制度が向上し、入力信号の信号/雑音比の低下を一層確実に抑えることができるとともに構成の簡略化が図れるという利点がある。
【0093】
【発明の効果】
請求項1の発明は、入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音成分を検出する雑音検出部と、入力信号の16m秒程度の短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音成分の大きさに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部と、利得算出部で算出された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部とを備え、雑音検出部は、入力信号の前記短い時間を16倍した時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択してなり、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とし、短時間平均値は主に入力信号に含まれる雑音成分以外の信号成分によってそのレベルが決まるから、雑音検出部で検出される雑音の程度に応じて複数の利得関数のうちから何れか一つを選択するとともに選択された利得関数及び短時間平均値から算出される利得で入力信号を増幅することにより、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、入力信号に含まれる雑音の程度に応じて利得関数を選択し、さらに雑音成分以外の信号成分によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数を選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。また、長時間平均値は主に入力信号に含まれる雑音成分によってそのレベルが決まるから入力信号に含まれる雑音の程度を表す値として用いることができ、入力信号に含まれる雑音の程度が比較的容易に検出できる。さらに、雑音成分のレベルによって決まる入力信号の長時間平均値を的確に検出することができて信号/雑音比の向上が図れる。しかも、一般に入力信号の状態が変化する際に利得の変動が大きくなることから、利得の変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することによって雑音成分が増幅されるのを抑えて信号/雑音比の低下が防止できる。
【0096】
請求項2の発明は、請求項1の発明において、長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とし、入力信号から直接長時間平均を検出する場合に比較して検出に要する手間や構成が簡略化できる。
【0097】
請求項3の発明は、請求項1又は2の発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とし、音声信号に含まれる背景雑音の成分を長時間平均値として検出することができ、背景雑音成分のレベルに応じた適切な利得関数の選択が可能となる。
【0098】
請求項4の発明は、請求項1の発明において、雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とし、非音声信号の周波数スペクトルは主に入力信号に含まれる雑音成分によってそのレベルが決まるから入力信号に含まれる雑音の程度を表す値として用いることができ、入力信号に含まれる雑音の程度が比較的容易に検出できる。
【0099】
請求項5の発明は、請求項1〜4の何れかの発明において、短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とし、しきい値を越えるようなレベルの高い入力信号が入力された場合に出力信号が歪むのを防止することができる。
【0100】
請求項6の発明は、請求項1〜5の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とし、音声信号でない非音声信号に対する利得が必要以上に大きくなるのを防いで出力信号の信号/雑音比の低下を抑えることができる。
【0101】
請求項7の発明は、請求項1〜6の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とし、音声信号以外の出力信号を減衰させることで雑音を低減することができる。
【0102】
請求項8の発明は、請求項7の発明において、出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とし、入力信号が非音声信号から音声信号に切り換わったときに音声信号の先頭部分の音量が低下するといった不具合の発生を防いで通話品質の向上が図れる。
【0103】
請求項9の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とし、長時間平均値が短時間平均値よりも相対的に大きな値となるときに入力信号判別用のしきい値を変更することにより、音声信号か否かの判別に対する入力信号の雑音成分の影響を低減することができる。
【0104】
請求項10の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とし、音声信号か否かの判別の精度が向上する。
【0105】
請求項11の発明は、請求項5の発明において、前記利得変動補正部は、利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することを特徴とし、一般に入力信号の状態が変化する際に利得の変動が大きくなることから、利得の変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することによって雑音成分が増幅されるのを抑えて信号/雑音比の低下が防止できる。
【0106】
請求項12の発明は、請求項1〜11の何れかの発明において、入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とし、雑音成分を除去した後の入力信号から短時間平均を検出することにより、雑音成分の影響を受けることなく的確な利得を算出することができる。
【0107】
請求項13の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とし、音声信号以外の雑音成分を入力信号から除去するから、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。
【0108】
請求項14の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とし、音声信号以外の雑音成分を入力信号から除去するから、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、非音声区間検出部では入力信号の周波数スペクトルから非音声区間を検出することで検出の精度を向上することができる。
【0109】
請求項15の発明は、請求項14の発明において、周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とし、パワー正規化によって入力信号の周波数スペクトルの特徴が明確になって非音声区間検出部による非音声区間の検出精度が向上する。
【0110】
請求項16の発明は、請求項13又は14の発明において、雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とし、構成の簡略化が図れる。
【0111】
請求項17の発明は、請求項13又は14の発明において、雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とし、構成の簡略化が図れる。
【図面の簡単な説明】
【図1】本発明の基本例1を示すブロック図である。
【図2】同上における利得関数の説明図である。
【図3】基本例2を示すブロック図である。
【図4】基本例3を示すブロック図である。
【図5】基本例4を示すブロック図である。
【図6】同上の説明図である。
【図7】基本例5における入力信号判別部のブロック図である。
【図8】基本例6を示すブロック図である。
【図9】同上における入力信号判別部のブロック図である。
【図10】実施形態1を示すブロック図である。
【図11】実施形態2を示すブロック図である。
【図12】同上における雑音除去部のブロック図である。
【図13】実施形態3を示すブロック図である。
【図14】実施形態4を示すブロック図である。
【図15】同上における長時間平均レベル検出部の動作説明図である。
【図16】同上における長時間平均レベル検出部の動作説明図である。
【図17】実施形態5を示すブロック図である。
【図18】実施形態6を示すブロック図である。
【図19】実施形態7を示すブロック図である。
【図20】実施形態8を示すブロック図である。
【図21】実施形態9を示すブロック図である。
【図22】実施形態10を示すブロック図である。
【図23】実施形態11を示すブロック図である。
【図24】実施形態12を示すブロック図である。
【図25】実施形態13を示すブロック図である。
【図26】実施形態14を示すブロック図である。
【図27】従来の自動利得制御装置における利得関数の説明図である。
【符号の説明】
1 入力信号バッファ部
2 長時間平均レベル検出部
3 短時間平均レベル検出部
4 利得関数選択部
5 利得算出部
6 出力値算出部
Claims (17)
- 入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音成分を検出する雑音検出部と、入力信号の16m秒程度の短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音成分の大きさに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部と、利得算出部で算出された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部とを備え、雑音検出部は、入力信号の前記短い時間を16倍した時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択してなり、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とする自動利得制御装置。
- 長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とする請求項1記載の自動利得制御装置。
- 入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とする請求項1又は2記載の自動利得制御装置。
- 雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする請求項1記載の自動利得制御装置。
- 短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とする請求項1〜4の何れかに記載の自動利得制御装置。
- 入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とする請求項1〜5の何れかに記載の自動利得制御装置。
- 入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とする請求項1〜6の何れかに記載の自動利得制御装置。
- 出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とする請求項7記載の自動利得制御装置。
- 入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とする請求項6又は7又は8記載の自動利得制御装置。
- 入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とする請求項6又は7又は8記載の自動利得制御装置。
- 前記利得変動補正部は、利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することを特徴とする請求項5記載の自動利得制御装置。
- 入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とする請求項1〜11の何れかに記載の自動利得制御装置。
- 雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする請求項1〜12の何れかに記載の自動利得制御装置。
- 雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする請求項1〜12の何れかに記載の自動利得制御装置。
- 周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とする請求項14記載の自動利得制御装置。
- 雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とする請求項13又は14記載の自動利得制御装置。
- 雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とする請求項13又は14記載の自動利得制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002334172A JP4321049B2 (ja) | 2002-07-29 | 2002-11-18 | 自動利得制御装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002220322 | 2002-07-29 | ||
JP2002334172A JP4321049B2 (ja) | 2002-07-29 | 2002-11-18 | 自動利得制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004129187A JP2004129187A (ja) | 2004-04-22 |
JP4321049B2 true JP4321049B2 (ja) | 2009-08-26 |
Family
ID=32300616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002334172A Expired - Fee Related JP4321049B2 (ja) | 2002-07-29 | 2002-11-18 | 自動利得制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4321049B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190074718A (ko) * | 2017-12-20 | 2019-06-28 | 주식회사 디엠씨시스 | 사용자 특성을 고려한 오디오 출력 조정 시스템 및 그 조정 방법 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100561440B1 (ko) | 2004-07-24 | 2006-03-17 | 삼성전자주식회사 | 채널 변경에 따른 음량 자동 보정 장치 및 그 방법 |
JP4604836B2 (ja) * | 2005-05-20 | 2011-01-05 | ブラザー工業株式会社 | 音声処理装置、通話装置、およびプログラム |
JP4631581B2 (ja) * | 2005-07-27 | 2011-02-16 | パナソニック電工株式会社 | 拡声通話装置 |
JP4650163B2 (ja) * | 2005-08-25 | 2011-03-16 | パナソニック電工株式会社 | 拡声通話装置 |
RU2438197C2 (ru) | 2007-07-13 | 2011-12-27 | Долби Лэборетериз Лайсенсинг Корпорейшн | Обработка звуковых сигналов с использованием анализа слуховой сцены и спектральной асимметрии |
JP4826625B2 (ja) | 2008-12-04 | 2011-11-30 | ソニー株式会社 | 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器 |
JP5120288B2 (ja) | 2009-02-16 | 2013-01-16 | ソニー株式会社 | 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器 |
JP5316560B2 (ja) * | 2011-02-07 | 2013-10-16 | ソニー株式会社 | 音量補正装置、音量補正方法および音量補正プログラム |
JP5702666B2 (ja) * | 2011-05-16 | 2015-04-15 | 富士通テン株式会社 | 音響装置および音量補正方法 |
JP6065308B2 (ja) * | 2012-09-07 | 2017-01-25 | パナソニックIpマネジメント株式会社 | 音量補正装置 |
KR20160132574A (ko) | 2015-05-11 | 2016-11-21 | 현대자동차주식회사 | 자동이득제어모듈, 그 제어방법, 이를 포함하는 차량, 및 그 제어방법 |
EP3479378B1 (en) | 2016-07-04 | 2023-05-24 | Harman Becker Automotive Systems GmbH | Automatic correction of loudness level in audio signals containing speech signals |
-
2002
- 2002-11-18 JP JP2002334172A patent/JP4321049B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190074718A (ko) * | 2017-12-20 | 2019-06-28 | 주식회사 디엠씨시스 | 사용자 특성을 고려한 오디오 출력 조정 시스템 및 그 조정 방법 |
KR102009383B1 (ko) * | 2017-12-20 | 2019-08-09 | 주식회사 디엠씨시스 | 사용자 특성을 고려한 오디오 출력 조정 시스템 및 그 조정 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2004129187A (ja) | 2004-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2241099B1 (en) | Acoustic echo reduction | |
JP4681163B2 (ja) | ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法 | |
US6618701B2 (en) | Method and system for noise suppression using external voice activity detection | |
JP5036874B2 (ja) | エコー消去装置 | |
JP4321049B2 (ja) | 自動利得制御装置 | |
US8126176B2 (en) | Hearing aid | |
EP2811485A1 (en) | Sound correcting apparatus, sound correcting program, and sound correcting method | |
US20110125494A1 (en) | Speech Intelligibility | |
US8321215B2 (en) | Method and apparatus for improving intelligibility of audible speech represented by a speech signal | |
JP3961290B2 (ja) | 雑音抑圧装置 | |
US9154874B2 (en) | Howling detection device, howling suppressing device and method of detecting howling | |
US8489393B2 (en) | Speech intelligibility | |
EP2132734B1 (en) | Method of estimating noise levels in a communication system | |
CN103270740A (zh) | 声音控制装置、声音控制方法、声音控制程序以及移动终端装置 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
JP3973929B2 (ja) | ハウリング検出装置 | |
US5787165A (en) | Handsfree radiotelephone having dynamic path attenuation control for echo suppression | |
US20150039300A1 (en) | Vehicle-mounted communication device | |
CN110136734B (zh) | 使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器 | |
US7085370B1 (en) | Ringback detection circuit | |
JP2008522511A (ja) | 適応可能な音声処理パラメータ用の方法及び装置 | |
JP2009147701A (ja) | 振幅制御装置、携帯電話装置、および振幅制限方法 | |
JP2009147702A (ja) | 騒音レベル推定装置、受話音量制御装置、携帯電話装置、および騒音レベル推定方法 | |
JP2004032387A (ja) | ハウリング制御装置及び補聴器 | |
WO2020203258A1 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050614 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081014 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090512 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090525 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130612 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |