[go: up one dir, main page]

JP2005525717A - 選択的な音の増幅 - Google Patents

選択的な音の増幅 Download PDF

Info

Publication number
JP2005525717A
JP2005525717A JP2003531458A JP2003531458A JP2005525717A JP 2005525717 A JP2005525717 A JP 2005525717A JP 2003531458 A JP2003531458 A JP 2003531458A JP 2003531458 A JP2003531458 A JP 2003531458A JP 2005525717 A JP2005525717 A JP 2005525717A
Authority
JP
Japan
Prior art keywords
signal
sound
desired sound
filter
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003531458A
Other languages
English (en)
Inventor
アレクサンドル エル ゴノポルスキー
Original Assignee
クラリティー リミテッド ライアビリティ カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クラリティー リミテッド ライアビリティ カンパニー filed Critical クラリティー リミテッド ライアビリティ カンパニー
Publication of JP2005525717A publication Critical patent/JP2005525717A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

異なる方向に向けられた、2つのマイクロフォン又はマイクロフォンの組が、該マイクロフォンから受け取られた信号の相関性及びコヒーレンスに基づいてフィルタパラメータを生成するのに用いられる。第1の信号は、少なくとも1つの第1のマイクロフォンによって受け取られた音から取得される。各々の第1のマイクロフォンは、第1の主要な感度方向を含む第1の方向の組からの音を受け取る。所望の音方向は、第1の方向の組に含まれる。第2の信号は、少なくとも1つの第2のマイクロフォンによって受け取られた音から取得される。各々の第2のマイクロフォンは、第1の主要な感度方向とは異なる第2の主要な感度方向を含む第2の方向の組からの音を受け取る。所望の音方向は、第2の方向の組に含まれる。フィルタ係数は、第1の信号及び第2の信号のコヒーレンス、及び、該第1の信号及び該第2の信号の相関性に基づいて求められる。第1の信号及び第2の信号の組み合わせは、求められたフィルタ係数によりフィルタ処理される。

Description

本発明は、雑音がある状態でのスピーチ(会話)のような所望の音を検出して増幅することに関する。
多くの用途において、他の方向から発生する音を大幅に除去することにより、特定の方向から明瞭な音を求めることを必要とする。このような適用例は、電話、コンピュータ、補聴器、セキュリティ及び音声作動式制御を含む多種多様の製品における音声認識及び検出、マン・マシン・インターフェース、スピーチの増幅その他同様なものを含む。
空間的フィルタ処理は、信号源の物理的位置に基づいて多数の信号源の間を区別するために意図的に設計される場合には、効果的な方法となることがある。このような区別は、例えば、指向性マイクロフォンアレイにより可能になる。しかしながら、空間的フィルタ処理のために用いられる通常のビーム形成技術は、いくつかの問題を有する。第1に、このような技術は、適切な大きさのアパーチャーを実現するために、大きなマイクロフォン間隔を必要とする。第2に、このような技術は、狭帯域信号に対してより適用できるものであり、相対的に広帯域信号であるスピーチについては、必ずしも十分な性能をもたらすわけではない。
必要とされているのは、スピーチについて良好な性能及び小さな寸法の両方を提供するスピーチの増幅である。
本発明は、異なる方向に向けられた、2つのマイクロフォン、又は、マイクロフォンの組からの入力を用いて、該マイクロフォンから受け取られた信号の相関性及びコヒーレンスに基づいてフィルタパラメータを生成するようにするものである。
所望の音方向から来る所望の音を増幅する方法が提供される。第1の信号は、少なくとも1つの第1のマイクロフォンにより受け取られた音から取得される。各々の第1のマイクロフォンは、第1の主要な感度方向を含む第1の方向の組からの音を受け取る。所望の音方向は、第1の方向の組に含まれる。第2の信号は、少なくとも1つの第2のマイクロフォンにより受け取られた音から取得される。各々の第2のマイクロフォンは、第1の主要な感度方向とは異なる第2の主要な感度方向を含む第2の方向の組からの音を受け取る。所望の音方向は、第2の方向の組に含まれる。フィルタ係数は、第1の信号及び第2の信号のコヒーレンス、及び、該第1の信号及び該第2の信号の間の相関性に基づいて求められる。第1の信号及び第2の信号の組み合わせは、求められたフィルタ係数によりフィルタ処理される。
本発明の実施形態においては、第1の主要な感度方向も第2の主要な感度方向も、所望の音方向と同じではない。
本発明の別の実施形態においては、所望の音方向と第1の主要な感度方向との間の角度オフセットは、該所望の音方向と第2の主要な感度方向との間の角度オフセットと大きさが等しい。
本発明のさらに別の実施形態においては、フィルタ係数は、第1の信号及び第2の信号に基づいてコヒーレンス係数を求め、該第1の信号及び該第2の信号に基づいて相関係数を求め、次いで、コヒーレンス係数を該相関係数で基準化することにより見出される。
本発明によるさらに別の実施形態においては、第1の信号及び第2の信号は、フィルタ係数を求める前に空間的フィルタ処理される。この空間的フィルタ処理は、第1の信号の遅延バージョンを第2の信号から引くことにより、及び該第2の信号の遅延バージョンを該第1の信号から引くことにより達成できる。
本発明のさらに別の実施形態においては、所望の音はスピーチを含む。
さらに、所望の音方向から受け取られた所望の音を再生するためのシステムが提供される。少なくとも1つのマイクロフォンを有する第1のマイクロフォンの組は、第1の方向に向けられる。第1のマイクロフォンの組は、所望の音を含む受け取った音に応答して第1の信号を生成する。少なくとも1つのマイクロフォンを有する第2のマイクロフォンの組は、第1の方向とは異なる第2の方向に向けられる。第2のマイクロフォンの組は、所望の音を含む受け取った音に応答して第2の信号を生成する。フィルタ推定器は、第1の信号及び第2の信号のコヒーレンス、及び、該第1の信号及び該第2の信号の相関性に基づいてフィルタ係数を求める。フィルタは、第1の信号及び第2の信号を、求められたフィルタ係数によりフィルタ処理する。
さらに、所望の音を増幅するために複数の受け取った音の信号をフィルタ処理するのに用いられるフィルタ係数を生成する方法が提供される。第1の音の信号は、所望の音方向を含む第1の方向の組から受け取られる。第2の音の信号は、所望の音方向を含む第2の方向の組から受け取られる。第2の方向の組は、第1の組の方向ではない方向を含む。コヒーレンス係数は、第1の音の信号及び第2の音の信号に基づいて求められる。相関係数は第1の音の信号及び第2の音の信号に基づいて求められる。フィルタ係数は、コヒーレンス係数を相関係数で基準化することにより生成される。
図1を参照すると、本発明において用いることのできる異なる方向性をもつ2つのマイクロフォンのパターンを示す概略図が示されている。本発明は、異なる方向性ピックアップパターンをもった2つ又はそれ以上のマイクロフォンが、特定の方向から届く1つ又はそれ以上の信号を選択するように配置されるものとして示される方向性パターンを利用するものである。
図1は、異なる方向性をもつ2つのマイクロフォンの一例を示す。以下の説明において、一方又は両方のマイクロフォンは、マイクロフォン群と置き換えてもよい。同様に、2つより多い方向を、同時であるか、又は、複数のマイクロフォンによって支持される多くの方向から2つ又はそれ以上を選択することのいずれかにより考えることができる。
信号方向1から届く信号及び他の源から届く多数の雑音源を選択するように配置された2つのマイクロフォンを考える。左のマイクロフォンは、主要な感度方向2を有し、右のマイクロフォンは、主要な感度方向3を有する。左のマイクロフォンは、4で示される極性応答プロットを有し、右のマイクロフォンは、5で示される極性応答プロットを有する。領域6は、左及び右のマイクロフォンのスピーチ方向1に対する共同応答領域を示す。
各々の複数の雑音源は、Nx(j)と表示が付けられ、ここでは、Xは方向(左又は右)を定義し、jは指定された番号である。これらは、実際の物理的な雑音源である必要はない。各Nx(j)は、例えば、マイクロフォンに届く雑音信号の近似とすることができる。すべての音源は、異なる位置から受け取られた場合には、独立した源であるものと仮定される。
図1に示されるシステムは、両方のマイクロフォンが、方向1からの本質的に同じ信号の解釈であるが、異なる雑音の解釈を拾い上げることを示す。左のマイクロフォンの信号(ML)及び右のマイクロフォンの信号(MR)は、以下のように表すことができ、
Figure 2005525717

Figure 2005525717
ここで、SpeechLは、左のマイクロフォン又はマイクロフォン群に登録されたスピーチの解釈であり、SpeechRは、右のマイクロフォン又はマイクロフォン群に登録されたスピーチの解釈である。スピーチの信号自体(従って、このような左及び右の解釈の両方)は、スピーチ方向1から届き、しかも、合計された雑音NL及びNRは、左及び右の方向それぞれから届く音を構成する。
図2は、マイクロフォンの多数の群を用いる本発明の実施形態を示す。マイクロフォンの組20を用いて、より大きな方向性を達成することができる。さらに、多数のマイクロフォン20又はマイクロフォン群20は、スピーチが取得される方向1を選択するために使用することができる。
ここで図3を参照すると、本発明の実施形態を示すブロック図が示される。全体を40で示されるスピーチ獲得システムは、少なくとも2つのマイクロフォン又はマイクロフォン群を含む。図示例においては、左のマイクロフォン42は応答パターン3を有し、右のマイクロフォン44は応答パターン5を有する。マイクロフォン42、44の重なり合う領域6は、スピーチ方向1において、組み合わされた応答パターン46を生成する。
左のマイクロフォン42は、左の信号48を生成する。右のマイクロフォン44は、右の信号50を生成する。フィルタ推定器52は左の信号48及び右の信号50を受け取り、フィルタ係数54を生成する。加算器56は、左の信号48及び右の信号50を合計して、合計信号58を生成する。フィルタ60は、フィルタ係数54を用いて、合計信号58をフィルタ処理して、方向1以外の方向からの無相関雑音による影響が減少された、方向1からのスピーチを有する出力信号62を生成するようにする。
ここで図4を参照すると、本発明の実施形態によるフィルタ係数推定を示すブロック図が示される。フィルタ推定器52は、左のマイクロフォン42からの左の信号48、及び、右のマイクロフォン44からの右の信号50を受け取る空間フィルタ70を含む。空間フィルタ70は、マイクロフォン信号48、50のうちの少なくとも1つより高い比率の雑音、又はより高い比率の信号を有する少なくとも1つの信号を含むことのできるフィルタ処理された信号72を生成する。空間フィルタ70はさらに、環境における雑音源の特定のサブセット、又は、マイクロフォン42、44に対して特定の方向の組から発生する雑音源からのより大きい容量を含むフィルタ処理された信号72を生成できる。
コヒーレンス推定器74は、フィルタ処理された信号72の少なくとも1つを受け取り、コヒーレンス係数76を生成する。相関係数推定器78は、フィルタ処理された信号72の少なくとも1つを受け取り、少なくとも1つの相関係数80を生成する。フィルタ係数54は、コヒーレンス係数76及び相関係数80に基づくものである。図示実施形態においては、コヒーレンス係数76は、相関係数80で基準化される。
ここで、本発明の実施形態の数学的実装が与えられる。ここでの仮定は、合計された雑音NL及びNRはコヒーレントではないが、左のマイクロフォン44(SpeechL)及び右のマイクロフォン48(SpeechR)による解釈はコヒーレントであるというものである。このことは、所望のスピーチ信号と合計された雑音NL及びNRとの間の信号対雑音の比を最大にするコヒーレンス関数に基づいた最適なフィルタの構成を可能にする。
2つの信号X及びYのコヒーレンス関数は、以下のように定義でき、
Figure 2005525717
ここで、Sx(ω)及びSy(ω)は、信号X及びYの複素フーリエ変換であり、Sxy(ω)は信号X及びYの複素コスペクトルであり、〈*〉は、1コマごとの記号の平均である。
スペクトルSL(ω)及びSR(ω)は、スピーチSSP(ω)の複素スペクトル、及び、合計された雑音の複素スペクトルにより定義することができ、SNL(ω)は合計されたNLであり、SNR(ω)は合計されたNRである。このように、左及び右のチャネルについてのフーリエ変換は、以下のように表すことができる。
L(ω)=SSP(ω)+SNL(ω)
R(ω)=SSP(ω)+SNR(ω)
次いで、スペクトルの大きさの二乗は以下のようになる。
L 2(ω)=SSP 2(ω)+SNL 2(ω)
R 2(ω)=SSP 2(ω)+SNR 2(ω)
左及び右のチャネルの複素コスペクトルは、以下のように表すことができる。
Figure 2005525717
P、NL及びNRは、独立した源であるので、以下の不等式は、それぞれの積について成り立つ。
Figure 2005525717
さらに、その帯域におけるスピーチのパワーが大きい場合には、スピーチにより占められる周波数帯ωにおいて、CohLR(ω)⇒1である。しかしながら、スピーチがない場合には、CohLR(ω)は、ゼロと1との間にある。
スピーチ周波数帯においては、マイクロフォン20及びマイクロフォン20群の間に小さい距離が与えられると、無音の期間中のコヒーレンス(すなわち、スピーチが存在しないとき)は、1に近づくことになる。
Figure 2005525717
従って、コヒーレンス関数は、スピーチ期間中は、スピーチについて良好な最適の濾過を有することになるが、無音期間中は、雑音を減少させるのにほとんど助けにならない。無音期間中に雑音を減少させるために、相関係数を用いることができる。
2つの信号X及びYの相関関数は、以下のように定義することができ、
Figure 2005525717
ここで、COVは共分散を示し、VARは、分散を示す。
周波数領域を用いる場合には、FFTフレームにおける平均を用いることができる。時間相関係数、Ccorr(κ)は、以下のように定義される。
Figure 2005525717
ここで、κは、使用されたフレームの数(又はその等価な区分時間)であり、Nは、各フレームにおけるサンプルの数である。さらに、
Figure 2005525717
及び
Figure 2005525717
このように、スピーチ時間中は、Ccorr(κ)→1であり、無音期間中は、Ccorr(κ)→0である。
本発明の一実施形態においては、フレームκにおける推定フィルタG(ω、κ)は、以下のように、Ccorr(κ)及びCoh(ω、κ)の積を用いることにより得ることができる。
G(ω、κ)=Coh(ω、κ)・Ccorr(κ)
多数のフレーム(M)を平均することを含むCcorr(κ)を得るための別の方法は、以下の通りである。
Figure 2005525717
この場合においては、同様に、
G(ω、κ)=Coh(ω、κ)・Ccorr(κ)である。
ここで図5を参照すると、本発明の実施形態による空間的フィルタ処理を示すブロック図が示される。空間フィルタ70は、左の信号48及び右の信号50を受け入れる。左の信号は、ブロック90において遅延される。右の信号50は、ブロック92において遅延される。減算器94は右の信号50と遅延した左の信号48との差を生成する。減算器96は左の信号48と遅延した右の信号50との差を生成する。このように、一方のフィルタ処理された信号72は、左側の雑音源により重畳されたスピーチ信号を含み、他方のものは、右側の雑音源により重畳されたスピーチ信号を含む。
ここで図6を参照すると、本発明の実施形態による複数の所望の音の信号を受け取るように配置されたマイクロフォンを示す概略図が示されている。多数の方向から届く多数の音は、2つ又はそれ以上のマイクロフォン群を用いて取得することができる。4つの群が示され、これらは、4つの関心のあるスピーチ源に向けることができる。
本発明の実施形態が図示及び説明されたが、これらの実施形態は、本発明のすべての可能な形態を図示し説明することを意図するものではない。例えば、説明においてスピーチが実施例として用いられたが、如何なる音源も、本発明により増幅することができる。明細書の中で用いられる用語は、限定ではなく説明の用語であり、本発明の精神及び範囲から離れることなく種々の変更が可能であることを理解すべきである。
本発明において用いることのできる異なる方向性をもつ2つのマイクロフォンのパターンを示す概略図である。 本発明において用いることのできる異なる方向性を生成するために用いられる多数のマイクロフォンを示す概略図である。 本発明の実施形態を示すブロック図である。 本発明の実施形態によるフィルタ係数推定を示すブロック図である。 本発明の実施形態による空間的フィルタ処理を示すブロック図である。 本発明の実施形態による複数の所望の音の信号を受け取るように配置されたマイクロフォンを示す概略図である。

Claims (19)

  1. 所望の音方向から来る所望の音を増幅する方法であって、
    各々が、第1の主要な感度方向を含みかつ前記所望の音方向を含む第1の方向の組からの音を受け取る第1のマイクロフォンの、少なくとも1つにより受け取られた音から第1の信号を取得する工程、
    各々が、前記第1の主要な感度方向とは異なる第2の主要な感度方向を含みかつ前記所望の音方向を含む第2の方向の組からの音を受け取る第2のマイクロフォンの、少なくとも1つにより受け取られた音から第2の信号を取得する工程、
    前記第1の信号及び前記第2の信号のコヒーレンス、及び前記第1の信号及び前記第2の信号の間の相関性に基づいてフィルタ係数を求める工程、及び
    前記第1の信号及び前記第2の信号の組み合わせを前記求められたフィルタ係数によりフィルタ処理する工程、
    を含む方法。
  2. 前記第1の主要な感度方向が前記所望の音方向とは異なるものであり、前記第2の主要な感度方向が前記所望の音方向とは異なるものである請求項1に記載の所望の音を増幅する方法。
  3. 前記所望の音方向と前記第1の主要な感度方向との間の角度のオフセットと、前記所望の音方向と前記第2の主要な感度方向との間の角度オフセットとの大きさが等しい請求項1に記載の所望の音を増幅する方法。
  4. フィルタ係数を求める工程が、
    コヒーレンス係数を前記第1の信号及び前記第2の信号に基づいて求める工程、
    相関係数を前記第1の信号及び前記第2の信号に基づいて求める工程、及び
    前記コヒーレンス係数を前記相関係数で基準化する工程、
    を含む請求項1に記載の所望の音を増幅する方法。
  5. フィルタ係数を求める工程の前に、前記第1の信号及び前記第2の信号を空間的にフィルタ処理する工程をさらに含む請求項1に記載の所望の音を増幅する方法。
  6. 空間的にフィルタ処理する工程が、前記第1の信号の遅延バージョンを前記第2の信号から引き、前記第2の信号の遅延バージョンを前記第1の信号から引くことを含む請求項5に記載の所望の音を増幅する方法。
  7. 前記所望の音がスピーチを含む請求項5記載の所望の音を増幅する方法。
  8. 所望の音方向から受け取った所望の音を再生するシステムであって、
    第1の方向に向けられ、少なくとも1つのマイクロフォンを含み、所望の音を含む受け取った音に応答して第1の信号を生成する第1のマイクロフォンの組と、
    前記第1の方向とは異なる第2の方向に向けられ、少なくとも1つのマイクロフォンを含み、前記所望の音を含む受け取った音に応答して第2の信号を生成する第2のマイクロフォンの組と、
    前記第1のマイクロフォンの組及び前記第2のマイクロフォンの組と接続し、前記第1の信号及び前記第2の信号のコヒーレンス並びに前記第1の信号及び前記第2の信号の間の相関性に基づいてフィルタ係数を求めるフィルタ推定器と、
    前記フィルタ推定器、前記第1のマイクロフォンの組、及び前記第2のマイクロフォンの組と接続し、前記第1の信号及び前記第2の信号を前記求められたフィルタ係数によりフィルタ処理するフィルタと、
    を備えることを特徴とするシステム。
  9. 前記第1の方向が前記所望の音方向とは異なり、前記第2の方向が前記所望の音方向とは異なる請求項8に記載の所望の音を再生するシステム。
  10. 前記所望の音方向が、実質的に前記第1の方向と前記第2の方向との間の中心にある請求項8に記載の所望の音を再生するシステム。
  11. 前記フィルタ推定器が、
    前記第1の信号及び前記第2の信号を空間的にフィルタ処理することによりフィルタ処理された信号を生成する空間フィルタと、
    前記フィルタ処理された信号に基づいてコヒーレンス係数を生成するコヒーレンス推定器と、
    前記フィルタ処理された信号に基づいて相関係数を生成する相関係数推定器と、
    前記コヒーレンス係数を前記相関係数で基準化することにより前記フィルタ係数を生成するスカラと、
    を備える請求項8に記載の所望の音を再生するシステム。
  12. 前記相関係数が複数のフレームにわたる平均として求められる請求項11に記載の所望の音を再生するシステム。
  13. 前記空間フィルタが、遅延された第1の信号を第2の信号から引くことにより、及び遅延された第2の信号を第1の信号から引くことにより、フィルタ処理された信号を生成する請求項11に記載の所望の音を再生するシステム。
  14. 前記所望の音がスピーチを含む請求項8に記載の所望の音を再生するシステム。
  15. 各々の音の信号に含まれる所望の音方向からの所望の音を増幅するために、複数の受け取った音の信号をフィルタ処理するのに用いられるフィルタ係数を生成する方法であって、
    所望の音方向を含む第1の方向の組から第1の音の信号を受け取る工程、
    前記所望の音方向を含み、前記第1の方向の組の方向ではない方向を含む第2の方向の組から第2の音の信号を受け取る工程、
    前記第1の音の信号及び前記第2の音の信号に基づいてコヒーレンス係数を求める工程、
    前記第1の音の信号及び前記第2の音の信号に基づいて相関係数を求める工程、及び
    前記コヒーレンス係数を前記相関係数で基準化することにより前記フィルタ係数を生成する工程、
    を含む方法。
  16. コヒーレンス係数を求める工程及び相関係数を求める工程の前に、前記第1の音の信号及び前記第2の音の信号を空間的にフィルタ処理する工程をさらに含む請求項15に記載のフィルタ係数を生成する方法。
  17. 空間的にフィルタ処理する工程が、
    前記第1の音の信号をバッファする工程、
    前記第2の音の信号をバッファする工程、
    前記第1の音の信号と前記バッファされた第2の音の信号との間の差を取得する工程、及び
    前記第2の音の信号と前記バッファされた第1の音の信号との間の差を取得する工程、
    を含む請求項16に記載のフィルタ係数を生成する方法。
  18. 相関係数を求める工程が、複数のサンプリングフレームにわたる相関係数を平均する工程を含む請求項15に記載のフィルタ係数を生成する方法。
  19. 前記所望の音がスピーチを含む請求項15に記載のフィルタ係数を生成する方法。
JP2003531458A 2001-09-24 2002-09-24 選択的な音の増幅 Pending JP2005525717A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US32483701P 2001-09-24 2001-09-24
PCT/US2002/030294 WO2003028006A2 (en) 2001-09-24 2002-09-24 Selective sound enhancement

Publications (1)

Publication Number Publication Date
JP2005525717A true JP2005525717A (ja) 2005-08-25

Family

ID=23265310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003531458A Pending JP2005525717A (ja) 2001-09-24 2002-09-24 選択的な音の増幅

Country Status (6)

Country Link
US (1) US20030061032A1 (ja)
EP (1) EP1430472A2 (ja)
JP (1) JP2005525717A (ja)
KR (1) KR20040044982A (ja)
AU (1) AU2002339995A1 (ja)
WO (1) WO2003028006A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126279A (ja) * 2013-12-25 2015-07-06 沖電気工業株式会社 音声信号処理装置及びプログラム

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7076072B2 (en) * 2003-04-09 2006-07-11 Board Of Trustees For The University Of Illinois Systems and methods for interference-suppression with directional sensing patterns
EP1581026B1 (en) 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
FR2878399B1 (fr) * 2004-11-22 2007-04-06 Wavecom Sa Dispositif et procede de debruitage a deux voies mettant en oeuvre une fonction de coherence associee a une utilisation de proprietes psychoacoustiques, et programme d'ordinateur correspondant
EP1718103B1 (en) * 2005-04-29 2009-12-02 Harman Becker Automotive Systems GmbH Compensation of reverberation and feedback
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8180067B2 (en) * 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8036767B2 (en) * 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US11217237B2 (en) 2008-04-14 2022-01-04 Staton Techiya, Llc Method and device for voice operated control
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US9129291B2 (en) 2008-09-22 2015-09-08 Personics Holdings, Llc Personalized sound management and method
US9372251B2 (en) * 2009-10-05 2016-06-21 Harman International Industries, Incorporated System for spatial extraction of audio signals
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US20120057717A1 (en) * 2010-09-02 2012-03-08 Sony Ericsson Mobile Communications Ab Noise Suppression for Sending Voice with Binaural Microphones
DE102010043127B4 (de) * 2010-10-29 2024-08-14 Sennheiser Electronic Se & Co. Kg Mikrofon
EP2555189B1 (en) * 2010-11-25 2016-10-12 Goertek Inc. Method and device for speech enhancement, and communication headphones with noise reduction
US9589580B2 (en) * 2011-03-14 2017-03-07 Cochlear Limited Sound processing based on a confidence measure
KR101111524B1 (ko) * 2011-10-26 2012-02-13 (주)유나 유리 실험 기구 거치대
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
JP6221257B2 (ja) * 2013-02-26 2017-11-01 沖電気工業株式会社 信号処理装置、方法及びプログラム
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
KR102606286B1 (ko) 2016-01-07 2023-11-24 삼성전자주식회사 전자 장치 및 전자 장치를 이용한 소음 제어 방법
CN105976826B (zh) * 2016-04-28 2019-10-25 中国科学技术大学 应用于双麦克风小型手持设备的语音降噪方法
CN107331407B (zh) * 2017-06-21 2020-10-16 深圳市泰衡诺科技有限公司 下行通话降噪方法及装置
JP6686977B2 (ja) * 2017-06-23 2020-04-22 カシオ計算機株式会社 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム
CN112992169B (zh) * 2019-12-12 2024-06-11 华为技术有限公司 语音信号的采集方法、装置、电子设备以及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4888807A (en) * 1989-01-18 1989-12-19 Audio-Technica U.S., Inc. Variable pattern microphone system
JPH0728470B2 (ja) * 1989-02-03 1995-03-29 松下電器産業株式会社 アレイマイクロホン
IT1257164B (it) * 1992-10-23 1996-01-05 Ist Trentino Di Cultura Procedimento per la localizzazione di un parlatore e l'acquisizione diun messaggio vocale, e relativo sistema.
US5473701A (en) * 1993-11-05 1995-12-05 At&T Corp. Adaptive microphone array
JPH07248784A (ja) * 1994-03-10 1995-09-26 Nissan Motor Co Ltd 能動型騒音制御装置
DE4436272A1 (de) * 1994-10-11 1996-04-18 Schalltechnik Dr Ing Schoeps G Verfahren und Vorrichtung zur Beeinflussung der Richtcharakteristiken einer akustoelektrischen Empfangsanordnung
US5694474A (en) * 1995-09-18 1997-12-02 Interval Research Corporation Adaptive filter for signal processing and method therefor
JP3522954B2 (ja) * 1996-03-15 2004-04-26 株式会社東芝 マイクロホンアレイ入力型音声認識装置及び方法
US6041127A (en) * 1997-04-03 2000-03-21 Lucent Technologies Inc. Steerable and variable first-order differential microphone array
US6584203B2 (en) * 2001-07-18 2003-06-24 Agere Systems Inc. Second-order adaptive differential microphone array

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015126279A (ja) * 2013-12-25 2015-07-06 沖電気工業株式会社 音声信号処理装置及びプログラム

Also Published As

Publication number Publication date
US20030061032A1 (en) 2003-03-27
AU2002339995A1 (en) 2003-04-07
KR20040044982A (ko) 2004-05-31
WO2003028006A3 (en) 2003-11-20
WO2003028006A2 (en) 2003-04-03
EP1430472A2 (en) 2004-06-23

Similar Documents

Publication Publication Date Title
JP2005525717A (ja) 選択的な音の増幅
US7092529B2 (en) Adaptive control system for noise cancellation
US7386135B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
EP1278395B1 (en) Second-order adaptive differential microphone array
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
EP1994788B1 (en) Noise-reducing directional microphone array
US6917688B2 (en) Adaptive noise cancelling microphone system
KR102352927B1 (ko) 상관 기반 근접장 검출기
US8180067B2 (en) System for selectively extracting components of an audio input signal
US8000482B2 (en) Microphone array processing system for noisy multipath environments
JP2009522942A (ja) 発話改善のためにマイク間レベル差を用いるシステム及び方法
CN110875056B (zh) 语音转录设备、系统、方法、及电子设备
CN113744752A (zh) 语音处理方法及装置
WO2003017718A1 (en) Post-processing scheme for adaptive directional microphone system with noise/interference suppression
US9406293B2 (en) Apparatuses and methods to detect and obtain desired audio
CN113782046A (zh) 一种用于远距离语音识别的麦克风阵列拾音方法及系统
CN118824277A (zh) 基于三元麦克风阵列的自适应语音降噪方法
CN118250592A (zh) 一种基于阵列麦克风的降风噪方法及系统
Modhave et al. Design of multichannel wiener filter for speech enhancement in hearing aids and noise reduction technique
Ramesh Babu et al. Speech enhancement using beamforming and Kalman Filter for In-Car noisy environment
The et al. A Method for Reducing Speech Distortion in Minimum Variance Distortionless Response Beamformer
Stolbov et al. Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise
JPH03274099A (ja) 音声認識装置
Li et al. Noise reduction based on microphone array and post-filtering for robust speech recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080128

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080630