JP2005525717A - 選択的な音の増幅 - Google Patents
選択的な音の増幅 Download PDFInfo
- Publication number
- JP2005525717A JP2005525717A JP2003531458A JP2003531458A JP2005525717A JP 2005525717 A JP2005525717 A JP 2005525717A JP 2003531458 A JP2003531458 A JP 2003531458A JP 2003531458 A JP2003531458 A JP 2003531458A JP 2005525717 A JP2005525717 A JP 2005525717A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- sound
- desired sound
- filter
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003321 amplification Effects 0.000 title description 3
- 238000003199 nucleic acid amplification method Methods 0.000 title description 3
- 230000035945 sensitivity Effects 0.000 claims abstract description 19
- 230000005236 sound signal Effects 0.000 claims description 24
- 238000000034 method Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 13
- 230000003111 delayed effect Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000003139 buffering effect Effects 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
異なる方向に向けられた、2つのマイクロフォン又はマイクロフォンの組が、該マイクロフォンから受け取られた信号の相関性及びコヒーレンスに基づいてフィルタパラメータを生成するのに用いられる。第1の信号は、少なくとも1つの第1のマイクロフォンによって受け取られた音から取得される。各々の第1のマイクロフォンは、第1の主要な感度方向を含む第1の方向の組からの音を受け取る。所望の音方向は、第1の方向の組に含まれる。第2の信号は、少なくとも1つの第2のマイクロフォンによって受け取られた音から取得される。各々の第2のマイクロフォンは、第1の主要な感度方向とは異なる第2の主要な感度方向を含む第2の方向の組からの音を受け取る。所望の音方向は、第2の方向の組に含まれる。フィルタ係数は、第1の信号及び第2の信号のコヒーレンス、及び、該第1の信号及び該第2の信号の相関性に基づいて求められる。第1の信号及び第2の信号の組み合わせは、求められたフィルタ係数によりフィルタ処理される。
Description
本発明は、雑音がある状態でのスピーチ(会話)のような所望の音を検出して増幅することに関する。
多くの用途において、他の方向から発生する音を大幅に除去することにより、特定の方向から明瞭な音を求めることを必要とする。このような適用例は、電話、コンピュータ、補聴器、セキュリティ及び音声作動式制御を含む多種多様の製品における音声認識及び検出、マン・マシン・インターフェース、スピーチの増幅その他同様なものを含む。
空間的フィルタ処理は、信号源の物理的位置に基づいて多数の信号源の間を区別するために意図的に設計される場合には、効果的な方法となることがある。このような区別は、例えば、指向性マイクロフォンアレイにより可能になる。しかしながら、空間的フィルタ処理のために用いられる通常のビーム形成技術は、いくつかの問題を有する。第1に、このような技術は、適切な大きさのアパーチャーを実現するために、大きなマイクロフォン間隔を必要とする。第2に、このような技術は、狭帯域信号に対してより適用できるものであり、相対的に広帯域信号であるスピーチについては、必ずしも十分な性能をもたらすわけではない。
必要とされているのは、スピーチについて良好な性能及び小さな寸法の両方を提供するスピーチの増幅である。
本発明は、異なる方向に向けられた、2つのマイクロフォン、又は、マイクロフォンの組からの入力を用いて、該マイクロフォンから受け取られた信号の相関性及びコヒーレンスに基づいてフィルタパラメータを生成するようにするものである。
所望の音方向から来る所望の音を増幅する方法が提供される。第1の信号は、少なくとも1つの第1のマイクロフォンにより受け取られた音から取得される。各々の第1のマイクロフォンは、第1の主要な感度方向を含む第1の方向の組からの音を受け取る。所望の音方向は、第1の方向の組に含まれる。第2の信号は、少なくとも1つの第2のマイクロフォンにより受け取られた音から取得される。各々の第2のマイクロフォンは、第1の主要な感度方向とは異なる第2の主要な感度方向を含む第2の方向の組からの音を受け取る。所望の音方向は、第2の方向の組に含まれる。フィルタ係数は、第1の信号及び第2の信号のコヒーレンス、及び、該第1の信号及び該第2の信号の間の相関性に基づいて求められる。第1の信号及び第2の信号の組み合わせは、求められたフィルタ係数によりフィルタ処理される。
本発明の実施形態においては、第1の主要な感度方向も第2の主要な感度方向も、所望の音方向と同じではない。
本発明の別の実施形態においては、所望の音方向と第1の主要な感度方向との間の角度オフセットは、該所望の音方向と第2の主要な感度方向との間の角度オフセットと大きさが等しい。
本発明のさらに別の実施形態においては、フィルタ係数は、第1の信号及び第2の信号に基づいてコヒーレンス係数を求め、該第1の信号及び該第2の信号に基づいて相関係数を求め、次いで、コヒーレンス係数を該相関係数で基準化することにより見出される。
本発明によるさらに別の実施形態においては、第1の信号及び第2の信号は、フィルタ係数を求める前に空間的フィルタ処理される。この空間的フィルタ処理は、第1の信号の遅延バージョンを第2の信号から引くことにより、及び該第2の信号の遅延バージョンを該第1の信号から引くことにより達成できる。
本発明のさらに別の実施形態においては、所望の音はスピーチを含む。
本発明のさらに別の実施形態においては、所望の音はスピーチを含む。
さらに、所望の音方向から受け取られた所望の音を再生するためのシステムが提供される。少なくとも1つのマイクロフォンを有する第1のマイクロフォンの組は、第1の方向に向けられる。第1のマイクロフォンの組は、所望の音を含む受け取った音に応答して第1の信号を生成する。少なくとも1つのマイクロフォンを有する第2のマイクロフォンの組は、第1の方向とは異なる第2の方向に向けられる。第2のマイクロフォンの組は、所望の音を含む受け取った音に応答して第2の信号を生成する。フィルタ推定器は、第1の信号及び第2の信号のコヒーレンス、及び、該第1の信号及び該第2の信号の相関性に基づいてフィルタ係数を求める。フィルタは、第1の信号及び第2の信号を、求められたフィルタ係数によりフィルタ処理する。
さらに、所望の音を増幅するために複数の受け取った音の信号をフィルタ処理するのに用いられるフィルタ係数を生成する方法が提供される。第1の音の信号は、所望の音方向を含む第1の方向の組から受け取られる。第2の音の信号は、所望の音方向を含む第2の方向の組から受け取られる。第2の方向の組は、第1の組の方向ではない方向を含む。コヒーレンス係数は、第1の音の信号及び第2の音の信号に基づいて求められる。相関係数は第1の音の信号及び第2の音の信号に基づいて求められる。フィルタ係数は、コヒーレンス係数を相関係数で基準化することにより生成される。
図1を参照すると、本発明において用いることのできる異なる方向性をもつ2つのマイクロフォンのパターンを示す概略図が示されている。本発明は、異なる方向性ピックアップパターンをもった2つ又はそれ以上のマイクロフォンが、特定の方向から届く1つ又はそれ以上の信号を選択するように配置されるものとして示される方向性パターンを利用するものである。
図1は、異なる方向性をもつ2つのマイクロフォンの一例を示す。以下の説明において、一方又は両方のマイクロフォンは、マイクロフォン群と置き換えてもよい。同様に、2つより多い方向を、同時であるか、又は、複数のマイクロフォンによって支持される多くの方向から2つ又はそれ以上を選択することのいずれかにより考えることができる。
信号方向1から届く信号及び他の源から届く多数の雑音源を選択するように配置された2つのマイクロフォンを考える。左のマイクロフォンは、主要な感度方向2を有し、右のマイクロフォンは、主要な感度方向3を有する。左のマイクロフォンは、4で示される極性応答プロットを有し、右のマイクロフォンは、5で示される極性応答プロットを有する。領域6は、左及び右のマイクロフォンのスピーチ方向1に対する共同応答領域を示す。
各々の複数の雑音源は、Nx(j)と表示が付けられ、ここでは、Xは方向(左又は右)を定義し、jは指定された番号である。これらは、実際の物理的な雑音源である必要はない。各Nx(j)は、例えば、マイクロフォンに届く雑音信号の近似とすることができる。すべての音源は、異なる位置から受け取られた場合には、独立した源であるものと仮定される。
図1に示されるシステムは、両方のマイクロフォンが、方向1からの本質的に同じ信号の解釈であるが、異なる雑音の解釈を拾い上げることを示す。左のマイクロフォンの信号(ML)及び右のマイクロフォンの信号(MR)は、以下のように表すことができ、
ここで、SpeechLは、左のマイクロフォン又はマイクロフォン群に登録されたスピーチの解釈であり、SpeechRは、右のマイクロフォン又はマイクロフォン群に登録されたスピーチの解釈である。スピーチの信号自体(従って、このような左及び右の解釈の両方)は、スピーチ方向1から届き、しかも、合計された雑音NL及びNRは、左及び右の方向それぞれから届く音を構成する。
ここで、SpeechLは、左のマイクロフォン又はマイクロフォン群に登録されたスピーチの解釈であり、SpeechRは、右のマイクロフォン又はマイクロフォン群に登録されたスピーチの解釈である。スピーチの信号自体(従って、このような左及び右の解釈の両方)は、スピーチ方向1から届き、しかも、合計された雑音NL及びNRは、左及び右の方向それぞれから届く音を構成する。
図2は、マイクロフォンの多数の群を用いる本発明の実施形態を示す。マイクロフォンの組20を用いて、より大きな方向性を達成することができる。さらに、多数のマイクロフォン20又はマイクロフォン群20は、スピーチが取得される方向1を選択するために使用することができる。
ここで図3を参照すると、本発明の実施形態を示すブロック図が示される。全体を40で示されるスピーチ獲得システムは、少なくとも2つのマイクロフォン又はマイクロフォン群を含む。図示例においては、左のマイクロフォン42は応答パターン3を有し、右のマイクロフォン44は応答パターン5を有する。マイクロフォン42、44の重なり合う領域6は、スピーチ方向1において、組み合わされた応答パターン46を生成する。
左のマイクロフォン42は、左の信号48を生成する。右のマイクロフォン44は、右の信号50を生成する。フィルタ推定器52は左の信号48及び右の信号50を受け取り、フィルタ係数54を生成する。加算器56は、左の信号48及び右の信号50を合計して、合計信号58を生成する。フィルタ60は、フィルタ係数54を用いて、合計信号58をフィルタ処理して、方向1以外の方向からの無相関雑音による影響が減少された、方向1からのスピーチを有する出力信号62を生成するようにする。
ここで図4を参照すると、本発明の実施形態によるフィルタ係数推定を示すブロック図が示される。フィルタ推定器52は、左のマイクロフォン42からの左の信号48、及び、右のマイクロフォン44からの右の信号50を受け取る空間フィルタ70を含む。空間フィルタ70は、マイクロフォン信号48、50のうちの少なくとも1つより高い比率の雑音、又はより高い比率の信号を有する少なくとも1つの信号を含むことのできるフィルタ処理された信号72を生成する。空間フィルタ70はさらに、環境における雑音源の特定のサブセット、又は、マイクロフォン42、44に対して特定の方向の組から発生する雑音源からのより大きい容量を含むフィルタ処理された信号72を生成できる。
コヒーレンス推定器74は、フィルタ処理された信号72の少なくとも1つを受け取り、コヒーレンス係数76を生成する。相関係数推定器78は、フィルタ処理された信号72の少なくとも1つを受け取り、少なくとも1つの相関係数80を生成する。フィルタ係数54は、コヒーレンス係数76及び相関係数80に基づくものである。図示実施形態においては、コヒーレンス係数76は、相関係数80で基準化される。
ここで、本発明の実施形態の数学的実装が与えられる。ここでの仮定は、合計された雑音NL及びNRはコヒーレントではないが、左のマイクロフォン44(SpeechL)及び右のマイクロフォン48(SpeechR)による解釈はコヒーレントであるというものである。このことは、所望のスピーチ信号と合計された雑音NL及びNRとの間の信号対雑音の比を最大にするコヒーレンス関数に基づいた最適なフィルタの構成を可能にする。
2つの信号X及びYのコヒーレンス関数は、以下のように定義でき、
ここで、Sx(ω)及びSy(ω)は、信号X及びYの複素フーリエ変換であり、Sxy(ω)は信号X及びYの複素コスペクトルであり、〈*〉は、1コマごとの記号の平均である。
ここで、Sx(ω)及びSy(ω)は、信号X及びYの複素フーリエ変換であり、Sxy(ω)は信号X及びYの複素コスペクトルであり、〈*〉は、1コマごとの記号の平均である。
スペクトルSL(ω)及びSR(ω)は、スピーチSSP(ω)の複素スペクトル、及び、合計された雑音の複素スペクトルにより定義することができ、SNL(ω)は合計されたNLであり、SNR(ω)は合計されたNRである。このように、左及び右のチャネルについてのフーリエ変換は、以下のように表すことができる。
SL(ω)=SSP(ω)+SNL(ω)
SR(ω)=SSP(ω)+SNR(ω)
次いで、スペクトルの大きさの二乗は以下のようになる。
SL 2(ω)=SSP 2(ω)+SNL 2(ω)
SR 2(ω)=SSP 2(ω)+SNR 2(ω)
左及び右のチャネルの複素コスペクトルは、以下のように表すことができる。
SL(ω)=SSP(ω)+SNL(ω)
SR(ω)=SSP(ω)+SNR(ω)
次いで、スペクトルの大きさの二乗は以下のようになる。
SL 2(ω)=SSP 2(ω)+SNL 2(ω)
SR 2(ω)=SSP 2(ω)+SNR 2(ω)
左及び右のチャネルの複素コスペクトルは、以下のように表すことができる。
さらに、その帯域におけるスピーチのパワーが大きい場合には、スピーチにより占められる周波数帯ωにおいて、CohLR(ω)⇒1である。しかしながら、スピーチがない場合には、CohLR(ω)は、ゼロと1との間にある。
スピーチ周波数帯においては、マイクロフォン20及びマイクロフォン20群の間に小さい距離が与えられると、無音の期間中のコヒーレンス(すなわち、スピーチが存在しないとき)は、1に近づくことになる。
従って、コヒーレンス関数は、スピーチ期間中は、スピーチについて良好な最適の濾過を有することになるが、無音期間中は、雑音を減少させるのにほとんど助けにならない。無音期間中に雑音を減少させるために、相関係数を用いることができる。
従って、コヒーレンス関数は、スピーチ期間中は、スピーチについて良好な最適の濾過を有することになるが、無音期間中は、雑音を減少させるのにほとんど助けにならない。無音期間中に雑音を減少させるために、相関係数を用いることができる。
周波数領域を用いる場合には、FFTフレームにおける平均を用いることができる。時間相関係数、Ccorr(κ)は、以下のように定義される。
ここで、κは、使用されたフレームの数(又はその等価な区分時間)であり、Nは、各フレームにおけるサンプルの数である。さらに、
及び
このように、スピーチ時間中は、Ccorr(κ)→1であり、無音期間中は、Ccorr(κ)→0である。
ここで、κは、使用されたフレームの数(又はその等価な区分時間)であり、Nは、各フレームにおけるサンプルの数である。さらに、
及び
このように、スピーチ時間中は、Ccorr(κ)→1であり、無音期間中は、Ccorr(κ)→0である。
本発明の一実施形態においては、フレームκにおける推定フィルタG(ω、κ)は、以下のように、Ccorr(κ)及びCoh(ω、κ)の積を用いることにより得ることができる。
G(ω、κ)=Coh(ω、κ)・Ccorr(κ)
G(ω、κ)=Coh(ω、κ)・Ccorr(κ)
ここで図5を参照すると、本発明の実施形態による空間的フィルタ処理を示すブロック図が示される。空間フィルタ70は、左の信号48及び右の信号50を受け入れる。左の信号は、ブロック90において遅延される。右の信号50は、ブロック92において遅延される。減算器94は右の信号50と遅延した左の信号48との差を生成する。減算器96は左の信号48と遅延した右の信号50との差を生成する。このように、一方のフィルタ処理された信号72は、左側の雑音源により重畳されたスピーチ信号を含み、他方のものは、右側の雑音源により重畳されたスピーチ信号を含む。
ここで図6を参照すると、本発明の実施形態による複数の所望の音の信号を受け取るように配置されたマイクロフォンを示す概略図が示されている。多数の方向から届く多数の音は、2つ又はそれ以上のマイクロフォン群を用いて取得することができる。4つの群が示され、これらは、4つの関心のあるスピーチ源に向けることができる。
本発明の実施形態が図示及び説明されたが、これらの実施形態は、本発明のすべての可能な形態を図示し説明することを意図するものではない。例えば、説明においてスピーチが実施例として用いられたが、如何なる音源も、本発明により増幅することができる。明細書の中で用いられる用語は、限定ではなく説明の用語であり、本発明の精神及び範囲から離れることなく種々の変更が可能であることを理解すべきである。
Claims (19)
- 所望の音方向から来る所望の音を増幅する方法であって、
各々が、第1の主要な感度方向を含みかつ前記所望の音方向を含む第1の方向の組からの音を受け取る第1のマイクロフォンの、少なくとも1つにより受け取られた音から第1の信号を取得する工程、
各々が、前記第1の主要な感度方向とは異なる第2の主要な感度方向を含みかつ前記所望の音方向を含む第2の方向の組からの音を受け取る第2のマイクロフォンの、少なくとも1つにより受け取られた音から第2の信号を取得する工程、
前記第1の信号及び前記第2の信号のコヒーレンス、及び前記第1の信号及び前記第2の信号の間の相関性に基づいてフィルタ係数を求める工程、及び
前記第1の信号及び前記第2の信号の組み合わせを前記求められたフィルタ係数によりフィルタ処理する工程、
を含む方法。 - 前記第1の主要な感度方向が前記所望の音方向とは異なるものであり、前記第2の主要な感度方向が前記所望の音方向とは異なるものである請求項1に記載の所望の音を増幅する方法。
- 前記所望の音方向と前記第1の主要な感度方向との間の角度のオフセットと、前記所望の音方向と前記第2の主要な感度方向との間の角度オフセットとの大きさが等しい請求項1に記載の所望の音を増幅する方法。
- フィルタ係数を求める工程が、
コヒーレンス係数を前記第1の信号及び前記第2の信号に基づいて求める工程、
相関係数を前記第1の信号及び前記第2の信号に基づいて求める工程、及び
前記コヒーレンス係数を前記相関係数で基準化する工程、
を含む請求項1に記載の所望の音を増幅する方法。 - フィルタ係数を求める工程の前に、前記第1の信号及び前記第2の信号を空間的にフィルタ処理する工程をさらに含む請求項1に記載の所望の音を増幅する方法。
- 空間的にフィルタ処理する工程が、前記第1の信号の遅延バージョンを前記第2の信号から引き、前記第2の信号の遅延バージョンを前記第1の信号から引くことを含む請求項5に記載の所望の音を増幅する方法。
- 前記所望の音がスピーチを含む請求項5記載の所望の音を増幅する方法。
- 所望の音方向から受け取った所望の音を再生するシステムであって、
第1の方向に向けられ、少なくとも1つのマイクロフォンを含み、所望の音を含む受け取った音に応答して第1の信号を生成する第1のマイクロフォンの組と、
前記第1の方向とは異なる第2の方向に向けられ、少なくとも1つのマイクロフォンを含み、前記所望の音を含む受け取った音に応答して第2の信号を生成する第2のマイクロフォンの組と、
前記第1のマイクロフォンの組及び前記第2のマイクロフォンの組と接続し、前記第1の信号及び前記第2の信号のコヒーレンス並びに前記第1の信号及び前記第2の信号の間の相関性に基づいてフィルタ係数を求めるフィルタ推定器と、
前記フィルタ推定器、前記第1のマイクロフォンの組、及び前記第2のマイクロフォンの組と接続し、前記第1の信号及び前記第2の信号を前記求められたフィルタ係数によりフィルタ処理するフィルタと、
を備えることを特徴とするシステム。 - 前記第1の方向が前記所望の音方向とは異なり、前記第2の方向が前記所望の音方向とは異なる請求項8に記載の所望の音を再生するシステム。
- 前記所望の音方向が、実質的に前記第1の方向と前記第2の方向との間の中心にある請求項8に記載の所望の音を再生するシステム。
- 前記フィルタ推定器が、
前記第1の信号及び前記第2の信号を空間的にフィルタ処理することによりフィルタ処理された信号を生成する空間フィルタと、
前記フィルタ処理された信号に基づいてコヒーレンス係数を生成するコヒーレンス推定器と、
前記フィルタ処理された信号に基づいて相関係数を生成する相関係数推定器と、
前記コヒーレンス係数を前記相関係数で基準化することにより前記フィルタ係数を生成するスカラと、
を備える請求項8に記載の所望の音を再生するシステム。 - 前記相関係数が複数のフレームにわたる平均として求められる請求項11に記載の所望の音を再生するシステム。
- 前記空間フィルタが、遅延された第1の信号を第2の信号から引くことにより、及び遅延された第2の信号を第1の信号から引くことにより、フィルタ処理された信号を生成する請求項11に記載の所望の音を再生するシステム。
- 前記所望の音がスピーチを含む請求項8に記載の所望の音を再生するシステム。
- 各々の音の信号に含まれる所望の音方向からの所望の音を増幅するために、複数の受け取った音の信号をフィルタ処理するのに用いられるフィルタ係数を生成する方法であって、
所望の音方向を含む第1の方向の組から第1の音の信号を受け取る工程、
前記所望の音方向を含み、前記第1の方向の組の方向ではない方向を含む第2の方向の組から第2の音の信号を受け取る工程、
前記第1の音の信号及び前記第2の音の信号に基づいてコヒーレンス係数を求める工程、
前記第1の音の信号及び前記第2の音の信号に基づいて相関係数を求める工程、及び
前記コヒーレンス係数を前記相関係数で基準化することにより前記フィルタ係数を生成する工程、
を含む方法。 - コヒーレンス係数を求める工程及び相関係数を求める工程の前に、前記第1の音の信号及び前記第2の音の信号を空間的にフィルタ処理する工程をさらに含む請求項15に記載のフィルタ係数を生成する方法。
- 空間的にフィルタ処理する工程が、
前記第1の音の信号をバッファする工程、
前記第2の音の信号をバッファする工程、
前記第1の音の信号と前記バッファされた第2の音の信号との間の差を取得する工程、及び
前記第2の音の信号と前記バッファされた第1の音の信号との間の差を取得する工程、
を含む請求項16に記載のフィルタ係数を生成する方法。 - 相関係数を求める工程が、複数のサンプリングフレームにわたる相関係数を平均する工程を含む請求項15に記載のフィルタ係数を生成する方法。
- 前記所望の音がスピーチを含む請求項15に記載のフィルタ係数を生成する方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32483701P | 2001-09-24 | 2001-09-24 | |
PCT/US2002/030294 WO2003028006A2 (en) | 2001-09-24 | 2002-09-24 | Selective sound enhancement |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005525717A true JP2005525717A (ja) | 2005-08-25 |
Family
ID=23265310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003531458A Pending JP2005525717A (ja) | 2001-09-24 | 2002-09-24 | 選択的な音の増幅 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20030061032A1 (ja) |
EP (1) | EP1430472A2 (ja) |
JP (1) | JP2005525717A (ja) |
KR (1) | KR20040044982A (ja) |
AU (1) | AU2002339995A1 (ja) |
WO (1) | WO2003028006A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015126279A (ja) * | 2013-12-25 | 2015-07-06 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7076072B2 (en) * | 2003-04-09 | 2006-07-11 | Board Of Trustees For The University Of Illinois | Systems and methods for interference-suppression with directional sensing patterns |
EP1581026B1 (en) | 2004-03-17 | 2015-11-11 | Nuance Communications, Inc. | Method for detecting and reducing noise from a microphone array |
FR2878399B1 (fr) * | 2004-11-22 | 2007-04-06 | Wavecom Sa | Dispositif et procede de debruitage a deux voies mettant en oeuvre une fonction de coherence associee a une utilisation de proprietes psychoacoustiques, et programme d'ordinateur correspondant |
EP1718103B1 (en) * | 2005-04-29 | 2009-12-02 | Harman Becker Automotive Systems GmbH | Compensation of reverberation and feedback |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US8180067B2 (en) * | 2006-04-28 | 2012-05-15 | Harman International Industries, Incorporated | System for selectively extracting components of an audio input signal |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8934641B2 (en) * | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8949120B1 (en) * | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8036767B2 (en) * | 2006-09-20 | 2011-10-11 | Harman International Industries, Incorporated | System for extracting and changing the reverberant content of an audio input signal |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US11217237B2 (en) | 2008-04-14 | 2022-01-04 | Staton Techiya, Llc | Method and device for voice operated control |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
US9129291B2 (en) | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
US9372251B2 (en) * | 2009-10-05 | 2016-06-21 | Harman International Industries, Incorporated | System for spatial extraction of audio signals |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US20120057717A1 (en) * | 2010-09-02 | 2012-03-08 | Sony Ericsson Mobile Communications Ab | Noise Suppression for Sending Voice with Binaural Microphones |
DE102010043127B4 (de) * | 2010-10-29 | 2024-08-14 | Sennheiser Electronic Se & Co. Kg | Mikrofon |
EP2555189B1 (en) * | 2010-11-25 | 2016-10-12 | Goertek Inc. | Method and device for speech enhancement, and communication headphones with noise reduction |
US9589580B2 (en) * | 2011-03-14 | 2017-03-07 | Cochlear Limited | Sound processing based on a confidence measure |
KR101111524B1 (ko) * | 2011-10-26 | 2012-02-13 | (주)유나 | 유리 실험 기구 거치대 |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
JP6221257B2 (ja) * | 2013-02-26 | 2017-11-01 | 沖電気工業株式会社 | 信号処理装置、方法及びプログラム |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
KR102606286B1 (ko) | 2016-01-07 | 2023-11-24 | 삼성전자주식회사 | 전자 장치 및 전자 장치를 이용한 소음 제어 방법 |
CN105976826B (zh) * | 2016-04-28 | 2019-10-25 | 中国科学技术大学 | 应用于双麦克风小型手持设备的语音降噪方法 |
CN107331407B (zh) * | 2017-06-21 | 2020-10-16 | 深圳市泰衡诺科技有限公司 | 下行通话降噪方法及装置 |
JP6686977B2 (ja) * | 2017-06-23 | 2020-04-22 | カシオ計算機株式会社 | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム |
CN112992169B (zh) * | 2019-12-12 | 2024-06-11 | 华为技术有限公司 | 语音信号的采集方法、装置、电子设备以及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4888807A (en) * | 1989-01-18 | 1989-12-19 | Audio-Technica U.S., Inc. | Variable pattern microphone system |
JPH0728470B2 (ja) * | 1989-02-03 | 1995-03-29 | 松下電器産業株式会社 | アレイマイクロホン |
IT1257164B (it) * | 1992-10-23 | 1996-01-05 | Ist Trentino Di Cultura | Procedimento per la localizzazione di un parlatore e l'acquisizione diun messaggio vocale, e relativo sistema. |
US5473701A (en) * | 1993-11-05 | 1995-12-05 | At&T Corp. | Adaptive microphone array |
JPH07248784A (ja) * | 1994-03-10 | 1995-09-26 | Nissan Motor Co Ltd | 能動型騒音制御装置 |
DE4436272A1 (de) * | 1994-10-11 | 1996-04-18 | Schalltechnik Dr Ing Schoeps G | Verfahren und Vorrichtung zur Beeinflussung der Richtcharakteristiken einer akustoelektrischen Empfangsanordnung |
US5694474A (en) * | 1995-09-18 | 1997-12-02 | Interval Research Corporation | Adaptive filter for signal processing and method therefor |
JP3522954B2 (ja) * | 1996-03-15 | 2004-04-26 | 株式会社東芝 | マイクロホンアレイ入力型音声認識装置及び方法 |
US6041127A (en) * | 1997-04-03 | 2000-03-21 | Lucent Technologies Inc. | Steerable and variable first-order differential microphone array |
US6584203B2 (en) * | 2001-07-18 | 2003-06-24 | Agere Systems Inc. | Second-order adaptive differential microphone array |
-
2002
- 2002-09-24 EP EP02778321A patent/EP1430472A2/en not_active Withdrawn
- 2002-09-24 KR KR10-2004-7004267A patent/KR20040044982A/ko not_active Withdrawn
- 2002-09-24 US US10/253,684 patent/US20030061032A1/en not_active Abandoned
- 2002-09-24 JP JP2003531458A patent/JP2005525717A/ja active Pending
- 2002-09-24 AU AU2002339995A patent/AU2002339995A1/en not_active Abandoned
- 2002-09-24 WO PCT/US2002/030294 patent/WO2003028006A2/en not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015126279A (ja) * | 2013-12-25 | 2015-07-06 | 沖電気工業株式会社 | 音声信号処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20030061032A1 (en) | 2003-03-27 |
AU2002339995A1 (en) | 2003-04-07 |
KR20040044982A (ko) | 2004-05-31 |
WO2003028006A3 (en) | 2003-11-20 |
WO2003028006A2 (en) | 2003-04-03 |
EP1430472A2 (en) | 2004-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005525717A (ja) | 選択的な音の増幅 | |
US7092529B2 (en) | Adaptive control system for noise cancellation | |
US7386135B2 (en) | Cardioid beam with a desired null based acoustic devices, systems and methods | |
EP1278395B1 (en) | Second-order adaptive differential microphone array | |
KR101456866B1 (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
EP1994788B1 (en) | Noise-reducing directional microphone array | |
US6917688B2 (en) | Adaptive noise cancelling microphone system | |
KR102352927B1 (ko) | 상관 기반 근접장 검출기 | |
US8180067B2 (en) | System for selectively extracting components of an audio input signal | |
US8000482B2 (en) | Microphone array processing system for noisy multipath environments | |
JP2009522942A (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
CN110875056B (zh) | 语音转录设备、系统、方法、及电子设备 | |
CN113744752A (zh) | 语音处理方法及装置 | |
WO2003017718A1 (en) | Post-processing scheme for adaptive directional microphone system with noise/interference suppression | |
US9406293B2 (en) | Apparatuses and methods to detect and obtain desired audio | |
CN113782046A (zh) | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 | |
CN118824277A (zh) | 基于三元麦克风阵列的自适应语音降噪方法 | |
CN118250592A (zh) | 一种基于阵列麦克风的降风噪方法及系统 | |
Modhave et al. | Design of multichannel wiener filter for speech enhancement in hearing aids and noise reduction technique | |
Ramesh Babu et al. | Speech enhancement using beamforming and Kalman Filter for In-Car noisy environment | |
The et al. | A Method for Reducing Speech Distortion in Minimum Variance Distortionless Response Beamformer | |
Stolbov et al. | Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise | |
JPH03274099A (ja) | 音声認識装置 | |
Li et al. | Noise reduction based on microphone array and post-filtering for robust speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080128 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080630 |