JP5207479B2 - 雑音抑圧装置およびプログラム - Google Patents
雑音抑圧装置およびプログラム Download PDFInfo
- Publication number
- JP5207479B2 JP5207479B2 JP2009121192A JP2009121192A JP5207479B2 JP 5207479 B2 JP5207479 B2 JP 5207479B2 JP 2009121192 A JP2009121192 A JP 2009121192A JP 2009121192 A JP2009121192 A JP 2009121192A JP 5207479 B2 JP5207479 B2 JP 5207479B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- spectrum
- coefficient
- kurtosis
- stationary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000001629 suppression Effects 0.000 title claims description 114
- 238000001228 spectrum Methods 0.000 claims description 161
- 238000012545 processing Methods 0.000 claims description 79
- 230000008859 change Effects 0.000 claims description 68
- 238000000034 method Methods 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 17
- 238000013459 approach Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 11
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000000926 separation method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012880 independent component analysis Methods 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 238000004378 air conditioning Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02085—Periodic noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
RNN(fq)=E[vN(fq)vN(fq)H] ……(4)
数式(3)や数式(4)の記号Hは行列の転置(エルミート転置)を意味する。また、数式(4)の記号E[ ]は、現在のフレームを含む所定個のフレーム(例えば、現在のフレームから過去の所定個のフレーム)にわたる平均値(期待値)または加算値を意味する。数式(3)のフィルタ係数W(fq)の算定に利用される共分散行列RNN(fq)の逆行列が存在するように、数式(2b)の所定値εは、好適にはゼロ以外の数値に設定される。
拡散性雑音が支配的である期間の双方において、ミュージカルノイズの抑制と雑音抑圧率NRRの向上とを両立しながら雑音成分(定常雑音および非定常雑音)を効果的に抑圧することが可能である。
以上に例示した各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合される。
フィルタ係数Wの算定には、MVDR以外にも、公知の適応型ビームフォーマが任意に利用される。例えば、指向性アレイ処理後の音響信号VOUTのSN比が最大となるようにフィルタ係数Wを決定するSNR最大化ビームフォーマが好適に採用される。具体的には、以下の数式(10)で表現される固有値問題のもとで固有値が最大となる固有ベクトルを、係数設定部44はフィルタ係数W(fq)として算定する。
β・SNN(fq)K(fq)=SXX(fq)K(fq) ……(10)
以上の形態においては、図6を参照して説明したように、減算係数αをフレーム毎に順次に更新する方法(すなわち、複数のフレームにわたって減算係数αを徐々に最適値に近づける方法)を例示したが、図6のステップS2からステップS6の処理を1個のフレームについて複数回にわたり反復することで、減算係数αをフレーム毎に最適値に設定する構成も採用される。もっとも、図6のように減算係数αをフレーム毎に段階的に更新する方法によれば、減算係数αを各フレームについて個別に最適化する方法と比較して、雑音抑圧装置100の処理量が大幅に削減されるという利点がある。
以上の形態においては、雑音区間から推定した非定常雑音のスペクトルNd[j]を目的音区間における非定常雑音のスペクトルNd[j]として流用したが、目的音区間内の非定常雑音のスペクトルNd[j]を目的音区間内の各フレームから直接的に特定する構成も採用され得る。例えば、図1の雑音抽出部24を図9の雑音抽出部24Bや図10の雑音抽出部24Cに置換した構成が採用される。
尖度変化指標KRの定義は以上の例示(尖度Kxと尖度Kzとの相対比)に限定されない。例えば、尖度Kzと尖度Kxとの差分値を尖度変化指標KR(KR=Kz−Kx)として算定する構成や、尖度Kxおよび尖度Kzを変数とする所定の関数の演算値を尖度変化指標KRとして算定する構成(例えば、尖度Kxと尖度Kzとの相対比や差分値の対数値を尖度変化指標KRとして使用する構成)も好適である。また、以上の形態においては音響信号V[1]〜V[J]から尖度Kxを算定したが、J個のチャネルのなかから選択された1個の音響信号V[j]のみから尖度Kxを算定する構成も採用される。
以上の形態では周波数分析部22から波形合成部52までの処理を周波数領域で実行したが、第1雑音抑圧部32によるスペクトル減算以外の処理は適宜に時間領域の信号処理に変更され得る。例えば、時間領域の音響信号V[j]の各強度から指標算定部62が尖度Kxを算定する構成や、時間領域の音響信号VOUTの各強度から指標算定部62が尖度Kzを算定する構成が採用される。また、雑音抽出部24や定常雑音推定部26の処理も時間領域で実行され得る。
以上の各形態においては定常雑音のスペクトルNw[j]を音響信号V[j}のチャネル毎に生成したが、複数のチャネルに対して共通のスペクトルNw(例えば図1のスペクトルNw[1]〜Nw[J]の平均)を生成する構成も採用され得る。第1雑音抑圧部32は、スペクトルX[1]〜X[J]の各々から定常雑音の共通のスペクトルNwを減算することでスペクトルY[1]〜Y[J]を生成し、非定常雑音推定部34は、雑音成分のスペクトルN[1]〜N[J]の各々から共通のスペクトルNwを減算することで非定常雑音のスペクトルNd[1]〜Nd[J]を生成する。
Claims (3)
- 複数の収音機器が生成した複数のチャネルの音響信号から雑音成分を抑圧する装置であって、
前記各チャネルの音響信号について雑音成分を抽出する雑音抽出手段と、
前記雑音成分に含まれる定常雑音を推定する定常雑音推定手段と、
前記定常雑音のスペクトルを減算係数に応じた度合で前記各チャネルの音響信号のスペクトルから減算する第1雑音抑圧手段と、
前記各チャネルの雑音成分のスペクトルから前記定常雑音のスペクトルを減算することで非定常雑音のスペクトルを推定する非定常雑音推定手段と、
目的音成分を強調するフィルタ係数を前記非定常雑音のスペクトルから生成する係数設定手段と、
前記第1雑音抑圧手段による処理後の複数のチャネルの音響信号について前記フィルタ係数を適用したフィルタ処理を実行する第2雑音抑圧手段と、
音響信号の強度の度数分布における尖度が前記第1雑音抑圧手段による処理前と前記第2雑音抑圧手段による処理後とで変化する度合を示す尖度変化指標を算定する指標算定手段と、
前記尖度変化指標に応じて前記減算係数を可変に制御する係数調整手段と
を具備する雑音抑圧装置。 - 前記係数調整手段は、前記尖度変化指標が所定値に近づくように前記減算係数を設定する
請求項1の雑音抑圧装置。 - 複数の収音機器が生成した各チャネルの音響信号について雑音成分を抽出する雑音抽出処理と、
前記雑音成分に含まれる定常雑音を推定する定常雑音推定処理と、
前記定常雑音のスペクトルを減算係数に応じた度合で前記各チャネルの音響信号のスペクトルから減算する第1雑音抑圧処理と、
前記各チャネルの雑音成分のスペクトルから前記定常雑音のスペクトルを減算することで非定常雑音のスペクトルを推定する非定常雑音推定処理と、
目的音成分を強調するフィルタ係数を前記非定常雑音のスペクトルから生成する係数設定処理と、
前記第1雑音抑圧処理の実行後の複数のチャネルの音響信号に対する前記フィルタ係数を適用した第2雑音抑圧処理と、
音響信号の強度の度数分布における尖度が前記第1雑音抑圧処理の実行前と前記第2雑音抑圧処理の実行後とで変化する度合を示す尖度変化指標を算定する指標算定処理と、
前記尖度変化指標に応じて前記減算係数を可変に制御する係数調整処理と
をコンピュータに実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009121192A JP5207479B2 (ja) | 2009-05-19 | 2009-05-19 | 雑音抑圧装置およびプログラム |
US12/782,615 US20100296665A1 (en) | 2009-05-19 | 2010-05-18 | Noise suppression apparatus and program |
EP10005240A EP2254113A1 (en) | 2009-05-19 | 2010-05-19 | Noise suppression apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009121192A JP5207479B2 (ja) | 2009-05-19 | 2009-05-19 | 雑音抑圧装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010271411A JP2010271411A (ja) | 2010-12-02 |
JP5207479B2 true JP5207479B2 (ja) | 2013-06-12 |
Family
ID=42470761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009121192A Expired - Fee Related JP5207479B2 (ja) | 2009-05-19 | 2009-05-19 | 雑音抑圧装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20100296665A1 (ja) |
EP (1) | EP2254113A1 (ja) |
JP (1) | JP5207479B2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112012031656A2 (pt) * | 2010-08-25 | 2016-11-08 | Asahi Chemical Ind | dispositivo, e método de separação de fontes sonoras, e, programa |
JP5728903B2 (ja) * | 2010-11-26 | 2015-06-03 | ヤマハ株式会社 | 音響処理装置およびプログラム |
WO2012074503A1 (en) * | 2010-11-29 | 2012-06-07 | Nuance Communications, Inc. | Dynamic microphone signal mixer |
JP5621637B2 (ja) * | 2011-02-04 | 2014-11-12 | ヤマハ株式会社 | 音響処理装置 |
US9538286B2 (en) * | 2011-02-10 | 2017-01-03 | Dolby International Ab | Spatial adaptation in multi-microphone sound capture |
JP5687522B2 (ja) * | 2011-02-28 | 2015-03-18 | 国立大学法人 奈良先端科学技術大学院大学 | 音声強調装置、方法、及びプログラム |
JP5278477B2 (ja) | 2011-03-30 | 2013-09-04 | 株式会社ニコン | 信号処理装置、撮像装置、および、信号処理プログラム |
GB2493327B (en) * | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
GB2495278A (en) | 2011-09-30 | 2013-04-10 | Skype | Processing received signals from a range of receiving angles to reduce interference |
GB2495128B (en) | 2011-09-30 | 2018-04-04 | Skype | Processing signals |
GB2495131A (en) | 2011-09-30 | 2013-04-03 | Skype | A mobile device includes a received-signal beamformer that adapts to motion of the mobile device |
GB2495129B (en) | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
GB2495130B (en) | 2011-09-30 | 2018-10-24 | Skype | Processing audio signals |
GB2495472B (en) | 2011-09-30 | 2019-07-03 | Skype | Processing audio signals |
JP5687605B2 (ja) * | 2011-11-14 | 2015-03-18 | 国立大学法人 奈良先端科学技術大学院大学 | 音声強調装置、音声強調方法、及び音声強調プログラム |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
GB201120392D0 (en) | 2011-11-25 | 2012-01-11 | Skype Ltd | Processing signals |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
JP5903921B2 (ja) * | 2012-02-16 | 2016-04-13 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム |
US20150117652A1 (en) * | 2012-05-31 | 2015-04-30 | Toyota Jidosha Kabushiki Kaisha | Sound source detection device, noise model generation device, noise reduction device, sound source direction estimation device, approaching vehicle detection device and noise reduction method |
JP5967571B2 (ja) * | 2012-07-26 | 2016-08-10 | 本田技研工業株式会社 | 音響信号処理装置、音響信号処理方法、及び音響信号処理プログラム |
JP6169849B2 (ja) | 2013-01-15 | 2017-07-26 | 本田技研工業株式会社 | 音響処理装置 |
EP2985761B1 (en) | 2013-04-11 | 2021-01-13 | Nec Corporation | Signal processing apparatus, signal processing method, signal processing program |
JP6337519B2 (ja) * | 2014-03-03 | 2018-06-06 | 富士通株式会社 | 音声処理装置、雑音抑圧方法、およびプログラム |
JP6411780B2 (ja) * | 2014-06-09 | 2018-10-24 | ローム株式会社 | オーディオ信号処理回路、その方法、それを用いた電子機器 |
CN106157967A (zh) | 2015-04-28 | 2016-11-23 | 杜比实验室特许公司 | 脉冲噪声抑制 |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
US9928848B2 (en) * | 2015-12-24 | 2018-03-27 | Intel Corporation | Audio signal noise reduction in noisy environments |
KR101768587B1 (ko) * | 2016-05-13 | 2017-08-17 | 국방과학연구소 | 비정상 클러터 및 이종 클러터 억제를 위한 공분산 행렬 추정방법 |
US10311889B2 (en) | 2017-03-20 | 2019-06-04 | Bose Corporation | Audio signal processing for noise reduction |
JP6345327B1 (ja) * | 2017-09-07 | 2018-06-20 | ヤフー株式会社 | 音声抽出装置、音声抽出方法および音声抽出プログラム |
CN112447184B (zh) * | 2020-11-10 | 2024-06-18 | 北京小米松果电子有限公司 | 语音信号处理方法及装置、电子设备、存储介质 |
CN113205823A (zh) * | 2021-04-12 | 2021-08-03 | 广东技术师范大学 | 一种肺音信号端点检测方法、系统及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2836271B2 (ja) * | 1991-01-30 | 1998-12-14 | 日本電気株式会社 | 雑音除去装置 |
JP4496378B2 (ja) * | 2003-09-05 | 2010-07-07 | 財団法人北九州産業学術推進機構 | 定常雑音下における音声区間検出に基づく目的音声の復元方法 |
JP4496379B2 (ja) * | 2003-09-17 | 2010-07-07 | 財団法人北九州産業学術推進機構 | 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法 |
US7533017B2 (en) * | 2004-08-31 | 2009-05-12 | Kitakyushu Foundation For The Advancement Of Industry, Science And Technology | Method for recovering target speech based on speech segment detection under a stationary noise |
CN1815550A (zh) * | 2005-02-01 | 2006-08-09 | 松下电器产业株式会社 | 可识别环境中的语音与非语音的方法及系统 |
JP4825552B2 (ja) | 2006-03-13 | 2011-11-30 | 国立大学法人 奈良先端科学技術大学院大学 | 音声認識装置、周波数スペクトル取得装置および音声認識方法 |
US8131541B2 (en) * | 2008-04-25 | 2012-03-06 | Cambridge Silicon Radio Limited | Two microphone noise reduction system |
-
2009
- 2009-05-19 JP JP2009121192A patent/JP5207479B2/ja not_active Expired - Fee Related
-
2010
- 2010-05-18 US US12/782,615 patent/US20100296665A1/en not_active Abandoned
- 2010-05-19 EP EP10005240A patent/EP2254113A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JP2010271411A (ja) | 2010-12-02 |
US20100296665A1 (en) | 2010-11-25 |
EP2254113A1 (en) | 2010-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5207479B2 (ja) | 雑音抑圧装置およびプログラム | |
JP6134078B1 (ja) | ノイズ抑制 | |
JP5347902B2 (ja) | 音響処理装置 | |
JP7041156B6 (ja) | ビームフォーミングを使用するオーディオキャプチャのための方法及び装置 | |
JP6019969B2 (ja) | 音響処理装置 | |
JP2017503388A5 (ja) | ||
JP5277887B2 (ja) | 信号処理装置およびプログラム | |
JP6724905B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5034734B2 (ja) | 音処理装置およびプログラム | |
JP6665353B2 (ja) | ビームフォーミングを使用するオーディオキャプチャ | |
JP5034735B2 (ja) | 音処理装置およびプログラム | |
JP2010220087A (ja) | 音響処理装置およびプログラム | |
JP2004078021A (ja) | 収音方法、収音装置、および収音プログラム | |
JP5376635B2 (ja) | 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム | |
JP5233772B2 (ja) | 信号処理装置およびプログラム | |
EP3531719B1 (en) | Dereverberation device and hearing aid | |
Miyazaki et al. | Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction | |
JP2010286685A (ja) | 信号処理装置 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
JP4950971B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム、記録媒体 | |
JP5163435B2 (ja) | 信号処理装置およびプログラム | |
JP5321171B2 (ja) | 音処理装置およびプログラム | |
JP5338395B2 (ja) | 信号処理装置およびプログラム | |
JP2014010279A (ja) | 雑音抑圧装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120410 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130215 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160301 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5207479 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |