JP6064566B2 - 音響処理装置 - Google Patents
音響処理装置 Download PDFInfo
- Publication number
- JP6064566B2 JP6064566B2 JP2012268102A JP2012268102A JP6064566B2 JP 6064566 B2 JP6064566 B2 JP 6064566B2 JP 2012268102 A JP2012268102 A JP 2012268102A JP 2012268102 A JP2012268102 A JP 2012268102A JP 6064566 B2 JP6064566 B2 JP 6064566B2
- Authority
- JP
- Japan
- Prior art keywords
- noise component
- component
- acoustic signal
- reliability
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 claims description 74
- 238000004364 calculation method Methods 0.000 claims description 59
- 238000009499 grossing Methods 0.000 claims description 46
- 230000001629 suppression Effects 0.000 claims description 35
- 230000008859 change Effects 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 23
- 230000008901 benefit Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009408 flooring Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。図1に示すように、第1実施形態の音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、目的音成分と雑音成分との混合音の波形を示す時間領域の音響信号x(t)を音響処理装置100に供給する(t:時間)。目的音成分は、例えば音声や楽音等の音響成分であり、雑音成分は、例えば空調設備の動作音や人混み内の雑踏音等の環境音に代表される加法性雑音の音響成分である。周囲の音響を収音して音響信号x(t)を生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号x(t)を取得して音響処理装置100に供給する再生装置や、通信網から音響信号x(t)を受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
すなわち、算定処理部424は、第2指標値P2(k,m)に対する第1指標値P1(k,m)の相対比(P1(k,m)/P2(k,m))を、所定値(第1実施形態の例示では1)以下の範囲内(0≦CS(k,m)≦1)で信頼度CS(k,m)として算定する。なお、第1指標値P1(k,m)と第2指標値P2(k,m)との差分を信頼度CS(k,m)として算定する構成も採用され得る。
前述の通り、観測成分X(k,m)内で目的音成分が優勢であるほど信頼度CS(k,m)は0以上かつ1以下の範囲内で大きい数値となる(雑音成分が優勢であるほど信頼度CS(k,m)は小さい数値となる)から、観測成分X(k,m)内で雑音成分が目的音成分と比較して優勢である(観測成分X(k,m)が雑音成分に該当する確度が高い)ほど信頼度CN(k,m)は大きい数値となる。したがって、観測成分X(k,m)が雑音成分に該当する確度の指標として信頼度CN(k,m)を利用することが可能である。以上に説明した通り、図2の指標算定部42は、第1指標値P1(k,m)と第2指標値P2(k,m)との相違(具体的には両者間の相対比)に応じて各周波数の信頼度CN(k,m)を単位期間毎に順次に算定する。図2の推定処理部44は、指標算定部42が算定した信頼度CN(k,m)を利用して音響信号x(t)の推定雑音成分N(k,m)を単位期間毎に順次に生成する。
係数Aは、0以上かつ1以下の範囲内で適切な数値に設定される。具体的には、抑圧対象として想定される雑音成分の定常性(時間的な変動の程度)に応じて係数Aは可変に設定される。例えば、時間的な変動が比較的に大きい雑音成分が想定される場合には係数Aが0.2から0.5程度の数値に設定され、時間的な変動が小さい雑音成分が想定される場合には係数Aが0.02程度の数値に設定される。利用者からの指示に応じて係数Aを可変に設定することも可能である。
雑音区間は、音響信号x(t)のうち目的音成分が存在しないと推定される区間である。例えば、雑音抑圧の開始点から所定の時間長にわたる区間(例えば音響信号x(t)の始点から500ミリ秒の区間)が雑音区間として好適である。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
第3実施形態の推定処理部44は、第1推定雑音成分Q1(k,m)と第2推定雑音成分Q2(k,m)とを単位期間毎に順次に算定する。第1推定雑音成分Q1(k,m)は、以下の数式(9A)で表現される通り、平滑化係数ω1(k,m)を適用した観測成分X(k,m)のパワー|X(k,m)|2の指数移動平均である。同様に、第2推定雑音成分Q2(k,m)は、以下の数式(9B)で表現される通り、平滑化係数ω2(k,m)を適用した観測成分X(k,m)のパワー|X(k,m)|2の指数移動平均である。
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
すなわち、第1推定雑音成分Q1(k,m)および第2推定雑音成分Q2(k,m)の最小値(min{Q1(k,m),Q2(k,m)})が閾値σ1を上回る単位期間では推定雑音成分N(k,m)が閾値σ1に設定される。すなわち、閾値σ1を上限値として推定雑音成分N(k,m)が設定される。閾値σ1は、例えば観測成分X(k,m)のパワー|X(k,m)|2に設定される。数式(13)を採用した構成では、推定雑音成分N(k,m)の上限値が閾値σ1に制限されるから、周波数領域での雑音抑圧に起因したミュージカルノイズを低減することが可能である。
数式(14)を採用した構成では、数式(11)の演算で推定雑音成分N(k,m)を算定する構成と比較して音響信号x(t)における雑音成分の時間変化に迅速に追従するように推定雑音成分N(k,m)を算定できるという利点がある。
すなわち、第1推定雑音成分Q1(k,m)および第2推定雑音成分Q2(k,m)の最大値(max{Q1(k,m),Q2(k,m)})が閾値σ2を上回る単位期間では推定雑音成分N(k,m)が閾値σ2に設定される。すなわち、閾値σ2を上限値として推定雑音成分N(k,m)が設定される。閾値σ2は、例えば観測成分X(k,m)のパワー|X(k,m)|2に設定される。数式(15)を採用した構成では、推定雑音成分N(k,m)の上限値が閾値σ2に制限されるから、第1推定雑音成分Q1(k,m)および第2推定雑音成分Q2(k,m)の最大値が誤推定等に起因して極端に大きい数値となった場合でも推定雑音成分N(k,m)を適切な範囲内に抑制することが可能である。
すなわち、第1推定雑音成分Q1(k,m)および第2推定雑音成分Q2(k,m)の最小値(min{Q1(k,m),Q2(k,m)})と観測成分X(k,m)のパワー|X(k,m)|2とを推定事前SNRξ(m)に応じた加重値で加重平均することで推定雑音成分N(k,m)が算定される。係数ηは、推定事前SNRξ(m)の寄与度を制御するための変数である。
数式(17A)の記号εは所定の数値に設定される。なお、ゼロの対数は負の無限大であるから、数値εをゼロに設定すると数式(17A)の演算(log10ε)が不安定となる可能性がある。そこで、数値εは非常に小さい正数(ε>0)に設定される。
数式(18)から理解される通り、第m番目の単位期間を最後尾とするM個の単位期間の各々の観測成分X(k,m)のパワー|X(k,m)|2を、M個の単位期間にわたる信頼度CN(k,m)の合計値に対するその単位期間の信頼度CN(k,m)の相対比(CN(k,m)/ΣCN(k,m-n))を加重値として加重平均(加重加算)することで推定雑音成分N(k,m)が算定される。
Claims (5)
- 目的音成分と雑音成分とを包含する音響信号の時間変化に追従する第1指標値と、前記第1指標値と比較して低い追従性で前記音響信号の時間変化に追従する第2指標値との相違に応じて、前記音響信号の各単位期間が前記目的音成分および前記雑音成分の一方に該当する確度の指標である信頼度を単位期間毎に算定する指標算定手段と、
前記指標算定手段が算定した各単位期間の信頼度を利用して前記音響信号から推定雑音成分を生成する推定処理手段と
を具備する音響処理装置。 - 前記指標算定手段は、前記音響信号の各単位期間が前記目的音成分に該当する確度の指標である基礎指標を前記第1指標値と前記第2指標値とに相違に応じて単位期間毎に算定し、前記基礎指標が第1閾値を上回る単位期間または前記音響信号の強度が第2閾値を下回る単位期間については信頼度を所定値に設定する一方、他の単位期間については前記基礎指標に応じて前記信頼度を算定する
請求項1の音響処理装置。 - 前記推定処理手段は、前記指標算定手段が算定した信頼度に応じた平滑化係数を前記音響信号の各単位期間の強度の指数移動平均に適用することで前記推定雑音成分を生成する
請求項1または請求項2の音響処理装置。 - 前記推定処理手段は、前記指標算定手段が算定した信頼度と第1係数とに応じた平滑化係数を前記音響信号の各単位期間の強度の指数移動平均に適用することで第1推定雑音成分を生成し、前記指標算定手段が算定した信頼度と前記第1係数とは相違する第2係数とに応じた平滑化係数を前記音響信号の各単位期間の強度の指数移動平均に適用することで第2推定雑音成分を生成し、前記第1推定雑音成分と前記第2推定雑音成分とに応じて前記推定雑音成分を生成する
請求項1から請求項3の何れかの音響処理装置。 - 前記推定処理手段が生成した推定雑音成分を前記音響信号から抑圧する雑音抑圧手段
を具備する請求項1から請求項4の何れかの音響処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012268102A JP6064566B2 (ja) | 2012-12-07 | 2012-12-07 | 音響処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012268102A JP6064566B2 (ja) | 2012-12-07 | 2012-12-07 | 音響処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014115377A JP2014115377A (ja) | 2014-06-26 |
JP6064566B2 true JP6064566B2 (ja) | 2017-01-25 |
Family
ID=51171455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012268102A Expired - Fee Related JP6064566B2 (ja) | 2012-12-07 | 2012-12-07 | 音響処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6064566B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6556657B2 (ja) * | 2016-04-07 | 2019-08-07 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、プログラム、記録媒体 |
EP3324406A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3324407A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
JP6892598B2 (ja) * | 2017-06-16 | 2021-06-23 | アイコム株式会社 | ノイズ抑圧回路、ノイズ抑圧方法、および、プログラム |
CN112272848B (zh) * | 2018-04-27 | 2024-05-24 | 杜比实验室特许公司 | 使用间隙置信度的背景噪声估计 |
JP7139822B2 (ja) * | 2018-09-20 | 2022-09-21 | 沖電気工業株式会社 | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 |
JP7380361B2 (ja) * | 2020-03-17 | 2023-11-15 | 沖電気工業株式会社 | 雑音推定装置、雑音推定プログラム、雑音推定方法、及び収音装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3398401B2 (ja) * | 1992-03-16 | 2003-04-21 | 株式会社東芝 | 音声認識方法及び音声対話装置 |
JP3297346B2 (ja) * | 1997-04-30 | 2002-07-02 | 沖電気工業株式会社 | 音声検出装置 |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
-
2012
- 2012-12-07 JP JP2012268102A patent/JP6064566B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014115377A (ja) | 2014-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6064566B2 (ja) | 音響処理装置 | |
US12112768B2 (en) | Post-processing gains for signal enhancement | |
JP6014259B2 (ja) | ノイズ削減利得の百分位数フィルタリング | |
JP5641186B2 (ja) | 雑音抑圧装置およびプログラム | |
JP6177253B2 (ja) | ハーモニシティベースの単一チャネルスピーチ品質評価 | |
JP6361156B2 (ja) | 雑音推定装置、方法及びプログラム | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
US20150032447A1 (en) | Determining a Harmonicity Measure for Voice Processing | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
JP2023536104A (ja) | 機械学習を用いたノイズ削減 | |
CN112712816A (zh) | 语音处理模型的训练方法和装置以及语音处理方法和装置 | |
JP6361148B2 (ja) | 雑音推定装置、方法及びプログラム | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP2013250356A (ja) | 係数設定装置および雑音抑圧装置 | |
JP5772723B2 (ja) | 音響処理装置および分離マスク生成装置 | |
JP2006178333A (ja) | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 | |
JP2015169901A (ja) | 音響処理装置 | |
JP6299279B2 (ja) | 音響処理装置および音響処理方法 | |
JP6171558B2 (ja) | 音響処理装置 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
JP2015004959A (ja) | 音響処理装置 | |
JP2015169900A (ja) | 雑音抑圧装置 | |
JP2017138409A (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP6679881B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161205 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6064566 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |