JP5526524B2 - 雑音抑圧装置及び雑音抑圧方法 - Google Patents
雑音抑圧装置及び雑音抑圧方法 Download PDFInfo
- Publication number
- JP5526524B2 JP5526524B2 JP2008274858A JP2008274858A JP5526524B2 JP 5526524 B2 JP5526524 B2 JP 5526524B2 JP 2008274858 A JP2008274858 A JP 2008274858A JP 2008274858 A JP2008274858 A JP 2008274858A JP 5526524 B2 JP5526524 B2 JP 5526524B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- gain
- noise suppression
- frame
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
そのような雑音抑圧の技術としては、例えば以下の特許文献1及び2、並びに非特許文献1乃至5に開示されているようなものが知られている。
例えば、前記のスペクトラル・サブトラクション法は、入力信号中に含まれる雑音スペクトルを推定し、その雑音スペクトル推定値を、振幅スペクトルから差し引く手法に基づくが、この場合、いわゆるミュージカルノイズが発生するおそれが高いという問題がある。これは、ここでいう雑音スペクトル推定値が、必ずしも、実際の雑音スペクトルを反映するとは限らないことによる。つまり、ある周波数帯域では、雑音スペクトル推定値を差し引いた後にもなお雑音が残る場合があり、また、他の周波数帯域では、引き過ぎが生じる場合があるのである。このため、雑音スペクトル差し引き後の振幅スペクトルを時間領域に再変換すると、複数のランダムな周波数をもつ正弦波が合成されたものが現れる可能性があり、これが再生されることによって、非常に耳障りな雑音(即ち、ミュージカルノイズ)が発生してしまうおそれがあるのである。
しかし、この技術では、原音加算割合が、入力信号のSNRを推定することに基づき定められるようになっているので、雑音抑圧処理のいわば柔軟性に若干欠ける嫌いがある。例えば、前記非特許文献5では、SNRが10〜15〔dB〕であることを基準に、SNRがそれ以上の時は原音加算割合が0.05、それを下回る時は0.5、などというように、本来抑圧したい、あるいは、抑圧すべき雑音量とは無関係に、原音加算割合の設定が行われるため、実際上享受される雑音抑圧効果に若干の問題があるのである。このような事情は、前述した特許文献2においてもあてはまる。
このような状況下で、例えば、前述の非特許文献1のように、音声部分にはスペクトラル・サブトラクション法を適用するが、雑音部分には固定ゲインを適用して雑音を抑圧するという場合、その固定ゲインの値が過小のときは、雑音部分から音声部分への切り替わりの場面において、背景雑音量が大きくなるという現象が生じ、固定ゲインの値が過大のときは、逆に背景雑音量が小さくなるという現象が生じ得る。これが例えば再生されれば、聴取者に、聴感上の不自然さを感じさせるおそれが高い。
しかも、本発明においては、原音加算割合としての意義をもつ「第1割合」が、雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められるようになっているので、実際上享受される雑音抑圧効果がきわめて実効的になる。というのも、本発明の場合、前述の例のようにSNR推定値と基準値との単純な比較によるのではなく、当該の「第1割合」が、目標雑音抑圧ゲインとの関係において定められ、また、この目標雑音抑圧ゲインは、本来抑圧したい、あるいは抑圧すべき雑音量に基づいて設定され得るものであるからである。
なお、本発明にいう「目標雑音抑圧ゲイン」は、本発明に係る雑音抑圧装置外部に設置された操作部等を介することによって人為的に与えられるようにしたり、あるいは、何らかの適当な手法により自動的に演算されるようにしてよい。
この態様によれば、第2雑音抑圧後信号に、「第2割合」で、入力信号が加算される。
ここで本態様では、「平均値ゲイン」が用いられることに特徴の1つがある。この平均値ゲインは、仮に、前記の雑音抑圧ゲインが、G(1),G(2),…,G(K)であるとすると、例えば、その平均値ゲインたるGaveが、Cave=(G(1)+G(2)+…+G(K))/Kなどとして求められる。そして、さらに、入力信号を、周波数領域に変換して得られる振幅スペクトルが、Y(1),Y(2),…,Y(K)であるとすると、周波数領域にある出力信号は、Gave・Y(1),Gave・Y(2),…,Gave・Y(K)、などと得られることになる(これは、本態様にいう「平均値ゲインを適用した結果得られる第2雑音抑圧後信号」の一具体例である。)。
したがって、まず、このような平均値ゲインの存在によれば、例えば前述したような雑音スペクトル推定値による振幅スペクトルの引き過ぎの事例等が発生することがないから、ミュージカルノイズの発生がきわめて実効的に抑圧される。
のみならず、本態様では更に、このような平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、原音加算が行われるようになっているので、ミュージカルノイズの抑圧効果は更に効果的に享受されることになる。
まず、「第1雑音抑圧後信号」の生成及び「第1割合」の定立の双方に「雑音抑圧ゲイン」が関わり、前者は後者に基づく原音加算処理の対象となる一方、「第2雑音抑圧後信号」の生成及び「第2割合」の定立の双方に「平均値ゲイン」が関わり、前者は後者に基づく原音加算処理の対象となる、という概念上の区別を確認する。
この前提で、まず、本態様にいう「平均値ゲイン」が算出される以上は、本発明に係る「原音加算手段」は、その「平均値ゲイン」に基づく「第2割合」による原音加算を行うだけで、「第1割合」による原音加算は行わないという関係が、本発明においては成立しうる。つまり、この場合は、本態様が、前述の「第1割合」を含む態様に対して、いわば優先的地位に立つ。
あるいは、入力信号中のある部分では「第1割合」による原音加算が、他の部分では「第2割合」による原音加算が行われる、などといった態様も、本発明においては成立しうる(この場合、前者の部分は「第1雑音抑圧後信号」に関連し、後者の部分は「第2雑音抑圧後信号」に関連するということになる。)。
さらに、場合によっては、「第2雑音抑圧後信号」に「第2割合」による原音加算を行うだけでなく、「第1雑音抑圧後信号」にも「第2割合」による原音加算を行う、などといった態様も、本発明は特にその範囲内に収める(かかる態様は、本発明の各種態様の1つとして、後に言及される。)。このことはつまり、「平均値ゲイン」でなく「雑音抑圧ゲイン」の関与で成立する「第1雑音抑圧後信号」にも、「平均値ゲイン」に基づいて定められる「第2割合」の適用があってよいことを含意する(場合によっては、その逆も然りである。)。
この態様によれば、前記第1又は第2割合を時間軸上で平滑化した平滑化割合が算出される。したがって、この平滑化割合は、「第1割合」又は「第2割合」が、前述の「差」に基づいて定立された後、なおこれらが平滑化処理を受けたものである。なお、「時間軸上で平滑化」とは、算出後の平滑化割合が、時系列に沿って、OGsmt-T(1),OGsmt-T(2),…,OGsmt-T(r),…、とあるとすると(rは適当な整数)、例えば、適当な平滑化係数δを用いて、OGsmt-T(r)=δ・OGsmt-T(r−1)+(1−δ)・ogなどとして算出されることを意味する(ただし、ogは、「第1割合」又は「第2割合」である。)。
これによれば、第1又は第2割合(正確に言うと、平滑化された第1又は第2割合。つまり、本態様に言う「平滑化割合」)の時間の経過に従った急激な変化が生じないから、雑音抑圧処理の連続性・一貫性が維持される。
なお、本発明においては、後述するように、経時的に区分されたフレーム毎の処理が行われると好適であるが、その場合、本態様にいう「時間軸」は、より具体的には、そのフレームの1個1個が順に並べられていく場合に観念される軸、として想定され得る。この点についての、より詳細な具体例については、後述する実施形態、特に式(7)に関して説明される。
また、本態様に関連して、本態様にいう「第1割合」又は「第2割合」は、後述する実施形態においては、「原音加算率og」として、同じく「平滑化割合」は「原音加算割合OGt」として、それぞれ具体化されて説明される。
この態様によれば、前述の平均値ゲインが、雑音フレームに、より好適には雑音フレームだけに適用されて、第2雑音抑圧後信号が生成される(そして、この第2雑音抑圧後信号は、前記第2割合による原音加算処理を受ける。)。雑音フレームでは、ミュージカルノイズが比較的に発生しやすいことからすると、本態様は、それを狙うかの如く平均値ゲインの適用を行うことになるので、ミュージカルノイズ抑圧効果を得るための最適な態様の1つということができる。
なお、本態様において、音声が「含まれる」あるいは「含まれない」という用語は、いわば絶対的な意味に解されてはならない。例えば、“すべてが音声”で満たされるフレームと、“全く音声が不存在”のフレームという2つの態様が観念的には想定されるが、この両者両極端を指して「音声フレーム」及び「雑音フレーム」の区別が行われる場合に本態様が限定されるわけでは勿論なく、また、後者のみが「雑音フレーム」で、それ以外はすべて「音声フレーム」という区別が行われる場合に、本態様が限定されるわけでもない。つまり、本態様は、「雑音フレーム」と認定される場合においても、当該の雑音フレームに「音声」が全く含まれてはならないということまで要求せず、本態様にいう「音声フレーム」及び「雑音フレーム」の区別は、上記の2つの場合の適当な中間点を基準に行われてよいのである。
以上のような意味において、本態様にいう「含まれる」あるいは「含まれない」という用語、あるいは、本態様に係る「音声フレーム」及び「雑音フレーム」の区別は、相対的なものということができる。
この態様によれば、前述の雑音抑圧ゲインが、音声フレームに適用されて、第1雑音抑圧後信号が生成される(そして、この第1雑音抑圧後信号は、前記第1割合による原音加算処理を受ける。)。この態様は、すぐ前に述べた態様と併存可能であるが、その場合、好適には、音声フレームでは、平均化処理を経ないいわば通常の雑音抑圧ゲインのみが利用され、雑音フレームでは、平均化処理を経た、平均値ゲインのみが利用される、ということになる。音声フレームでは、雑音の存在が然程目立たず、雑音フレームでは、その逆であるという事情に鑑みるなら、本態様に係る処理内容は、きわめて合理的・効率的・実効的な雑音抑圧効果を享受可能にする。
この態様によれば、「第2雑音抑圧後信号」に「第2割合」による原音加算を行うだけでなく、「第1雑音抑圧後信号」にも「第2割合」による原音加算を行うことになる。つまり、この場合、「平均値ゲイン」でなく「雑音抑圧ゲイン」の関与で成立する「第1雑音抑圧後信号」にも、「平均値ゲイン」に基づいて定められる「第2割合」による原音加算処理が行われるのである。
これによれば、原音加算割合として利用されるものが、「第2割合」に一本化されるので、処理の効率化等が実現される。
この態様によれば、音声フレームにおける原音加算処理では、その直近に処理された雑音フレームにおいて利用された原音加算割合(即ち、「第2割合」)が、その原音加算割合(即ち、「第1割合」)であるものとして利用される。つまり、この場合、その実質は直近の雑音フレームの「第2割合」の値であるのに、あたかもそれが、当該音声フレームにおける「第1割合」の値であるかのように擬制されるということである。
このようなことから、本態様においては、直近の雑音フレームで実行された雑音抑圧処理が、それに続く音声フレームにおける雑音抑圧処理にいわば引き継がれるようなことになり、雑音フレームから音声フレームへの切り替わりの場面において、雑音抑圧処理の一貫性が保持される。これにより、当該切り替わりの場面において、雑音量が急激に変化するといった現象の発生が未然に防止される。
なお、この態様は、第1雑音抑圧後信号に第1割合で原音を加算し、第2雑音抑圧後信号に第2割合で原音を加算するという態様が並存し、かつ、前者は入力信号中の雑音フレームに関し、後者は音声フレームに関するということを前提とする。
この態様によれば、音声フレーム及び雑音フレームそれぞれについての第1又は第2割合が好適に定立される。雑音フレームに関しては、平滑化割合が算出されるので、雑音抑圧処理の一貫性・連続性が保持されるし、音声フレームに関しては、前述したような「直近の雑音フレーム」における雑音スペクトルの維持が好適になされる(つまり、本態様によれば、ある雑音フレームについての第2割合が既に設定されているなら、その後、音声フレームが続く限りは、当該第2割合の値が、新たな第1割合の値として維持され続ける。)。この点についての、より詳細な具体例については、後述する実施形態、特に式(7)に関して説明される。
なお、本態様において、単に「フレーム」という場合、それは「音声フレーム」である場合も、「雑音フレーム」である場合もある。
また、この態様は、第1雑音抑圧後信号に第1割合で原音を加算し、第2雑音抑圧後信号に第2割合で原音を加算するという態様が並存し、かつ、前者は入力信号中の雑音フレームに関し、後者は音声フレームに関するということを前提とする。
さらに、本態様に関連して、本態様にいう「第1割合」、「第2割合」及び「平滑化割合」等は、後述する実施形態においては、「原音加算率og」あるいは「原音加算割合OGt」などとして具体化されて説明されるが、この場合、前者における1つの言葉が、後者における1つの言葉に、1対1で対応するという関係は成立しないことに注意を要する。
og=max(0,tg−G) …… (A)
ここで、ogは、求めるべき第1又は第2割合、tgは、前記目標雑音抑圧ゲイン、Gは、前記雑音抑圧ゲイン又は前記平均値ゲイン、max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する。
この態様によれば、第1又は第2割合が好適に算出される。この点についての、より詳細な具体例については、後述する実施形態、特に式(5)に関して説明される。
この態様によれば、上述した、本発明に係る雑音抑圧装置の各種態様のうち、第2雑音抑圧後信号に第2割合で入力信号が加算される態様に関して述べた作用効果と本質的に異ならない作用効果が奏されることが明白である。
なお、本態様にいう「第2雑音抑圧後信号に、…第2割合で、…入力信号を加算する」と、前記の「第1雑音抑圧後信号に、…第1割合で、…入力信号を加算する」との関係については、上述と同様である。
この態様によれば、上述した、本発明に係る雑音抑圧装置の各種態様のうち、雑音フレームに平均値ゲインを適用する態様に関して述べた作用効果と本質的に異ならない作用効果が奏されることが明白である。
なお、本態様にいう「含まれる」あるいは「含まれない」という用語の意義については、上述と同様である。
以下では、本発明に係る第1の実施の形態について図1を参照しながら説明する。なお、ここに言及した図1に加え、以下で参照する各図面(例えば図6等のグラフをも含む。)においては、各部の寸法の比率が実際のものとは適宜に異ならせてある場合がある。
前記の周波数領域の信号は、振幅スペクトル及び位相スペクトルに分けられ、このうちの位相スペクトルは、後述する周波数・時間変換部70にそのまま送られる。他方、振幅スペクトルは、後述する雑音スペクトル推定部20以後の各部に送られて、後述する各種の処理を受ける。
この音声信号は、例えば、入力信号のレベルが予め定めた閾値を超えるか否かを基準として検出される。もっとも、本発明は、これ以外にも様々な手法を採用することが可能である。例えば、確率・統計的手法を用いて音声信号の発生確率を推定する手法等が採用されてもよいし、あるいは、検出対象としても、前記入力信号を利用するのではなく、そのフーリエ変換後の信号(つまり、前記でいう周波数領域の信号)を利用する手法等が採用されてもよい。
なお、以下では、この音声検出部80によって音声信号が存在すると判定されたフレームは、「音声フレーム」と、不存在であると判定されたフレームは、「雑音フレーム」と、それぞれ呼ぶことがある。なお、ここで存在・不存在というのは、いわば絶対的な意義をもたない。前述のように、音声信号の有無が所定の閾値を基準に判断されることがある以上、「雑音フレーム」に、厳密に言えば音声信号と呼べるものが含まれている可能性は排除されない。
このように、雑音スペクトル推定部20は、現に処理しているフレームが、雑音フレームであるか音声フレームであるかに応じて、雑音スペクトル推定値Nt(n)を求めるために利用する式を変更する。すなわち、音声フレーム処理時(case・B)には、その直前の雑音スペクトル推定値をそのまま用いて雑音スペクトル推定値Nt(n)を求め、雑音フレーム処理時(case・A)には、入力した振幅スペクトルを時間軸上で平滑化することで、雑音スペクトル推定値Nt(n)を求める。
ここで、max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する(以下、同じ。)。
この式(2)により、入力された振幅スペクトルY(n)に対する雑音スペクトル推定値Nt(n)との間において、Y(n)<Nt(n)が成立する場合は、G(n)=0となり、Y(n)>Nt(n)が成立する場合は、G(n)=(Y(n)−Nt(n))/Y(n)となる。
この雑音抑圧ゲイン演算部30で算出された雑音抑圧ゲインは、前記音声検出部80によって区分された音声フレーム及び雑音フレームの別に応じて、雑音期間・雑音抑圧ゲイン演算部40を介して又は直接に、原音加算ゲイン演算部60に供給される。図1に示す雑音抑圧装置1は、このような処理を実現するためのスイッチを備える(図中弧線矢印参照)。
まず、式(2)で求められた雑音抑圧ゲインG(n)に基づいて、以下の式(3)で表現されるgが算出される。
このgは、式(3)の右辺から明らかなように、式(2)の雑音抑圧ゲインについての、周波数帯域nに関する平均値を意味する。
次いで、この式(3)の雑音抑圧ゲイン平均値gが、以下の式(4)によって平滑化される。
ここで、μは平滑化係数、Gtは、現に処理中である雑音フレームについての雑音抑圧ゲイン、Gt−1は、その直前に処理した雑音フレームについての雑音抑圧ゲインである。
前述の式(1)のcase・Aとして示される式もそうであるが、この式(4)では、現に処理中のフレームにおける雑音抑圧ゲインを求めるにあたって、その直前に処理されたフレームにおけるそれが参照されていることから、時間軸上で平滑化が行われているということがいえる(後述する式(7)についても同様である。)。
この式(4)中のGtが、本雑音期間用ゲイン演算部40において求められるべき、雑音期間に適用するための雑音抑圧ゲイン(以下、簡単のため、「雑音期間用ゲイン」ということがある。)である。
雑音期間用ゲイン演算部40は、このようにして求められた雑音期間用ゲインGtを、すべての周波数帯域に対して一律に適用する。以下では、この事情を表現するため、この一律に適用されるGtを、G1(n)と表現する。この場合、G1(0),G1(1),…,G1(N−1)のすべてが、Gtに等しい。
ここで、tgは、目標雑音抑圧ゲインであり、以下の式(6)に基づいている。
この式(6)中のTGは、目標雑音抑圧量であり、dB単位で与えられる。このTG(あるいは、tg)は、装置外部から図示しない操作部等を介することによって人為的に与えられたり、あるいは、何らかの適当な手法により自動的に演算されてよい。
以上の式(5)によれば、目標雑音抑圧ゲインtgと雑音期間用ゲインGtとの間において、tg<Gtが成立する場合は、og=0となり、tg≧Gtが成立する場合は、og=tg−Gtとなる。
まず、式(5)で求められた原音加算率ogに基づいて、以下の式(7)で表現されるOGtが算出される。
ここでOGtは、現に処理中であるフレームにおける原音加算割合、OGt−1は、その直前のフレームにおける原音加算割合、λは平滑化係数である。なお、式(7)中のcase・A及びcase・Bの意義は、上述の式(1)の場合と同様である(以下の式(8)においても同じである。)。
このように、原音加算ゲイン演算部60は、現に処理しているフレームが、雑音フレームであるか音声フレームであるかに応じて、原音加算割合OGtを求めるために利用する式を変更する。すなわち、音声フレーム処理時(case・B)には、その直前の原音加算割合をそのまま用いて、原音加算割合OGtを求め、雑音フレーム処理時(case・A)には、前記の原音加算率ogを時間軸上で平滑化することで、原音加算割合OGtを求める。
ここで、G1(n)は、上で説明したように、雑音フレームにおいて、すべての周波数帯域に対して一律に適用される雑音期間用ゲインを表している。
この式(8)によれば、前述の式(7)における場合分けに応じて、原音加算後の雑音抑圧ゲインG2(n)(以下、簡単のため、「修正後ゲインG2(n)」ということがある。)が求められる。
まず、時間・周波数変換部10は、入力信号に対して、フーリエ変換を施し、更にこれを、図1に示すように、振幅スペクトルY(n)及び位相スペクトルに分解する(図2のステップS101)。この際、時間・周波数変換部10は、前述のように、フレームごとの処理を実施する。
また、これと並行して、音声検出部80は、入力信号中に含まれる音声信号の有無を検出する(図2のステップS102)。この検出処理は、入力信号を、音声フレームと雑音フレームとに分別する処理を可能にする。音声検出部80は、当該の処理も行う。
なお、このような分別処理は、図1に示すように、音声検出部80の検出結果に応じたスイッチの切り替えによっている。
このように、第1実施形態においては、式(2)により求められる雑音抑圧ゲインG(n)をそのままの状態で用いるのではなく、そのG(n)に対して、式(3)による周波数帯域に関する平均化、及び、式(4)による時間軸上の平滑化、を行った後の雑音期間用ゲインGtを、全周波数帯域用の雑音期間用ゲインG1(n)として用いることに、その大きな特徴の1つがある。
なお、図3(D)では、雑音抑圧ゲインG(n)に対する平均化処理を行った場合の一例が例示されている(図3(C)中に示される破線も参照)。
このように、第1実施形態においては、原音加算率ogが、雑音期間用ゲインGtを利用することによって求められることに、その大きな特徴の1つがある。
この場合、この修正後ゲインG2(n)は結局、前述の平均化・平滑化を経た雑音期間用ゲインG1(n)と、原音加算の程度とを勘案した上で決定されたゲインであるという意味合いをもつ。
ただし、この音声フレーム処理では、雑音フレーム処理と比べて、以下のような異同、あるいは注意点がある。
要するに、音声フレームでは、直近の雑音フレームにおいて算出された雑音スペクトル推定値Nt−p(n)(pは、当該の音声フレームの直前のフレームから数えて、その直近の雑音フレームまでのフレーム数(両端を含む。))が利用されることになるのである。
上述の場合と表現を一致させるなら、音声フレームでは、直近の雑音フレームにおいて算出された原音加算割合OGt−p(n)(pは、当該の音声フレームの直前のフレームから数えて、その直近の雑音フレームまでのフレーム数(両端を含む。))が利用される、ということになる。
図3(E)では、簡単のため、単純に図3(A)の振幅スペクトルY(n)に、図3(C)の平均化された雑音抑圧ゲイン(つまり、g)が乗算された結果が示されている。第1実施形態では、上述のように、これに加えて、原音加算の程度に配慮されたゲインの調整が更に行われはするが(式(8)、特にOGt(n)の役割、参照)、図3(E)は、仮に、そのような原音加算処理への配慮を省く場合を想定したときの処理の本質をよく表している(式(8)において、OGt(n)=0ならば、修正後ゲインG2(n)は、単にG1(n)、又は、G(n)に等しいというだけである。)。
まず、第1実施形態の雑音抑圧装置1によれば、入力信号に含まれる雑音が極めて好適に抑圧される。ここで「好適に」ということのうちには、第1実施形態において特に、以下に記す各点の内実が含まれる。
例えば、雑音スペクトル推定値に基づく雑音抑圧ゲインは、簡単には、前記式(2)中の(Y(n)−N(n))/Y(n)を用いて求めることが可能であり、これをそのまま図1に示す乗算器11で適用する態様を想定すれば、雑音抑圧後の振幅スペクトルS(n)は、S(n)={(Y(n)−N(n))/Y(n)}・Y(n)=Y(n)−N(n)として求められることになる。つまり、この場合は、入力信号の振幅スペクトルから雑音スペクトル推定値を単純に差し引くことによって、雑音抑圧後の振幅スペクトルS(n)が得られることになる。
しかし、この場合の雑音スペクトル推定値は、あくまでも“推定値”であるから、必ずしも、実際の雑音スペクトルを反映しているとは限らない。したがって、ある周波数帯域では、雑音スペクトル推定値差し引き後にもなお雑音が残る場合があり、また、他の周波数帯域では、引き過ぎが生じる場合もある(この引き過ぎの場合は、負の振幅スペクトルが考えられない以上、0に設定される。)。図4では、このような事情が概念的に表現されており、例えば図4(C)中の実線は引き残り(符号“KN”参照)、破線は引き過ぎ(符号“HS”参照)の各場合を表現している(なお、図4(A)及び(B)は、図3(A)及び(B)と全く同じである。また、図4(C)の符号HStが指示する部分は、たまたま、Y(n)−N(n)=0が成立する場合の例示である。)。
このような振幅スペクトルS(n)を時間領域に逆フーリエ変換すると、その信号は、複数のランダムな周波数をもつ正弦波が合成されたもののようになり、これが再生されれば、非常に耳障りな音となって聞こえてくることになる。これがミュージカルノイズである。
このように、ミュージカルノイズは、厳密に言えば不可知の実際の雑音スペクトルと、雑音スペクトル推定値とが一致しないことを主な原因として発生する。
以上の(2)及び(3)を要するに、第1実施形態では、音声フレームにおいて、実効的な雑音抑圧が行われながらも、なお雑音フレーム処理時における雑音抑圧処理(特に、その効果)を尊重して、両フレーム間の流れがより自然なものとなるような工夫がなされているのである。これによれば、第1実施形態の雑音抑圧装置1が何らかの音声再生手段に接続されたとした場合、雑音フレームから音声フレームへの切り替わりの場面において、聴取者に、雑音に係る音量感の変更等々の聴感上の違和感を与えることがない。
また、図4(C)中の破線で示す、雑音抑圧後の振幅スペクトルが0となってしまう部分(即ち、符号HS及びHStが指示する部分)に、一定の値(ノイズ・フロア)を加算する手法をとることによって、ミュージカルノイズを抑圧することも考えられる。これは、当該の部分HS及びHStに、いわば下駄を履かせることによって、引き残りの部分KNをマスキングしよう(あるいは、目立たなくしよう)とする発想に出ている(また、この手法と、前記のαを使う手法とを併用する場合、αはより小さく設定されてもよいから、その場合、音質の劣化防止という効果も得られる。)。
しかし、このようなノイズ・フロアの加算は、とりもなおさず雑音の絶対量を増加させることを意味するから、雑音抑圧という本来の目的達成の観点からみて問題があるだけでなく、そのノイズ・フロアの量の設定如何によっては、雑音抑圧効果が極めて不十分になるおそれが高いという問題を生じさせる。
なお、上述においては、第1実施形態の雑音抑圧装置1によって奏される効果をより明瞭に把握するため、前記αを用いる手法、あるいはノイズ・フロアを用いる手法との対比において、当該効果についての説明を行っている部分があるが、本発明は、これらαあるいはノイズ・フロアを用いてミュージカルノイズを抑圧する手法を積極的に排除する意図までは有しない。すなわち、これらの手法と本発明及びその各種態様とは併用可能であり、そのような併用形態によれば、当該手法の良いところを享受しつつ、本発明及びその各種態様の効果をより際立たせること等が可能となる。
(4-i) まず、原音加算の割合(即ち、OGt)が、雑音期間用ゲインGtと目標雑音抑圧ゲインtgとの大きさの如何に応じて定まる原音加算率ogに基づいて定められるようになっている。具体的には、既に述べたように、原音加算処理においては、目標としている雑音抑圧の程度(即ち、tg)を支配的要因の1つとし、これとの関係において原音加算率ogが決められるようになっているので、雑音期間用ゲインGtに基づく処理と、原音加算処理との間で、バランスがとれた使い分けが行われることにより、より実効的に雑音抑圧効果ないしミュージカルノイズ抑圧効果、さらには音質改善効果が享受されることになる。
以下では、本発明に係る第2の実施の形態について図5乃至図7を参照しながら説明する。なお、この第2実施形態は、上記第1実施形態との対比において、音声検出処理に関連する相違点があり、その他の点については、特に断りがない限り上記第1実施形態と全く同じである。したがって、以下では、前記相違点に関する説明を主に行い、その他の点についての説明は簡略化ないし省略する。また、図面上の符号についても前記相違点以外については流用する。
まず、式(2)で求められた雑音抑圧ゲインG(n)に基づいて、以下の式(9)で表現されるVarが算出される。
ここで、gは、上記第1実施形態において利用されていた式(3)によって表現されるgであって、要するに、G(n)についての周波数帯域nに関する平均値である(第2実施形態は、このgの演算を、雑音期間用ゲイン演算部40だけでなく、音声検出部801も行う。むろん、両者の一方で行った演算の結果を、両者間で共用してもよい。)。
この式(9)のVarは、表式から明らかな通り、G(n)の分散を表す。
一般に、式(2)によって算出される雑音抑圧ゲインG(n)は、音声信号が含まれる場合と含まれない場合とで大きく異なる様相を示す。図6及び図7はその一例を示しており、前者は、音声信号が含まれる場合の雑音抑圧ゲインG(n)の演算例、後者は、含まれない場合の雑音抑圧ゲインG(n)の演算例である。これらの図を対比すると明らかなように、両者の場合それぞれにおけるG(n)の分散を計算すれば、両者間に大きな隔たりが生じることが容易に推測される。つまり、あるフレームについてのG(n)の分散の値が一定程度大きければ、それは音声信号を含み、そうでなければ、音声信号を含まないという判断を行うことが、相当程度の確からしさで可能である。
前述のVarに係る大小判断の意義は、ここにある。改めていえば、ある所定値VBがあるとして、Var>VBであれば、当該フレームには音声信号があり、したがって、それは「音声フレーム」に区別され、Var≦VBであれば、当該フレームには音声信号がなく、したがって、それは「雑音フレーム」に区別される、ということになる。
このような場合における雑音スペクトル推定値Nt(n)は、例えば、以下の式(10)及び式(11)によって求められてよい。
ここで、PAt(n)は、現に処理中であるフレームにおける入力信号中の振幅スペクトルであって平滑化されたもの、PAt−1(n)は、その直前のフレームにおける当該振幅スペクトルであって平滑化されたもの、αは平滑化係数、γ・βは制御パラメータである。また、式(11)中、case・Cとあるのは、PAt(n)>Nt−1(n)が成立する場合を表現し、case・Dとあるのは、それ以外の場合を表現している。
他方、式(11)のcase・Cとして示される式は、前記式(1)中においては該当するものはない。もっとも、この式は、上述のように、即ちPAt(n)>Nt−1(n)が成立する場合、即ち、現に処理中であるフレームにおける振幅スペクトルが、その直前のフレームにおける雑音スペクトル推定値を越える場合に発動するから、このcase・Cは、その現に処理中であるフレームが、音声フレームである可能性を示唆するものと捉えることも不可能でない(仮に、多くのn(=0,1,2,3,…)について、かかる条件が満たされるなら、その可能性はより高まるといえる。ただし、あくまでも“示唆”に過ぎない。)。
これら式(10)及び式(11)は、以上のような意味における限りで、前記式(1)と共通性をもつといえる。
いずれにしても、雑音スペクトル推定値が好適に算出されることに変わりはない。
まず、この第2実施形態によっても、上記第1実施形態によって奏された作用効果と本質的に異ならない作用効果が奏されることは明白である。すなわち、この第2実施形態でも、上記第1実施形態に関し述べた(1)から(4)の効果がほぼ同様に奏される。
本発明においては、雑音抑圧ゲインG(n)の演算は必ず行わなければならない処理である以上、その演算結果を利用して音声検出処理をも行ってしまうことが、処理の効率化・合理化を導くことは論を俟たない。しかも、その検出性能は相当程度高い(図6及び図7対比参照)。
(1) 上記第1及び第2実施形態では、雑音期間用ゲインGtが、周波数軸上で平均化され、時間軸上で平滑化されているが、本発明は、かかる形態に限定されない。上でも既に述べたが、平均化処理と平滑化処理とでは、その主な狙いが異なっているので、特に平滑化処理に関しては、場合によっては省略されてよい。図3(E)にみられるように、平均化処理だけを実施したとしても、ミュージカルノイズの抑圧効果は一定程度享受可能である。
まず、本発明において、雑音抑圧ゲイン平均値gは、式(3)によって求められる形態に限定されない。
すなわち、式(3)において、gは、N個すべての周波数帯域(全部でN個の0,1,2,…,N−1番目の周波数帯域)を用いて算出されているが、このgは、例えば、そのうちの一部だけの周波数帯域を用いて算出されてもよい。この場合、極低域(DC成分に近い帯域)や極高域(ナイキスト周波数に近い帯域)の双方又は一方を除く、周波数帯域を用いることが考えられる。
また、雑音抑圧ゲイン平均値gを求めるにあたっては、個々の周波数帯域に異なる重み付けを行ってもよい。例えば、ある特定の重み係数を特定の周波数帯域についてだけ乗算したり、あるいは、連続的、段階的に増加又は減少する重み付け係数をすべての周波数帯域について乗算したり、等々のようである。
次に、本発明において、雑音期間用ゲインGtは、前記式(4)によって求められる形態に限定されない。
すなわち、式(4)において、Gtは、雑音抑圧ゲイン平均値gを時間軸上で平滑化することにより求められているが、このGtは、例えば、相隣接するフレームのgの平均値として算出されてもよい。
例えば、前述した極低域や極高域の双方又は一方を除く周波数帯域にだけ、当該雑音期間用ゲインGtないしG1(n)が適用されてよい。この場合、その適用除外となった周波数帯域については、固定値たるゲインが適用されるとよい。
例えば、分散に代えて、標準偏差が用いられてよいことは当然、時間軸上の分散、あるいは標準偏差が用いられてもよい。また、周波数帯域ごとの雑音抑圧ゲインG(n)のうち、所定の2つの基準値によって画された空間内に収まるものが幾つあるか等に基づいて、音声フレーム及び雑音フレーム間の区別が行われてもよい(例えば、その数が比較的大であれば、雑音抑圧ゲインG(n)は一定の箇所に集中して存在すると判断可能であるから、その散らばりの程度は小さいといえ、したがって、当該のフレームは、雑音フレームと認定される、などというようである。)。さらには、上述した各種の判断手法は、場合によって併用されてよい。これによれば、例えば、散らばりの程度が、前記分散と前記空間内に収まる雑音抑圧ゲインG(n)の数との双方が参照された上で判断される、などということになる。
Y(n)……入力信号の振幅スペクトル、N(n)……雑音スペクトル推定値、G(n)……雑音抑圧ゲイン、g……雑音抑圧ゲイン平均値、Gt,G1(n)……雑音期間に適用するための雑音抑圧ゲイン(雑音期間用ゲイン)、og……原音加算率、tg……目標雑音抑圧ゲイン、TG……目標雑音抑圧量、OG……原音加算割合、G2(n)……原音加算後の雑音抑圧ゲイン(修正後ゲイン)
Claims (12)
- K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に基づいて推定する雑音スペクトル推定手段と、
前記雑音スペクトル推定手段による推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する第1ゲイン演算手段と、
前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと、目標としている雑音抑圧の程度を示す目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算手段と、
を備えることを特徴とする雑音抑圧装置。 - 前記雑音抑圧ゲインについての、前記K個の周波数帯域に関する平均値ゲインを算出する第2ゲイン演算手段を更に備え、
前記原音加算手段は、
前記入力信号に前記平均値ゲインを適用した結果得られる第2雑音抑圧後信号に、当該平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、前記入力信号を加算する、
ことを特徴とする請求項1に記載の雑音抑圧装置。 - 前記原音加算手段は、
前記第1又は第2割合を時間軸上で平滑化した平滑化割合を算出し、
前記第1又は第2雑音抑圧後信号に、前記平滑化割合で、前記入力信号を加算する、
ことを特徴とする請求項1又は2に記載の雑音抑圧装置。 - 前記入力信号に含まれる音声の有無を検出することで、当該入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分する音声検出手段を更に備え、
前記第2雑音抑圧後信号は、
前記入力信号のうち前記雑音フレームに該当する部分に、前記平均値ゲインを適用した結果得られる、
ことを特徴とする請求項2に記載の雑音抑圧装置。 - 前記第1雑音抑圧後信号は、
前記入力信号のうち前記音声フレームに該当する部分に、前記雑音抑圧ゲインを適用した結果得られる、
ことを特徴とする請求項4に記載の雑音抑圧装置。 - 前記原音加算手段は、
前記第1雑音抑圧後信号に、前記第1割合に代えて前記第2割合で、前記入力信号を加算する、
ことを特徴とする請求項5に記載の雑音抑圧装置。 - 前記原音加算手段は、
前記音声フレームに係る前記第1雑音抑圧後信号に前記入力信号を加算しようとする場合は、
当該音声フレームに直近の雑音フレームに関して既に算出された前記第2割合を、当該音声フレームにおける前記第1割合であるものとして、前記第1雑音抑圧後信号に前記入力信号を加算する、
ことを特徴とする請求項5に記載の雑音抑圧装置。 - 前記原音加算手段は、
前記雑音フレームに係る前記第2雑音抑圧後信号に前記入力信号を加算しようとする場合は、
当該雑音フレームにおける前記第2割合を一時的第2割合として算出した後、当該雑音フレームの直前のフレームにおける前記第1又は第2割合を用いて、当該一時的第2割合を時間軸上で平滑化した平滑化割合を算出し、この平滑化割合を前記第2割合であるものとして、前記第2雑音抑圧後信号に前記入力信号を加算し、
前記音声フレームに係る前記第1雑音抑圧後信号に前記入力信号を加算しようとする場合は、
当該音声フレームの直前のフレームにおける前記第1又は第2割合を、当該音声フレームにおける前記第1割合であるものとして、前記第1雑音抑圧後信号に前記入力信号を加算する、
ことを特徴とする請求項5又は7に記載の雑音抑圧装置。 - 前記第1又は第2割合は、
以下の式(A)によって求められることを特徴とする請求項1乃至8のいずれか一項に記載の雑音抑圧装置。
og=max(0,tg−G) …… (A)
ここで、ogは、求めるべき第1又は第2割合、
tgは、前記目標雑音抑圧ゲイン、
Gは、前記雑音抑圧ゲイン又は前記平均値ゲイン、
max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する。 - K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に基づいて推定する雑音スペクトル推定工程と、
前記雑音スペクトル推定工程における推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する第1ゲイン演算工程と、
前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと、目標としている雑音抑圧の程度を示す目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算工程と、
を含むことを特徴とする雑音抑圧方法。 - 前記雑音抑圧ゲインについての、前記K個の周波数帯域に関する平均値ゲインを算出する第2ゲイン演算工程を更に含み、
前記原音加算工程では、
前記入力信号に前記平均値ゲインを適用した結果得られる第2雑音抑圧後信号に、当該平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、前記入力信号が加算される、
ことを特徴とする請求項10に記載の雑音抑圧方法。 - 前記入力信号に含まれる音声の有無を検出することで、当該入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分する音声検出工程を更に含み、
前記第2雑音抑圧後信号は、
前記入力信号のうち前記雑音フレームに該当する部分に、前記平均値ゲインを適用した結果得られる、
ことを特徴とする請求項11に記載の雑音抑圧方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008274858A JP5526524B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置及び雑音抑圧方法 |
KR1020090101092A KR101088558B1 (ko) | 2008-10-24 | 2009-10-23 | 잡음 억압 장치 및 잡음 억압 방법 |
CN2009102055351A CN101727911B (zh) | 2008-10-24 | 2009-10-26 | 噪声抑制装置及噪声抑制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008274858A JP5526524B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置及び雑音抑圧方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010102201A JP2010102201A (ja) | 2010-05-06 |
JP5526524B2 true JP5526524B2 (ja) | 2014-06-18 |
Family
ID=42273495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008274858A Expired - Fee Related JP5526524B2 (ja) | 2008-10-24 | 2008-10-24 | 雑音抑圧装置及び雑音抑圧方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5526524B2 (ja) |
KR (1) | KR101088558B1 (ja) |
CN (1) | CN101727911B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
CN104915930B (zh) * | 2014-03-14 | 2019-05-28 | 深圳迈瑞生物医疗电子股份有限公司 | 对图像进行灰度补偿和噪声抑制的方法及装置 |
WO2016038704A1 (ja) * | 2014-09-10 | 2016-03-17 | 三菱電機株式会社 | 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム |
JP6559576B2 (ja) | 2016-01-05 | 2019-08-14 | 株式会社東芝 | 雑音抑圧装置、雑音抑圧方法及びプログラム |
WO2017135484A1 (ko) * | 2016-02-05 | 2017-08-10 | 볼보 컨스트럭션 이큅먼트 에이비 | 건설기계의 냉각팬 가변장치 |
EP3312838A1 (en) | 2016-10-18 | 2018-04-25 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for processing an audio signal |
WO2022060891A1 (en) | 2020-09-15 | 2022-03-24 | Dolby Laboratories Licensing Corporation | Method and device for processing a binaural recording |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3454402B2 (ja) * | 1996-11-28 | 2003-10-06 | 日本電信電話株式会社 | 帯域分割型雑音低減方法 |
JP3459363B2 (ja) * | 1998-09-07 | 2003-10-20 | 日本電信電話株式会社 | 雑音低減処理方法、その装置及びプログラム記憶媒体 |
JP3454190B2 (ja) * | 1999-06-09 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置および方法 |
JP2002140100A (ja) * | 2000-11-02 | 2002-05-17 | Matsushita Electric Ind Co Ltd | 騒音抑圧装置 |
JP2002169599A (ja) * | 2000-11-30 | 2002-06-14 | Toshiba Corp | ノイズ抑制方法及び電子機器 |
JP3574123B2 (ja) * | 2001-03-28 | 2004-10-06 | 三菱電機株式会社 | 雑音抑圧装置 |
JP4520732B2 (ja) * | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
JP4162604B2 (ja) * | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
JP4518817B2 (ja) * | 2004-03-09 | 2010-08-04 | 日本電信電話株式会社 | 収音方法、収音装置、収音プログラム |
JP4568733B2 (ja) | 2004-12-28 | 2010-10-27 | パイオニア株式会社 | 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体 |
KR100657948B1 (ko) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
US8275611B2 (en) | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
-
2008
- 2008-10-24 JP JP2008274858A patent/JP5526524B2/ja not_active Expired - Fee Related
-
2009
- 2009-10-23 KR KR1020090101092A patent/KR101088558B1/ko not_active IP Right Cessation
- 2009-10-26 CN CN2009102055351A patent/CN101727911B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010102201A (ja) | 2010-05-06 |
KR101088558B1 (ko) | 2011-12-05 |
KR20100045934A (ko) | 2010-05-04 |
CN101727911A (zh) | 2010-06-09 |
CN101727911B (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5245714B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP5526524B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP5071346B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
US8521530B1 (en) | System and method for enhancing a monaural audio signal | |
JP5293817B2 (ja) | 音声信号処理装置及び音声信号処理方法 | |
JP5183828B2 (ja) | 雑音抑圧装置 | |
JP5646077B2 (ja) | 雑音抑圧装置 | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
JP4836720B2 (ja) | ノイズサプレス装置 | |
JP5300861B2 (ja) | 雑音抑圧装置 | |
JP2001134287A (ja) | 雑音抑圧装置 | |
US20130070939A1 (en) | Signal processing apparatus | |
JP5834088B2 (ja) | 動的マイクロフォン信号ミキサ | |
WO2002101729A1 (fr) | Attenuateur de bruit | |
JPWO2006046293A1 (ja) | 雑音抑圧装置 | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
JP2008309955A (ja) | ノイズサプレス装置 | |
JP5131149B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
US11183172B2 (en) | Detection of fricatives in speech signals | |
CN103187068B (zh) | 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法 | |
JP5316127B2 (ja) | 音処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140331 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5526524 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |