JP4006770B2 - ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 - Google Patents
ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 Download PDFInfo
- Publication number
- JP4006770B2 JP4006770B2 JP31032496A JP31032496A JP4006770B2 JP 4006770 B2 JP4006770 B2 JP 4006770B2 JP 31032496 A JP31032496 A JP 31032496A JP 31032496 A JP31032496 A JP 31032496A JP 4006770 B2 JP4006770 B2 JP 4006770B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- unit
- fourier transform
- compensation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims description 42
- 238000001228 spectrum Methods 0.000 claims abstract description 412
- 238000003860 storage Methods 0.000 claims abstract description 82
- 230000000087 stabilizing effect Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 30
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 19
- 230000003595 spectral effect Effects 0.000 claims description 17
- 230000006641 stabilisation Effects 0.000 claims description 14
- 238000011105 stabilization Methods 0.000 claims description 14
- 230000005236 sound signal Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 abstract description 5
- 230000015556 catabolic process Effects 0.000 abstract 2
- 238000006731 degradation reaction Methods 0.000 abstract 2
- 230000008569 process Effects 0.000 description 17
- 230000002688 persistence Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011946 reduction process Methods 0.000 description 3
- 238000011410 subtraction method Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000012356 Product development Methods 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000050 ionisation spectroscopy Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、ディジタル携帯電話やマルチメディア通信等に必要な音声符号化・復号化装置(音声コーデック)や、音声入出力装置を構成するために、入力された音声から背景ノイズ成分を推定するノイズ推定装置及びノイズ推定方法と、その背景ノイズ成分を除去するノイズ削減装置及びノイズ削減方法に関するものである。
【0002】
【従来の技術】
携帯電話等のディジタル移動通信の分野では、加入者の増加に対処するために低ビットレートの音声の圧縮符号化法が求められており、各研究機関において研究開発が進んでいる。日本国内においては、モトローラ社の開発したVSELP(11.2kbps)、NTT移動通信網株式会社の開発したPSI−CELP(5.6kbps)がディジタル携帯電話用の標準符号化方式として採用され、同方式を搭載したディジタル携帯電話が国内において既に発売されている。また国際的には、ITU−Tの標準化では16kbps(LD−CELP)、8kbps(CS−ACELP)が標準化され、現在製品開発の段階にある。
【0003】
これらの方式は、いずれもCELP(Code Exited LinearPrediction: M.R.Schroeder ”High Quality Speech at Low Bit Rates”Proc.ICASSP'85 pp.937-940に記載)という方式を改良したものである。これは、音声を音源情報と声道情報とに分離し、音源情報については、符号帳に格納された複数の音源サンプルのインデクスによって符号化し、声道情報については、LPC(線形予測係数)を符号化するとともに、音源情報符号化の際には、声道情報を加味して入力音声と比較を行なうという方法(A−b−S:Analysis by Synthesis)を採用していることに特徴がある。
【0004】
上記技術により、非常に低ビットレートで音声信号を伝送することができるようになったが、それと共に大きな問題点が明らかになった。それは、音声の発声モデルに基づいて情報圧縮を行っているために、音声信号以外の音響信号に対応できないという点である。そのため、音声信号中に背景ノイズや機器ノイズが含まれていると、効率の良い符号化が出来ず、合成時(復号化時)に異音を生じる結果となっていた。
【0005】
この問題を解決するために、従来より入力音声信号からノイズを削減する手法が検討されてきた。上記標準化方式のPSI−CELPでは、符号化を行う前にノイズキヤンセラによってノイズを削減するという処理を行っている。上記ノイズキャンセラは、カルマンフィルタを基本として開発されており、音声の有無を検出して、適応的に制御を行うことによりノイズを低減させている。このノイズキャンセラによって、ある程度の背景ノイズを削減することができる。しかし、ノイズレベルの高いノイズや、音声中のノイズ等に対しては余り良い性能が得られていなかった。
【0006】
一方、より強力なノイズ低減法として、スペクトルサブトラクション法が挙げられる。(S.F.Boll "Suppression of Acoustic Noise in Speech Using Spectral Subtraction", IEEE Trans.ASSP.,Vol.27,No.2,pp113-120,1979に記載)。これは、入力音声信号に対して離散フーリエ変換を行ってスペクトルに変換した後、ノイズをスペクトル上で減ずる方法であり、主に音声認識装置の入力部等に応用されている。
【0007】
この方法を音声信号中のノイズ低減に応用した一例について、図2を用いて説明する。すなわち、ノイズスペクトルの推定は次の手順で行われる。まず、音声を含んでいないノイズのみの信号31を入力し、A/D変換部32においてディジタル信号に変換する。次に、フーリエ変換部33において、一定時間長の入力信号列(フレームと呼ぶ)に対して離散フーリエ変換を行い、ノイズのスペクトルを求める。そして、ノイズ分析部34において、複数のフレームに対して求めたノイズのスペクトルからノイズの平均的スペクトルを求め、これをノイズスペクトル格納部35に格納する。そして、ノイズの削減は以下の手順で行われる。
【0008】
ノイズを含む音声信号36を入力し、A/D変換部37においてディジタル信号に変換する。次に、上記と同様にしてフーリエ変換部38で離散フーリエ変換を行い、ノイズを含んだ音声のスペクトルを求める。そして、ノイズ削減部39において、ノイズスペクトル格納部35に格納されたノイズスペクトルを、音声のスペクトルから減ずる。その結果得られたスペクトルに対して、逆フーリエ変換部40において逆フーリエ変換を行い、出力信号41を得る。
【0009】
なお、このアルゴリズムにおけるスペクトルとしては、振幅スペクトル(複素数の複素平面上でのノルム、実数部と虚数部を2乗して加算し、平方根をとることによって求められる。)を用いるのが一般的である。また、振幅スペクトルで減じた場合、逆フーリエ変換を行う時の位相成分としては、入力信号の位相成分をそのまま用いるという方法が挙げられる。
【0010】
【発明が解決しようとする課題】
上記スペクトルサブトラクション法は、より強力なノイズ低減方法であるが、ノイズ推定が困難であるために、これまでのリアルタイムの音声処理装置に用いられた例は少なかった。
【0011】
すなわち、上記スペクトルサブトラクション法をリアルタイムの音声処理装置に応用するためには、次の様な課題を有していた。
<1>音声がどのタイミングでデータ中に存在するかが明らかでないために、ノイズスペクトル推定が困難。
<2>ノイズレベルが高い時にスペクトルが大きく歪み、音質の劣化を生ずる。
<3>無音区間(音声の無いノイズのみの区間)において異音感を生ずる。
【0012】
本発明は、ノイズスペクトル推定が可能なノイズ推定装置及びノイズ推定方法の提供とともに、ノイズスペクトル推定が可能で、異音感を低減し、音質の劣化を抑えるノイズ削減装置及びノイズ削減方法の提供を目的とする。
【0013】
【課題を解決するための手段】
上記課題を解決するために本発明は、ノイズ推定部が、フーリエ変換部により得られる入力スペクトルとノイズスペクトル格納部に格納されているノイズスペクトルとを比較することによってノイズのスペクトルを推定し、得られたノイズスペクトルをノイズスペクトル格納部に格納し、ノイズ削減/スペクトル補償部が、ノイズ削減係数調節部により得られる係数に基づいてノイズスペクトル格納部に格納されているノイズスペクトルを、フーリエ変換部により得られる入力スペクトルから減じ、得られたスペクトルを調べて減じすぎた周波数のスペクトルを補償し、スペクトル安定化部が、ノイズ削減/スペクトル補償部により得られたスペクトルを安定化処理するとともに、フーリエ変換部により得られた複素スペクトルの位相のうちノイズ削減/スペクトル補償部において補償された周波数の位相を調整するように構成したものである。
【0014】
これにより、音声区間内でも音声区間外でもノイズスペクトル推定を行うことが可能で、音質の劣化を抑えることのできる優れたノイズ削減装置が得られる。
【0015】
【発明の実施の形態】
本発明は、2種類のノイズスペクトルを用いてノイズ削減を行うために前記2種類のノイズスペクトルを推定するノイズ推定装置であって、入力音声信号をディジタル信号に変換するA/D変換部と、前記A/D変換部により得られる一定時間長(1フレーム)のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの前記2種類のノイズスペクトルを格納するノイズスペクトル格納部と、前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、を備えたことを特徴とするノイズ推定装置であって、特に、予めノイズ区間であるかどうかの判定を行ない、ノイズであると判定した場合には、前記フーリエ変換部により得られる前記入力スペクトルを各周波数毎に前記補償用ノイズスペクトルと大小比較し、前記補償用ノイズスペクトルより小さい場合にその周波数の前記補償用ノイズスペクトルを新たな入力スペクトルとすることによって前記新たな補償用ノイズスペクトルを推定し、またそれとは別に、前記入力スペクトルを一定割合で加算していく前記学習の計算式によって前記新たな平均ノイズスペクトルを推定し、さらに、得られた前記新たな補償用ノイズスペクトルと前記新たな平均ノイズスペクトルとを前記ノイズスペクトル格納部に格納する前記ノイズ推定部を備えたノイズ推定装置とすることで、ノイズのスペクトルを平均と最低の2つの方向から推定することが可能となり、これを用いたノイズ削減装置を構成することにより、より的確な削減処理を行うことができるという作用を有する。
また本発明は、入力音声信号をディジタル信号に変換するA/D変換部と、削減量を決定する係数を調節するノイズ削減係数調節部と、前記A/D変換部により得られる一定時間長(1フレーム)のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの2種類のノイズスペクトルを格納するノイズスペクトル格納部と、前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、前記ノイズ削減係数調節部により得られる前記係数に基づいて前記ノイズスペクトル格納部に格納されている平均ノイズスペクトルを前記フーリエ変換部により得られる前記入力スペクトルから減じ、更に、得られるスペクトルを調べ、減じすぎた周波数のスペクトルを、補償用ノイズスペクトルで補償するノイズ削減/スペクトル補償部と、を備えることを特徴としたノイズ削減装置である。
ここで更に、前記ノイズ削減/スペクトル補償部により得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換部により得られた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償部において補償された周波数の位相を調整するスペクトル安定化部と、を備えてもよく、更に、前記スペクトル安定化部において平滑化処理されたスペクトルと調整された位相スペクトルとに基づいて逆フーリエ変換を行う逆フーリエ変換部と、前記逆フーリエ変換部により得られた信号に対してスペクトル強調を行うスペクトル強調部と、前記スペクトル強調部により得られた信号を前のフレームの信号と整合させる波形整合部と、を備えてもよい。
あるいは、前記A/D変換部により得られる一定時間長のディジタル信号に対して線形予測分析(LPC分析)を行うLPC分析部と、ノイズ削減処理を受けた前記入力スペクトルと前記複素スペクトルに対して逆離散フーリエ変換を行う逆フーリエ変換部と、前記逆フーリエ変換部により得られた信号に対して前記LPC分析部で得られたパラメータを用いたスペクトル強調を行うスペクトル強調部と、を更に備えてもよく、音声区間中でも音声区間外でもノイズスペクトル推定を行うことができるとともに、入力のスペクトル包絡の特徴を線形予測係数で強調することができるという作用を有する。
【0017】
また、ノイズ削減係数調節部にて得られたノイズ削減係数をノイズスペクトル格納部に格納された平均ノイズスペクトルに乗じて、フーリエ変換部にて得られた入力スペクトルから減じ、負のスペクトル値になってしまった周波数に対してはノイズスペクトル格納部に格納された補償用ノイズスペクトルにより補償するノイズ削減/スペクトル補償部を備えたノイズ削減装置とすることで、ノイズの平均スペクトルを削減に用いることにより、より大きくノイズスペクトルを削減することができるとともに、補償用スペクトルを別に推定したことにより、より的確な補償を行うことができるという作用を有する。
【0018】
また、ノイズ削減/スペクトル補償部にてノイズ削減とスペクトル補償をなされたスペクトルの全域パワーと聴感的に重要な一部の帯域のパワー(中域パワー)とを調べ、入力された信号が無音区間(音声のないノイズのみの信号)かどうかを識別し、無音区間と判断した場合には、全域パワーと中域パワーに対して安定化処理とパワー低減処理を行なうスペクトル安定化部を備えたノイズ削減装置とすることで、音声の含まれていないノイズのみの区間のスペクトルをスムージングすることができるとともに、同区間のスペクトルがノイズ削減のために極端なスペクトル変動を起こすことを防ぐという作用を有する。
【0019】
また、フーリエ変換部で得られた複素スペクトルに対して、ノイズ削減/スペクトル補償部でスペクトル補償を受けたかどうかの情報を基に、乱数による位相回転を行なうスペクトル安定化部を備えたノイズ削減装置とすることで、補償された周波数成分の位相にランダム性を持たせ、削減できずに残ったノイズを、聴感的に異音感の少ないノイズに変換させることができるという作用を有する。
【0020】
また、予めスペクトル強調に用いる重み係数のセットを複数用意し、ノイズ削減時には、入力された信号の状態に応じて重み付け係数のセットを選択し、選択された重み付け係数を用いてスペクトル強調を行なうスペクトル強調部を備えたノイズ削減装置することで、音声区間においては、聴感的により適当な重み付けができ、無音区間や無声子音区間においては、聴感重み付けによる異音感を押さえることができるという作用を有する。
【0021】
以下、本発明の実施の形態について、図1を用いて説明する。
(実施の形態)
図1は、本実施の形態におけるノイズ削減装置の主要部の機能ブロック図である。図1において、11は入力信号、12はA/D変換部、13はノイズ削減係数格納部、14はノイズ削減係数調整部、15は入力波形設定部、16は入力波形設定部、17はフーリエ変換部、18はノイズ削減/スペクトル補償部、19はスペクトル安定化部、20は逆フーリエ変換部、21はスペクトル強調部、22は波形整合部、23は出力信号、24はノイズ推定部、25はノイズスペクトル格納部、26は前スペクトル格納部、27は乱数位相格納部、28は前波形格納部、29は最大パワー格納部である。
【0022】
始めに初期設定について説明する。(表1)に、固定パラメータの名称と設定例を示す。
【0023】
【表1】
【0024】
また、乱数位相格納部27には、位相を調整するための位相データを格納しておく。これらは、スペクトル安定化部19において、位相を回転させるために用いられる。位相データが8種類の場合の例を(表2)に示す。
【0025】
【表2】
【0026】
さらに、上記位相データを用いるためのカウンター(乱数位相カウンター)も、乱数位相格納部27に格納しておく。この値は、予め0に初期化して格納しておく。
【0027】
次に、スタティックのRAM領域を設定する。すなわち、ノイズ削減係数格納部13、ノイズスペクトル格納部25、前スペクトル格納部26、前波形格納部28、最大パワー格納部29をクリアする。以下に、各格納部の説明と設定例を述べる。
【0028】
ノイズ削減係数格納部13は、ノイズ削減係数を格納するエリアであり、初期値として20.0を格納しておく。ノイズスペクトル格納部25は、平均ノイズパワーと、平均ノイズスペクトルと、1位候補の補償用ノイズスペクトルと2位候補の補償用ノイズスペクトルとそれぞれの周波数のスペクトル値が、何フレーム前に変化したかを示すフレーム数(持続数)を、各周波数毎に格納するエリアであり、平均ノイズパワーに十分大きな値、平均ノイズスペクトルに指定最小パワー、補償用ノイズスペクトルと持続数としてそれぞれに充分大きな数を初期値として格納しておく。
【0029】
前スペクトル格納部26は、補償用ノイズパワー、以前のフレームのパワー(全域、中域)(前フレームパワー)、以前のフレームの平滑化パワー(全域、中域)(前フレーム平滑化パワー)、及びノイズ連続数を格納するエリアであり、補償用ノイズパワーとして十分大きな値を、前フレームパワー、全フレーム平滑化パワーとしていずれも0.0を、またノイズ連続数としてノイズ基準連続数を格納しておく。
【0030】
前波形格納部28は、出力信号を整合させるための、前のフレームの出力信号の、最後の先読みデータ長分のデータを格納するエリアであり、初期値として全てに0を格納しておく。スペクトル強調部21は、ARMA及び高域強調フィルタリングを行なうが、そのためのそれぞれのフィルターの状態をいずれも0にクリアしておく。最大パワー格納部29は、入力された信号のパワーの最大を格納するエリアであり、最大パワーとして0を格納しておく。
【0031】
次にノイズ削減アルゴリズムについて、図1を用いてブロック毎に説明する。
まず、音声を含むアナログ入力信号11をA/D変換部12でA/D変換し、1フレーム長+先読みデータ長(上記設定例では、160+80=240ポイント)の分だけ入力する。ノイズ削減係数調節部14は、ノイズ削減係数格納部13に格納されたノイズ削減係数と指定ノイズ削減係数とノイズ削減係数学習係数と補償パワー上昇係数とを基に、(数1)により、ノイズ削減係数並びに補償係数を算出する。そして、得られたノイズ削減係数をノイズ削減係数格納部13に格納するとともに、A/D変換部12で得られた入力信号を、入力波形設定部15へ送り、さらに補償係数とノイズ削減係数を、ノイズ推定部24とノイズ削減/スペクトル補償部18へ送る。
【0032】
【数1】
【0033】
なお、ノイズ削減係数はノイズを減ずる割合を示した係数、指定ノイズ削減係数は予め指定された固定削減係数、ノイズ削減係数学習係数はノイズ削減係数の指定ノイズ削減係数に近づける割合を示した係数、補償係数はスペクトル補償における補償パワーを調節する係数、補償パワー上昇係数は補償係数を調節する係数である。
【0034】
入力波形設定部15においては、A/D変換部12からの入力信号を、FFT(高速フーリエ変換)することができるように、2の指数乗の長さを持つメモリ配列に、後ろ詰めで書込む。前の部分は0を詰めておく。前述の設定例では、256の長さの配列に0〜15まで0を書込み、16〜255まで入力信号を書込む。この配列は、8次のFFTの際に実数部として用いられる。また、虚数部として、実数部と同じ長さの配列を用意し、全てに0を書込んでおく。
【0035】
LPC分析部16においては、入力波形設定部15で設定した実数部エリアに対してハミング窓を掛け、窓掛け後の波形に対して自己相関分析を行って自己相関係数を求め、自己相関法に基づくLPC分析を行い、線形予測係数を得る。さらに、得られた線形予測係数をスペクトル強調部21に送る。
【0036】
フーリエ変換部17は、入力波形設定部15で得られる実数部、虚数部のメモリ配列を用いて、FFTによる離散フーリエ変換を行う。得られた複素スペクトルの実数部と虚数部の絶対値の和を計算することによって、入力信号の疑似振幅スペクトル(以下、入力スペクトル)を求める。また、各周波数の入力スペクトル値の総和(以下、入力パワー)を求め、ノイズ推定部24へ送る。また、複素スペクトルそのものを、スペクトル安定化部19へ送る。
【0037】
次に、ノイズ推定部24における処理を説明する。
ノイズ推定部24は、フーリエ変換部17で得られた入力パワーと最大パワー格納部29に格納された最大パワーの値とを比較し、最大パワーの方が小さい場合は、最大パワー値を入力パワー値として、その値を最大パワー格納部29に格納する。そして、以下の3つうち少なくとも一つに該当する場合はノイズ推定を行い、全て満たさない場合はノイズ推定は行わない。
(1)入力パワーが、最大パワーに無音検出係数を乗じた値よりも小さい。
(2)ノイズ削減係数が、指定ノイズ削減係数に0.2を加えたものより大きい。
(3)入力パワーが、ノイズスペクトル格納部25から得られる平均ノイズパワーに1.6を乗じたものより小さい。
【0038】
ここで、ノイズ推定部24におけるノイズ推定アルゴリズムを述べる。
まず、ノイズスペクトル格納部25に格納されている1位候補、2位候補の全ての周波数の持続数を更新する(1を加算する)。そして、1位候補の各周波数の持続数を調べ、予め設定したノイズスペクトル基準持続数より大きい場合は、2位候補の補償用スペクトルと持続数を1位候補とし、2位候補の補償用スペクトルを3位候補の補償用スペクトルとし持続数を0とする。ただし、この2位候補の補償用スペクトルの入れ替えにおいては、3位候補を格納せず、2位候補を若干大きくしたもので代用することによって、メモリを節約することができる。本実施の形態では、2位候補の補償用スペクトルを1.4倍したものを代用することとする。
【0039】
持続数の更新の後に、各周波数毎に、補償用ノイズスペクトルと入力スペクトルとの比較を行う。まず、各周波数の入力スペクトルを1位候補の補償用ノイズスペクトルと比較し、もし入力スペクトルの方が小さい場合は、1位候補の補償用ノイズスペクトルと持続数を2位候補とし、入力スペクトルを1位候補の補償用スペクトルとし1位候補の持続数は0とする。前記の条件以外の場合は、入力スペクトルと2位候補の補償用ノイズスペクトルとの比較を行い、もし入力スペクトルの方が小さい場合は、入力スペクトルを2位候補の補償用スペクトルとし2位候補の持続数は0とする。そして、得られた1、2位候補の補償用スペクトルと持続数を補償用ノイズスペクトル格納部25に格納する。また、同時に、平均ノイズスペクトルも、次の(数2)にしたがって更新する。
【0040】
【数2】
【0041】
なお、平均ノイズスペクトルは、疑似的に求めた平均のノイズスペクトルであり、(数2)における係数gは、平均ノイズスペクトルの学習の早さを調節する係数である。すなわち、入力パワーがノイズパワーと比較して小さい場合は、ノイズのみの区間である可能性が高いとして学習速度を上げ、そうでない場合は、音声区間中である可能性があるとして学習速度を下げる効果を持つ係数である。
【0042】
そして、平均ノイズスペクトルの各周波数の値の総和を求め、これを平均ノイズパワーとする。補償用ノイズスペクトル、平均ノイズスペクトル、平均ノイズパワーは、ノイズスペクトル格納部25に格納する。
【0043】
また、上記ノイズ推定処理において、1つの周波数のノイズスペクトルを複数の周波数の入力スペクトルと対応させれば、ノイズスペクトル格納部25を構成するためのRAM容量を節約することができる。例として、本実施の形態の256ポイントのFFTを用いる場合に、1つの周波数のノイズスペクトルを4つの周波数の入力スペクトルから推定するときの、ノイズスペクトル格納部25のRAM容量を示す。(疑似)振幅スペクトルが周波数軸上で左右対称であることを考慮すると、全ての周波数で推定する場合は128個の周波数のスペクトルと持続数を格納するので、128(周波数)×2(スペクトルと持続数)×3(補償用の1、2位候補、平均)で計768WのRAM容量が必要になる。
【0044】
これに対して、1つの周波数のノイズスペクトルを4つの周波数の入力スペクトルと対応させる場合は、32(周波数)×2(スペクトルと持続数)×3(補償用の1、2位候補、平均)で計192WのRAM容量でよいことになる。この場合、ノイズスペクトルの周波数解像度は低下することになるが、上記1対4の場合は、殆ど性能の劣化がないことを実験により確認している。また、この工夫は、1つの周波数のスペクトルでノイズスペクトルを推定するものではないから、定常音(サイン波、母音等)が長時間続いた場合に、そのスペクトルをノイズスペクトルと誤推定することを防ぐ効果もある。
【0045】
次に、ノイズ削減/スペクトル補償部18における処理について説明する。
入力スペクトルから、ノイズスペクトル格納部25に格納されている平均ノイズスペクトルにノイズ削減係数調節部14で得られたノイズ削減係数を乗じたものを引く(以後、差スペクトル)。上記ノイズ推定部24の説明において示したノイズスペクトル格納部25のRAM容量の節約を行った場合は、入力スペクトルに対応する周波数の平均ノイズスペクトルにノイズ削減係数を乗じたものを引く。そして、差スペクトルが負になった場合には、ノイズスペクトル格納部25に格納された補償用ノイズスペクトルの1位候補に、ノイズ削減係数調整部14で求めた補償係数を乗じたものを代入することにより補償する。これを、全ての周波数について行う。また、差スペクトルを補償した周波数が分るように、周波数毎にフラグデータを作成する。例えば、各周波数毎に1つのエリアがあり、補償しない時は0、補償したときは1を代入する。このフラグデータは、差スペクトルと共に、スペクトル安定化部19へ送られる。また、フラグデータの値を調べることによって補償した総数(補償数)を求め、これもスペクトル安定化部19へ送る。
【0046】
次に、スペクトル安定化部19における処理について説明する。なお、この処理は、主に音声の含まれていない区間の異音感低減のために機能する。
【0047】
まず、ノイズ削減/スペクトル補償部18から得られた各周波数の差スペクトルの和を計算し、現フレームパワーを求める。現フレームパワーは全域と中域の2種類を求める。全域は全ての周波数(全域と呼ぶ、本実施の形態では0〜128まで)について求め、中域は聴感的に重要な中ごろの帯域(中域と呼ぶ、本実施の形態では16〜79まで)について求める。
【0048】
同様に、ノイズスペクトル格納部25に格納された補償用ノイズスペクトルの1位候補についての和を求め、これを現フレームノイズパワー(全域、中域)とする。ここで、ノイズ削減/スペクトル補償部18から得られた補償数の値を調べ、十分大きい場合、且つ、以下の3条件のうち少なくとも1つ満たす場合に、現フレームがノイズのみの区間と判断して、スペクトルの安定化処理を行う。
(1)入力パワーが、最大パワーに無音検出係数を乗じた値よりも小さい。
(2)現フレームパワー(中域)が、現フレームノイズパワー(中域)に5.0を乗じた値より小さい。
(3)入力パワーが、ノイズ基準パワーよりも小さい。
【0049】
安定化処理を行なわない場合は、前スペクトル格納部26に格納されたノイズ連続数が正の時に1を減じ、また現フレームノイズパワー(全域、中域)を前フレームパワー(全域、中域)とし、それぞれを前スペクトル格納部26に格納して、位相拡散処理に進む。
【0050】
ここで、スペクトル安定化処理について説明する。この処理の目的は、無音区間(音声の無いノイズのみの区間)のスペクトルの安定化とパワー低減を実現することである。処理は2種類あり、ノイズ連続数がノイズ基準連続数より小さい場合は(処理1)を、以上の場合は(処理2)を行なう。2つの処理を以下に示す。
(処理1)前スペクトル格納部26に格納されたノイズ連続数に1を加算し、また現フレームノイズパワー(全域、中域)を前フレームパワー(全域、中域)とし、それぞれを前スペクトル格納部26に格納して、位相調整処理へ進む。
(処理2)前スペクトル格納部26に格納された前フレームパワー、前フレーム平滑化パワー、更に固定係数である無音パワー減少係数を参照し、(数3)にしたがってそれぞれを変更する。
【0051】
【数3】
【0052】
次に、これらのパワーを差スペクトルに反映させる。そのために、中域に乗ずる係数(以後、係数1)と全域に乗ずる係数(以後、係数2)の2つの係数を算出する。まず、以下の(数4)に示す式で係数1を算出する。
【0053】
【数4】
【0054】
係数2は、係数1の影響を受けるので、求める手段は多少複雑になる。手順を以下に示す。
(1)前フレーム平滑化パワー(全域)が前フレームパワー(中域)より小さい場合、または、現フレームノイズパワー(全域)が現フレームノイズパワー(中域)よりも小さい場合は(2)へ。それ以外の場合は(3)へ。
(2)係数2は0.0とし、前フレームパワー(全域)を前フレームパワー(中域)として、(6)へ。
(3)現フレームノイズパワー(全域)が現フレームノイズパワー(中域)と等しい場合は(4)へ。異なる場合は(5)へ。
(4)係数2を1.0とし、(6)へ。
(5)以下の(数5)により係数2を求め、(6)へ。
【0055】
【数5】
【0056】
(6)係数2算出処理終了。
上記アルゴリズムにより得られた係数1、2は、いずれも上限を1.0に、下限を無音パワー減少係数にクリッピングする。そして、中域の周波数(本例では16〜79)の差スペクトルに係数1を乗じて得られた値を差スペクトルとし、さらに、その差スペクトルの全域から中域を除いた周波数(本例では0〜15、80〜128)の差スペクトルに係数2を乗じて得られた値を差スペクトルとする。それに伴い、前フレームパワー(全域、中域)を以下の(数6)によって変換する。
【0057】
【数6】
【0058】
こうして得られた各種パワーデータ等を全て前スペクトル格納部26に格納し、(処理2)を終わる。
【0059】
以上の要領で、スペクトル安定化部19におけるスペクトルの安定化が行われる。
【0060】
次に、位相調整処理について説明を行う。従来のスペクトルサブトラクションでは、位相は原則として変更しないが、本実施の形態では、その周波数のスペクトルが削減時に補償された場合に、位相をランダムに変更する処理を行なう。この処理により、残ったノイズのランダム性が強くなるので、聴感的に悪印象を与えにくくなるという効果が得られる。
【0061】
まず、乱数位相格納部27に格納された乱数位相カウンターを得る。そして、全ての周波数のフラグデータ(補償の有無を示したデータ)を参照して、補償している場合は、以下の(数7)により、フーリエ変換部17で得られた複素スペクトルの位相を回転させる。
【0062】
【数7】
【0063】
(数7)においては、2つの乱数位相データをペアで使用している。したがって、上記処理を1回行なう毎に、乱数位相カウンターを2ずつ増加させ、上限(本実施の形態では16)になった場合は0とする。なお、乱数位相カウンターは乱数位相格納部27へ格納し、得られた複素スペクトルは、逆フーリエ変換部20へ送る。また、差スペクトルの総和を求め(以下、差スペクトルパワー)、これをスペクトル強調部21へ送る。
【0064】
逆フーリエ変換部20では、スペクトル安定化部19で得られた差スペクトルの振幅と複素スペクトルの位相とに基づき、新たな複素スペクトルを構成し、FFTを用いて逆フーリエ変換を行う。(得られた信号を第1次出力信号と呼ぶ。)そして、得られた第1次出力信号をスペクトル強調部21へ送る。
【0065】
次に、スペクトル強調部21における処理について説明する。
まず、ノイズスペクトル格納部25に格納さされた平均ノイズパワーと、スペクトル安定化部19で得られた差スペクトルパワーと、定数であるノイズ基準パワーを参照して、MA強調係数とAR強調係数を選択する。選択は、以下の2つの条件を評価することにより行う。
(条件1)差スペクトルパワーがノイズスペクトル格納部25に格納された平均ノイズパワーに0.6を乗じた値よりも大きく、且つ、平均ノイズパワーがノイズ基準パワーよりも大きい。
(条件2)差スペクトルパワーが平均ノイズパワーより大きい。
【0066】
(条件1)を満たす場合は、これを「有声区間」とし、MA強調係数をMA強調係数1ー1とし、AR強調係数をAR強調係数1ー1とし、高域強調係数を高域強調係数1とする。また、(条件1)を満たさず、(条件2)を満たす場合は、これを「無声子音区間」とし、MA強調係数をMA強調係数1ー0とし、AR強調係数をAR強調係数1ー0とし、高域強調係数を0とする。また、(条件1)を満たさず、(条件2)を満たさない場合はこれを「無音区間、ノイズのみの区間」とし、MA強調係数をMA強調係数0とし、AR強調係数をAR強調係数0とし、高域強調係数を高域強調係数0とする。
【0067】
そして、LPC分析部16から得られた線形予測係数と、上記MA強調係数、AR強調係数を用いて、以下の(数8)の式に基づき、極強調フィルターのMA係数とAR係数とを算出する。
【0068】
【数8】
【0069】
そして、逆フーリエ変換部20において得られた第1次出力信号に対して、上記MA係数とAR係数とを用いて極強調フィルターを掛ける。このフィルターの伝達関数を、以下の(数9)に示す。
【0070】
【数9】
【0071】
更に、高域成分を強調するために、上記高域強調係数を用いて、高域強調フィルターを掛ける。このフィルターの伝達関数を、以下の(数10)に示す。
【0072】
【数10】
【0073】
上記処理によって得られた信号を第2次出力信号と呼ぶ。なお、フィルターの状態は、スペクトル強調部21の内部に保存される。
【0074】
最後に、波形整合部22において、スペクトル強調部21で得られた第2次出力信号と、前波形格納部28に格納された信号とを、三角窓によって重ね合せて出力信号を得る。更に、この出力信号の最後の先読みデータ長分のデータを、前波形格納部28に格納する。このときの整合方法を、以下の(数11)に示す。
【0075】
【数11】
【0076】
ここで注意が必要なのは、出力信号としては先読みデータ長+フレーム長分のデータが出力されるが、このうち信号として扱うことができるのは、データの始端からフレーム長の長さの区間のみということである。なぜなら、後ろの先読みデータ長のデータは、次の出力信号を出力するときに書き換えられるからである。ただし、出力信号の全区間内では連続性は補償されるので、LPC分析やフィルター分析等の周波数分析には使用することができる。
【0077】
【発明の効果】
以上のように本発明によれば、音声区間中でも音声区間外でもノイズスペクトル推定を行うことができ、音声がどのタイミングでデータ中に存在するかが明らかでない場合でもノイズスペクトルを推定することができる。また、入力のスペクトル包絡の特徴を線形予測係数で強調することができ、ノイズレベルが高い場合でも音質の劣化を防ぐことが出来る。
【0078】
また、ノイズのスペクトルを平均と最低の2つの方向から推定でき、より的確な削減処理を行うことができる。
【0079】
また、ノイズの平均スペクトルを削減に用いることによって、より大きくノイズスペクトルを削減することができ、さらに、補償用スペクトルを別に推定したことにより、より的確な補償を行うことができる。
【0080】
そして、音声の含まれていないノイズのみの区間のスペクトルをスムージングすることができ、同区間のスペクトルが、ノイズ削減のために極端なスペクトル変動による異音感を防ぐことができる。
【0081】
そして、補償された周波数成分の位相にランダム性を持たせることができ、削減できずに残ったノイズを、聴感的に異音感の少ないノイズに変換させることができる。
【0082】
また、音声区間においては、聴感的により適当な重み付けができるようになり、無音区間や無声子音区間においては、聴感重み付けによる異音感を抑えることができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態によるノイズ削減装置の主要部の機能ブロック図
【図2】従来のスペクトルサブトラクションによるノイズ削減装置の機能ブロック図
【符号の説明】
11 入力信号
12 A/D変換部
13 ノイズ削減係数格納部
14 ノイズ削減係数調節部
15 入力波形設定部
16 LPC分析部
17 フーリエ変換部
18 ノイズ削減/スペクトル補償部
19 スペクトル安定化部
20 逆フーリエ変換部
21 スペクトル強調部
22 波形整合部
23 出力音声
24 ノイズ推定部
25 ノイズスペクトル格納部
26 前スペクトル格納部
27 乱数位相格納部
28 前波形格納部
Claims (13)
- 2種類のノイズスペクトルを用いてノイズ削減を行うために前記2種類のノイズスペクトルを推定するノイズ推定装置であって、
入力音声信号をディジタル信号に変換するA/D変換部と、
前記A/D変換部により得られる一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、
ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの前記2種類のノイズスペクトルを格納するノイズスペクトル格納部と、
前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、
を備えたことを特徴とするノイズ推定装置。 - 前記ノイズ推定部は、
予めノイズ区間であるかどうかの判定を行い、ノイズであると判定した場合には、前記フーリエ変換部により得られる前記入力スペクトルを各周波数毎に前記補償用ノイズスペクトルと大小比較し、前記補償用ノイズスペクトルより小さい場合にその周波数の前記補償用ノイズスペクトルを新たな入力スペクトルとすることによって前記新たな補償用ノイズスペクトルを推定し、またそれとは別に、前記入力スペクトルを一定割合で加算していく前記学習の計算式によって前記新たな平均ノイズスペクトルを推定し、さらに、得られた前記新たな補償用ノイズスペクトルと前記新たな平均ノイズスペクトルとを前記ノイズスペクトル格納部に格納することを特徴とする請求項1記載のノイズ推定装置。 - 入力音声信号をディジタル信号に変換するA/D変換部と、
削減量を決定する係数を調節するノイズ削減係数調節部と、
前記A/D変換部により得られる一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、
ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの2種類のノイズスペクトルを格納するノイズスペクトル格納部と、
前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、
前記ノイズ削減係数調整部により得られる前記係数に基づいて前記ノイズスペクトル格納部に格納されている平均ノイズスペクトルを前記フーリエ変換部により得られる前記入力スペクトルから減じ、更に、得られるスペクトルを調べ、減じすぎた周波数のスペクトルを、補償用ノイズスペクトルで補償するノイズ削減/スペクトル補償部と、
を備えたことを特徴とするノイズ削減装置。 - 更に、
前記ノイズ削減/スペクトル補償部により得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換部によりえられた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償部において補償された周波数の位相を調節するスペクトル安定化部と、
を備えたことを特徴とする請求項3記載のノイズ削減装置。 - 前記ノイズ削減/スペクトル補償部は、
ノイズ削減とスペクトル補償とをなされたスペクトルの全域パワーと聴感的に重要な一部の帯域のパワーとを調べ、入力された信号が無音区間かどうかを識別し、
前記スペクトル安定化部は、
上記機能で無音区間と判断した場合には、全域パワーと中域パワーに対して平滑化処理とパワー低減処理とを行う
ことを特徴とする請求項4記載のノイズ削減装置。 - 前記スペクトル安定化部は、
前記フーリエ変換部で得られた複素スペクトルに対して、前記ノイズ削減/スペクトル補償部でスペクトル補償を受けたかどうかの情報を基に、乱数による位相回転を行う
ことを特徴とする請求項4記載のノイズ削減装置。 - 前記ノイズ削減/スペクトル補償部は、
前記ノイズ削減係数調節部にて得られたノイズ削減係数を前記ノイズスペクトル格納部に格納された平均ノイズスペクトルに乗じて、前記フーリエ変換部にて得られた前記入力スペクトルから減じ、負のスペクトル値になった周波数に対しては前記ノイズスペクトル格納部に格納された補償用ノイズスペクトルにより補償する
ことを特徴とする請求項3記載のノイズ削減装置。 - 更に、
前記A/D変換部により得られる前記一定時間長のディジタル信号に対して線形予測分析を行うLPC分析部と、
ノイズ削減処理を受けた前記入力スペクトルと前記複素スペクトルに対して逆離散フーリエ変換を行う逆フーリエ変換部と、
前記逆フーリエ変換部により得られた信号に対して前記LPC分析部で得られたパラメータを用いたスペクトル強調を行うスペクトル強調部と、
を備えたことを特徴とする請求項3記載のノイズ削減装置。 - 更に、
前記ノイズ削減/スペクトル補償部により得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換部により得られた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償部において補償された周波数の位相を調整するスペクトル安定化部と、
前記スペクトル安定化部において平滑化処理されたスペクトルと調整された位相スペクトルとに基づいて逆フーリエ変換を行う逆フーリエ変換部と、
前記逆フーリエ変換部により得られた信号に対してスペクトル強調を行うスペクトル強調部と、
前記スペクトル強調部により得られた信号を前のフレームの信号と整合させる波形整合部と、
を備えたことを特徴とする請求項3記載のノイズ削減装置。 - 2種類のノイズスペクトルを用いてノイズ削減を行うために前記2種類のノイズスペクトルを推定するノイズ推定方法であって、
入力音声信号をディジタル信号に変換するA/D変換ステップと、
前記A/D変換ステップにより得られた一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換ステップと、
ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの前記2種類のノイズスペクトルをノイズスペクトル格納部に格納するノイズスペクトル格納ステップと、
前記フーリエ変換ステップにより得られた前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定ステップと、
を備えたことを特徴とするノイズ推定方法。 - 入力音声信号をディジタル信号に変換するA/D変換ステップと、
削減量を決定する係数を調節するノイズ削減係数調節ステップと、
前記A/D変換ステップにより得られた一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換ステップと、
ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの2種類のノイズスペクトルをノイズスペクトル格納部に格納するノイズスペクトル格納ステップと、
前記フーリエ変換ステップにより得られた前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定ステップと、
前記ノイズ削減係数調整ステップにより得られた前記係数に基づいて前記ノイズスペクトル格納部に格納されている平均ノイズスペクトルを前記フーリエ変換ステップにより得られた前記入力スペクトルから減じ、更に、得られたスペクトルを調べ、減じすぎた周波数のスペクトルを、補償用ノイズスペクトルで補償するノイズ削減/スペクトル補償ステップと、
を備えたことを特徴とするノイズ削減方法。 - 更に、
前記ノイズ削減/スペクトル補償ステップにより得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換ステップによりえられた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償ステップにおいて補償された周波数の位相を調節するスペクトル安定化ステップと、
を備えたことを特徴とする請求項11記載のノイズ削減方法。 - 更に、
前記A/D変換ステップにより得られた前記一定時間長のディジタル信号に対して線形予測分析を行うLPC分析ステップと、
ノイズ削減処理を受けた前記入力スペクトルと前記複素スペクトルに対して逆離散フーリエ変換を行う逆フーリエ変換ステップと、
前記逆フーリエ変換ステップにより得られた信号に対して前記LPC分析ステップで得られたパラメータを用いたスペクトル強調を行うスペクトル強調ステップと、
を備えたことを特徴とする請求項11記載のノイズ削減方法。
Priority Applications (101)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31032496A JP4006770B2 (ja) | 1996-11-21 | 1996-11-21 | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 |
DE69712537T DE69712537T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
CNB011324244A CN1170269C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
CNB031603556A CN1262994C (zh) | 1996-11-07 | 1997-11-06 | 噪声消除器 |
CA2551458A CA2551458C (en) | 1996-11-07 | 1997-11-06 | A vector quantization apparatus |
DE69710505T DE69710505T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs |
DE69712535T DE69712535T2 (de) | 1996-11-07 | 1997-11-06 | Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs |
DE69712538T DE69712538T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
EP00121446A EP1071077B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generator |
EP01108523A EP1132894B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantisation codebook generation method |
DE69712928T DE69712928T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs |
KR1020017001044A KR100326777B1 (ko) | 1996-11-07 | 1997-11-06 | 음원 코덱용 생성 장치 및 음원 벡터 생성 방법 |
EP99126131A EP0992982B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method, and speech coding/decoding method and apparatus using the same |
CNB011324201A CN1169117C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
CNB97191558XA CN1167047C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置及方法 |
DE69708697T DE69708697T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs, und Vorrichtung und Verfahren zur Sprachcodierung/-decodierung |
EP00121447A EP1071078B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method and apparatus |
EP00121467A EP1071082B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method and generator |
PCT/JP1997/004033 WO1998020483A1 (fr) | 1996-11-07 | 1997-11-06 | Generateur de vecteur de source sonore, codeur et decodeur vocal |
CNB01132421XA CN1170268C (zh) | 1996-11-07 | 1997-11-06 | 声音编码或解码装置及方法 |
KR1019980705215A KR100306817B1 (ko) | 1996-11-07 | 1997-11-06 | 음원벡터생성장치및음원벡터생성방법 |
EP00121460A EP1071079B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method |
CNB011324198A CN1170267C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
CA002355975A CA2355975C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
DE69730316T DE69730316T2 (de) | 1996-11-07 | 1997-11-06 | Schallquellengenerator, sprachkodierer und sprachdekodierer |
CNB011324228A CN1188833C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置及方法 |
DE69713633T DE69713633T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
EP99126132A EP0991054B1 (en) | 1996-11-07 | 1997-11-06 | A CELP Speech Coder or Decoder, and a Method for CELP Speech Coding or Decoding |
KR1020017010774A KR20030096444A (ko) | 1996-11-07 | 1997-11-06 | 음원 벡터 생성 장치 및 방법 |
DE69712927T DE69712927T2 (de) | 1996-11-07 | 1997-11-06 | CELP-Codec |
CA002356051A CA2356051C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
DE69712539T DE69712539T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs |
CN2011100659405A CN102129862B (zh) | 1996-11-07 | 1997-11-06 | 降噪装置及包括降噪装置的声音编码装置 |
EP99126129A EP0994462B1 (en) | 1996-11-07 | 1997-11-06 | Excitation vector generation |
EP00126299A EP1136985B1 (en) | 1996-11-07 | 1997-11-06 | Apparatus and method for CELP speech coding and decoding |
CNB200310114349XA CN1223994C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
CA002355973A CA2355973C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
DE69708696T DE69708696T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-codebuchs |
EP02000123A EP1217614A1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method |
DE69721595T DE69721595T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
DE69708693.3T DE69708693C5 (de) | 1996-11-07 | 1997-11-06 | Verfahren und Vorrichtung für CELP Sprachcodierung oder -decodierung |
CN2006101007075A CN1877698B (zh) | 1996-11-07 | 1997-11-06 | 用于生成声源矢量的装置及方法 |
EP99126130A EP0992981B1 (en) | 1996-11-07 | 1997-11-06 | Excitation Method Generator and Excitation Vector Generating Method |
CA002356041A CA2356041C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
US09/101,186 US6453288B1 (en) | 1996-11-07 | 1997-11-06 | Method and apparatus for producing component of excitation vector |
KR1020017001046A KR100339168B1 (ko) | 1996-11-07 | 1997-11-06 | 음원 벡터 생성 장치, 음성 부호화 장치 및 음성 복호화장치 |
CNA2005100714801A CN1677489A (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
DE69723324T DE69723324T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs |
CA002356049A CA2356049C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
EP00126851A EP1094447B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method |
EP00121466A EP1071081B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method |
CA2614625A CA2614625C (en) | 1996-11-07 | 1997-11-06 | A noise canceller for removing a noise component from an input speech signal |
EP00121458A EP1074978B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation apparatus |
CA002355978A CA2355978C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
DE69710794T DE69710794T2 (de) | 1996-11-07 | 1997-11-06 | Vorrichtungzur Erzeugung eines Vektorquantisierungs-Codebuchs |
DE69715478T DE69715478T2 (de) | 1996-11-07 | 1997-11-06 | Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung |
EP00121464A EP1071080B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method |
EP00126875A EP1085504B1 (en) | 1996-11-07 | 1997-11-06 | CELP-Codec |
EP00121445A EP1074977B1 (en) | 1996-11-07 | 1997-11-06 | Vector quantization codebook generation method |
CN2006100799202A CN1845239B (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
KR10-2003-7012052A KR20040000406A (ko) | 1996-11-07 | 1997-11-06 | 변형 벡터 생성 장치 |
EP97911460A EP0883107B9 (en) | 1996-11-07 | 1997-11-06 | Sound source vector generator, voice encoder, and voice decoder |
DE69711715T DE69711715T2 (de) | 1996-11-07 | 1997-11-06 | Anregungsvektorerzeugung |
CA002242345A CA2242345C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
AU48842/97A AU4884297A (en) | 1996-11-07 | 1997-11-06 | Sound source vector generator, voice encoder, and voice decoder |
CNB011324236A CN1178204C (zh) | 1996-11-07 | 1997-11-06 | 声源矢量生成装置以及声音编码装置和声音解码装置 |
CA2483280A CA2483280C (en) | 1996-11-07 | 1997-11-06 | Excitation vector generator, speech coder and speech decoder |
HK04107703A HK1064787A1 (en) | 1996-11-07 | 1999-05-27 | Sound source vector generator, voice encoder, and voice decoder |
HK02103545.2A HK1041970B (zh) | 1996-11-07 | 1999-05-27 | 聲源矢量生成裝置及方法 |
HK02103546.1A HK1041971B (zh) | 1996-11-07 | 1999-05-27 | 聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置 |
HK02103542A HK1041967A1 (en) | 1996-11-07 | 1999-05-27 | Speech coder or decoder and speech coding or decoding method. |
HK02103541A HK1041966A1 (en) | 1996-11-07 | 1999-05-27 | Sound source vector generator, voice encoder and voice decoder. |
HK07101568.3A HK1096761A1 (en) | 1996-11-07 | 1999-05-27 | Apparatus and method for generating sound source vector |
HK99102382A HK1017472A1 (en) | 1996-11-07 | 1999-05-27 | Sound source vector generator and method for generating a sound source vector. |
HK04107704A HK1064788A1 (en) | 1996-11-07 | 1999-05-27 | Noise cancellator |
HK02103544A HK1041969A1 (en) | 1996-11-07 | 1999-05-27 | Sound source vector generator, voice encoder and voice decoder. |
HK02103543A HK1041968A1 (en) | 1996-11-07 | 1999-05-27 | Sound source vector generator, voice encoder and voice decoder. |
US09/440,092 US6330535B1 (en) | 1996-11-07 | 1999-11-15 | Method for providing excitation vector |
US09/440,083 US6421639B1 (en) | 1996-11-07 | 1999-11-15 | Apparatus and method for providing an excitation vector |
US09/440,199 US6345247B1 (en) | 1996-11-07 | 1999-11-15 | Excitation vector generator, speech coder and speech decoder |
US09/440,087 US6330534B1 (en) | 1996-11-07 | 1999-11-15 | Excitation vector generator, speech coder and speech decoder |
US09/440,093 US6910008B1 (en) | 1996-11-07 | 1999-11-15 | Excitation vector generator, speech coder and speech decoder |
KR1020017001040A KR100306816B1 (ko) | 1996-11-07 | 2001-01-22 | Celp 음성 부호화 또는 복호화 장치 및 방법 |
KR1020017001045A KR100304391B1 (ko) | 1996-11-07 | 2001-01-22 | 음원 벡터 생성 장치 및 방법 |
KR1020017001039A KR100306815B1 (ko) | 1996-11-07 | 2001-01-22 | Celp 음성 부호화 또는 복호화 장치 및 방법 |
KR1020017001038A KR100306814B1 (ko) | 1996-11-07 | 2001-01-22 | Celp 음성 부호화 또는 복호화 장치 및 방법 |
US09/843,877 US6799160B2 (en) | 1996-11-07 | 2001-04-30 | Noise canceller |
US09/843,938 US6772115B2 (en) | 1996-11-07 | 2001-04-30 | LSP quantizer |
US09/843,939 US6947889B2 (en) | 1996-11-07 | 2001-04-30 | Excitation vector generator and a method for generating an excitation vector including a convolution system |
US09/849,398 US7289952B2 (en) | 1996-11-07 | 2001-05-07 | Excitation vector generator, speech coder and speech decoder |
US09/855,708 US6757650B2 (en) | 1996-11-07 | 2001-05-16 | Excitation vector generator, speech coder and speech decoder |
US10/036,451 US20020099540A1 (en) | 1996-11-07 | 2002-01-07 | Modified vector generator |
US11/126,171 US7587316B2 (en) | 1996-11-07 | 2005-05-11 | Noise canceller |
US11/421,932 US7398205B2 (en) | 1996-11-07 | 2006-06-02 | Code excited linear prediction speech decoder and method thereof |
US11/508,852 US20070100613A1 (en) | 1996-11-07 | 2006-08-24 | Excitation vector generator, speech coder and speech decoder |
HK07103753.4A HK1097945A1 (en) | 1996-11-07 | 2007-04-11 | Sound source vector generator, voice encoder, and voice decoder |
US12/134,256 US7809557B2 (en) | 1996-11-07 | 2008-06-06 | Vector quantization apparatus and method for updating decoded vector storage |
US12/198,734 US20090012781A1 (en) | 1996-11-07 | 2008-08-26 | Speech coder and speech decoder |
US12/781,049 US8036887B2 (en) | 1996-11-07 | 2010-05-17 | CELP speech decoder modifying an input vector with a fixed waveform to transform a waveform of the input vector |
US12/870,122 US8086450B2 (en) | 1996-11-07 | 2010-08-27 | Excitation vector generator, speech coder and speech decoder |
US13/302,677 US8370137B2 (en) | 1996-11-07 | 2011-11-22 | Noise estimating apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31032496A JP4006770B2 (ja) | 1996-11-21 | 1996-11-21 | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10149198A JPH10149198A (ja) | 1998-06-02 |
JP4006770B2 true JP4006770B2 (ja) | 2007-11-14 |
Family
ID=18003871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP31032496A Expired - Lifetime JP4006770B2 (ja) | 1996-11-07 | 1996-11-21 | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4006770B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI19992453L (fi) * | 1999-11-15 | 2001-05-16 | Nokia Mobile Phones Ltd | Kohinanvaimennus |
JP3670217B2 (ja) | 2000-09-06 | 2005-07-13 | 国立大学法人名古屋大学 | 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法 |
JP4534883B2 (ja) * | 2005-07-11 | 2010-09-01 | カシオ計算機株式会社 | 楽音制御装置および楽音制御処理のプログラム |
JP5018193B2 (ja) | 2007-04-06 | 2012-09-05 | ヤマハ株式会社 | 雑音抑圧装置およびプログラム |
CN103250208B (zh) * | 2010-11-24 | 2015-06-17 | 日本电气株式会社 | 信号处理装置和信号处理方法 |
JP5887087B2 (ja) * | 2011-09-06 | 2016-03-16 | 綜合警備保障株式会社 | 雑音低減処理装置および雑音低減処理方法 |
WO2014083999A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
WO2014084000A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
JP2014178578A (ja) * | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音響処理装置 |
EP3217399B1 (en) * | 2016-03-11 | 2018-11-21 | GN Hearing A/S | Kalman filtering based speech enhancement using a codebook based approach |
-
1996
- 1996-11-21 JP JP31032496A patent/JP4006770B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH10149198A (ja) | 1998-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
US7379866B2 (en) | Simple noise suppression model | |
US7181402B2 (en) | Method and apparatus for synthetic widening of the bandwidth of voice signals | |
EP2491558B1 (en) | Determining an upperband signal from a narrowband signal | |
US6988066B2 (en) | Method of bandwidth extension for narrow-band speech | |
RU2470385C2 (ru) | Система и способ улучшения декодированного тонального звукового сигнала | |
US8069038B2 (en) | System for bandwidth extension of narrow-band speech | |
EP1252621B1 (en) | System and method for modifying speech signals | |
EP1638083A1 (en) | Bandwidth extension of bandlimited audio signals | |
EP3457402B1 (en) | Noise-adaptive voice signal processing method and terminal device employing said method | |
KR20010101422A (ko) | 매핑 매트릭스에 의한 광대역 음성 합성 | |
JPH09152900A (ja) | 予測符号化における人間聴覚モデルを使用した音声信号量子化法 | |
JPH09152895A (ja) | 合成フィルタの周波数応答に基づく知覚ノイズマスキング測定法 | |
WO2010091013A1 (en) | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder | |
Pulakka et al. | Speech bandwidth extension using gaussian mixture model-based estimation of the highband mel spectrum | |
JPH09152898A (ja) | 符号化されたパラメータのない音声信号の合成法 | |
EP1386313B1 (en) | Speech enhancement device | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP4006770B2 (ja) | ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 | |
JP2004272292A (ja) | 音信号加工方法 | |
EP1619666B1 (en) | Speech decoder, speech decoding method, program, recording medium | |
JP7335968B2 (ja) | Mdct係数からのスペクトル形状予測 | |
JP3183104B2 (ja) | ノイズ削減装置 | |
EP3281197B1 (en) | Audio encoder and method for encoding an audio signal | |
JP2003058186A (ja) | 雑音抑圧方法および雑音抑圧装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20031212 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070807 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070820 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120907 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130907 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |