[go: up one dir, main page]

JP4006770B2 - ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 - Google Patents

ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 Download PDF

Info

Publication number
JP4006770B2
JP4006770B2 JP31032496A JP31032496A JP4006770B2 JP 4006770 B2 JP4006770 B2 JP 4006770B2 JP 31032496 A JP31032496 A JP 31032496A JP 31032496 A JP31032496 A JP 31032496A JP 4006770 B2 JP4006770 B2 JP 4006770B2
Authority
JP
Japan
Prior art keywords
spectrum
noise
unit
fourier transform
compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP31032496A
Other languages
English (en)
Other versions
JPH10149198A (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP31032496A priority Critical patent/JP4006770B2/ja
Priority to DE69712537T priority patent/DE69712537T2/de
Priority to CNB011324244A priority patent/CN1170269C/zh
Priority to CNB031603556A priority patent/CN1262994C/zh
Priority to CA2551458A priority patent/CA2551458C/en
Priority to DE69710505T priority patent/DE69710505T2/de
Priority to DE69712535T priority patent/DE69712535T2/de
Priority to DE69712538T priority patent/DE69712538T2/de
Priority to EP00121446A priority patent/EP1071077B1/en
Priority to EP01108523A priority patent/EP1132894B1/en
Priority to DE69712928T priority patent/DE69712928T2/de
Priority to KR1020017001044A priority patent/KR100326777B1/ko
Priority to EP99126131A priority patent/EP0992982B1/en
Priority to CNB011324201A priority patent/CN1169117C/zh
Priority to CNB97191558XA priority patent/CN1167047C/zh
Priority to DE69708697T priority patent/DE69708697T2/de
Priority to EP00121447A priority patent/EP1071078B1/en
Priority to EP00121467A priority patent/EP1071082B1/en
Priority to PCT/JP1997/004033 priority patent/WO1998020483A1/ja
Priority to CNB01132421XA priority patent/CN1170268C/zh
Priority to KR1019980705215A priority patent/KR100306817B1/ko
Priority to EP00121460A priority patent/EP1071079B1/en
Priority to CNB011324198A priority patent/CN1170267C/zh
Priority to CA002355975A priority patent/CA2355975C/en
Priority to DE69730316T priority patent/DE69730316T2/de
Priority to CNB011324228A priority patent/CN1188833C/zh
Priority to DE69713633T priority patent/DE69713633T2/de
Priority to EP99126132A priority patent/EP0991054B1/en
Priority to KR1020017010774A priority patent/KR20030096444A/ko
Priority to DE69712927T priority patent/DE69712927T2/de
Priority to CA002356051A priority patent/CA2356051C/en
Priority to DE69712539T priority patent/DE69712539T2/de
Priority to CN2011100659405A priority patent/CN102129862B/zh
Priority to EP99126129A priority patent/EP0994462B1/en
Priority to EP00126299A priority patent/EP1136985B1/en
Priority to CNB200310114349XA priority patent/CN1223994C/zh
Priority to CA002355973A priority patent/CA2355973C/en
Priority to DE69708696T priority patent/DE69708696T2/de
Priority to EP02000123A priority patent/EP1217614A1/en
Priority to DE69721595T priority patent/DE69721595T2/de
Priority to DE69708693.3T priority patent/DE69708693C5/de
Priority to CN2006101007075A priority patent/CN1877698B/zh
Priority to EP99126130A priority patent/EP0992981B1/en
Priority to CA002356041A priority patent/CA2356041C/en
Priority to US09/101,186 priority patent/US6453288B1/en
Priority to KR1020017001046A priority patent/KR100339168B1/ko
Priority to CNA2005100714801A priority patent/CN1677489A/zh
Priority to DE69723324T priority patent/DE69723324T2/de
Priority to CA002356049A priority patent/CA2356049C/en
Priority to EP00126851A priority patent/EP1094447B1/en
Priority to EP00121466A priority patent/EP1071081B1/en
Priority to CA2614625A priority patent/CA2614625C/en
Priority to EP00121458A priority patent/EP1074978B1/en
Priority to CA002355978A priority patent/CA2355978C/en
Priority to DE69710794T priority patent/DE69710794T2/de
Priority to DE69715478T priority patent/DE69715478T2/de
Priority to EP00121464A priority patent/EP1071080B1/en
Priority to EP00126875A priority patent/EP1085504B1/en
Priority to EP00121445A priority patent/EP1074977B1/en
Priority to CN2006100799202A priority patent/CN1845239B/zh
Priority to KR10-2003-7012052A priority patent/KR20040000406A/ko
Priority to EP97911460A priority patent/EP0883107B9/en
Priority to DE69711715T priority patent/DE69711715T2/de
Priority to CA002242345A priority patent/CA2242345C/en
Priority to AU48842/97A priority patent/AU4884297A/en
Priority to CNB011324236A priority patent/CN1178204C/zh
Priority to CA2483280A priority patent/CA2483280C/en
Publication of JPH10149198A publication Critical patent/JPH10149198A/ja
Priority to HK04107703A priority patent/HK1064787A1/xx
Priority to HK02103545.2A priority patent/HK1041970B/zh
Priority to HK02103546.1A priority patent/HK1041971B/zh
Priority to HK02103542A priority patent/HK1041967A1/xx
Priority to HK02103541A priority patent/HK1041966A1/xx
Priority to HK07101568.3A priority patent/HK1096761A1/xx
Priority to HK99102382A priority patent/HK1017472A1/xx
Priority to HK04107704A priority patent/HK1064788A1/xx
Priority to HK02103544A priority patent/HK1041969A1/xx
Priority to HK02103543A priority patent/HK1041968A1/xx
Priority to US09/440,092 priority patent/US6330535B1/en
Priority to US09/440,083 priority patent/US6421639B1/en
Priority to US09/440,199 priority patent/US6345247B1/en
Priority to US09/440,087 priority patent/US6330534B1/en
Priority to US09/440,093 priority patent/US6910008B1/en
Priority to KR1020017001040A priority patent/KR100306816B1/ko
Priority to KR1020017001045A priority patent/KR100304391B1/ko
Priority to KR1020017001039A priority patent/KR100306815B1/ko
Priority to KR1020017001038A priority patent/KR100306814B1/ko
Priority to US09/843,877 priority patent/US6799160B2/en
Priority to US09/843,938 priority patent/US6772115B2/en
Priority to US09/843,939 priority patent/US6947889B2/en
Priority to US09/849,398 priority patent/US7289952B2/en
Priority to US09/855,708 priority patent/US6757650B2/en
Priority to US10/036,451 priority patent/US20020099540A1/en
Priority to US11/126,171 priority patent/US7587316B2/en
Priority to US11/421,932 priority patent/US7398205B2/en
Priority to US11/508,852 priority patent/US20070100613A1/en
Priority to HK07103753.4A priority patent/HK1097945A1/xx
Application granted granted Critical
Publication of JP4006770B2 publication Critical patent/JP4006770B2/ja
Priority to US12/134,256 priority patent/US7809557B2/en
Priority to US12/198,734 priority patent/US20090012781A1/en
Priority to US12/781,049 priority patent/US8036887B2/en
Priority to US12/870,122 priority patent/US8086450B2/en
Priority to US13/302,677 priority patent/US8370137B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ディジタル携帯電話やマルチメディア通信等に必要な音声符号化・復号化装置(音声コーデック)や、音声入出力装置を構成するために、入力された音声から背景ノイズ成分を推定するノイズ推定装置及びノイズ推定方法と、その背景ノイズ成分を除去するノイズ削減装置及びノイズ削減方法に関するものである。
【0002】
【従来の技術】
携帯電話等のディジタル移動通信の分野では、加入者の増加に対処するために低ビットレートの音声の圧縮符号化法が求められており、各研究機関において研究開発が進んでいる。日本国内においては、モトローラ社の開発したVSELP(11.2kbps)、NTT移動通信網株式会社の開発したPSI−CELP(5.6kbps)がディジタル携帯電話用の標準符号化方式として採用され、同方式を搭載したディジタル携帯電話が国内において既に発売されている。また国際的には、ITU−Tの標準化では16kbps(LD−CELP)、8kbps(CS−ACELP)が標準化され、現在製品開発の段階にある。
【0003】
これらの方式は、いずれもCELP(Code Exited LinearPrediction: M.R.Schroeder ”High Quality Speech at Low Bit Rates”Proc.ICASSP'85 pp.937-940に記載)という方式を改良したものである。これは、音声を音源情報と声道情報とに分離し、音源情報については、符号帳に格納された複数の音源サンプルのインデクスによって符号化し、声道情報については、LPC(線形予測係数)を符号化するとともに、音源情報符号化の際には、声道情報を加味して入力音声と比較を行なうという方法(A−b−S:Analysis by Synthesis)を採用していることに特徴がある。
【0004】
上記技術により、非常に低ビットレートで音声信号を伝送することができるようになったが、それと共に大きな問題点が明らかになった。それは、音声の発声モデルに基づいて情報圧縮を行っているために、音声信号以外の音響信号に対応できないという点である。そのため、音声信号中に背景ノイズや機器ノイズが含まれていると、効率の良い符号化が出来ず、合成時(復号化時)に異音を生じる結果となっていた。
【0005】
この問題を解決するために、従来より入力音声信号からノイズを削減する手法が検討されてきた。上記標準化方式のPSI−CELPでは、符号化を行う前にノイズキヤンセラによってノイズを削減するという処理を行っている。上記ノイズキャンセラは、カルマンフィルタを基本として開発されており、音声の有無を検出して、適応的に制御を行うことによりノイズを低減させている。このノイズキャンセラによって、ある程度の背景ノイズを削減することができる。しかし、ノイズレベルの高いノイズや、音声中のノイズ等に対しては余り良い性能が得られていなかった。
【0006】
一方、より強力なノイズ低減法として、スペクトルサブトラクション法が挙げられる。(S.F.Boll "Suppression of Acoustic Noise in Speech Using Spectral Subtraction", IEEE Trans.ASSP.,Vol.27,No.2,pp113-120,1979に記載)。これは、入力音声信号に対して離散フーリエ変換を行ってスペクトルに変換した後、ノイズをスペクトル上で減ずる方法であり、主に音声認識装置の入力部等に応用されている。
【0007】
この方法を音声信号中のノイズ低減に応用した一例について、図2を用いて説明する。すなわち、ノイズスペクトルの推定は次の手順で行われる。まず、音声を含んでいないノイズのみの信号31を入力し、A/D変換部32においてディジタル信号に変換する。次に、フーリエ変換部33において、一定時間長の入力信号列(フレームと呼ぶ)に対して離散フーリエ変換を行い、ノイズのスペクトルを求める。そして、ノイズ分析部34において、複数のフレームに対して求めたノイズのスペクトルからノイズの平均的スペクトルを求め、これをノイズスペクトル格納部35に格納する。そして、ノイズの削減は以下の手順で行われる。
【0008】
ノイズを含む音声信号36を入力し、A/D変換部37においてディジタル信号に変換する。次に、上記と同様にしてフーリエ変換部38で離散フーリエ変換を行い、ノイズを含んだ音声のスペクトルを求める。そして、ノイズ削減部39において、ノイズスペクトル格納部35に格納されたノイズスペクトルを、音声のスペクトルから減ずる。その結果得られたスペクトルに対して、逆フーリエ変換部40において逆フーリエ変換を行い、出力信号41を得る。
【0009】
なお、このアルゴリズムにおけるスペクトルとしては、振幅スペクトル(複素数の複素平面上でのノルム、実数部と虚数部を2乗して加算し、平方根をとることによって求められる。)を用いるのが一般的である。また、振幅スペクトルで減じた場合、逆フーリエ変換を行う時の位相成分としては、入力信号の位相成分をそのまま用いるという方法が挙げられる。
【0010】
【発明が解決しようとする課題】
上記スペクトルサブトラクション法は、より強力なノイズ低減方法であるが、ノイズ推定が困難であるために、これまでのリアルタイムの音声処理装置に用いられた例は少なかった。
【0011】
すなわち、上記スペクトルサブトラクション法をリアルタイムの音声処理装置に応用するためには、次の様な課題を有していた。
<1>音声がどのタイミングでデータ中に存在するかが明らかでないために、ノイズスペクトル推定が困難。
<2>ノイズレベルが高い時にスペクトルが大きく歪み、音質の劣化を生ずる。
<3>無音区間(音声の無いノイズのみの区間)において異音感を生ずる。
【0012】
本発明は、ノイズスペクトル推定が可能なノイズ推定装置及びノイズ推定方法の提供とともに、ノイズスペクトル推定が可能で、異音感を低減し、音質の劣化を抑えるノイズ削減装置及びノイズ削減方法の提供を目的とする。
【0013】
【課題を解決するための手段】
上記課題を解決するために本発明は、ノイズ推定部が、フーリエ変換部により得られる入力スペクトルとノイズスペクトル格納部に格納されているノイズスペクトルとを比較することによってノイズのスペクトルを推定し、得られたノイズスペクトルをノイズスペクトル格納部に格納し、ノイズ削減/スペクトル補償部が、ノイズ削減係数調節部により得られる係数に基づいてノイズスペクトル格納部に格納されているノイズスペクトルを、フーリエ変換部により得られる入力スペクトルから減じ、得られたスペクトルを調べて減じすぎた周波数のスペクトルを補償し、スペクトル安定化部が、ノイズ削減/スペクトル補償部により得られたスペクトルを安定化処理するとともに、フーリエ変換部により得られた複素スペクトルの位相のうちノイズ削減/スペクトル補償部において補償された周波数の位相を調整するように構成したものである。
【0014】
これにより、音声区間内でも音声区間外でもノイズスペクトル推定を行うことが可能で、音質の劣化を抑えることのできる優れたノイズ削減装置が得られる。
【0015】
【発明の実施の形態】
本発明は、2種類のノイズスペクトルを用いてノイズ削減を行うために前記2種類のノイズスペクトルを推定するノイズ推定装置であって、入力音声信号をディジタル信号に変換するA/D変換部と、前記A/D変換部により得られる一定時間長(1フレーム)のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの前記2種類のノイズスペクトルを格納するノイズスペクトル格納部と、前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、を備えたことを特徴とするノイズ推定装置であって、特に、予めノイズ区間であるかどうかの判定を行ない、ノイズであると判定した場合には、前記フーリエ変換部により得られる前記入力スペクトルを各周波数毎に前記補償用ノイズスペクトルと大小比較し、前記補償用ノイズスペクトルより小さい場合にその周波数の前記補償用ノイズスペクトルを新たな入力スペクトルとすることによって前記新たな補償用ノイズスペクトルを推定し、またそれとは別に、前記入力スペクトルを一定割合で加算していく前記学習の計算式によって前記新たな平均ノイズスペクトルを推定し、さらに、得られた前記新たな補償用ノイズスペクトルと前記新たな平均ノイズスペクトルとを前記ノイズスペクトル格納部に格納する前記ノイズ推定部を備えたノイズ推定装置とすることで、ノイズのスペクトルを平均と最低の2つの方向から推定することが可能となり、これを用いたノイズ削減装置を構成することにより、より的確な削減処理を行うことができるという作用を有する。
また本発明は、入力音声信号をディジタル信号に変換するA/D変換部と、削減量を決定する係数を調節するノイズ削減係数調節部と、前記A/D変換部により得られる一定時間長(1フレーム)のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの2種類のノイズスペクトルを格納するノイズスペクトル格納部と、前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、前記ノイズ削減係数調節部により得られる前記係数に基づいて前記ノイズスペクトル格納部に格納されている平均ノイズスペクトルを前記フーリエ変換部により得られる前記入力スペクトルから減じ、更に、得られるスペクトルを調べ、減じすぎた周波数のスペクトルを、補償用ノイズスペクトルで補償するノイズ削減/スペクトル補償部と、を備えることを特徴としたノイズ削減装置である。
ここで更に、前記ノイズ削減/スペクトル補償部により得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換部により得られた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償部において補償された周波数の位相を調整するスペクトル安定化部と、を備えてもよく、更に、前記スペクトル安定化部において平滑化処理されたスペクトルと調整された位相スペクトルとに基づいて逆フーリエ変換を行う逆フーリエ変換部と、前記逆フーリエ変換部により得られた信号に対してスペクトル強調を行うスペクトル強調部と、前記スペクトル強調部により得られた信号を前のフレームの信号と整合させる波形整合部と、を備えてもよい。
あるいは、前記A/D変換部により得られる一定時間長のディジタル信号に対して線形予測分析(LPC分析)を行うLPC分析部と、ノイズ削減処理を受けた前記入力スペクトルと前記複素スペクトルに対して逆離散フーリエ変換を行う逆フーリエ変換部と、前記逆フーリエ変換部により得られた信号に対して前記LPC分析部で得られたパラメータを用いたスペクトル強調を行うスペクトル強調部と、を更に備えてもよく、音声区間中でも音声区間外でもノイズスペクトル推定を行うことができるとともに、入力のスペクトル包絡の特徴を線形予測係数で強調することができるという作用を有する。
【0017】
また、ノイズ削減係数調節部にて得られたノイズ削減係数をノイズスペクトル格納部に格納された平均ノイズスペクトルに乗じて、フーリエ変換部にて得られた入力スペクトルから減じ、負のスペクトル値になってしまった周波数に対してはノイズスペクトル格納部に格納された補償用ノイズスペクトルにより補償するノイズ削減/スペクトル補償部を備えノイズ削減装置とすることで、ノイズの平均スペクトルを削減に用いることにより、より大きくノイズスペクトルを削減することができるとともに、補償用スペクトルを別に推定したことにより、より的確な補償を行うことができるという作用を有する。
【0018】
また、ノイズ削減/スペクトル補償部にてノイズ削減とスペクトル補償をなされたスペクトルの全域パワーと聴感的に重要な一部の帯域のパワー(中域パワー)とを調べ、入力された信号が無音区間(音声のないノイズのみの信号)かどうかを識別し、無音区間と判断した場合には、全域パワーと中域パワーに対して安定化処理とパワー低減処理を行なうスペクトル安定化部を備えノイズ削減装置とすることで、音声の含まれていないノイズのみの区間のスペクトルをスムージングすることができるとともに、同区間のスペクトルがノイズ削減のために極端なスペクトル変動を起こすことを防ぐという作用を有する。
【0019】
また、フーリエ変換部で得られた複素スペクトルに対して、ノイズ削減/スペクトル補償部でスペクトル補償を受けたかどうかの情報を基に、乱数による位相回転を行なうスペクトル安定化部を備えノイズ削減装置とすることで、補償された周波数成分の位相にランダム性を持たせ、削減できずに残ったノイズを、聴感的に異音感の少ないノイズに変換させることができるという作用を有する。
【0020】
また、予めスペクトル強調に用いる重み係数のセットを複数用意し、ノイズ削減時には、入力された信号の状態に応じて重み付け係数のセットを選択し、選択された重み付け係数を用いてスペクトル強調を行なうスペクトル強調部を備えノイズ削減装置することで、音声区間においては、聴感的により適当な重み付けができ、無音区間や無声子音区間においては、聴感重み付けによる異音感を押さえることができるという作用を有する。
【0021】
以下、本発明の実施の形態について、図1を用いて説明する。
(実施の形態)
図1は、本実施の形態におけるノイズ削減装置の主要部の機能ブロック図である。図1において、11は入力信号、12はA/D変換部、13はノイズ削減係数格納部、14はノイズ削減係数調整部、15は入力波形設定部、16は入力波形設定部、17はフーリエ変換部、18はノイズ削減/スペクトル補償部、19はスペクトル安定部、20は逆フーリエ変換部、21はスペクトル強調部、22は波形整合部、23は出力信号、24はノイズ推定部、25はノイズスペクトル格納部、26は前スペクトル格納部、27は乱数位相格納部、28は前波形格納部、29は最大パワー格納部である。
【0022】
始めに初期設定について説明する。(表1)に、固定パラメータの名称と設定例を示す。
【0023】
【表1】
Figure 0004006770
【0024】
また、乱数位相格納部27には、位相を調整するための位相データを格納しておく。これらは、スペクトル安定化部19において、位相を回転させるために用いられる。位相データが8種類の場合の例を(表2)に示す。
【0025】
【表2】
Figure 0004006770
【0026】
さらに、上記位相データを用いるためのカウンター(乱数位相カウンター)も、乱数位相格納部27に格納しておく。この値は、予め0に初期化して格納しておく。
【0027】
次に、スタティックのRAM領域を設定する。すなわち、ノイズ削減係数格納部13、ノイズスペクトル格納部25、前スペクトル格納部26、前波形格納部28、最大パワー格納部29をクリアする。以下に、各格納部の説明と設定例を述べる。
【0028】
ノイズ削減係数格納部13は、ノイズ削減係数を格納するエリアであり、初期値として20.0を格納しておく。ノイズスペクトル格納部25は、平均ノイズパワーと、平均ノイズスペクトルと、1位候補の補償用ノイズスペクトルと2位候補の補償用ノイズスペクトルとそれぞれの周波数のスペクトル値が、何フレーム前に変化したかを示すフレーム数(持続数)を、各周波数毎に格納するエリアであり、平均ノイズパワーに十分大きな値、平均ノイズスペクトルに指定最小パワー、補償用ノイズスペクトルと持続数としてそれぞれに充分大きな数を初期値として格納しておく。
【0029】
前スペクトル格納部26は、補償用ノイズパワー、以前のフレームのパワー(全域、中域)(前フレームパワー)、以前のフレームの平滑化パワー(全域、中域)(前フレーム平滑化パワー)、及びノイズ連続数を格納するエリアであり、補償用ノイズパワーとして十分大きな値を、前フレームパワー、全フレーム平滑化パワーとしていずれも0.0を、またノイズ連続数としてノイズ基準連続数を格納しておく。
【0030】
前波形格納部28は、出力信号を整合させるための、前のフレームの出力信号の、最後の先読みデータ長分のデータを格納するエリアであり、初期値として全てに0を格納しておく。スペクトル強調部21は、ARMA及び高域強調フィルタリングを行なうが、そのためのそれぞれのフィルターの状態をいずれも0にクリアしておく。最大パワー格納部29は、入力された信号のパワーの最大を格納するエリアであり、最大パワーとして0を格納しておく。
【0031】
次にノイズ削減アルゴリズムについて、図1を用いてブロック毎に説明する。
まず、音声を含むアナログ入力信号11をA/D変換部12でA/D変換し、1フレーム長+先読みデータ長(上記設定例では、160+80=240ポイント)の分だけ入力する。ノイズ削減係数調節部14は、ノイズ削減係数格納部13に格納されたノイズ削減係数と指定ノイズ削減係数とノイズ削減係数学習係数と補償パワー上昇係数とを基に、(数1)により、ノイズ削減係数並びに補償係数を算出する。そして、得られたノイズ削減係数をノイズ削減係数格納部13に格納するとともに、A/D変換部12で得られた入力信号を、入力波形設定部15へ送り、さらに補償係数とノイズ削減係数を、ノイズ推定部24とノイズ削減/スペクトル補償部18へ送る。
【0032】
【数1】
Figure 0004006770
【0033】
なお、ノイズ削減係数はノイズを減ずる割合を示した係数、指定ノイズ削減係数は予め指定された固定削減係数、ノイズ削減係数学習係数はノイズ削減係数の指定ノイズ削減係数に近づける割合を示した係数、補償係数はスペクトル補償における補償パワーを調節する係数、補償パワー上昇係数は補償係数を調節する係数である。
【0034】
入力波形設定部15においては、A/D変換部12からの入力信号を、FFT(高速フーリエ変換)することができるように、2の指数乗の長さを持つメモリ配列に、後ろ詰めで書込む。前の部分は0を詰めておく。前述の設定例では、256の長さの配列に0〜15まで0を書込み、16〜255まで入力信号を書込む。この配列は、8次のFFTの際に実数部として用いられる。また、虚数部として、実数部と同じ長さの配列を用意し、全てに0を書込んでおく。
【0035】
LPC分析部16においては、入力波形設定部15で設定した実数部エリアに対してハミング窓を掛け、窓掛け後の波形に対して自己相関分析を行って自己相関係数を求め、自己相関法に基づくLPC分析を行い、線形予測係数を得る。さらに、得られた線形予測係数をスペクトル強調部21に送る。
【0036】
フーリエ変換部17は、入力波形設定部15で得られる実数部、虚数部のメモリ配列を用いて、FFTによる離散フーリエ変換を行う。得られた複素スペクトルの実数部と虚数部の絶対値の和を計算することによって、入力信号の疑似振幅スペクトル(以下、入力スペクトル)を求める。また、各周波数の入力スペクトル値の総和(以下、入力パワー)を求め、ノイズ推定部24へ送る。また、複素スペクトルそのものを、スペクトル安定部19へ送る。
【0037】
次に、ノイズ推定部24における処理を説明する。
ノイズ推定部24は、フーリエ変換部17で得られた入力パワーと最大パワー格納部29に格納された最大パワーの値とを比較し、最大パワーの方が小さい場合は、最大パワー値を入力パワー値として、その値を最大パワー格納部29に格納する。そして、以下の3つうち少なくとも一つに該当する場合はノイズ推定を行い、全て満たさない場合はノイズ推定は行わない。
(1)入力パワーが、最大パワーに無音検出係数を乗じた値よりも小さい。
(2)ノイズ削減係数が、指定ノイズ削減係数に0.2を加えたものより大きい。
(3)入力パワーが、ノイズスペクトル格納部25から得られる平均ノイズパワーに1.6を乗じたものより小さい。
【0038】
ここで、ノイズ推定部24におけるノイズ推定アルゴリズムを述べる。
まず、ノイズスペクトル格納部25に格納されている1位候補、2位候補の全ての周波数の持続数を更新する(1を加算する)。そして、1位候補の各周波数の持続数を調べ、予め設定したノイズスペクトル基準持続数より大きい場合は、2位候補の補償用スペクトルと持続数を1位候補とし、2位候補の補償用スペクトルを3位候補の補償用スペクトルとし持続数を0とする。ただし、この2位候補の補償用スペクトルの入れ替えにおいては、3位候補を格納せず、2位候補を若干大きくしたもので代用することによって、メモリを節約することができる。本実施の形態では、2位候補の補償用スペクトルを1.4倍したものを代用することとする。
【0039】
持続数の更新の後に、各周波数毎に、補償用ノイズスペクトルと入力スペクトルとの比較を行う。まず、各周波数の入力スペクトルを1位候補の補償用ノイズスペクトルと比較し、もし入力スペクトルの方が小さい場合は、1位候補の補償用ノイズスペクトルと持続数を2位候補とし、入力スペクトルを1位候補の補償用スペクトルとし1位候補の持続数は0とする。前記の条件以外の場合は、入力スペクトルと2位候補の補償用ノイズスペクトルとの比較を行い、もし入力スペクトルの方が小さい場合は、入力スペクトルを2位候補の補償用スペクトルとし2位候補の持続数は0とする。そして、得られた1、2位候補の補償用スペクトルと持続数を補償用ノイズスペクトル格納部25に格納する。また、同時に、平均ノイズスペクトルも、次の(数2)にしたがって更新する。
【0040】
【数2】
Figure 0004006770
【0041】
なお、平均ノイズスペクトルは、疑似的に求めた平均のノイズスペクトルであり、(数2)における係数gは、平均ノイズスペクトルの学習の早さを調節する係数である。すなわち、入力パワーがノイズパワーと比較して小さい場合は、ノイズのみの区間である可能性が高いとして学習速度を上げ、そうでない場合は、音声区間中である可能性があるとして学習速度を下げる効果を持つ係数である。
【0042】
そして、平均ノイズスペクトルの各周波数の値の総和を求め、これを平均ノイズパワーとする。補償用ノイズスペクトル、平均ノイズスペクトル、平均ノイズパワーは、ノイズスペクトル格納部25に格納する。
【0043】
また、上記ノイズ推定処理において、1つの周波数のノイズスペクトルを複数の周波数の入力スペクトルと対応させれば、ノイズスペクトル格納部25を構成するためのRAM容量を節約することができる。例として、本実施の形態の256ポイントのFFTを用いる場合に、1つの周波数のノイズスペクトルを4つの周波数の入力スペクトルから推定するときの、ノイズスペクトル格納部25のRAM容量を示す。(疑似)振幅スペクトルが周波数軸上で左右対称であることを考慮すると、全ての周波数で推定する場合は128個の周波数のスペクトルと持続数を格納するので、128(周波数)×2(スペクトルと持続数)×3(補償用の1、2位候補、平均)で計768WのRAM容量が必要になる。
【0044】
これに対して、1つの周波数のノイズスペクトルを4つの周波数の入力スペクトルと対応させる場合は、32(周波数)×2(スペクトルと持続数)×3(補償用の1、2位候補、平均)で計192WのRAM容量でよいことになる。この場合、ノイズスペクトルの周波数解像度は低下することになるが、上記1対4の場合は、殆ど性能の劣化がないことを実験により確認している。また、この工夫は、1つの周波数のスペクトルでノイズスペクトルを推定するものではないから、定常音(サイン波、母音等)が長時間続いた場合に、そのスペクトルをノイズスペクトルと誤推定することを防ぐ効果もある。
【0045】
次に、ノイズ削減/スペクトル補償部18における処理について説明する。
入力スペクトルから、ノイズスペクトル格納部25に格納されている平均ノイズスペクトルにノイズ削減係数調節部14で得られたノイズ削減係数を乗じたものを引く(以後、差スペクトル)。上記ノイズ推定部24の説明において示したノイズスペクトル格納部25のRAM容量の節約を行った場合は、入力スペクトルに対応する周波数の平均ノイズスペクトルにノイズ削減係数を乗じたものを引く。そして、差スペクトルが負になった場合には、ノイズスペクトル格納部25に格納された補償用ノイズスペクトルの1位候補に、ノイズ削減係数調整部14で求めた補償係数を乗じたものを代入することにより補償する。これを、全ての周波数について行う。また、差スペクトルを補償した周波数が分るように、周波数毎にフラグデータを作成する。例えば、各周波数毎に1つのエリアがあり、補償しない時は0、補償したときは1を代入する。このフラグデータは、差スペクトルと共に、スペクトル安定化部19へ送られる。また、フラグデータの値を調べることによって補償した総数(補償数)を求め、これもスペクトル安定部19へ送る。
【0046】
次に、スペクトル安定部19における処理について説明する。なお、この処理は、主に音声の含まれていない区間の異音感低減のために機能する。
【0047】
まず、ノイズ削減/スペクトル補償部18から得られた各周波数の差スペクトルの和を計算し、現フレームパワーを求める。現フレームパワーは全域と中域の2種類を求める。全域は全ての周波数(全域と呼ぶ、本実施の形態では0〜128まで)について求め、中域は聴感的に重要な中ごろの帯域(中域と呼ぶ、本実施の形態では16〜79まで)について求める。
【0048】
同様に、ノイズスペクトル格納部25に格納された補償用ノイズスペクトルの1位候補についての和を求め、これを現フレームノイズパワー(全域、中域)とする。ここで、ノイズ削減/スペクトル補償部18から得られた補償数の値を調べ、十分大きい場合、且つ、以下の3条件のうち少なくとも1つ満たす場合に、現フレームがノイズのみの区間と判断して、スペクトルの安定化処理を行う。
(1)入力パワーが、最大パワーに無音検出係数を乗じた値よりも小さい。
(2)現フレームパワー(中域)が、現フレームノイズパワー(中域)に5.0を乗じた値より小さい。
(3)入力パワーが、ノイズ基準パワーよりも小さい。
【0049】
安定化処理を行なわない場合は、前スペクトル格納部26に格納されたノイズ連続数が正の時に1を減じ、また現フレームノイズパワー(全域、中域)を前フレームパワー(全域、中域)とし、それぞれを前スペクトル格納部26に格納して、位相拡散処理に進む。
【0050】
ここで、スペクトル安定化処理について説明する。この処理の目的は、無音区間(音声の無いノイズのみの区間)のスペクトルの安定化とパワー低減を実現することである。処理は2種類あり、ノイズ連続数がノイズ基準連続数より小さい場合は(処理1)を、以上の場合は(処理2)を行なう。2つの処理を以下に示す。
(処理1)前スペクトル格納部26に格納されたノイズ連続数に1を加算し、また現フレームノイズパワー(全域、中域)を前フレームパワー(全域、中域)とし、それぞれを前スペクトル格納部26に格納して、位相調整処理へ進む。
(処理2)前スペクトル格納部26に格納された前フレームパワー、前フレーム平滑化パワー、更に固定係数である無音パワー減少係数を参照し、(数3)にしたがってそれぞれを変更する。
【0051】
【数3】
Figure 0004006770
【0052】
次に、これらのパワーを差スペクトルに反映させる。そのために、中域に乗ずる係数(以後、係数1)と全域に乗ずる係数(以後、係数2)の2つの係数を算出する。まず、以下の(数4)に示す式で係数1を算出する。
【0053】
【数4】
Figure 0004006770
【0054】
係数2は、係数1の影響を受けるので、求める手段は多少複雑になる。手順を以下に示す。
(1)前フレーム平滑化パワー(全域)が前フレームパワー(中域)より小さい場合、または、現フレームノイズパワー(全域)が現フレームノイズパワー(中域)よりも小さい場合は(2)へ。それ以外の場合は(3)へ。
(2)係数2は0.0とし、前フレームパワー(全域)を前フレームパワー(中域)として、(6)へ。
(3)現フレームノイズパワー(全域)が現フレームノイズパワー(中域)と等しい場合は(4)へ。異なる場合は(5)へ。
(4)係数2を1.0とし、(6)へ。
(5)以下の(数5)により係数2を求め、(6)へ。
【0055】
【数5】
Figure 0004006770
【0056】
(6)係数2算出処理終了。
上記アルゴリズムにより得られた係数1、2は、いずれも上限を1.0に、下限を無音パワー減少係数にクリッピングする。そして、中域の周波数(本例では16〜79)の差スペクトルに係数1を乗じて得られた値を差スペクトルとし、さらに、その差スペクトルの全域から中域を除いた周波数(本例では0〜15、80〜128)の差スペクトルに係数2を乗じて得られた値を差スペクトルとする。それに伴い、前フレームパワー(全域、中域)を以下の(数6)によって変換する。
【0057】
【数6】
Figure 0004006770
【0058】
こうして得られた各種パワーデータ等を全て前スペクトル格納部26に格納し、(処理2)を終わる。
【0059】
以上の要領で、スペクトル安定部19におけるスペクトルの安定化が行われる。
【0060】
次に、位相調整処理について説明を行う。従来のスペクトルサブトラクションでは、位相は原則として変更しないが、本実施の形態では、その周波数のスペクトルが削減時に補償された場合に、位相をランダムに変更する処理を行なう。この処理により、残ったノイズのランダム性が強くなるので、聴感的に悪印象を与えにくくなるという効果が得られる。
【0061】
まず、乱数位相格納部2に格納された乱数位相カウンターを得る。そして、全ての周波数のフラグデータ(補償の有無を示したデータ)を参照して、補償している場合は、以下の(数7)により、フーリエ変換部17で得られた複素スペクトルの位相を回転させる。
【0062】
【数7】
Figure 0004006770
【0063】
(数7)においては、2つの乱数位相データをペアで使用している。したがって、上記処理を1回行なう毎に、乱数位相カウンターを2ずつ増加させ、上限(本実施の形態では16)になった場合は0とする。なお、乱数位相カウンターは乱数位相格納部27へ格納し、得られた複素スペクトルは、逆フーリエ変換部20へ送る。また、差スペクトルの総和を求め(以下、差スペクトルパワー)、これをスペクトル強調部21へ送る。
【0064】
逆フーリエ変換部20では、スペクトル安定部19で得られた差スペクトルの振幅と複素スペクトルの位相とに基づき、新たな複素スペクトルを構成し、FFTを用いて逆フーリエ変換を行う。(得られた信号を第1次出力信号と呼ぶ。)そして、得られた第1次出力信号をスペクトル強調部21へ送る。
【0065】
次に、スペクトル強調部21における処理について説明する。
まず、ノイズスペクトル格納部25に格納さされた平均ノイズパワーと、スペクトル安定部19で得られた差スペクトルパワーと、定数であるノイズ基準パワーを参照して、MA強調係数とAR強調係数を選択する。選択は、以下の2つの条件を評価することにより行う。
(条件1)差スペクトルパワーがノイズスペクトル格納部25に格納された平均ノイズパワーに0.6を乗じた値よりも大きく、且つ、平均ノイズパワーがノイズ基準パワーよりも大きい。
(条件2)差スペクトルパワーが平均ノイズパワーより大きい。
【0066】
(条件1)を満たす場合は、これを「有声区間」とし、MA強調係数をMA強調係数1ー1とし、AR強調係数をAR強調係数1ー1とし、高域強調係数を高域強調係数1とする。また、(条件1)を満たさず、(条件2)を満たす場合は、これを「無声子音区間」とし、MA強調係数をMA強調係数1ー0とし、AR強調係数をAR強調係数1ー0とし、高域強調係数を0とする。また、(条件1)を満たさず、(条件2)を満たさない場合はこれを「無音区間、ノイズのみの区間」とし、MA強調係数をMA強調係数0とし、AR強調係数をAR強調係数0とし、高域強調係数を高域強調係数0とする。
【0067】
そして、LPC分析部16から得られた線形予測係数と、上記MA強調係数、AR強調係数を用いて、以下の(数8)の式に基づき、極強調フィルターのMA係数とAR係数とを算出する。
【0068】
【数8】
Figure 0004006770
【0069】
そして、逆フーリエ変換部20において得られた第1次出力信号に対して、上記MA係数とAR係数とを用いて極強調フィルターを掛ける。このフィルターの伝達関数を、以下の(数9)に示す。
【0070】
【数9】
Figure 0004006770
【0071】
更に、高域成分を強調するために、上記高域強調係数を用いて、高域強調フィルターを掛ける。このフィルターの伝達関数を、以下の(数10)に示す。
【0072】
【数10】
Figure 0004006770
【0073】
上記処理によって得られた信号を第2次出力信号と呼ぶ。なお、フィルターの状態は、スペクトル強調部21の内部に保存される。
【0074】
最後に、波形整合部22において、スペクトル強調部21で得られた第2次出力信号と、前波形格納部28に格納された信号とを、三角窓によって重ね合せて出力信号を得る。更に、この出力信号の最後の先読みデータ長分のデータを、前波形格納部28に格納する。このときの整合方法を、以下の(数11)に示す。
【0075】
【数11】
Figure 0004006770
【0076】
ここで注意が必要なのは、出力信号としては先読みデータ長+フレーム長分のデータが出力されるが、このうち信号として扱うことができるのは、データの始端からフレーム長の長さの区間のみということである。なぜなら、後ろの先読みデータ長のデータは、次の出力信号を出力するときに書き換えられるからである。ただし、出力信号の全区間内では連続性は補償されるので、LPC分析やフィルター分析等の周波数分析には使用することができる。
【0077】
【発明の効果】
以上のように本発明によれば、音声区間中でも音声区間外でもノイズスペクトル推定を行うことができ、音声がどのタイミングでデータ中に存在するかが明らかでない場合でもノイズスペクトルを推定することができる。また、入力のスペクトル包絡の特徴を線形予測係数で強調することができ、ノイズレベルが高い場合でも音質の劣化を防ぐことが出来る。
【0078】
また、ノイズのスペクトルを平均と最低の2つの方向から推定でき、より的確な削減処理を行うことができる。
【0079】
また、ノイズの平均スペクトルを削減に用いることによって、より大きくノイズスペクトルを削減することができ、さらに、補償用スペクトルを別に推定したことにより、より的確な補償を行うことができる。
【0080】
そして、音声の含まれていないノイズのみの区間のスペクトルをスムージングすることができ、同区間のスペクトルが、ノイズ削減のために極端なスペクトル変動による異音感を防ぐことができる。
【0081】
そして、補償された周波数成分の位相にランダム性を持たせることができ、削減できずに残ったノイズを、聴感的に異音感の少ないノイズに変換させることができる。
【0082】
また、音声区間においては、聴感的により適当な重み付けができるようになり、無音区間や無声子音区間においては、聴感重み付けによる異音感を抑えることができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態によるノイズ削減装置の主要部の機能ブロック図
【図2】従来のスペクトルサブトラクションによるノイズ削減装置の機能ブロック図
【符号の説明】
11 入力信号
12 A/D変換部
13 ノイズ削減係数格納部
14 ノイズ削減係数調節部
15 入力波形設定部
16 LPC分析部
17 フーリエ変換部
18 ノイズ削減/スペクトル補償部
19 スペクトル安定化部
20 逆フーリエ変換部
21 スペクトル強調部
22 波形整合部
23 出力音声
24 ノイズ推定部
25 ノイズスペクトル格納部
26 前スペクトル格納部
27 乱数位相格納部
28 前波形格納部

Claims (13)

  1. 2種類のノイズスペクトルを用いてノイズ削減を行うために前記2種類のノイズスペクトルを推定するノイズ推定装置であって、
    入力音声信号をディジタル信号に変換するA/D変換部と、
    前記A/D変換部により得られる一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、
    ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの前記2種類のノイズスペクトルを格納するノイズスペクトル格納部と、
    前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、
    を備えたことを特徴とするノイズ推定装置。
  2. 前記ノイズ推定部は、
    予めノイズ区間であるかどうかの判定を行い、ノイズであると判定した場合には、前記フーリエ変換部により得られる前記入力スペクトルを各周波数毎に前記補償用ノイズスペクトルと大小比較し、前記補償用ノイズスペクトルより小さい場合にその周波数の前記補償用ノイズスペクトルを新たな入力スペクトルとすることによって前記新たな補償用ノイズスペクトルを推定し、またそれとは別に、前記入力スペクトルを一定割合で加算していく前記学習の計算式によって前記新たな平均ノイズスペクトルを推定し、さらに、得られた前記新たな補償用ノイズスペクトルと前記新たな平均ノイズスペクトルとを前記ノイズスペクトル格納部に格納することを特徴とする請求項1記載のノイズ推定装置。
  3. 入力音声信号をディジタル信号に変換するA/D変換部と、
    削減量を決定する係数を調節するノイズ削減係数調節部と、
    前記A/D変換部により得られる一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換部と、
    ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの2種類のノイズスペクトルを格納するノイズスペクトル格納部と、
    前記フーリエ変換部により得られる前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定部と、
    前記ノイズ削減係数調整部により得られる前記係数に基づいて前記ノイズスペクトル格納部に格納されている平均ノイズスペクトルを前記フーリエ変換部により得られる前記入力スペクトルから減じ、更に、得られるスペクトルを調べ、減じすぎた周波数のスペクトルを、補償用ノイズスペクトルで補償するノイズ削減/スペクトル補償部と、
    を備えたことを特徴とするノイズ削減装置。
  4. 更に、
    前記ノイズ削減/スペクトル補償部により得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換部によりえられた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償部において補償された周波数の位相を調節するスペクトル安定化部と、
    を備えたことを特徴とする請求項3記載のノイズ削減装置。
  5. 前記ノイズ削減/スペクトル補償部は、
    ノイズ削減とスペクトル補償とをなされたスペクトルの全域パワーと聴感的に重要な一部の帯域のパワーとを調べ、入力された信号が無音区間かどうかを識別し、
    前記スペクトル安定化部は、
    上記機能で無音区間と判断した場合には、全域パワーと中域パワーに対して平滑化処理とパワー低減処理とを行う
    ことを特徴とする請求項4記載のノイズ削減装置。
  6. 前記スペクトル安定化部は、
    前記フーリエ変換部で得られた複素スペクトルに対して、前記ノイズ削減/スペクトル補償部でスペクトル補償を受けたかどうかの情報を基に、乱数による位相回転を行う
    ことを特徴とする請求項4記載のノイズ削減装置。
  7. 前記ノイズ削減/スペクトル補償部は、
    前記ノイズ削減係数調節部にて得られたノイズ削減係数を前記ノイズスペクトル格納部に格納された平均ノイズスペクトルに乗じて、前記フーリエ変換部にて得られた前記入力スペクトルから減じ、負のスペクトル値になった周波数に対しては前記ノイズスペクトル格納部に格納された補償用ノイズスペクトルにより補償する
    ことを特徴とする請求項3記載のノイズ削減装置。
  8. 更に、
    前記A/D変換部により得られる前記一定時間長のディジタル信号に対して線形予測分析を行うLPC分析部と、
    ノイズ削減処理を受けた前記入力スペクトルと前記複素スペクトルに対して逆離散フーリエ変換を行う逆フーリエ変換部と、
    前記逆フーリエ変換部により得られた信号に対して前記LPC分析部で得られたパラメータを用いたスペクトル強調を行うスペクトル強調部と、
    を備えたことを特徴とする請求項3記載のノイズ削減装置。
  9. 更に、
    前記ノイズ削減/スペクトル補償部により得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換部により得られた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償部において補償された周波数の位相を調整するスペクトル安定化部と、
    前記スペクトル安定化部において平滑化処理されたスペクトルと調整された位相スペクトルとに基づいて逆フーリエ変換を行う逆フーリエ変換部と、
    前記逆フーリエ変換部により得られた信号に対してスペクトル強調を行うスペクトル強調部と、
    前記スペクトル強調部により得られた信号を前のフレームの信号と整合させる波形整合部と、
    を備えたことを特徴とする請求項3記載のノイズ削減装置。
  10. 2種類のノイズスペクトルを用いてノイズ削減を行うために前記2種類のノイズスペクトルを推定するノイズ推定方法であって、
    入力音声信号をディジタル信号に変換するA/D変換ステップと、
    前記A/D変換ステップにより得られた一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換ステップと、
    ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの前記2種類のノイズスペクトルをノイズスペクトル格納部に格納するノイズスペクトル格納ステップと、
    前記フーリエ変換ステップにより得られた前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定ステップと、
    を備えたことを特徴とするノイズ推定方法。
  11. 入力音声信号をディジタル信号に変換するA/D変換ステップと、
    削減量を決定する係数を調節するノイズ削減係数調節ステップと、
    前記A/D変換ステップにより得られた一定時間長のディジタル信号に対して離散フーリエ変換を行い入力スペクトルと複素スペクトルを得るフーリエ変換ステップと、
    ノイズ削減処理に用いる平均ノイズスペクトル及び前記ノイズ削減処理において減じすぎた周波数スペクトルを補償するために用いる補償用ノイズスペクトルの2種類のノイズスペクトルをノイズスペクトル格納部に格納するノイズスペクトル格納ステップと、
    前記フーリエ変換ステップにより得られた前記入力スペクトルと前記ノイズスペクトル格納部に格納されている前記補償用ノイズスペクトルとの比較によって得られる新たな補償用ノイズスペクトルと、前記フーリエ変換部により得られる前記入力スペクトルを学習の計算式に用いて得られる新たな平均ノイズスペクトルとを、前記2種類のノイズスペクトルとして新たに推定し、得られた新たな2種類のノイズスペクトルを前記ノイズスペクトル格納部に格納するノイズ推定ステップと、
    前記ノイズ削減係数調整ステップにより得られた前記係数に基づいて前記ノイズスペクトル格納部に格納されている平均ノイズスペクトルを前記フーリエ変換ステップにより得られた前記入力スペクトルから減じ、更に、得られたスペクトルを調べ、減じすぎた周波数のスペクトルを、補償用ノイズスペクトルで補償するノイズ削減/スペクトル補償ステップと、
    を備えたことを特徴とするノイズ削減方法。
  12. 更に、
    前記ノイズ削減/スペクトル補償ステップにより得られたスペクトルのうちノイズ区間と判定されるものについて、平滑化処理するとともに、前記フーリエ変換ステップによりえられた前記複素スペクトルの位相のうち前記ノイズ削減/スペクトル補償ステップにおいて補償された周波数の位相を調節するスペクトル安定化ステップと、
    を備えたことを特徴とする請求項11記載のノイズ削減方法。
  13. 更に、
    前記A/D変換ステップにより得られた前記一定時間長のディジタル信号に対して線形予測分析を行うLPC分析ステップと、
    ノイズ削減処理を受けた前記入力スペクトルと前記複素スペクトルに対して逆離散フーリエ変換を行う逆フーリエ変換ステップと、
    前記逆フーリエ変換ステップにより得られた信号に対して前記LPC分析ステップで得られたパラメータを用いたスペクトル強調を行うスペクトル強調ステップと、
    を備えたことを特徴とする請求項11記載のノイズ削減方法。
JP31032496A 1996-11-07 1996-11-21 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法 Expired - Lifetime JP4006770B2 (ja)

Priority Applications (101)

Application Number Priority Date Filing Date Title
JP31032496A JP4006770B2 (ja) 1996-11-21 1996-11-21 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
DE69712537T DE69712537T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
CNB011324244A CN1170269C (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
CNB031603556A CN1262994C (zh) 1996-11-07 1997-11-06 噪声消除器
CA2551458A CA2551458C (en) 1996-11-07 1997-11-06 A vector quantization apparatus
DE69710505T DE69710505T2 (de) 1996-11-07 1997-11-06 Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs
DE69712535T DE69712535T2 (de) 1996-11-07 1997-11-06 Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs
DE69712538T DE69712538T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
EP00121446A EP1071077B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generator
EP01108523A EP1132894B1 (en) 1996-11-07 1997-11-06 Vector quantisation codebook generation method
DE69712928T DE69712928T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs
KR1020017001044A KR100326777B1 (ko) 1996-11-07 1997-11-06 음원 코덱용 생성 장치 및 음원 벡터 생성 방법
EP99126131A EP0992982B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method, and speech coding/decoding method and apparatus using the same
CNB011324201A CN1169117C (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
CNB97191558XA CN1167047C (zh) 1996-11-07 1997-11-06 声源矢量生成装置及方法
DE69708697T DE69708697T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs, und Vorrichtung und Verfahren zur Sprachcodierung/-decodierung
EP00121447A EP1071078B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method and apparatus
EP00121467A EP1071082B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method and generator
PCT/JP1997/004033 WO1998020483A1 (fr) 1996-11-07 1997-11-06 Generateur de vecteur de source sonore, codeur et decodeur vocal
CNB01132421XA CN1170268C (zh) 1996-11-07 1997-11-06 声音编码或解码装置及方法
KR1019980705215A KR100306817B1 (ko) 1996-11-07 1997-11-06 음원벡터생성장치및음원벡터생성방법
EP00121460A EP1071079B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method
CNB011324198A CN1170267C (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
CA002355975A CA2355975C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
DE69730316T DE69730316T2 (de) 1996-11-07 1997-11-06 Schallquellengenerator, sprachkodierer und sprachdekodierer
CNB011324228A CN1188833C (zh) 1996-11-07 1997-11-06 声源矢量生成装置及方法
DE69713633T DE69713633T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
EP99126132A EP0991054B1 (en) 1996-11-07 1997-11-06 A CELP Speech Coder or Decoder, and a Method for CELP Speech Coding or Decoding
KR1020017010774A KR20030096444A (ko) 1996-11-07 1997-11-06 음원 벡터 생성 장치 및 방법
DE69712927T DE69712927T2 (de) 1996-11-07 1997-11-06 CELP-Codec
CA002356051A CA2356051C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
DE69712539T DE69712539T2 (de) 1996-11-07 1997-11-06 Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs
CN2011100659405A CN102129862B (zh) 1996-11-07 1997-11-06 降噪装置及包括降噪装置的声音编码装置
EP99126129A EP0994462B1 (en) 1996-11-07 1997-11-06 Excitation vector generation
EP00126299A EP1136985B1 (en) 1996-11-07 1997-11-06 Apparatus and method for CELP speech coding and decoding
CNB200310114349XA CN1223994C (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
CA002355973A CA2355973C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
DE69708696T DE69708696T2 (de) 1996-11-07 1997-11-06 Verfahren und Vorrichtung zur Erzeugung eines Vektorquantisierungs-codebuchs
EP02000123A EP1217614A1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method
DE69721595T DE69721595T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
DE69708693.3T DE69708693C5 (de) 1996-11-07 1997-11-06 Verfahren und Vorrichtung für CELP Sprachcodierung oder -decodierung
CN2006101007075A CN1877698B (zh) 1996-11-07 1997-11-06 用于生成声源矢量的装置及方法
EP99126130A EP0992981B1 (en) 1996-11-07 1997-11-06 Excitation Method Generator and Excitation Vector Generating Method
CA002356041A CA2356041C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
US09/101,186 US6453288B1 (en) 1996-11-07 1997-11-06 Method and apparatus for producing component of excitation vector
KR1020017001046A KR100339168B1 (ko) 1996-11-07 1997-11-06 음원 벡터 생성 장치, 음성 부호화 장치 및 음성 복호화장치
CNA2005100714801A CN1677489A (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
DE69723324T DE69723324T2 (de) 1996-11-07 1997-11-06 Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs
CA002356049A CA2356049C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
EP00126851A EP1094447B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method
EP00121466A EP1071081B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method
CA2614625A CA2614625C (en) 1996-11-07 1997-11-06 A noise canceller for removing a noise component from an input speech signal
EP00121458A EP1074978B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation apparatus
CA002355978A CA2355978C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
DE69710794T DE69710794T2 (de) 1996-11-07 1997-11-06 Vorrichtungzur Erzeugung eines Vektorquantisierungs-Codebuchs
DE69715478T DE69715478T2 (de) 1996-11-07 1997-11-06 Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung
EP00121464A EP1071080B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method
EP00126875A EP1085504B1 (en) 1996-11-07 1997-11-06 CELP-Codec
EP00121445A EP1074977B1 (en) 1996-11-07 1997-11-06 Vector quantization codebook generation method
CN2006100799202A CN1845239B (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
KR10-2003-7012052A KR20040000406A (ko) 1996-11-07 1997-11-06 변형 벡터 생성 장치
EP97911460A EP0883107B9 (en) 1996-11-07 1997-11-06 Sound source vector generator, voice encoder, and voice decoder
DE69711715T DE69711715T2 (de) 1996-11-07 1997-11-06 Anregungsvektorerzeugung
CA002242345A CA2242345C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
AU48842/97A AU4884297A (en) 1996-11-07 1997-11-06 Sound source vector generator, voice encoder, and voice decoder
CNB011324236A CN1178204C (zh) 1996-11-07 1997-11-06 声源矢量生成装置以及声音编码装置和声音解码装置
CA2483280A CA2483280C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
HK04107703A HK1064787A1 (en) 1996-11-07 1999-05-27 Sound source vector generator, voice encoder, and voice decoder
HK02103545.2A HK1041970B (zh) 1996-11-07 1999-05-27 聲源矢量生成裝置及方法
HK02103546.1A HK1041971B (zh) 1996-11-07 1999-05-27 聲源矢量生成裝置以及聲音編碼裝置和聲音解碼裝置
HK02103542A HK1041967A1 (en) 1996-11-07 1999-05-27 Speech coder or decoder and speech coding or decoding method.
HK02103541A HK1041966A1 (en) 1996-11-07 1999-05-27 Sound source vector generator, voice encoder and voice decoder.
HK07101568.3A HK1096761A1 (en) 1996-11-07 1999-05-27 Apparatus and method for generating sound source vector
HK99102382A HK1017472A1 (en) 1996-11-07 1999-05-27 Sound source vector generator and method for generating a sound source vector.
HK04107704A HK1064788A1 (en) 1996-11-07 1999-05-27 Noise cancellator
HK02103544A HK1041969A1 (en) 1996-11-07 1999-05-27 Sound source vector generator, voice encoder and voice decoder.
HK02103543A HK1041968A1 (en) 1996-11-07 1999-05-27 Sound source vector generator, voice encoder and voice decoder.
US09/440,092 US6330535B1 (en) 1996-11-07 1999-11-15 Method for providing excitation vector
US09/440,083 US6421639B1 (en) 1996-11-07 1999-11-15 Apparatus and method for providing an excitation vector
US09/440,199 US6345247B1 (en) 1996-11-07 1999-11-15 Excitation vector generator, speech coder and speech decoder
US09/440,087 US6330534B1 (en) 1996-11-07 1999-11-15 Excitation vector generator, speech coder and speech decoder
US09/440,093 US6910008B1 (en) 1996-11-07 1999-11-15 Excitation vector generator, speech coder and speech decoder
KR1020017001040A KR100306816B1 (ko) 1996-11-07 2001-01-22 Celp 음성 부호화 또는 복호화 장치 및 방법
KR1020017001045A KR100304391B1 (ko) 1996-11-07 2001-01-22 음원 벡터 생성 장치 및 방법
KR1020017001039A KR100306815B1 (ko) 1996-11-07 2001-01-22 Celp 음성 부호화 또는 복호화 장치 및 방법
KR1020017001038A KR100306814B1 (ko) 1996-11-07 2001-01-22 Celp 음성 부호화 또는 복호화 장치 및 방법
US09/843,877 US6799160B2 (en) 1996-11-07 2001-04-30 Noise canceller
US09/843,938 US6772115B2 (en) 1996-11-07 2001-04-30 LSP quantizer
US09/843,939 US6947889B2 (en) 1996-11-07 2001-04-30 Excitation vector generator and a method for generating an excitation vector including a convolution system
US09/849,398 US7289952B2 (en) 1996-11-07 2001-05-07 Excitation vector generator, speech coder and speech decoder
US09/855,708 US6757650B2 (en) 1996-11-07 2001-05-16 Excitation vector generator, speech coder and speech decoder
US10/036,451 US20020099540A1 (en) 1996-11-07 2002-01-07 Modified vector generator
US11/126,171 US7587316B2 (en) 1996-11-07 2005-05-11 Noise canceller
US11/421,932 US7398205B2 (en) 1996-11-07 2006-06-02 Code excited linear prediction speech decoder and method thereof
US11/508,852 US20070100613A1 (en) 1996-11-07 2006-08-24 Excitation vector generator, speech coder and speech decoder
HK07103753.4A HK1097945A1 (en) 1996-11-07 2007-04-11 Sound source vector generator, voice encoder, and voice decoder
US12/134,256 US7809557B2 (en) 1996-11-07 2008-06-06 Vector quantization apparatus and method for updating decoded vector storage
US12/198,734 US20090012781A1 (en) 1996-11-07 2008-08-26 Speech coder and speech decoder
US12/781,049 US8036887B2 (en) 1996-11-07 2010-05-17 CELP speech decoder modifying an input vector with a fixed waveform to transform a waveform of the input vector
US12/870,122 US8086450B2 (en) 1996-11-07 2010-08-27 Excitation vector generator, speech coder and speech decoder
US13/302,677 US8370137B2 (en) 1996-11-07 2011-11-22 Noise estimating apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31032496A JP4006770B2 (ja) 1996-11-21 1996-11-21 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法

Publications (2)

Publication Number Publication Date
JPH10149198A JPH10149198A (ja) 1998-06-02
JP4006770B2 true JP4006770B2 (ja) 2007-11-14

Family

ID=18003871

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31032496A Expired - Lifetime JP4006770B2 (ja) 1996-11-07 1996-11-21 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法

Country Status (1)

Country Link
JP (1) JP4006770B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI19992453L (fi) * 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
JP3670217B2 (ja) 2000-09-06 2005-07-13 国立大学法人名古屋大学 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
JP4534883B2 (ja) * 2005-07-11 2010-09-01 カシオ計算機株式会社 楽音制御装置および楽音制御処理のプログラム
JP5018193B2 (ja) 2007-04-06 2012-09-05 ヤマハ株式会社 雑音抑圧装置およびプログラム
CN103250208B (zh) * 2010-11-24 2015-06-17 日本电气株式会社 信号处理装置和信号处理方法
JP5887087B2 (ja) * 2011-09-06 2016-03-16 綜合警備保障株式会社 雑音低減処理装置および雑音低減処理方法
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP2014178578A (ja) * 2013-03-15 2014-09-25 Yamaha Corp 音響処理装置
EP3217399B1 (en) * 2016-03-11 2018-11-21 GN Hearing A/S Kalman filtering based speech enhancement using a codebook based approach

Also Published As

Publication number Publication date
JPH10149198A (ja) 1998-06-02

Similar Documents

Publication Publication Date Title
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
US7379866B2 (en) Simple noise suppression model
US7181402B2 (en) Method and apparatus for synthetic widening of the bandwidth of voice signals
EP2491558B1 (en) Determining an upperband signal from a narrowband signal
US6988066B2 (en) Method of bandwidth extension for narrow-band speech
RU2470385C2 (ru) Система и способ улучшения декодированного тонального звукового сигнала
US8069038B2 (en) System for bandwidth extension of narrow-band speech
EP1252621B1 (en) System and method for modifying speech signals
EP1638083A1 (en) Bandwidth extension of bandlimited audio signals
EP3457402B1 (en) Noise-adaptive voice signal processing method and terminal device employing said method
KR20010101422A (ko) 매핑 매트릭스에 의한 광대역 음성 합성
JPH09152900A (ja) 予測符号化における人間聴覚モデルを使用した音声信号量子化法
JPH09152895A (ja) 合成フィルタの周波数応答に基づく知覚ノイズマスキング測定法
WO2010091013A1 (en) Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
Pulakka et al. Speech bandwidth extension using gaussian mixture model-based estimation of the highband mel spectrum
JPH09152898A (ja) 符号化されたパラメータのない音声信号の合成法
EP1386313B1 (en) Speech enhancement device
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP4006770B2 (ja) ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
JP2004272292A (ja) 音信号加工方法
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
JP7335968B2 (ja) Mdct係数からのスペクトル形状予測
JP3183104B2 (ja) ノイズ削減装置
EP3281197B1 (en) Audio encoder and method for encoding an audio signal
JP2003058186A (ja) 雑音抑圧方法および雑音抑圧装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20031212

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120907

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130907

Year of fee payment: 6

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term