JP4440332B2 - 音信号加工方法及び音信号加工装置 - Google Patents
音信号加工方法及び音信号加工装置 Download PDFInfo
- Publication number
- JP4440332B2 JP4440332B2 JP2009158538A JP2009158538A JP4440332B2 JP 4440332 B2 JP4440332 B2 JP 4440332B2 JP 2009158538 A JP2009158538 A JP 2009158538A JP 2009158538 A JP2009158538 A JP 2009158538A JP 4440332 B2 JP4440332 B2 JP 4440332B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- sound
- decoded
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 title claims abstract description 138
- 230000005236 sound signal Effects 0.000 title claims abstract description 28
- 238000003672 processing method Methods 0.000 title claims description 16
- 238000009499 grossing Methods 0.000 claims description 70
- 238000001228 spectrum Methods 0.000 abstract description 187
- 238000000034 method Methods 0.000 abstract description 132
- 230000008569 process Effects 0.000 abstract description 89
- 238000013139 quantization Methods 0.000 abstract description 47
- 230000009466 transformation Effects 0.000 abstract description 40
- 230000001965 increasing effect Effects 0.000 abstract description 21
- 238000011156 evaluation Methods 0.000 description 67
- 230000000694 effects Effects 0.000 description 58
- 230000001629 suppression Effects 0.000 description 44
- 238000004364 calculation method Methods 0.000 description 37
- 230000003595 spectral effect Effects 0.000 description 30
- 230000006866 deterioration Effects 0.000 description 15
- 230000015556 catabolic process Effects 0.000 description 14
- 238000006731 degradation reaction Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000003247 decreasing effect Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 241001123248 Arma Species 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004260 weight control Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
図1は、本実施の形態による音信号加工方法を適用した音声復号方法の全体構成を示し、図中1は音声復号装置、2はこの発明による信号加工方法を実行する信号加工部、3は音声符号、4は音声復号部、5は復号音声、6は出力音声である。信号加工部2は、信号変形部7、信号評価部12、重み付き加算部18より構成されている。信号変形部7は、フーリエ変換部8、振幅平滑化部9、位相擾乱部10、逆フーリエ部11より構成されている。信号評価部12は、逆フィルタ部13、パワー算出部14、背景雑音らしさ算出部15、推定背景雑音パワー更新部16、推定雑音スペクトル更新部17より構成されている。
得られた所定の長さ(1フレーム長)の信号を復号音声5として出力する。そして、この復号音声5は、信号加工部2内の信号変形部7、信号評価部12、重み付き加算部18に入力される。
ここで、xiが現在のフレーム(第iフレーム)の平滑化前の対数振幅スペクトル値、yi−1が前フレーム(第i−1フレーム)の平滑化後の対数振幅スペクトル値、yiが現在のフレーム(第iフレーム)の平滑化後の対数振幅スペクトル値、αが0〜1の値を持つ平滑化係数である、平滑化係数αはフレーム長、解消したい劣化音のレベルなどによって最適値が異なるが、概ね0.5程度の値となる。
ここで、pがパワー算出部14から入力されたパワー、pNが推定雑音パワー更新部16内に格納されている推定雑音パワー、vが算出された背景雑音らしさである。
ここで、βは0〜1の値を取る更新速度定数で、比較的0に近い値に設定するとよい。この式の右辺の値を求めて、左辺のpN′を新しい推定雑音パワーとすることで更新を行う。
ィルタ部13にて説明した通りで、多くの場合LSPを使用する。そして、背景雑音らしさ算出部15から入力され背景雑音らしさとここで算出したスペクトルパラメータを用いて、内部に格納してある推定雑音スペクトルを更新する。例えば、入力された背景雑音らしさが高い(vの値が大きい)時に、次式に従い、算出したスペクトルパラメータを推定雑音スペクトルに反映させることで更新を行う。
ここで、xが現在のフレームのスペクトルパラメータ、xNが推定雑音スペクトル(パラメータ)である。γは0〜1の値を取る更新速度定数で、比較的0に近い値に設定するとよい。この式の右辺の値を求めて、左辺のxN′を新しい推定雑音スペクトル(パラメータ)とすることで更新を行う。
存する。
(n= −NX,…,N−NX−1)
ここで、y(n)が出力音声6である。この時、信号加工部2としての処理遅延は最低でもNXだけ必要となる。
(n= 0,…,N−1)
この場合、復号音声5と変形復号音声34の時間関係にズレがあるので、位相擾乱部10における擾乱が弱い(つまり復号音声の位相特性がある程度残っている)場合や、フレーム内でスペクトルやパワーが急変する場合には劣化を生じる場合がある。特に重み付き加算部18における重み付け係数が大きく変化するときと、2つの重み付け係数が拮抗している場合に劣化を生じ易い。しかし、それらの劣化は比較的少なく、信号加工部の導入効果の方が十分に大きい。よって処理遅延NXが許容できない適用対象についても、この方法を用いることができる。
図4は、本実施の形態による音信号加工方法を雑音抑圧方法と組み合わて適用した音信号加工装置の構成の一部を示す。図中36は入力信号、8はフーリエ変換部、19は雑音抑圧部、39はスペクトル変形部、12は信号評価部、18は重み付き加算部、11は逆フーリエ変換部、40は出力信号である。スペクトル変形部39は、振幅平滑化部9、位相擾乱部10より構成されている。
以下、図に基づいて動作を説明する。
変形雑音抑圧スペクトル)を生成し、所定の評価値(背景雑音らしさ)によって加工前のスペクトルと加工スペクトルの加算重みを制御するようにしたので、劣化成分が多く含まれて主観品質の低下につながっている区間(背景雑音区間)を中心に加工スペクトルの比率を増やして、主観品質を改善できる効果がある。
図1との対応部分に同一符号を付けた図5は、本実施の形態による音信号加工方法を適用した音声復号装置の全体構成を示し、図中20は信号変形部7の変形強度を制御する情報を出力する変形強度制御部である。変形強度制御部20は、聴覚重み付け部21、フーリエ変換部22、レベル判定部23、連続性判定部24、変形強度算出部25より構成されている。
に出力する。ここで、聴覚重み付け処理としては、音声符号化処理(音声復号部4で行った音声復号処理と対を成すもの)で使用されているものと同様な処理を行う。
平均値を求めて、この平均値に所定の閾値Thを加算して、これを上回る成分に対しては第一の変形強度を0、これを下回る成分に対しては第一の変形強度を1とすればよい。図6には、この閾値Thを用いた場合の聴覚重み付けスペクトルと第一の変形強度の関係を示す。なお、第一の変形強度の算出方法はこれに限定されるものではない。
(復号音声)の各周波数成分毎の振幅の大きさ、各周波数毎の振幅や位相の連続性の大きさに基づいて、加工信号(変形復号音声)を生成する際の変形強度を周波数毎に制御するようにしたので、実施の形態1が持つ効果に加えて、前記振幅スペクトル成分が小さいために量子化雑音や劣化成分が支配的になっている成分、スペクトル成分の連続性が低いために量子化雑音や劣化成分が多くなりがちな成分に対して重点的に加工が加えられ、量子化雑音や劣化成分が少ない良好な成分まで加工してしまうことがなくなり、入力信号や実際の背景雑音の特性を比較的良好に残しつつ量子化雑音や劣化成分を主観的に抑圧でき、主観品質を改善できる効果がある。
図5との対応部分に同一符号を付けた図7は、本実施の形態による音信号加工方法を適用した音声復号装置の全体構成を示し、図中41は加算制御値分割部であり、図5における信号変形部7の部分は、フーリエ変換部8、スペクトル変形部39、逆フーリエ変換部11の構成に変更している。
毎の変形強度と、信号評価部12から入力された加算制御値35を用いて、周波数毎の加算制御値42を生成し、これを重み付き加算部18に出力する。変形強度が強い周波数については、その周波数の加算制御値42の値を制御して、重み付き加算部18における復号音声スペクトル43の重みを弱く、変形復号音声スペクトル44の重みを強くする。逆に変形強度が弱い周波数については、その周波数の加算制御値42の値を制御して、重み付き加算部18における復号音声スペクトル43の重みを強く、変形復号音声スペクトル44の重みを弱くする。つまり、変形強度が強い周波数については、背景雑音らしさが高いわけであるので、その周波数の加算制御値42を大きくし、逆の場合には、小さくするわけである。
この実施の形態4によれば、入力信号(復号音声)または聴覚重み付けされた入力信号(復号音声)の各周波数成分毎の振幅の大きさ、各周波数毎の振幅や位相の連続性の大きさに基づいて、入力信号のスペクトル(復号音声スペクトル)と加工スペクトル(変形復号音声スペクトル)の重み付け加算を周波数成分毎に独立に制御するようにしたので、実施の形態1が持つ効果に加えて、前記振幅スペクトル成分が小さいために量子化雑音や劣化成分が支配的になっている成分、スペクトル成分の連続性が低いために量子化雑音や劣化成分が多くなりがちな成分に対して重点的に加工スペクトルの重みを強め、量子化雑音や劣化成分が少ない良好な成分まで加工スペクトルの重みを強めてしまうことがなくなり、入力信号や実際の背景雑音の特性を比較的良好に残しつつ量子化雑音や劣化成分を主観的に抑圧でき、主観品質を改善できる効果がある。
図5との対応部分に同一符号を付けた図8は、本実施の形態による音信号加工方法を適用した音声復号装置の全体構成を示し、図中26は背景雑音らしさ(加算制御値35)の時間方向の変動性を判定する変動性判定部である。
加算制御値35などのフレーム(またはサブフレーム)の特性を表すパラメータの時間方向の変動性が高い場合には、復号音声5のスペクトルが時間方向に大きく変化している場合が多く、必要以上に強い振幅平滑化や位相擾乱付与を行うと不自然な反響感が発生してしまう。そこで、この第三の変形強度は、加算制御値35の時間方向の変動性が高い場合には、振幅平滑化部9における平滑化と位相擾乱部10における擾乱付与が弱くなるように設定する。なお、フレーム(またはサブフレーム)の特性を表すパラメータであれば、復号音声のパワー、スペクトル包絡パラメータなど、加算制御値35以外のパラメータを用いても同様の効果を得ることができる。
三の変形強度については一方のみを制御対象とする構成でも構わない。
図5との対応部分に同一符号を付けた図9は、本実施の形態による音信号加工方法を適用した音声復号装置の全体構成を示す。図中27は摩擦音らしさ評価部、31は背景雑音らしさ評価部、45は加算制御値算出部である。摩擦音らしさ評価部27は、低域カットフィルタ28、零交差数カウント部29、摩擦音らしさ算出部30より構成される。背景雑音らしさ評価部31は、図5における信号評価部12と同じ構成であり、逆フィルタ部13、パワー算出部14、背景雑音らしさ算出部15、推定雑音パワー更新部16、推定雑音スペクトル更新部17より構成される。信号評価部12は、図5の場合と異なり、摩擦音らしさ評価部27、背景雑音らしさ評価部31、加算制御値算出部45より構成される。
音らしさを段階的に設定したり、所定の関数を用意しておいて、零交差数から連続的な値の摩擦音らしさを算出するようにしても良い。
図1との対応部分に同一符号を付けた図10は、本実施の形態による信号加工方法を適用した音声復号装置の全体構成を示し、図中32はポストフィルタ部である。
4内に含まれるもの、もしくは存在しないものの何れにも適用可能なものについて説明したが、この実施の形態7では、音声復号部4内にポストフィルタ処理が含まれるものからポストフィルタ処理の全部もしくは一部をポストフィルタ部32として独立させている。
図10との対応部分に同一符号を付けた図11は、本実施の形態による音信号加工方法を適用した音声復号装置の全体構成を示し、図中33は音声復号部4内で生成されたスペクトルパラメータである。図10との相違点としては、実施の形態3と同様の変形強度制
御部20が追加され、スペクトルパラメータ33が音声復号部4から信号評価部12と変形強度制御部20に入力されている点である。
フーリエ変換部8、振幅平滑化部9、位相擾乱部10、逆フーリエ変換部11の処理を行い、得られた変形復号音声34を重み付き加算部18に出力する。
以降のポストフィルタ部32、重み付き加算部18の動作については、実施の形態7と同様であるため、説明を省略する。
上記図7に示す実施の形態4の構成において、加算制御値分割部41が、重み付け加算部18にて加算される変形復号音声スペクトル44の周波数毎の重みを乗じた後のスペクトルの概形が、量子化雑音の推定スペクトル形状に一致するように、出力する変形強度を制御することも可能である。
上記実施の形態1、実施の形態3ないし8の構成において、振幅平滑化部9の処理内で、平滑化後の振幅スペクトルが推定量子化雑音の振幅スペクトル形状に一致するように加工することも可能である。なお、推定量子化雑音の振幅スペクトル形状の算出は、実施の形態9と同様にして行えばよい。
上記実施の形態1、実施の形態3ないし10では、信号加工部2を復号音声5の加工に
使用しているが、この信号加工部2のみを取り出して、音響信号復号部(音響信号符号化に対する復号部)、雑音抑圧処理の後段に接続するなど、他の信号加工処理に使用することもできる。但し、解消したい劣化成分の特性に応じて、信号変形部における変形処理、信号評価部における評価方法を変更、調整することが必要になる。
上記実施の形態1ないし11では、現在のフレームまでの信号を用いて該信号の加工を行っているが、処理遅延の発生を許して次フレーム以降の信号も使用する構成も可能である。
上記実施の形態1、実施の形態3、実施の形態5ないし12では、フーリエ変換によってスペクトル成分を算出し、変形処理を行って、逆フーリエ変換によって信号領域に戻しているが、フーリエ変換の代わりにバンドパスフィルタ群の各出力に対して、変形処理を行い、帯域別信号の加算によって信号を再構築する構成も可能である。
上記実施の形態1ないし13では、振幅平滑化部9と位相擾乱部10の両方を備えた構成であったが、振幅平滑化部9と位相擾乱部10の一方を省略した構成も可能であるし、更に別の変形部を導入した構成も可能である。
Claims (4)
- 音声符号から複数のパラメータを生成し、当該複数のパラメータを用いて前記音声符号に対応した復号音声を生成する復号音声生成ステップと、
前記復号音声生成ステップによって生成された前記復号音声の振幅を時間軸方向に平滑化して第一の加工音声を生成する第一加工音声生成ステップと、
前記復号音声と前記第一の加工音声とを混合して第二の加工音声を生成する第二加工音声生成ステップであって、前記復号音声生成ステップによって生成された複数のパラメータの少なくとも1つに基づく前記復号音声の雑音らしさが高くなるにつれて大きくなる第一の重み付け係数と、周波数成分毎に異なる第二の重み付け係数とで重み付けられた前記第一の加工音声と、前記復号音声とを加算して第二の加工音声を生成する第二加工音声生成ステップとを備えたことを特徴とする音信号加工方法。 - 音声符号から複数のパラメータを生成し、当該複数のパラメータを用いて前記音声符号に対応した復号音声を生成する復号音声生成ステップと、
前記復号音声生成ステップによって生成された前記復号音声の振幅を時間軸方向に平滑化して第一の加工音声を生成する第一加工音声生成ステップと、
前記復号音声と前記第一の加工音声とを混合して第二の加工音声を生成する第二加工音声生成ステップであって、前記復号音声生成ステップにおいて生成された複数のパラメータの少なくとも1つに基づく混合比であって、前記復号音声の雑音らしさが高くなるにつれて、前記第二の加工音声における前記第一の加工音声の比率が大きくなるような混合比であり、前記第二の加工音声における前記第一の加工音声の比率が周波数成分毎に異なるような混合比で前記復号音声と前記第一の加工音声とを混合する第二加工音声生成ステップとを備えたことを特徴とする音信号加工方法。 - 音声符号から複数のパラメータを生成し、当該複数のパラメータを用いて前記音声符号に対応した復号音声を生成する復号音声生成手段と、
前記復号音声生成手段によって生成された前記復号音声の振幅を時間軸方向に平滑化して第一の加工音声を生成する第一加工音声生成手段と、
前記復号音声と前記第一の加工音声とを混合して第二の加工音声を生成する第二加工音声生成手段であって、前記復号音声生成手段によって生成された複数のパラメータの少なくとも1つに基づく前記復号音声の雑音らしさが高くなるにつれて大きくなる第一の重み付け係数と、周波数成分毎に異なる第二の重み付け係数とで重み付けられた前記第一の加工音声と、前記復号音声とを加算して第二の加工音声を生成する第二加工音声生成手段とを備えたことを特徴とする音信号加工装置。 - 音声符号から複数のパラメータを生成し、当該複数のパラメータを用いて前記音声符号に対応した復号音声を生成する復号音声生成手段と、
前記復号音声生成手段によって生成された前記復号音声の振幅を時間軸方向に平滑化して第一の加工音声を生成する第一加工音声生成手段と、
前記復号音声と前記第一の加工音声とを混合して第二の加工音声を生成する第二加工音声生成手段であって、前記復号音声生成手段において生成された複数のパラメータの少なくとも1つに基づく混合比であって、前記復号音声の雑音らしさが高くなるにつれて、前記第二の加工音声における前記第一の加工音声の比率が大きくなるような混合比であり、前記第二の加工音声における前記第一の加工音声の比率が周波数成分毎に異なるような混合比で前記復号音声と前記第一の加工音声とを混合する第二加工音声生成手段とを備えたことを特徴とする音信号加工装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009158538A JP4440332B2 (ja) | 1997-12-08 | 2009-07-03 | 音信号加工方法及び音信号加工装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33680397 | 1997-12-08 | ||
JP2009158538A JP4440332B2 (ja) | 1997-12-08 | 2009-07-03 | 音信号加工方法及び音信号加工装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006316566A Division JP4358221B2 (ja) | 1997-12-08 | 2006-11-24 | 音信号加工方法及び音信号加工装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009255958A Division JP4567803B2 (ja) | 1997-12-08 | 2009-11-09 | 音信号加工方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009230154A JP2009230154A (ja) | 2009-10-08 |
JP4440332B2 true JP4440332B2 (ja) | 2010-03-24 |
Family
ID=18302839
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009158538A Expired - Lifetime JP4440332B2 (ja) | 1997-12-08 | 2009-07-03 | 音信号加工方法及び音信号加工装置 |
JP2009255958A Expired - Lifetime JP4567803B2 (ja) | 1997-12-08 | 2009-11-09 | 音信号加工方法 |
JP2010131107A Expired - Lifetime JP4684359B2 (ja) | 1997-12-08 | 2010-06-08 | 音信号加工装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009255958A Expired - Lifetime JP4567803B2 (ja) | 1997-12-08 | 2009-11-09 | 音信号加工方法 |
JP2010131107A Expired - Lifetime JP4684359B2 (ja) | 1997-12-08 | 2010-06-08 | 音信号加工装置 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6526378B1 (ja) |
EP (1) | EP1041539A4 (ja) |
JP (3) | JP4440332B2 (ja) |
KR (1) | KR100341044B1 (ja) |
CN (1) | CN1192358C (ja) |
AU (1) | AU730123B2 (ja) |
CA (1) | CA2312721A1 (ja) |
IL (1) | IL135630A0 (ja) |
NO (1) | NO20002902L (ja) |
WO (1) | WO1999030315A1 (ja) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
JP3558031B2 (ja) * | 2000-11-06 | 2004-08-25 | 日本電気株式会社 | 音声復号化装置 |
DE10056498B4 (de) * | 2000-11-15 | 2006-07-06 | BSH Bosch und Siemens Hausgeräte GmbH | Programmgesteuertes Haushaltgerät mit verbessertem Geräuschbild |
JP2002287782A (ja) * | 2001-03-28 | 2002-10-04 | Ntt Docomo Inc | イコライザ装置 |
JP3568922B2 (ja) | 2001-09-20 | 2004-09-22 | 三菱電機株式会社 | エコー処理装置 |
DE10148351B4 (de) * | 2001-09-29 | 2007-06-21 | Grundig Multimedia B.V. | Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus |
US20030135374A1 (en) * | 2002-01-16 | 2003-07-17 | Hardwick John C. | Speech synthesizer |
WO2003063160A1 (en) * | 2002-01-25 | 2003-07-31 | Koninklijke Philips Electronics N.V. | Method and unit for substracting quantization noise from a pcm signal |
US7277537B2 (en) * | 2003-09-02 | 2007-10-02 | Texas Instruments Incorporated | Tone, modulated tone, and saturated tone detection in a voice activity detection device |
AU2003274864A1 (en) * | 2003-10-24 | 2005-05-11 | Nokia Corpration | Noise-dependent postfiltering |
JP4518817B2 (ja) * | 2004-03-09 | 2010-08-04 | 日本電信電話株式会社 | 収音方法、収音装置、収音プログラム |
US7454333B2 (en) * | 2004-09-13 | 2008-11-18 | Mitsubishi Electric Research Lab, Inc. | Separating multiple audio signals recorded as a single mixed signal |
CN101027719B (zh) * | 2004-10-28 | 2010-05-05 | 富士通株式会社 | 噪声抑制装置 |
US8520861B2 (en) * | 2005-05-17 | 2013-08-27 | Qnx Software Systems Limited | Signal processing system for tonal noise robustness |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
JP5255575B2 (ja) * | 2007-03-02 | 2013-08-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | レイヤード・コーデックのためのポストフィルタ |
JP5198477B2 (ja) * | 2007-03-05 | 2013-05-15 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 定常的な背景雑音の平滑化を制御するための方法及び装置 |
RU2433525C1 (ru) * | 2007-07-13 | 2011-11-10 | Долби Лэборетериз Лайсенсинг Корпорейшн | Изменяющийся во времени уровень звукового сигнала с использованием изменяющейся во времени оценочной плотности вероятности уровня |
JP4914319B2 (ja) * | 2007-09-18 | 2012-04-11 | 日本電信電話株式会社 | コミュニケーション音声処理方法とその装置、及びそのプログラム |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
JP5153886B2 (ja) * | 2008-10-24 | 2013-02-27 | 三菱電機株式会社 | 雑音抑圧装置および音声復号化装置 |
JP2010160496A (ja) * | 2010-02-15 | 2010-07-22 | Toshiba Corp | 信号処理装置および信号処理方法 |
JP4869420B2 (ja) * | 2010-03-25 | 2012-02-08 | 株式会社東芝 | 音情報判定装置、及び音情報判定方法 |
CN103250208B (zh) * | 2010-11-24 | 2015-06-17 | 日本电气株式会社 | 信号处理装置和信号处理方法 |
WO2012114628A1 (ja) * | 2011-02-26 | 2012-08-30 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び記憶媒体 |
JP5898515B2 (ja) * | 2012-02-15 | 2016-04-06 | ルネサスエレクトロニクス株式会社 | 半導体装置及び音声通信装置 |
EP2845191B1 (en) | 2012-05-04 | 2019-03-13 | Xmos Inc. | Systems and methods for source signal separation |
US10497381B2 (en) | 2012-05-04 | 2019-12-03 | Xmos Inc. | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation |
JP6027804B2 (ja) * | 2012-07-23 | 2016-11-16 | 日本放送協会 | 雑音抑圧装置およびそのプログラム |
WO2014083999A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
WO2014084000A1 (ja) * | 2012-11-27 | 2014-06-05 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
ES2961553T3 (es) * | 2013-03-04 | 2024-03-12 | Voiceage Evs Llc | Dispositivo y método para reducir el ruido de cuantificación en un decodificador de dominio del tiempo |
US9858946B2 (en) | 2013-03-05 | 2018-01-02 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
WO2014136629A1 (ja) | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US9728182B2 (en) | 2013-03-15 | 2017-08-08 | Setem Technologies, Inc. | Method and system for generating advanced feature discrimination vectors for use in speech recognition |
JP2014178578A (ja) * | 2013-03-15 | 2014-09-25 | Yamaha Corp | 音響処理装置 |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
JP6379839B2 (ja) * | 2014-08-11 | 2018-08-29 | 沖電気工業株式会社 | 雑音抑圧装置、方法及びプログラム |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
WO2018052004A1 (ja) * | 2016-09-15 | 2018-03-22 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
JP6759927B2 (ja) * | 2016-09-23 | 2020-09-23 | 富士通株式会社 | 発話評価装置、発話評価方法、および発話評価プログラム |
JP7147211B2 (ja) * | 2018-03-22 | 2022-10-05 | ヤマハ株式会社 | 情報処理方法および情報処理装置 |
CN110660403B (zh) * | 2018-06-28 | 2024-03-08 | 北京搜狗科技发展有限公司 | 一种音频数据处理方法、装置、设备及可读存储介质 |
CN111477237B (zh) * | 2019-01-04 | 2022-01-07 | 北京京东尚科信息技术有限公司 | 音频降噪方法、装置和电子设备 |
CN111866026B (zh) * | 2020-08-10 | 2022-04-12 | 四川湖山电器股份有限公司 | 一种用于语音会议的语音数据丢包处理系统及处理方法 |
BR112023006291A2 (pt) * | 2020-10-09 | 2023-05-09 | Fraunhofer Ges Forschung | Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro |
AU2021357364B2 (en) * | 2020-10-09 | 2024-06-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing |
WO2022190245A1 (ja) * | 2021-03-10 | 2022-09-15 | 三菱電機株式会社 | 騒音抑圧装置、騒音抑圧方法、及び騒音抑圧プログラム |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57148429A (en) * | 1981-03-10 | 1982-09-13 | Victor Co Of Japan Ltd | Noise reduction device |
JPS57184332A (en) * | 1981-05-09 | 1982-11-13 | Nippon Gakki Seizo Kk | Noise eliminating device |
JPS5957539A (ja) * | 1982-09-27 | 1984-04-03 | Sony Corp | 適応的符号化装置 |
JPS61123898A (ja) * | 1984-11-20 | 1986-06-11 | 松下電器産業株式会社 | 音色加工装置 |
US4937873A (en) * | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
JPS6424572A (en) | 1987-07-20 | 1989-01-26 | Victor Company Of Japan | Noise reducing circuit |
JPH01123898A (ja) | 1987-11-07 | 1989-05-16 | Yoshitaka Satoda | カラーバブルソープ |
JP2898637B2 (ja) * | 1987-12-10 | 1999-06-02 | 株式会社東芝 | 音声信号分析方法 |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US4933973A (en) * | 1988-02-29 | 1990-06-12 | Itt Corporation | Apparatus and methods for the selective addition of noise to templates employed in automatic speech recognition systems |
US5276765A (en) * | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
JPH02266717A (ja) * | 1989-04-07 | 1990-10-31 | Kyocera Corp | ディジタルオーディオ信号の符号化復号化装置 |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP3094522B2 (ja) * | 1991-07-19 | 2000-10-03 | 株式会社日立製作所 | ベクトル量子化方法及びその装置 |
EP0537948B1 (en) * | 1991-10-18 | 1997-09-03 | AT&T Corp. | Method and apparatus for smoothing pitch-cycle waveforms |
JP2563719B2 (ja) * | 1992-03-11 | 1996-12-18 | 技術研究組合医療福祉機器研究所 | 音声加工装置と補聴器 |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
JPH07184332A (ja) | 1993-12-24 | 1995-07-21 | Toshiba Corp | 電子機器システム |
JP3353994B2 (ja) | 1994-03-08 | 2002-12-09 | 三菱電機株式会社 | 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム |
JP2964879B2 (ja) | 1994-08-22 | 1999-10-18 | 日本電気株式会社 | ポストフィルタ |
JPH0863194A (ja) * | 1994-08-23 | 1996-03-08 | Hitachi Denshi Ltd | 残差駆動形線形予測方式ボコーダ |
JPH08154179A (ja) * | 1994-09-30 | 1996-06-11 | Sanyo Electric Co Ltd | 画像処理装置およびその装置を用いた画像通信装置 |
JP3568255B2 (ja) | 1994-10-28 | 2004-09-22 | 富士通株式会社 | 音声符号化装置及びその方法 |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
JPH1049197A (ja) * | 1996-08-06 | 1998-02-20 | Denso Corp | 音声復元装置及び音声復元方法 |
JP3269969B2 (ja) * | 1996-05-21 | 2002-04-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
JPH10171497A (ja) * | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
JP3454403B2 (ja) * | 1997-03-14 | 2003-10-06 | 日本電信電話株式会社 | 帯域分割型雑音低減方法及び装置 |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6167375A (en) * | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
US6092039A (en) * | 1997-10-31 | 2000-07-18 | International Business Machines Corporation | Symbiotic automatic speech recognition and vocoder |
-
1998
- 1998-12-07 AU AU13527/99A patent/AU730123B2/en not_active Ceased
- 1998-12-07 CA CA002312721A patent/CA2312721A1/en not_active Abandoned
- 1998-12-07 KR KR1020007006191A patent/KR100341044B1/ko not_active IP Right Cessation
- 1998-12-07 WO PCT/JP1998/005514 patent/WO1999030315A1/ja not_active Application Discontinuation
- 1998-12-07 IL IL13563098A patent/IL135630A0/xx unknown
- 1998-12-07 CN CNB988119285A patent/CN1192358C/zh not_active Expired - Fee Related
- 1998-12-07 EP EP98957198A patent/EP1041539A4/en not_active Withdrawn
-
2000
- 2000-05-10 US US09/568,127 patent/US6526378B1/en not_active Expired - Fee Related
- 2000-06-07 NO NO20002902A patent/NO20002902L/no unknown
-
2009
- 2009-07-03 JP JP2009158538A patent/JP4440332B2/ja not_active Expired - Lifetime
- 2009-11-09 JP JP2009255958A patent/JP4567803B2/ja not_active Expired - Lifetime
-
2010
- 2010-06-08 JP JP2010131107A patent/JP4684359B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN1281576A (zh) | 2001-01-24 |
JP2010237703A (ja) | 2010-10-21 |
CN1192358C (zh) | 2005-03-09 |
KR20010032862A (ko) | 2001-04-25 |
JP2009230154A (ja) | 2009-10-08 |
JP4567803B2 (ja) | 2010-10-20 |
NO20002902D0 (no) | 2000-06-07 |
JP2010033072A (ja) | 2010-02-12 |
EP1041539A1 (en) | 2000-10-04 |
WO1999030315A1 (fr) | 1999-06-17 |
CA2312721A1 (en) | 1999-06-17 |
IL135630A0 (en) | 2001-05-20 |
NO20002902L (no) | 2000-06-07 |
KR100341044B1 (ko) | 2002-07-13 |
EP1041539A4 (en) | 2001-09-19 |
US6526378B1 (en) | 2003-02-25 |
AU730123B2 (en) | 2001-02-22 |
AU1352799A (en) | 1999-06-28 |
JP4684359B2 (ja) | 2011-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4440332B2 (ja) | 音信号加工方法及び音信号加工装置 | |
US8255222B2 (en) | Speech separating apparatus, speech synthesizing apparatus, and voice quality conversion apparatus | |
RU2667029C2 (ru) | Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки, модифицирующего сигнал возбуждения во временной области | |
JP4945586B2 (ja) | 信号帯域拡張装置 | |
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
EP1327241B1 (en) | Perceptually improved enhancement of encoded acoustic signals | |
EP1638083A1 (en) | Bandwidth extension of bandlimited audio signals | |
JP4230414B2 (ja) | 音信号加工方法及び音信号加工装置 | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
US11367453B2 (en) | Apparatus and method for generating an error concealment signal using power compensation | |
JP2004512561A (ja) | 符号化音響信号の復号に関するエラー隠匿 | |
AU2001284607A1 (en) | Perceptually improved enhancement of encoded acoustic signals | |
US20200273466A1 (en) | Apparatus and method for generating an error concealment signal using individual replacement LPC representations for individual codebook information | |
JP4358221B2 (ja) | 音信号加工方法及び音信号加工装置 | |
CN109416911B (zh) | 声音合成装置及声音合成方法 | |
Kornagel | Techniques for artificial bandwidth extension of telephone speech | |
RU2707144C2 (ru) | Аудиокодер и способ для кодирования аудиосигнала | |
JPH10149198A (ja) | ノイズ削減装置 | |
JP3360423B2 (ja) | 音声強調装置 | |
Vaillancourt et al. | New post-processing techniques for low bit rate celp codecs | |
JPH08110796A (ja) | 音声強調方法および装置 | |
JPH09160595A (ja) | 音声合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100105 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100106 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |