JPH10509256A - ピッチ操作器を使用する音声信号の変換方法 - Google Patents
ピッチ操作器を使用する音声信号の変換方法Info
- Publication number
- JPH10509256A JPH10509256A JP8517145A JP51714596A JPH10509256A JP H10509256 A JPH10509256 A JP H10509256A JP 8517145 A JP8517145 A JP 8517145A JP 51714596 A JP51714596 A JP 51714596A JP H10509256 A JPH10509256 A JP H10509256A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- pitch
- frequency
- hearing
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Electrophonic Musical Instruments (AREA)
- Selective Calling Equipment (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
音声信号の変換であって、音声信号を2つの信号部分(a、b)に分離することを含み、ここに(a)は準静止部分を表し、また(b)は信号の過度部分を表す。信号(b)は、逆にフィルタを通し、そして過度検出器とピッチ操作器とに並列に供給され、他方信号(a)はスペクトル分析を受ける。本発明の変換回路は、どの様な音声信号にも良く定義された操作が可能であり、これは、一部には難聴者にとって、一部には雑音環境での正常な聴取能力を持つ人にとって有利である。最後に、本発明の回路は、良く定義された音の合成に極めて便利なことが見出されており、これは補聴器(聴力損失シミュレータ)の制御において大いに重要である。
Description
【発明の詳細な説明】
ピッチ操作器を使用する音声信号の変換方法
本発明は、音声信号を変換する方法に関し、この音声信号は2つの信号部分a
、b、に分離され、ここにaは、ホルマント周波数についての情報をもつ信号の
準静止部分を表し、またbは、ピッチ周波数及びストップ子音についての情報を
もつ信号の過度部分である,残余信号を表し、信号bは、音声信号の逆フィルタ
を通すことにより発生する。
この様な方法は、米国特許明細書第5060258号から知られ、また、U.
ハートマン、K.ヘルマンセン及びF.K.フィンクによる論文「ひどい難聴者
のための特徴抽出」、D.S.P.グループ、電子システム研究所、アルボーグ
大学、1993年9月、及びK.ヘルマンセン、P.ルバク、U.ハートマン、
及びF.K.フィンクによる論文「パルトランツールを使用した音声信号のスペ
クトル鋭利化」、アルボーグ大学から知られている。
上の論文の記載の様に、音声信号は2つの信号部分に分離され、その一方は、
スペクトルにより記述され、他方は、時間信号である。スペクトル信号は、LP
C(線形予測コーディング)に基づき、FFT変換に基づき又は他の方法で計算
できる。分析により作られるスペクトルは、複数の二次並列セクションに分割で
き、また論文に開示されている様に、これらのセクションは、3つのパラメタに
より特徴づけられ、これらのパラメタは、共振周波数fo、Q値
及びおよそ周波数foであるスペクトル部分のパワーであり、これらのパラメタ
でLPC又はFFTスペクトルを変換(即ち、操作)することができる。さらに
、この信号は、典型的には、いわゆるホルマントからなり、これらは、ボーカル
区域における共振周波数であり、又は別な言い方では、この信号は、音声信号の
情報内容のかなりの部分を記述している。
LPC分析(逆フィルタの通過)により発生する第2の信号は、残余信号であ
り、これは、発声された音に関して音声信号のトーン又はピッチ表し、これは、
典型的には100から300Hzの範囲にある。例えば、男性の音声は低い周波
数をもち、他方女性の音声は幾分高い値をもつ。上述の、トーン周波数又はピッ
チ周波数は、音声和音により発生する毎秒当たりのパルスの数で定義される。
さて、音声信号は、次に述べる様な多くの用途に使用するため、2つのサブ信
号の手段により、幾つかの方法で操作することができる。
例えば、上述の形式の音声信号の変換は、次のために使用される。
a)正常な、並びに損なわれた聴取能力をもつ人々のために、雑音環境におい
てスピーチの理解し易さを改善する見地から音声ピクチャーを変える。
b)酷く損なわれた聴取能力をもつ人々のスピーチの理解し易さと快適さを改
善する見地から音声ピクチャーを変える。
c)例えば、補聴器のテストに使用するため、聴力損失をシミュレートする。
前述のように、上述の論文に従えば,音声信号の変換の大きな利点は、ホルマ
ント周波数と共の残余信号を、相互に関係無く操作できることである。事実は、
もし完全な音声信号が、10%(正常な聴力をもつ人に対して)より多く圧縮/
伸長されると、音声品質は、部分的に破壊されることである。この制約は、もし
ピッチ信号が維持され、そしてホルマント周波数が減少されるならば、同じ程度
には適用できない。
しかし、上述の論文に従った信号処理は、改善できることが見出だされている
。もし例えば、扉がぴしゃりと閉じると、どの様な型でも、補聴器をもっている
難聴者は、容易に不快な驚きを感じるが、それは、補聴器の回路は、この急激な
信号を十分に早く減衰できないからである。
上の論文で述べている回路において、例えば、扉がぴしゃりと閉じる音の様な
、音のトランジェントは、LPC分析において実質的にはモデル化されていない
が、残余信号中にむしろ強いパルスとして発生する。
従って、本発明の目的は、残余チャネルにおけるこの雑音信号を除去すること
であり、これは、請求の範囲第1項の導入部分で述べた方法により行われ、上記
方法においては、逆フィルタを通した後、信号bは、過度検出器とピッチ操作器
に並列に供給され、ピッチ操作器は、過度検出器から出力信号が供給される乗算
器に直列に接続される遅延回路を含む。
信号パルスは、この様にして、過度検出器により捕獲され,そして、乗算器へ
の信号は、過度検出器から到着する信号に対して遅延されるので、雑音パルスを
、乗算器により除去可能である。さらに、雑音パルスの除去が、他の信号部分の
信号処理と完全に無関係に行われることは,極めて重要であり、この雑音パルス
の除去は、ホルマント周波数の操作を含む。
乗算器からの、出力信号は、ピッチ変換器へ供給される。ピッチ周波数は、こ
れにより、ホルマント周波数の信号処理と完全に無関係に変更することができる
。このことは、音声は、その特徴ある内容を何等変えることなく、別のピッチへ
変換できることを意味する。
ある場合には、雑音/トランジェントの除去において、過度検出器が、その入
力が信号aに接続されるスペクトル計算回路からの出力に接続されることは、便
利かもしれないが、それは、LPC分析からのスペクトル情報を組み込むことに
なるからである。
最後に、ピッチ周波数、音声トランジェント、及び、もしあれば、ストップ子
音を含む残余信号bが、ピッチ操作器の手段により相互に無関係に操作されるこ
とは、好都合である。
これは、可能であるが、それは、音声トランジェントパルス、ピッチパルス及
びストップ子音は、異なる外観をもつからである。換言すれば、例えば、除去さ
れる雑音パルスは、ピッチ周波数又はストップ子音に影響しない。
残余信号bは、ピッチパルス、ストップ子音及び音声トランジェントを、もし
あれば、時間順次信号要素として含むので、これらの異なる信号要素は、結果と
して相互に無関係に増幅/減衰されることができる。これは乗算器の手段により
行われ、ここでは、増幅率(又は減衰率)は、種々の時間順次信号要素(ピッチ
パルス、ストップ子音、等)を分類する過度検出器に「より制御される」。種々
の時間順次信号要素の分類(B項を見よ)に関する不可欠の遅延のために、遅延
リンクが乗算器の前に付加されている。分類に依存して乗算器は、1より少ない
、1に等しい、又は1より多きい増幅率に調節される。
残余信号bにおいて、発生している過度信号の分類は、振幅スペクトル(周波
数領域)及び残余信号(時間領域)の両方に基づいて行われる。
関係する時間信号セグメントの周波数成分が決定される。これは第7図に示さ
れ、ここでは、過度検出器15が、周波数成分についての情報をブロック12(
スペクトルの計算)から受けとる。
ピッチパルスとストップ子音とは、相互に区別できるが、それは、ストップ子
音は、高い周波数範囲(周波数領域)に集中したかなり多くの信号パワーをもつ
からである。
雑音トランジェントは、他の信号要素とは、簡単なレベル検出器により区別で
きるが、それは、雑音トランジェントは、「スピーチ音」より遥かに高いピーク
振幅(時間領域、即ち、残余信号b内)を含むからである。
その上、音声認識(例えば、ケプストラム係数に基づく分類)に関して開発さ
れた幾つかの極めて進歩したパターン認識方法を使用することは原則として可能
である。
個々のホルマントの強度−ダイナミックの変動が、個々のホルマントがその中
に存在する周波数範囲に依存する、難聴者の実際のダイナミックレンジとの関係
において圧縮できる場合は、「圧縮されたホルマント」の強度変動が、UCL(
不快レベル)と呼ばれる範囲内を維持し、そして増加した聴力スレッシュホルド
により下方向に制限されることを確保できる。(典型的な、聴力損失が、より高
い周波数の方に向かつて増加するにつれて、強度−ダイナミックの圧縮は、通常
より高い周波数の方に向かつて増加されなければならない。)この強度圧縮は、
丁度「1つのチャネル」に関する。換言すれば、残余チャネル内のピッチ信号は
、従来のアナログマルチチャネル圧縮補聴器の場合の様に、強度圧縮により影響
されない。
本発明はまた、方法の実施において使用するための、ピッチ操作器に関する。
このピッチ操作器は、乗算器及びピッチ変換器と直列に遅延回路を含むことを特
徴とする。これにより、雑音パルスを除去し、ピッチ周波数を変更し、そして残
余チャネル中のストップ子音の振幅を増加できる回路が提供される。
最後に、この発明は、方法又はピッチ操作器の使用に関する。これらの使用は
、請求の範囲第9及び10項に定義されている。
本発明の、信号処理システムは、特に補聴器に関して有益であるが、それは、
周波数を1つの範囲から別の範囲へ変換すると共に強度条件を選択的に変更する
ことに関して、補聴器への信号を操作できるからである。例えば、高い周波数か
ら低い周波数範囲への変換は、しばしば望ましいが、それは、大抵の聴力の損傷
は、高い周波数で起こるからである。これに関連して、本発明の利点は、信号情
報は本質的に損なわれず、従って、難聴者は、正常な聴力の人がより広い周波数
範囲において受ける情報から利益をうけるであろう。前に述べた様に、雑音パル
スが除去できることはまた、有利であるが、それは、雑音パルスは難聴者にとっ
て非常に不快であるからである。
前に述べた様に、スペクトル(例えば、LPC又はFFTを通じて計算された
)は、特定の中心周波数、帯域幅及び強度をもつ、複数の二次セクションに分解
/分割できる。
二次セクションは、中心周波数の増加に従って、番号付けできる。奇数番号を
もつ、それぞれのセクションは、合計した後の破壊的干渉を防止するため180
度位相シフトされる。
第1のセクション(No.1)は、z=−1に対してゼロでパッドされる。最
後のセクションは、z=+1に対してゼロでパッドされる。他の全部のセクショ
ンは、z=−1及びz=+1の両方で、それぞれゼロでパッドされる。
LPC分析が、前に述べた様に、逆フィルタの計算に使用される。逆フィルタ
のゼロ(複数)のQ値は、因子アルファ(alpha)(典型的に0.95−0
.99)により適合して調節され、これは、全部のLPC係数上に乗算される。
この調節は、女性の音声(及び子供の音声)でまさに、発音されることのできる
、純音(pure tone)信号の処理に関係して行われる。
本発明による極めて柔軟性のある信号処理は、また音声の合成を可能にする。
これは、多くの応用があり、そして最も興味のある1つは、おそらく、全部のパ
ラメタが知られている場合、合成された音声を作ることができることであり、こ
れは、特に補聴器の試験の時に有利である。
本発明は、以下に図面を参照してより完全に説明するが、ここで
第1図は、既知の信号変換回路のブロック図であり、
第2図は、第1図に示す回路における信号処理の原理を示すブロック図であり
、
第3図は、1つのチャネルにおけるスペクトル信号を示し、
第4図は、他のチャネルにおける残余信号を示し、
第5図は、変換回路における処理後の出力信号を示し、
第6図は、本発明による変換回路の拡張されたブロック図を示し、
第7図は、第6図のピッチ操作の詳細な部分のブロック図を示し、
第8図は、第6及び7図の手段による信号処理の1例を示し、
第9図は、本発明による変換原理の1例を示す。
第1図に示す音声信号の変形のための回路のブロック図から判る様に、この回
路は、信号を2つの部分に分離する分析部1からなり、この1つの部分は、分解
部2及び変換部3からなり、そして1つの分岐に導かれ、これに対し、他の部分
は残余信号であり、そして別の分岐に導かれ、これに続いて変形された音声信号
を与えるため分析が行われる。さらに判ることは、変換部の入力は、記憶装置2
9に接続され、これは、個人的データ、例えば、測定されたUCL、次を参照、
又は増加した聴力しきい値についての情報を含む。
第2図は、2つの信号部分がどの様に処理されるかをより具体的に示し、ここ
で、aと呼称される一方の信号部分は、信号の準静止部分をブロック5において
処理し、これは次にブロック7において操作され、これに対し、他方の信号部分
bは、過度部分を処理し、これは同様に操作され、そして2つの操作された信号
は結合されて1つの変形された音声信号となる。注意すべきことは、信号aは、
スペクトル中の音声信号を分解することにより作られ、これは二次ユニット(複
数)の中に配列され、より詳しくは、これらは並列−分割され、これにより各部
分が1つのホルマント周波数を表し、これはそのパワー、その共振周波数fo及
びQ値により記述され、
信号はこの様に、並列部分に分割されるので、今や個々の部分を上の3つのパ
ラメタに基づいて操作することができる。換言すれば、音声信号の内容について
の情報を含む信号aは、柔軟性あるやり方で操作できる。例えば、帯域幅を減少
させることにより、ホルマント周波数を鋭利にできる。勿論、幾つかの周波数帯
域が変換において省略されるのを妨げるものはなにもない。音声信号の他方の部
分b、残余信号は、ピッチ周波数を含み、これは声として出された音について、
トーンを表し、これは典型的には100から300Hzの範囲にある。この部分
において、ピッチ周波数は、ホルマント周波数と完全に無関係に操作でき、この
ことは、例えば、男性の声は、音声信号中の情報のどれも失うことなく、子供の
声に変換できる。上述の回路における信号処理の1例は第3図に示され、これは
、語「ポルセボグネン(polsevognen)」に対するLPCスペクトル
の準静止部分が雑音の汚染なしに示される。第4図は、同じ語に対する残余信号
を示し、他方第5図は、スペクトルが第1及び2図の回路を通過した後のスペク
トルを示し、これらのスペクトル部分は鋭利となり、むしろ相互に明瞭に分離さ
れている。第5図における信号処理は、帯域幅を変更することにより遂行され、
他方2つの他のパラメタは維持され、これらは、パラメタ中のパワー及び共振周
波数である。
第3−5図に示す場合は、雑音無し信号に関するが、雑音に汚染された信号の
場合にも正確に同じことが遂行される。この様な場合、雑音はかなり減少される
が、これは、聴力の損なわれた人に対しても正常な聴力の人に対しても雑音を除
くために利用される。
第6図は、本発明の変換回路を示す。この図において、9はマイクロフォンで
、音声信号をアナログディジタル変換器から転送し、そしてここからプレエンフ
ァシスフィルタ11へ転送する。この信号は、次にダッシュ線で示す2つのブロ
ック、即ち、第1図に示すブロックに対応するブロック1、2に渡され、即ち、
ブロック1は分析部を形成し、ブロック2は分解部を形成する。判る様に、ブロ
ック2は音声信号のスペクトルを計算するための回路12からなり、これは、次
にブロック13へ渡され、ここで信号は回路13により疑似分解され、このこと
は、信号は、並列一分割され、そしてパラメタである共振周波数fo、Q値及び
与えられた共振周波数での信号のパワーPにより記述されることを意味する。注
意すべきことは、ブロック12におけるスペクトルの計算は、LPC係数に基づ
き、FFT変換に基づき又は随意にPLP(知覚による線形予測)計算に基づい
て遂
行できることである。
回路11における疑似分解の後、信号は変換回路14へ渡され、ここでスペク
トルは、上述の3つのパラメタの手段により変化される。次に変換回路からの出
力は、変換されたフィルタのために、またパルスレスポンスのスケーリングのた
めにパルスレスポンス決定回路へ渡される。この信号は、パルスレスポンス回路
16の出力から合成フィルタヘ渡される。図から判るように、信号はプレエンフ
ァシスフィルタ11からLPC回路17へ渡され、この出力は、LPCに基づく
可変係数をもつ逆フィルタ回路19へ渡される。その入力をプレエンファシス回
路11から受ける遅延回路18は、逆フィルタ回路19の別の入力ヘ接続される
。逆フィルタ回路19の出力は、ピッチ操作器20へ渡され、その別の入力へ過
度検出器15が接続される。さらに、参照番号25で示す様に、スペクトル計算
回路12から過度検出器15へ接続を確立することができる。ピッチ操作器20
の出力は、合成フィルタ21へ渡され、その出力はポストエンファシス回路22
へ渡され、これはさらに、ディジタルアナログ変換器23及び最終的に拡声器2
4へ渡される。第7図から判る様に、ピッチ操作器は、遅延回路26、乗算器2
7、及びピッチ周波数の変更を意図するピッチ変換器28からなる。
信号の準静止部分については、即ち、第2図の信号aにおいては、第6及び7
図の回路が前述と同じやり方で動作し、従ってここでは、より完全には述べない
。他方、本発明に従えば、残余チャネルにおける信号処理は、前述のものとは異
なる。残余チャネルにおける信号処理を説明するため、第8図を参照し、ここで
は、Iの所に、2つのピッチパルスP、雑音パルスsi及びストップ子音skか
らなる時間信号を示す。この信号は、逆フィルタ19から現れ、そして過度検出
器15及び遅延回路26へ供給されることを予期している。Iの所から判る様に
、それぞれのパルスの外観は異なり、そして、従って分離することが可能である
。例えば、過度検出器は適合されており、このため、雑音パルスの振幅に基づき
、上記振幅を検出し、そしてその振幅を減少させる様に乗算器27に合図し、こ
れに続いて同じ信号が、遅延回路26を経由してその振幅が減少した時に乗算器
へ渡され、これは、Iの所の雑音パルスsiの下にIIの所に示される。時間軸
I上に示されるピッチパルスPについては、これらは、ピッチ変換器28の手段
によ
り処理され、これはピッチ操作器20の一部を形成する。既知の信号処理方法に
対して、これは、既に述べた様に、残余信号において行われ、このことは、もし
音声の変換を、例えば、子供の声を大人の声に、音声信号の内容が変化すること
なく行われることを希望するならば重要である。最後に、ストップ子音skが、
時間軸上に示される。このストップ子音は、雑音パルスsi及びピッチパルスP
と無関係に乗算器の手段により変化できるが、それは、ストップ子音は、残余信
号における時間領域分析をLPC分析からのスペクトル情報と組み合わせること
により識別できるからである。これにより、ストップ子音が存在する限り、増幅
を増加させることが可能である。第8図のIIIと印された底部の線は、ピッチ
操作の、ピッチパルス、雑音トランジェント及びストップ子音への影響の結果を
示す。
本発明による変換原理の使用の1例を、第9図を参照して以下に説明する。
聴力損失の大多数は、難聴者のダイナミックレンジが大きく減少、例えば、2
0dBが特徴であることが知られている。正常のダイナミックレンジは約120
dBである。最大音圧により生じる不快は、UCLと呼ばれ、そして120dB
のオーダである。正常の聴力しきい値は、約0dBである。換言すれば、大きな
聴力損失は、小さなダイナミックレンジを伴う。もし例えば、聴力しきい値が、
90dBまで増加すると、ダイナミックレンジは、120−90=30dBであ
ろう。このダイナミックレンジは、音声知覚に関連して約10dBだけ追加され
て減少するであろう、というのは、音声知覚が合理的であるためには、音声レベ
ルは聴力しきい値より約10dB上でなければならないからである。このことは
、有効ダイナミックレンジは、この場合約20dBに減少することを意味する。
実際の音声信号の「固有のダイナミック」は、同じオーダである。このことは、
難聴者と、関係する話者との距離が変化するときは、音声レベルがかなり変わる
という環境にも更に関係づけるべきである。音声レベルは、もし、話者が、1か
ら2メートルの距離へ難聴者に対して移動すると、約6dBへ低下する。
さらに注意すべきことは、聴力損失は、周波数に大きく依存し、また聴力損失
は、しばしばより高い周波数の方へ増加し、即ち、多くの場合、聴力は、100
0Hzまでの低い周波数範囲では比較的そのままである。このことは、減少した
聴力損失に対する補償は、通常周波数依存でなければならないことを意味する。
一般に、聴力損失補償は、上級(superior)原理に基づいており、こ
の原理では、ホルマント周波数は、個々のUCL(不快レベル)を表す曲線と個
個に測定した特定の難聴者の聴力しきい値より2−10dB高い曲線との間に位
置しなければならない。この範囲は下位のITS(個々の目標空間)と呼ばれる
。この上級原理は、できるだけ多くの音声が個々の難聴者により聞く事ができる
様に保障する。
この適合化は、新しい周波数スペクトルが計算される度毎に一般に行われる。
本発明のシステムは、個々のホルマントの完全な制御を提供し、またこのシステ
ムは、従って、登録されたホルマントを最適に個々の難聴者のICSより上に変
換することができる。変換回路は、さらに柔軟性があるが、それは、ホルマント
についての必要な情報はパラメトリック形式で利用でき、またさらに明確な発音
の自然でかつ正しい表現に対応しているからである。
お互に対するホルマントの強度は、「自然」の強度分布に対して変更できるこ
とは重要である。このことは、難聴者に対するマスク条件の変化に関係して判る
にちがいない。より高い周波数に向かって増加する聴力損失をもつ聴力損失曲線
は、例えば、最低のホルマントは、容易に次の最低のホルマントをマスクするで
あろうことを意味している。従って、より高い周波数に向かって増加する(個々
のホルマント周波数での聴力損失の大きさに関して判る)、個々のホルマント周
波数の増幅を確立することが通常有利であろう。
ささやき声は、種々のホルマントの相互の強度が「正常な声」に対して変化す
ることに特徴がある。(これに加えて、ピッチパルスが存在せず、剌激は空気の
乱れた流れにより起こる。)さらに、難聴者にとって、適当に(ささやき声のダ
イナミックは典型的な高い周波数の聴取力損失によく整合しており、その結果マ
スク条件を変える)増幅されたささやき声は、しばしば容易に理解できることは
興味ある観察である。
強度条件の動的変化を取り巻く環境は、その上極めて重要である。もし、ホル
マントの強度の適合が、誤ったペースでなされると、一時的に、音声信号変調パ
ターンについての情報の幾つかの重要な項目が破壊される。これは、概念変調伝
達関数により説明でき、技術レビュー、ブルーエル・オージー・クジャー(Br
uel og Kjar)no2、1985、以下MTFと呼ぶを参照のこと。
約0.5Hzから20Hzの範囲における変調周波数に対する音声変調は顕著に
は歪まないことは、極めて重要である。
例えば、MTFに記載されている変調条件における明らかな変化が、何故にア
ナログ多重チャネル圧縮補聴器が、ダイナミック強度適合が従来の単一チャネル
補聴器におけるよりもかなり良いという事実にも拘らず音声理解能力に顕著な改
善を明らかに与えていないかという理由であるというのが一般的な意見である。
補聴器使用者のための、幾つかのより最近の適合方策は、この様にMTF条件の
最適化をも含んでいる。
本発明の変換システムにおいて、時間ダイナミック状態を制御するのは、容易
である。前述の様に、ホルマントの強度は、音声の変調条件が受入できない程度
に変化するように、誤ったペースで変化させてはならない。変換システムの進歩
した形式は、NTF条件を、現行のホルマントの変換に関して、個々のユーザの
ITSより上に含ませることができる。上述の条件は第9図に示され、ここで、
グラフ1はUCLを示し、グラフ2はホルマント構造、f1、f2、f3、を示
し、ここでf2及びf3は強度についてf1よりも高められるであろう。曲線3
は、典型的な高い周波数での聴力損失をもつ人の特性を示し、他方曲線4は、正
常な聴力の能力を持つ人の特性を示す。本発明の変換システムは、ホルマント周
波数の操作を可能にして、これらが曲線1と3の間にあるようにし、これにより
、難聴者が、正常な聴力しきい値をもつ人と同じ又は本質的に同じ情報を知覚で
きるようにする。上述の信号処理は,ホルマント構造におけるより大きな変化の
より多くの可能性を提供するが、それは、ピッチ周波数が含まれずに、完全に独
立して調節できるからである。
【手続補正書】特許法第184条の8第1項
【提出日】1996年11月14日
【補正内容】
その上、音声認識(例えば、ケプストラム係数に基づく分類)に関して開発さ
れた幾つかの極めて進歩したパターン認識方法を使用することは原則として可能
である。
個々のホルマントの強度−ダイナミックの変動が、個々のホルマントがその中
に存在する周波数範囲に依存する、難聴者の実際のダイナミックレンジとの関係
において圧縮できる場合は、「圧縮されたホルマント」の強度変動が、UCL(
不快レベル)と呼ばれる範囲内を維持し、そして増加した聴力スレッシホルドに
より下方向に制限されることを確保できる。(典型的な、聴力損失が、より高い
周波数の方に向かって増加するにつれて、強度−ダイナミックの圧縮は、通常よ
り高い周波数の方に向かって増加されなければならない。)この強度圧縮は、丁
度「1つのチャネル」に関する。換言すれば、残余チャネル内のピッチ信号は、
従来のアナログマルチチャネル圧縮補聴器の場合の様に、強度圧縮により影響さ
れない。
本発明はまた、音声信号を変換するための装置に関し、信号を2つの部分a、
bに分離するための回路を含み、ここに第1の部分は変換回路に直列の分解回路
に供給され、他方bは、逆フィルタを通すための回路に供給される。この装置は
、回路からの出力は過度検出器とピッチ操作器とに並列に接続され、このピッチ
操作器は、遅延回路と、過度検出器からその出力が接続される乗算器との直列接
続を含むことを特徴とする。
最後に、この発明は、方法の使用又は装置に関する。これらは、請求の範囲第
9及び10項に定義されている。
本発明の、信号処理システムは、特に補聴器に関して有益であるが、それは、
周波数を1つの範囲から別の範囲へ変換すると共に強度条件を選択的に変更する
ことに関して、補聴器への信号を操作できるからである。
請求の範囲
1.音声信号を変換する方法であって、音声信号を2つの信号部分a、b、に
分離することを含み、ここに、aは、ホルマント周波数の情報をもつ、信号の準
静止部分を表し、またbは、ピッチ周波数及びストップ子音の情報を含む信号の
過度部分をもつ残余信号を表し、上記信号bは、音声信号を逆フィルタ(17、
18、19)を通すことにより発生するものにおいて、
逆フィルタを通した後、信号bは、過度検出器(15)とピッチ操作器(20
)とに並列に供給され、ピッチ操作器(20)は、乗算器(27)に直列に結合
される遅延回路(26)を含み、乗算器には過度検出器(15)から出力信号が
供給される、ことを特徴とする音声信号を変換する方法。
2.請求の範囲第1項による方法において、過度検出器(15)からの制御信
号により制御される乗算器(27)は、遅延回路からの種々の信号要素、例えば
、ストップ子音/ピッチパルス及び雑音トランジェントの時間順序(時間選択的
)増幅/減衰を遂行できることを特徴とする方法。
3.請求の範囲第1項又は第2項による方法において、乗算器(27)からの
出力信号はピッチ周波数変換器(28)に供給されることを特徴とする方法。
4.請求の範囲の先行するいずれかの項による方法において、過度検出器(1
5)は、スペクトル計算回路(12)からの出力に接続され、スペクトル計算回
路の入力は信号aに接続されることを特徴とする方法。
5.請求の範囲の先行するいずれかの項による方法において、ピッチ周波数、
音トランジェント及びストップ子音の情報を含む残余信号bは、相互に無関係に
ピッチ操作器(20)により操作できることを特徴とする方法。
6.請求の範囲の先行するいずれかの項による方法において、個々のホルマン
トの強度−ダイナミック変動は難聴者の実際のダイナミックレンジに関して圧縮
され、それは周波数−依存でありまた個々のホルマントが存在する周波数範囲に
依存することを特徴とする方法。
7.音声信号を変換するための装置であって、信号を2つの部分a、bに分離
するための回路(11)を含み、ここに第1の部分は変換回路(14)に直列の
分解回路(12、13)に供給され、また他方の部分bは、逆フィルタを通すた
めの回路(17、18、19)に供給されるものにおいて、回路(17、18、
19)からの出力は、過度検出器(15)とピッチ操作器(20)とに並列に接
続され、ピッチ操作器は、遅延回路(26)と、過度検出器(15)から出力が
接続される乗算器回路(27)との直列接続を含むことを特徴とする装置。
8.請求の範囲第7項による装置において、過度検出器(15)からの制御信
号により制御される乗算器(27)は、ストップ子音が増幅されるように、時間
順序、随意には時間選択的増幅を提供し、他方ピッチパルスは、変化しない強度
で送信され、また雑音パルスは減衰されることを特徴とする装置。
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FR,GB,GR,IE,IT,LU,M
C,NL,PT,SE),OA(BF,BJ,CF,CG
,CI,CM,GA,GN,ML,MR,NE,SN,
TD,TG),AP(KE,LS,MW,SD,SZ,U
G),AL,AM,AT,AU,BB,BG,BR,B
Y,CA,CH,CN,CZ,DE,DK,EE,ES
,FI,GB,GE,HU,IS,JP,KE,KG,
KP,KR,KZ,LK,LR,LS,LT,LU,L
V,MD,MG,MK,MN,MW,MX,NO,NZ
,PL,PT,RO,RU,SD,SE,SG,SI,
SK,TJ,TM,TT,UA,UG,US,UZ,V
N
(72)発明者 フインク,フレミング ケイ.
デンマーク国デイケイ − 9490 パンド
ルプ,ルンデガルドスベユ 38
(72)発明者 ハルトマン,ウウエ
デンマーク国デイケイ − 9210 アルボ
ルグ ソー.ソルバッケン 36
(72)発明者 ヘルマンセン,クイエルド
デンマーク国デイケイ − 9260 ギスト
ルプ スタメン 67
(72)発明者 ルバク,ペル
デンマーク国デイケイ − 9240 ニベ,
ローゼンパルケン 46
Claims (1)
- 【特許請求の範囲】 1.音声信号を変換する方法であって、音声信号を2つの信号部分a、b、に 分離することを含み、ここに、aは、ホルマント周波数の情報をもつ、信号の準 静止部分を表し、またbは、ピッチ周波数及びストップ子音の情報を含む信号の 過度部分をもつ残余信号を表し、上記信号bは、音声信号を逆フィルタを通すこ とにより発生するものにおいて、 逆フィルタを通した後、信号bは、過度検出器とピッチ操作器とに並列に供給 され、ピッチ操作器は、乗算器に直列に結合される遅延回路を含み、乗算器には 過度検出器から出力信号が供給される、ことを特徴とする音声信号を変換する方 法。 2.請求の範囲第1項による方法において、過度検出器からの制御信号により 制御される乗算器は、遅延回路からの種々の信号要素(例えば、ストップ子音/ ピッチパルス及び雑音トランジェント)の時間順序(時間選択的)増幅/減衰を 遂行できることを特徴とする方法。 3.請求の範囲第1項又は第2項による方法において、乗算器からの出力信号 はピッチ周波数変換器に供給されることを特徴とする方法。 4.請求の範囲の先行するいずれかの項による方法において、過度検出器は、 スペクトル計算回路からの出力に接続され、スペクトル計算回路の入力は信号a に接続されることを特徴とする方法。 5.請求の範囲の先行するいずれかの項による方法において、ピッチ周波数、 音トランジェント及びストップ子音の情報を含む残余信号bは、相互に無関係に ピッチ操作器により操作できることを特徴とする方法。 6.請求の範囲の先行するいずれかの項による方法において、個々のホルマン トの強度−ダイナミック変動は難聴者の実際のダイナミックレンジに関して圧縮 され、それは周波数−依存でありまた個々のホルマントが存在する周波数範囲に 依存することを特徴とする方法。 7.請求の範囲第1項−第5項による方法の遂行に使用するためのピッチ操作 器において、それは、乗算器及びピッチ周波数変換器と直列な遅延回路を含むこ とを特徴とするピッチ操作器。 8.請求の範囲第7項によるピッチ操作器において、過度検出器からの制御信 号により制御される乗算器は、ストップ子音が増幅されるように、時間順序(随 意には時間選択的)増幅を提供し、他方ピッチパルスは、変化しない強度で送信 され、また雑音パルスは減衰されることを特徴とするピッチ操作器。 9.補聴器における請求の範囲第1項から第8項による方法の使用又はピッチ 操作器。 10.例えば聴力損失シミュレータとしての音声合成装置における請求の範囲第 1項から第8項による方法の使用又はピッチ操作器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DK1347/94 | 1994-11-25 | ||
DK134794 | 1994-11-25 | ||
PCT/DK1995/000474 WO1996016533A2 (en) | 1994-11-25 | 1995-11-27 | Method for transforming a speech signal using a pitch manipulator |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10509256A true JPH10509256A (ja) | 1998-09-08 |
Family
ID=8103855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8517145A Pending JPH10509256A (ja) | 1994-11-25 | 1995-11-27 | ピッチ操作器を使用する音声信号の変換方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5933801A (ja) |
EP (1) | EP0796489B1 (ja) |
JP (1) | JPH10509256A (ja) |
AT (1) | ATE179827T1 (ja) |
AU (1) | AU3978595A (ja) |
DE (1) | DE69509555T2 (ja) |
DK (1) | DK0796489T3 (ja) |
WO (1) | WO1996016533A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011514987A (ja) * | 2008-03-10 | 2011-05-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 瞬間的事象を有する音声信号の操作装置および操作方法 |
Families Citing this family (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6044147A (en) * | 1996-05-16 | 2000-03-28 | British Teledommunications Public Limited Company | Telecommunications system |
WO1999001942A2 (en) * | 1997-07-01 | 1999-01-14 | Partran Aps | A method of noise reduction in speech signals and an apparatus for performing the method |
US5913187A (en) * | 1997-08-29 | 1999-06-15 | Nortel Networks Corporation | Nonlinear filter for noise suppression in linear prediction speech processing devices |
FR2786908B1 (fr) | 1998-12-04 | 2001-06-08 | Thomson Csf | Procede et dispositif pour le traitement des sons pour correction auditive des malentendants |
CN1100305C (zh) * | 1999-03-31 | 2003-01-29 | 五邑大学 | 噪声环境下语音控制指令产生装置 |
AU4394300A (en) * | 1999-05-19 | 2000-12-12 | Noisecom Aps | A method and apparatus for noise reduction in speech signals |
US6910011B1 (en) * | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
GB2357231B (en) | 1999-10-01 | 2004-06-09 | Ibm | Method and system for encoding and decoding speech signals |
IL140082A0 (en) * | 2000-12-04 | 2002-02-10 | Sisbit Trade And Dev Ltd | Improved speech transformation system and apparatus |
CN1529882A (zh) * | 2001-05-11 | 2004-09-15 | 西门子公司 | 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法 |
JP2003255993A (ja) * | 2002-03-04 | 2003-09-10 | Ntt Docomo Inc | 音声認識システム、音声認識方法、音声認識プログラム、音声合成システム、音声合成方法、音声合成プログラム |
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
KR20040058855A (ko) * | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
WO2005003902A2 (en) * | 2003-06-24 | 2005-01-13 | Johnson & Johnson Consumer Companies, Inc. | Method and system for using a database containing rehabilitation plans indexed across multiple dimensions |
WO2005002431A1 (en) * | 2003-06-24 | 2005-01-13 | Johnson & Johnson Consumer Companies Inc. | Method and system for rehabilitating a medical condition across multiple dimensions |
US20070276285A1 (en) * | 2003-06-24 | 2007-11-29 | Mark Burrows | System and Method for Customized Training to Understand Human Speech Correctly with a Hearing Aid Device |
WO2005125275A2 (en) * | 2004-06-14 | 2005-12-29 | Johnson & Johnson Consumer Companies, Inc. | System for optimizing hearing within a place of business |
EP1765153A4 (en) * | 2004-06-14 | 2009-07-22 | Johnson & Johnson Consumer | SYSTEM AND METHOD FOR THE CONVENIENT AND AUTOMATIC TESTING OF THE HEARING OF A PERSON |
US20080187145A1 (en) * | 2004-06-14 | 2008-08-07 | Johnson & Johnson Consumer Companies, Inc. | System For and Method of Increasing Convenience to Users to Drive the Purchase Process For Hearing Health That Results in Purchase of a Hearing Aid |
EP1767060A4 (en) * | 2004-06-14 | 2009-07-29 | Johnson & Johnson Consumer | SYSTEM AND METHOD FOR TRAINING HEARING EQUIPMENT AT HOME |
US20080240452A1 (en) * | 2004-06-14 | 2008-10-02 | Mark Burrows | At-Home Hearing Aid Tester and Method of Operating Same |
US20080165978A1 (en) * | 2004-06-14 | 2008-07-10 | Johnson & Johnson Consumer Companies, Inc. | Hearing Device Sound Simulation System and Method of Using the System |
US20080056518A1 (en) * | 2004-06-14 | 2008-03-06 | Mark Burrows | System for and Method of Optimizing an Individual's Hearing Aid |
EP1769412A4 (en) * | 2004-06-14 | 2010-03-31 | Johnson & Johnson Consumer | AUDIOLOGICAL DEVICE INTERFACE USER DATABASE FOR PROVIDING AURAL REHABILITATION OF LOSS OF HEARING VIA FURTHER AUDIENCES |
EP1767061A4 (en) * | 2004-06-15 | 2009-11-18 | Johnson & Johnson Consumer | EASY, PROGRAMMABLE, TIME LIMITED HEARING EQUIPMENT, USE METHOD AND SYSTEM FOR PROGRAMMING THEREOF |
US20060025991A1 (en) * | 2004-07-23 | 2006-02-02 | Lg Electronics Inc. | Voice coding apparatus and method using PLP in mobile communications terminal |
US8543390B2 (en) * | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7680652B2 (en) * | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
KR20060067016A (ko) | 2004-12-14 | 2006-06-19 | 엘지전자 주식회사 | 음성 부호화 장치 및 방법 |
US8027833B2 (en) * | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
FR2911426A1 (fr) * | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US20080231557A1 (en) * | 2007-03-20 | 2008-09-25 | Leadis Technology, Inc. | Emission control in aged active matrix oled display using voltage ratio or current ratio |
US8904400B2 (en) * | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) * | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
DE102009013020A1 (de) * | 2009-03-16 | 2010-09-23 | Hayo Becks | Vorrichtung und Verfahren zur Anpassung von Klangbildern |
US8983829B2 (en) | 2010-04-12 | 2015-03-17 | Smule, Inc. | Coordinating and mixing vocals captured from geographically distributed performers |
US9865277B2 (en) * | 2013-07-10 | 2018-01-09 | Nuance Communications, Inc. | Methods and apparatus for dynamic low frequency noise suppression |
JP2017538146A (ja) * | 2014-10-20 | 2017-12-21 | アウディマックス・エルエルシー | インテリジェントな音声認識および処理のためのシステム、方法、およびデバイス |
CN105118514A (zh) * | 2015-08-17 | 2015-12-02 | 惠州Tcl移动通信有限公司 | 一种播放无损音质声音的方法及耳机 |
US10821027B2 (en) | 2017-02-08 | 2020-11-03 | Intermountain Intellectual Asset Management, Llc | Devices for filtering sound and related methods |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3649765A (en) * | 1969-10-29 | 1972-03-14 | Bell Telephone Labor Inc | Speech analyzer-synthesizer system employing improved formant extractor |
US4222393A (en) * | 1978-07-28 | 1980-09-16 | American Tinnitus Association | Tinnitus masker |
JPH0636159B2 (ja) * | 1985-12-18 | 1994-05-11 | 日本電気株式会社 | ピツチ検出器 |
JPS62194296A (ja) * | 1986-02-21 | 1987-08-26 | 株式会社日立製作所 | 音声符号化方式 |
DE69228211T2 (de) * | 1991-08-09 | 1999-07-08 | Koninklijke Philips Electronics N.V., Eindhoven | Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals |
JP3336617B2 (ja) * | 1993-05-31 | 2002-10-21 | ソニー株式会社 | 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体 |
SG43076A1 (en) * | 1994-03-18 | 1997-10-17 | British Telecommuncations Plc | Speech synthesis |
JPH0990974A (ja) * | 1995-09-25 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 信号処理方法 |
-
1995
- 1995-11-27 US US08/836,313 patent/US5933801A/en not_active Expired - Fee Related
- 1995-11-27 JP JP8517145A patent/JPH10509256A/ja active Pending
- 1995-11-27 AU AU39785/95A patent/AU3978595A/en not_active Abandoned
- 1995-11-27 DK DK95938368T patent/DK0796489T3/da active
- 1995-11-27 DE DE69509555T patent/DE69509555T2/de not_active Expired - Fee Related
- 1995-11-27 AT AT95938368T patent/ATE179827T1/de not_active IP Right Cessation
- 1995-11-27 EP EP95938368A patent/EP0796489B1/en not_active Expired - Lifetime
- 1995-11-27 WO PCT/DK1995/000474 patent/WO1996016533A2/en active IP Right Grant
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011514987A (ja) * | 2008-03-10 | 2011-05-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 瞬間的事象を有する音声信号の操作装置および操作方法 |
Also Published As
Publication number | Publication date |
---|---|
WO1996016533A2 (en) | 1996-06-06 |
US5933801A (en) | 1999-08-03 |
ATE179827T1 (de) | 1999-05-15 |
EP0796489A2 (en) | 1997-09-24 |
DE69509555T2 (de) | 1999-09-02 |
DE69509555D1 (de) | 1999-06-10 |
EP0796489B1 (en) | 1999-05-06 |
AU3978595A (en) | 1996-06-19 |
WO1996016533A3 (en) | 1996-08-08 |
DK0796489T3 (da) | 1999-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10509256A (ja) | ピッチ操作器を使用する音声信号の変換方法 | |
EP2375785B1 (en) | Stability improvements in hearing aids | |
CN100369111C (zh) | 话音增强装置 | |
EP0814639B1 (en) | Spectral transposition of a digital audio signal | |
CN103999487B (zh) | 听觉装置的稳定性和语音可听性改进 | |
US20030216907A1 (en) | Enhancing the aural perception of speech | |
JPH04328798A (ja) | パブリックアドレス明瞭度強調システム | |
JP2002507291A (ja) | 音声通信システムにおける音声強調方法およびその装置 | |
Nejime et al. | Evaluation of the effect of speech-rate slowing on speech intelligibility in noise using a simulation of cochlear hearing loss | |
JP3131249B2 (ja) | 混合音声信号受信装置 | |
GB2305831A (en) | Noise suppression using Fourier/Inverse Fourier technique | |
CA2321225C (en) | Apparatus and method for de-esser using adaptive filtering algorithms | |
JP3185363B2 (ja) | 補聴器 | |
JPH06289898A (ja) | 音声信号処理装置 | |
RU2589298C1 (ru) | Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке | |
JPH0580796A (ja) | 話速制御型補聴方法および装置 | |
JP3847989B2 (ja) | 信号抽出装置 | |
JP3102553B2 (ja) | 音声信号処理装置 | |
JP6159570B2 (ja) | 音声強調装置、及びプログラム | |
KR100746680B1 (ko) | 음성 강조 장치 | |
JP5745453B2 (ja) | 音声明瞭度変換装置、音声明瞭度変換方法及びそのプログラム | |
JP2997668B1 (ja) | 雑音抑圧方法および雑音抑圧装置 | |
WO2001018794A1 (en) | Spectral enhancement of acoustic signals to provide improved recognition of speech | |
JPH0417520B2 (ja) | ||
Aoki et al. | Enhancing the naturalness of synthesized speech by using the random fractalness of vowel source signals |