JP4420562B2

JP4420562B2 - 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法

Info

Publication number: JP4420562B2
Application number: JP2000547612A
Authority: JP
Inventors: スウ，フアン−ユ; ベンヤッシーネ，アディル
Original assignee: Conexant Systems LLC
Current assignee: Conexant Systems LLC
Priority date: 1998-05-11
Filing date: 1999-05-04
Publication date: 2010-02-24
Anticipated expiration: 2019-05-04
Also published as: EP1076895A1; DE69905152T2; DE69905152D1; JP2003522964A; US6122611A; ATE232008T1; WO1999057715A1; EP1076895B1

Description

【０００１】
【発明の分野】
この発明は、通信の分野に関する。より具体的には、この発明は、符号化音声通信の分野に関する。
【０００２】
【背景技術】
２人以上の人の間の会話の際には、周囲または背景ノイズは典型的には、人の耳の全般的な聴覚経験に固有のものである。図１は、典型的な録音された会話のアナログ音波１００を示し、これは、音声通信によって生じる音声群１０４〜１０８とともに背景または周囲のノイズ信号１０２を含む。音声通信の伝送、受信および記憶の技術的分野では、音声群１０４〜１０８の符号化および復号化にはいくつかの異なった技術が存在する。音声群１０４〜１０８の符号化および復号化の技術の１つは、符号励起線形予測（ＣＥＬＰ）コーダなど、分析合成符号化システム（analysis-by-synthesis coding system）を用いるものであり、たとえば国際電気通信連合（International Telecommunication Union、ＩＴＵ）推奨Ｇ．７２９を参照されたい。
【０００３】
図２は、音声の符号化および復号化のための先行技術の分析合成システム２００の一般的な概略ブロック図を示す。図１の音声群１０４〜１０８の符号化および復号化のための分析合成システム２００は、対応する合成ユニット２２０とともに分析ユニット２０４を利用する。分析ユニット２０４は、ＣＥＬＰコーダなどの、分析合成タイプの音声コーダを表わす。符号励起線形予測コーダは、通信ネットワークおよび記憶容量の制約に見合うために中間のまたは低いビットレートで音声群１０４〜１０８を符号化する方法の１つである。
【０００４】
音声を符号化するために、分析ユニット２０４の図２のマイクロホン２０６は、入力信号として図１のアナログ音波１００を受取る。マイクロホン２０６は、受取ったアナログ音波１００を、アナログ−デジタル（Ａ／Ｄ）サンプラ回路２０８に出力する。アナログ−デジタルサンプラ２０８は、アナログ音波１００を、サンプリングされたデジタル音声信号（離散的時間期間にわたってサンプリングされている）に変換し、これは線形予測係数（ＬＰＣ）抽出器２１０およびコードブック２１４に出力される。
【０００５】
図２の線形予測係数抽出器２１０は、Ａ／Ｄサンプラ２０８から受取ったサンプリングされたデジタル音声信号から線形予測係数を抽出する。隣接する音声サンプルどうしの間の短期相関に関連する線形予測係数は、サンプリングされたデジタル音声信号の声道を表わす。決定された線形予測係数は次に、上述のとおり、インデックスを備えるルックアップテーブルを用いてＬＰＣ抽出器２１０によって量子化される。ＬＰＣ抽出器２１０は次に、量子化された線形予測係数のインデックス値とともに、サンプリングされたデジタル音声信号の残余をピッチ抽出器２１２に伝送する。
【０００６】
図２のピッチ抽出器２１２は、線形予測係数抽出器２１０から受取ったサンプリングされたデジタル音声信号内のピッチ周期どうしの間に存在する長期相関を除去する。言い換えれば、ピッチ抽出器２１２は、受取ったサンプリングされたデジタル音声信号から周期性を除去し、その結果白色残差音声信号が得られる。決定されたピッチ値は次に、上述のとおり、インデックスを備えるルックアップテーブルを用いてピッチ抽出器２１２によって量子化される。ピッチ抽出器２１２は次に、量子化された線形予測係数および量子化されたピッチのインデックス値を記憶装置／伝送ユニット２１６に伝送する。
【０００７】
図２のコードブック２１４は、コードワードと呼ばれる、特定の数の記憶されたデジタルパターンを含む。コードブック２１４は通常、当業者には公知であるように、最良の代表ベクトルを与え、何らかの知覚される態様で残差信号を量子化するために検索される。選択されたコードワードまたはベクトルは典型的には、固定の励起コードワードと呼ばれる。受取った信号を表わす最良のコードワードを決定した後、コードブック回路２１４はまた、受取った信号の利得係数を計算する。決定された利得係数は次に、インデックスを備えるルックアップテーブルを用いてコードブック２１４によって量子化されるが、これは当業者には周知の量子化方式である。コードブック２１４は次に、量子化された利得のインデックス値とともに決定されたコードワードのインデックスを、記憶装置／伝送器ユニット２１６に伝送する。
【０００８】
分析ユニット２０４の図２の記憶装置／伝送器２１６は次に、通信ネットワーク２１８を介して合成ユニット２２０にピッチ、利得、線形予測係数のインデックス値およびコードワードを伝送するが、これらはすべて、受取ったアナログ音波信号１００を表わすものである。合成ユニット２２０は、記憶装置／伝送器２１６から受取った異なったパラメータを復号化し、合成音声信号を得る。人が合成音声信号を聞くことを可能にするために、合成ユニット２２０は、合成音声信号をスピーカ２２２に出力する。
【０００９】
図２を参照して上述した分析合成システム２００に関連した不利益が存在する。分析ユニット２０４が中間または低いビットレートでアナログ音波１００をサンプリングした場合、合成ユニット２２０によって発生され、スピーカ２２２によって出力された符号化音声は、自然に聞こえない。図３は、合成ユニット２２０によってスピーカ２２２に出力された合成音声信号３００の例を示す。合成音声信号３００は、音声群３０４〜３０８とともに背景ノイズ３０２を含む。合成音声３００内には、音声群３０４〜３０８内で発生された、減衰された背景ノイズ３０２があることに注目されたい。この現象の理由は、分析ユニットコーダ２０４は、アナログ音波１００の図１の音声群１０４〜１０８をモデリングするために特に調整されており、音声群１０４〜１０８内に存在する背景ノイズ１０２を適切に再生することができないということである。したがって、合成音声信号３００がスピーカ２２２によって出力されたとき、これは、音声群３０４〜３０８の初めおよび終わりで生じる、背景ノイズ３０２の振幅における突然の変化のために、人の耳には不自然に聞こえる。
【００１０】
したがって、音声を符号化および復号化するための分析合成システムの分析ユニットによって中間または低いビットレートで符号化された音声信号を考慮すると、人の耳に自然かつ現実的に聞こえる合成音声信号を合成ユニットが出力することを可能とするシステムを提供することが有利であろう。この発明は、この利点を提供する。
【００１１】
【発明の概要】
この発明は、背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法を含む。たとえば、この発明は、通信ネットワークを介して符号化音声信号を受取り、次に、その中に含まれる異なったパラメータを復号化しかつ合成し、合成音声信号を発生する。この発明は、合成音声信号内に表わされる非音声期間を決定する。決定された非音声期間は次に、シミュレートされた背景ノイズを出力信号に注入するために利用される。さらに、非音声期間はまた、シミュレートされた背景ノイズを合成音声信号の音声期間といつ組合せるべきかを決定するために、この発明によって使用される。この発明の結果得られた出力信号は、音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノイズの連続的な存在のために、人の耳にはより自然かつ現実的に聞こえる向上された合成音声信号である。
【００１２】
背景ノイズが共存する符号化音声の品質を向上させるための方法であって、この方法は、（ａ）合成音声部分および合成背景ノイズ部分を有する合成音声信号を発生するステップを含み、受取られた符号化音声信号に基づく合成音声信号は、線形予測係数、ピッチ係数、励起コードワードおよびエネルギ（利得）を含み、さらにこの方法は、（ｂ）合成音声信号の合成背景ノイズ部分に対応する符号化音声信号から抽出されたエネルギおよび線形予測係数のサブセットを用いて背景ノイズ信号を生成するステップと、（ｃ）背景ノイズ信号および合成音声信号を組合せ、自然に聞こえる出力合成音声信号を発生するステップとを含む。
【００１３】
この明細書の一部に組込まれかつこれを形成する添付の図面は、この発明の実施例を例示し、この説明とともに、この発明の原理を説明する役割を果たす。
【００１４】
【詳細な説明】
この発明の、背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法の以下の詳細な説明では、この発明を完全に理解するために、多くの具体的詳細が述べられる。しかしながら、この発明はこれらの具体的詳細なしに実施可能であることは、当業者には明らかである。他の場合には、周知の方法、処理、構成要素および回路は、この発明の局面を不必要にわかりにくくしないように詳細には記載されない。
【００１５】
この発明は、符号化音声通信の分野内で動作する。具体的には、図４は、この発明が動作する通信および記憶装置のための、音声を符号化し復号化するために用いられる分析合成システム４００の一般的な概略を示す。分析ユニット４０２は、背景ノイズとともに音声通信の表示を構成する信号である会話信号４１２を受取る。この発明における分析ユニット４０２のある実施例は、先に記載された図２の分析ユニット２０４と同じ電気的構成要素および動作を有する。分析ユニット４０２は、会話信号４１２を、音声部分および背景ノイズ部分を含むデジタルの（圧縮された）符号化音声信号４１４に符号化する。受取った会話信号４１２を符号化した後、分析ユニット４０２は、符号化音声信号４１４を通信ネットワーク４０６を介して受信機４１６（たとえば電話または携帯電話）に伝送するか、または、記憶装置４０４（たとえば、磁気または光学記録装置または留守番電話）に伝送することが可能である。
【００１６】
図４の受信機４１６は、通信ネットワーク４０６を介して受信すると、符号化音声信号４１４を合成ユニット４０８に転送する。合成ユニット４０８は、受信した符号化音声信号４１４によって表わされる合成音声信号を発生する。加えて、この発明に従って、合成ユニット４０８は、受信した符号化音声信号４１４内に表わされる受信した背景ノイズを利用して、シミュレートされた背景ノイズを生成し、これは合成音声信号と適切に組合される。合成ユニット４０８から結果として得られた出力信号は、信号の音声期間中およびそれらの間に連続したレベルの背景ノイズを有する向上された合成音声信号である。スピーカ４１０は、合成ユニット４０８から受取った向上された合成音声信号を出力するが、これは、音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノイズが連続しているために人の耳にはより現実的かつ自然に聞こえる。
【００１７】
図４の記憶装置４０４は、分析ユニット４０２の出力の１つに任意で接続され、いかなる符号化音声信号４１４をも記憶する記憶能力を提供し、後からある所望のときにこれを再生することができる。この発明に従う記憶装置４０４のある実施例は、ランダムアクセスメモリ（ＲＡＭ）ユニット、フロッピーディスク、ハードドライブメモリユニットまたはデジタル留守番電話メモリである。記憶された符号化音声信号４１４が後に再生されると、これは記憶装置４０４から合成ユニット４１８にまず出力される。合成ユニット４１８は、上述した合成ユニット４０８と同じ機能を果たす。合成ユニット４１８から得られる出力信号は、信号の音声期間中およびそれらの間に連続したレベルの背景ノイズを有する、向上された合成音声信号である。スピーカ４２０は、合成ユニット４０８から受取った向上された合成音声信号を出力するが、これは人の耳にはより現実的かつ自然に聞こえる。
【００１８】
図５は、合成回路５００のブロック図を示すものであるが、これは、この発明の実施例に従う図４の合成ユニット４０８のある実施例である。合成回路５００のデコーダ回路５０２は、通信ネットワーク４０６を介して符号化音声信号４１４を受信する構成要素である。デコーダ回路５０２は次に、音声通信４１２を表わす、符号化音声信号４１４内で受取られる異なったパラメータを復号化しかつ合成する。音声信号４１４は、符号化された線形予測係数（ＬＰＣ）、ピッチ係数、固定の励起コードワードおよびエネルギを含む。符号化音声信号４１４内に含まれるエネルギから利得係数を得ることが可能であることが認められる。デコーダ回路５０２は、線形予測係数およびエネルギの両方を含む信号５１０を、ノイズ生成器回路５０４に伝送する。さらに、デコーダ回路５０２は、合成音声信号５１２を、加算器回路５０８および音声活性検出器（ＶＡＤ）回路５０６の両方に伝送する。合成音声信号５１２は、合成音声部分および合成背景ノイズ部分を含む。この発明に従うデコーダ回路５０２のある実施例は、ソフトウェアで実現される。
【００１９】
図５のノイズ生成器回路５０４は、信号５１０の線形予測係数のサブセットおよびエネルギのサブセットを利用し、シミュレートされた背景ノイズ信号５１６を発生し、これは加算器回路５０８に伝送される。加算器回路５０８は、出力信号５１８を人の耳により自然に聞こえるようにするために、シミュレートされた背景ノイズ信号５１６を合成音声信号５１２の合成音声部分に加算する。さらに、加算器回路５０８は、合成音声信号５１６の非音声部分または合成背景ノイズ部分をその出力に通過させ、これは自然に聞こえる出力合成音声信号５１８の一部となる。加算器回路５０８は、以下に記載する音声活性検出器回路５０６によって伝送される信号５１４の受信に基づいて、どの機能を果たすかが異なっている。この発明に従うと、ノイズ生成器回路５０４および加算器回路５０８もまた、ソフトウェアで実現可能である。
【００２０】
図５の音声活性検出器回路５０６は、受取った合成音声信号５１２内に含まれる合成された非音声期間（たとえば合成背景ノイズのみの期間）を合成音声期間から区別する。音声活性検出器回路５０６が合成音声信号５１２の非音声期間を決定すると、これは、信号５１４としてノイズ生成器回路５０４および加算器回路５０８の両方に表示を伝送する。ノイズ生成器回路５０４は、信号５１４を利用し、シミュレートされた背景ノイズ信号５１６の発生の際にこれを支援する。この発明に従う音声活性検出器回路５０６のある実施例は、ソフトウェアで実現される。
【００２１】
加算器回路５０８による図５の信号５１４の受信は、これが行なう特定の機能を左右し、自然な音の出力合成音声信号５１８を発生する。具体的には、信号５１４内に含まれる非音声期間は、受取った合成音声信号５１２内に含まれる合成非音声期間をその出力にいつ通過させるかを、加算器回路５０８に示す。さらに、信号５１４内に含まれる音声期間は、受取った合成音声信号５１２内に含まれる合成音声期間と受取ったシミュレートされた背景ノイズ信号５１６とをいつ加算するべきかを、加算器回路５０８に示す。
【００２２】
図６は、合成回路６００のブロック図を示し、これは、この発明の実施例に従う図４の合成ユニット４０８の別の実施例である。合成回路６００は、図５の合成回路５００と類似しているがただし、これは音声活性検出器回路５０６を含まない。デコーダ回路５０２、ノイズ生成器回路５０４および加算器回路５０８は各々、一般的には、図５を参照して上述したのと同じ機能を果たす。付加機能を行なう合成回路６００内の構成要素は、デコーダ回路５０２のみである。デコーダ回路５０２が、合成音声信号５１２の非音声期間を示す信号５１４を発生するために、図４の分析ユニット４０２は、図５の音声活性検出器回路５０６と同じ機能を果たす音声活性検出器回路も含む。分析ユニット４０２内に位置する音声活性検出器回路によって決定される非音声期間データは次に、符号化音声信号４１４内に含まれる。
【００２３】
図７は、図５および図６内に位置するこの発明の実施例に従うデコーダ回路５０２のある実施例のブロック図を示す。励起コードブック回路７０２、ピッチ合成フィルタ回路７０４および線形予測係数合成フィルタ回路７０６は各々、図４の通信ネットワーク４０６を介して転送された符号化音声信号４１４を受取る。励起コードブック回路７０２は、固定の励起コードワードを受取り、受取った符号化音声信号４１４内に表わされたその利得値によって乗算された対応するデジタル信号パターンを信号７１０として発生する。励起コードブック回路７０２は次に、信号７１０をピッチ合成フィルタ回路７０４に伝送する。この発明に従う励起コードブック回路７０２のある実施例は、ソフトウェアで実現される。
【００２４】
図７のピッチ合成フィルタ回路７０４は、符号化音声信号４１４内に含まれる符号化されたピッチ係数を受取り、対応する復号化されたピッチ信号を発生し、出力信号７１２を発生するために、これを受取った信号７１０と合成する。線形予測係数合成フィルタ回路７０６は、符号化音声信号４１４内に含まれる符号化された線形予測係数を受取り、これは、「合成」されてから信号７１２に加えられ、合成音声信号５１２を発生する。線形予測係数合成フィルタ回路７０６はまた、エネルギおよび線形予測係数を含む信号５１０を、図５および図６のノイズ生成器回路５０４に出力する。この発明に従うと、ピッチ合成フィルタ回路７０４および線形予測係数合成フィルタ回路７０６もまた、ソフトウェアで実現可能である。
【００２５】
図８は、図５および図６内に位置するこの発明の実施例に従うノイズ生成器回路５０４のある実施例のブロック図を示す。移動平均回路８０６は、図５の音声活性検出器５０６から非音声信号５１４を受取り、かつ図７の線形予測係数合成フィルタ回路７０６からエネルギおよび線形予測係数を含む信号５１０を受取る構成要素である。信号５１４は、信号５１０の線形予測係数およびエネルギ内に存在する非音声期間（たとえば合成背景ノイズのみの期間）を、移動平均回路８０６に示す。移動平均回路８０６は次に、信号５１０内に表わされる背景ノイズ期間に対応する受取った線形予測係数の移動平均値を決定する。さらに、移動平均回路８０６は、信号５１０内に表わされる背景ノイズ期間に対応するエネルギの移動平均値も決定する。したがって、移動平均回路８０６は、非音声期間の合成背景ノイズに対応する、エネルギの決定された移動平均および線形予測係数の決定された移動平均値を連続的に記憶する。移動平均回路８０６は次に、両方の記憶された移動平均値のコピーを信号８１２として、線形予測係数合成フィルタ回路８０４に出力する。
【００２６】
別の実施例では、図８の移動平均回路８０６を図７の線形予測係数合成フィルタ回路７０６内に位置付けることも可能である。さらに、別の実施例では、移動平均回路８０６を線形予測係数合成フィルタ回路７０６内に部分的に位置付けることも可能であり、一方で残りの回路構成を図８のノイズ生成器回路５０４内に位置づける。具体的には、背景ノイズの、線形予測係数の移動平均値およびエネルギの移動平均値を決定する移動平均回路８０６の回路構成は、線形予測係数合成フィルタ回路７０６内に位置付けられ、一方で、移動平均回路８０６の記憶回路は、ノイズ生成器回路５０４内に位置付けられる。この発明に従う移動平均回路８０６のある実施例は、ソフトウェアで実現される。
【００２７】
図８の白色ノイズ生成器回路８０２は、白色ガウスノイズ信号８１０を発生し、これは線形予測係数合成フィルタ回路８０４に出力される。この発明に従う白色ノイズ生成器回路８０２のある実施例は、乱数生成器回路である。この発明に従う白色ノイズ生成器回路８０２の別の実施例は、ソフトウェアで実現される。線形予測係数合成フィルタ回路８０４は、受取った信号８１０および８１２を用いて、シミュレートされた背景ノイズ信号５１６を発生し、これは図５および図６の加算器回路５０８に出力される。この発明に従う線形予測係数合成フィルタ回路８０４のある実施例は、ソフトウェアで実現される。
【００２８】
図９は、この発明の実施例に従う図５および図６の合成回路５００および６００によってそれぞれ出力されるより自然に聞こえる合成音声信号５１８を示す。自然に聞こえる出力合成音声信号５１８は、背景ノイズ９０２および合成音声群９０４〜９０８を含む。背景ノイズ９０２は、合成音声群９０４〜９０８中およびそれらの間に連続して存在することに注目されたい。この発明によってシミュレートされた背景ノイズを合成音声群９０４〜９０８とを組合せることによって、向上された合成音声信号５１８は、人の耳に自然かつ現実的に聞こえる。
【００２９】
この発明の特定の実施例の前の記載は、例示および説明の目的で提示された。これは、余すところないまたはこの発明を開示された正確な態様に限定するものではなく、明らかに、多くの変形および変更が上記教示に鑑みて可能である。実施例は、この発明の原理およびその実践的適用を最もよく説明するために選択され記載され、これによって当業者が、企図された特定の使用に適合するようなさまざまな変形でこの発明およびさまざまな実施例を最良に利用することを可能とする。この発明の範囲は、前掲の特許請求の範囲およびその等価によって定義されることが意図される。
【図面の簡単な説明】
【図１】信号にわたって背景または周囲ノイズを含む典型的な音声の会話のアナログ音波を示す図である。
【図２】音声の符号化および復号化のための先行技術の分析合成システムの一般的な概略ブロック図である。
【図３】先行技術のシステムに従う合成ユニットによって出力される合成音声信号を示す図である。
【図４】この発明が動作する音声の符号化および復号化のための分析合成システムの一般的概略図である。
【図５】図４の分析合成システム内に位置するこの発明の実施例に従う合成ユニットのある実施例のブロック図である。
【図６】図４の分析合成システム内に位置するこの発明の実施例に従う合成ユニットの別の実施例のブロック図である。
【図７】図５および図６の合成ユニット内に位置するこの発明の実施例に従うデコーダ回路のある実施例のブロック図である。
【図８】図５および図６の合成ユニット内に位置するこの発明の実施例に従うノイズ生成器回路のある実施例のブロック図である。
【図９】この発明の実施例に従う合成ユニットによって出力されるより自然に聞こえる合成音声信号の図である。

Claims

合成音声信号の品質を向上させるための方法であって、前記方法は、
（ａ）音声部分および背景ノイズ部分を有する符号化音声信号から前記合成音声信号を発生するステップを含み、前記符号化音声信号は、線形予測係数、ピッチ係数、励起コードワードおよびエネルギを含み、さらに、
（ｂ）前記符号化音声信号の前記背景ノイズ部分および前記音声部分に対応する合成音声信号の部分を決定するステップと、
（ｃ）前記符号化音声信号の前記背景ノイズ部分に対応する前記エネルギおよび前記線形予測係数のサブセットを用いて背景ノイズ信号を発生するステップと、
（ｄ）前記背景ノイズ信号を前記符号化音声信号の前記音声部分に対応する前記合成音声信号に付加して、自然に聞こえる出力合成音声信号を発生するステップとを含む、方法。
前記ステップ（ｃ）は、前記符号化音声信号の前記背景ノイズ部分に対応する前記線形予測係数のサブセットの移動平均値および前記エネルギの移動平均値を決定するステップをさらに含み、前記移動平均値は、前記背景ノイズ信号を発生するために用いられる、請求項１に記載の方法。
前記ステップ（ｃ）は、白色ノイズ信号を前記符号化音声信号の前記音声部分に対応する前記合成音声信号に付加するステップをさらに含む、請求項２に記載の方法。
前記白色ノイズ信号は、乱数生成器回路によって発生される、請求項３に記載の方法。
前記ステップ（ａ）は、
前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに対応するデジタル信号パターンを発生するステップと、
前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成するステップと、
前記符号化音声信号の前記ピッチ係数を用いて前記合成音声信号を部分的に合成するステップと、
前記符号化音声信号の前記線形予測係数を用いて前記合成音声信号を部分的に合成するステップとをさらに含む、請求項４に記載の方法。
合成音声信号の品質を向上させるための方法であって、前記方法は、
（ａ）線形予測係数、ピッチ係数、励起コードワードおよびエネルギを含む符号化音声信号から前記合成音声信号を発生するステップと、
（ｂ）前記線形予測係数のサブセットおよび前記符号化音声信号の前記エネルギを用いて背景ノイズ信号を発生するステップと、
（ｃ）前記合成音声信号の音声期間および非音声期間を決定するステップと、
（ｄ）前記合成音声信号の前記音声期間の間、前記背景ノイズ信号を前記合成音声信号に付加し、自然に聞こえる出力合成音声信号を発生するステップとを含む、方法。
前記ステップ（ｂ）は、前記合成音声信号の背景ノイズ部分に対応する前記線形予測係数のサブセットの移動平均値および前記エネルギの移動平均値を決定するステップをさらに含み、前記移動平均値は、前記背景ノイズ信号を発生するために用いられる、請求項６に記載の方法。
前記ステップ（ｂ）は、白色ノイズ信号を前記符号化音声信号の前記音声部分に対応する前記合成音声信号に付加するステップをさらに含む、請求項７に記載の方法。
前記白色ノイズ信号は、乱数生成器回路によって発生される、請求項８に記載の方法。
前記ステップ（ａ）は、
前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに対応するデジタル信号パターンを発生するステップと、
前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成するステップと、
前記符号化音声信号の前記ピッチ係数を用いて前記合成音声信号を部分的に合成するステップと、
前記符号化音声信号の前記線形予測係数を用いて前記合成音声信号を部分的に合成するステップとをさらに含む、請求項８に記載の方法。
合成音声信号の品質を向上させるための装置であって、前記装置は、
線形予測係数、ピッチ係数、励起コードワードおよびエネルギを含む符号化音声信号から前記合成音声信号を発生するためのデコーダ回路を含み、前記符号化音声信号は、音声部分および背景ノイズ部分を有し、さらに、
前記デコーダ回路に結合され、前記符号化音声信号の前記背景ノイズ部分に対応する前記線形予測係数のサブセットおよび前記エネルギを用いて背景ノイズ信号を発生するためのノイズ生成器回路を含み、さらに、
前記デコーダ回路および前記ノイズ生成器回路に結合される加算器を含み、前記背景ノイズ信号を前記符号化音声信号の前記音声部分に付加して自然に聞こえる出力合成音声信号を発生する、装置。
前記符号化音声信号の前記背景ノイズ部分に対応する前記エネルギの移動平均値および前記線形予測係数のサブセットの移動平均値を決定するための移動平均回路をさらに含む、請求項１１に記載の装置。
前記ノイズ生成器回路は、白色ノイズ信号を発生するための白色ノイズ生成器回路をさらに含み、前記ノイズ生成器回路は、前記白色ノイズ信号を用いて前記背景ノイズ信号を発生する、請求項１２に記載の装置。
前記白色ノイズ生成器回路は、乱数生成器回路である、請求項１３に記載の装置。
前記ノイズ生成器回路は、前記移動平均値を受取るよう前記移動平均回路に結合される第１の線形予測係数合成フィルタ回路をさらに含み、前記第１の線形予測係数合成フィルタ回路は、前記白色ノイズ信号を受取るよう前記白色ノイズ生成器回路にさらに結合され、前記第１の線形予測係数合成フィルタ回路は、前記白色ノイズ信号および前記移動平均値を用いて前記背景ノイズ信号を発生する、請求項１３に記載の装置。
前記デコーダ回路は、
前記符号化音声信号を受取るよう結合され、前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに対応するデジタル信号パターンを発生する励起コードブック回路をさらに含み、前記デコーダ回路は、前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成し、さらに、
前記符号化音声信号を受取るよう結合され、前記ピッチ係数を用いて前記合成音声信号を部分的に合成するピッチ合成フィルタ回路と、
前記符号化音声信号を受取るよう結合され、前記線形予測係数および前記エネルギを用いて前記合成音声信号を部分的に合成する第２の線形予測係数合成フィルタ回路とをさらに含む、請求項１５に記載の装置。