JP2004198522A - 適応符号帳の更新方法、音声符号化装置及び音声復号化装置 - Google Patents
適応符号帳の更新方法、音声符号化装置及び音声復号化装置 Download PDFInfo
- Publication number
- JP2004198522A JP2004198522A JP2002364109A JP2002364109A JP2004198522A JP 2004198522 A JP2004198522 A JP 2004198522A JP 2002364109 A JP2002364109 A JP 2002364109A JP 2002364109 A JP2002364109 A JP 2002364109A JP 2004198522 A JP2004198522 A JP 2004198522A
- Authority
- JP
- Japan
- Prior art keywords
- decoded
- adaptive codebook
- waveform
- speech
- excitation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】復号化波形生成部201は、ゲイン符号とインデクスに対応する2つの音源を用いてローカルな音源波形を生成する。復号化波形挿入部202は、復号化音源データメモリ204に記憶されている復号化音源データを未来から過去にメモリシフトしてメモリから出た部分を破棄し、未来の空いた部分にローカルな復号化音源波形を格納する。フィルタ処理部203は、ローカルな復号化音源波形を挿入された後の復号化音源データに対してフィルタリングを行う。フィルタ処理部203にてピッチフィルタリングされた後の復号化音源データを、更新された適応符号帳とする。
【選択図】 図2
Description
【発明の属する技術分野】
本発明は、CELP方式の音声符号化装置/音声復号化装置における適応符号帳の更新方法に関する。
【0002】
【従来の技術】
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声信号を伝送する場合、音声信号の伝送効率を高めるため、圧縮符号化技術がよく使われる。これまでに多くの音声符号化方式が開発されており、CELP方式等、近年開発された低ビットレート音声符号化方式の多くは、音声信号をスペクトル包絡情報とスペクトルの微細構造情報とに分離し、分離した情報をそれぞれ圧縮・符号化する方式である(例えば、非特許文献1)。
【0003】
そして、近年では、音声符号化装置の更なる音質の向上が求められている。この点、CELP方式の音声符号化装置における確率的符号帳の構成、適応符号帳の構成及び探索方法については研究が進んでいる(例えば、特許文献1)。
【0004】
【特許文献1】
特開2002−182697号公報
【非特許文献1】
M.R.Schroeder, B.S.Atal, "Code Excited Linear Prediction: High QualitySpeech at Low Bit Rate", IEEE proc., ICASSP'85 pp.937-940
【0005】
【発明が解決しようとする課題】
しかしながら、適応符号帳の更新についての研究は余りなされておらず、この部分の性能向上に課題を有している。
【0006】
本発明はかかる点に鑑みてなされたものであり、CELP方式の音声符号化装置/音声復号化装置において音質の向上を図ることができる適応符号帳の更新方法、音声符号化装置及び音声復号化装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
本発明の適応符号帳の更新方法は、適応符号帳である復号化音源データを未来から過去にメモリシフトしてメモリから出た部分を破棄する工程と、未来の空いた部分にローカルな復号化音源波形を格納する工程と、ローカルな復号化音源波形を挿入された後の復号化音源データに対してフィルタリングを行う工程とを具備する方法を採る。
【0008】
この方法により、適応符号帳のピッチ構造を強調することができ、復号化音源データをより良好な音質が得られるように加工することができる。
【0009】
本発明の適応符号帳の更新方法は、フィルタリングを行う工程において、未来から過去に向かってフィルタをかける後ろ向きフィルタリングを用いる方法を採る。
【0010】
この方法により、復号化音源データをより良好な音質が得られるように加工することができ、さらに、その加工による伝送誤りの伝播を少なくすることができる。
【0011】
本発明の適応符号帳の更新方法は、フィルタリングを行う工程において、後ろ向きフィルタのピッチフィルタにより、適応符号帳の符号に対応するラグと復号化された適応符号帳の音源のゲインを用いてピッチフィルタリングを行う方法を採る。
【0012】
この方法により、ピッチ構造のはっきりした復号化音源データを用意することができる。
【0013】
本発明の音声符号化装置は、上記いずれかの方法により適応符号帳の更新を行う構成を採る。また、本発明の音声復号化装置は、上記いずれかの方法に対応した適応符号帳の更新を行う構成を採る。
【0014】
これらの構成により、適応符号帳である復号化音源データを、より良好な音質が得られるように加工することができる。
【0015】
【発明の実施の形態】
本発明の骨子は、適応符号帳である復号化音源データを未来から過去にメモリシフトしてメモリから出た部分を破棄し、未来の空いた部分にローカルな復号化音源波形を格納し、ローカルな復号化音源波形を挿入された後の復号化音源データに対してフィルタリングを行うことにより適応符号帳を更新することである。
【0016】
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
【0017】
(実施の形態1)
図1は、CELP方式の音声符号化装置の構成を示すブロック図である。なお、入力音声信号は、20ms程度の時間間隔で区切られた処理フレームごとに、音声符号化装置に逐次入力されるものとする。
【0018】
処理フレームごとに音声符号化装置に入力された入力音声信号は、まず、LPC分析部101に供給される。LPC分析部101は、入力音声信号をLPC(Linear Predictive Coding)分析してLPC係数を取得し、LPC係数をベクトル量子化してLPC符号とし、このLPC符号を復号化して復号化LPC係数を得る。
【0019】
適応符号帳102は、一般に、過去の合成音源波形を一定の長さ(ピッチ探索範囲)だけメモリに格納したものである。ここで、符号化は、どの位前の合成音源を使用するかの値(一般にラグと呼ばれ、人の母音等の有声音では基本周期(ピッチ)に対応する)と、そのゲインの2つのパラメータで行われる。したがって、適応符号帳102は、人の母音等規則的に似ている波形が並ぶ部分の符号化において符号化効率に大きく貢献する。
【0020】
確率的符号帳103は、番号付けられたサブフレーム長の音源サンプルが複数格納されているものである。
【0021】
音源作成部104は、適応符号帳102及び確率的符号帳103から、それぞれ適応コードベクトル及び固定コードベクトルを読み出して、LPC合成部105へ送る。LPC合成部105は、音源作成部104から供給される適応コードベクトル及び固定コードベクトルを、LPC分析部101より与えられる復号化LPC係数をフィルタ係数にもつ全極型の合成フィルタでそれぞれ合成フィルタリングし、合成適応コードベクトル及び合成固定コードベクトルを得る。
【0022】
比較部106は、LPC合成部105から出力される合成適応コードベクトルと合成固定コードベクトルと入力音声信号との関係を分析して、合成適応コードベクトルに乗じる適応符号帳最適ゲインと合成固定コードベクトルに乗じる確率的符号帳最適ゲインをそれぞれ求める。
【0023】
また、比較部106は、合成適応コードベクトルに適応符号帳最適ゲインを乗じて得られるベクトルと、合成固定コードベクトルに確率的符号帳最適ゲインを乗じて得られるベクトルとを加算して合成音声ベクトルを取得し、合成音声と入力音声信号との距離計算を行う。そして、比較部106は、適応符号帳102が格納している適応コードベクトルと、確率的符号帳103が格納している固定コードベクトルの全組み合わせについて合成音声ベクトルを取得し、合成音声と入力音声信号との距離が最小となる適応コードベクトルのインデクスと固定コードベクトルのインデクス求める。そして、比較部106は、各符号帳から出力されるコードベクトルのインデクス、インデクスに対応するそれぞれのコードベクトル、並びにインデクスに対応する適応符号帳最適ゲイン及び確率的符号帳最適ゲインをパラメータ符号化部107へ送る。
【0024】
パラメータ符号化部107は、適応符号帳最適ゲインと確率的符号帳最適ゲインを符号化してゲイン符号を取得し、ゲイン符号と、LPC分析部101から与えられたLPC符号と、各符号帳のインデクスとを処理フレームごとにまとめて出力する。
【0025】
また、パラメータ符号化部107は、適応符号帳のインデクスに対応する適応コードベクトルにゲイン符号に対応する適応符号帳ゲインを乗じて得られるベクトルと、確率的符号帳のインデクスに対応する固定コードベクトルにゲイン符号に対応する確率的符号帳ゲインを乗じたベクトルとの2つベクトルを適応符号帳102に出力する。
【0026】
なお、LPC合成部105における合成フィルタリングは、線形予測係数や、高域強調フィルタや、入力音声を長期予測分析して得られる長期予測係数を用いた聴感重み付けフィルタを併用するのが一般的である。
【0027】
また、適応符号帳と確率的符号帳の最適インデクスの探索、最適ゲインの算出、最適ゲインの符号化処理は、フレームを更に分割したサブフレーム単位で行われるのが一般的である。
【0028】
次に、適応符号帳102の内部処理について、図2を用いて説明する。図2は、本実施の形態に係る適応符号帳102の内部構成を示す機能ブロック図である。図2に示すように、適応符号帳102は、復号化波形生成部201と、復号化波形挿入部202と、フィルタ処理部203と、復号化音源データメモリ204とから主に構成されている。
【0029】
復号化波形生成部201は、パラメータ符号化部107から入力したゲイン符号とインデクスに対応する2つの音源を用いてローカルな音源波形D(i)を以下の式(1)により生成する。
D(i)=ga×A(i)+gs×S(i)・・・(1)
i:波形のインデクス(i=0〜L−1)
L:サブフレーム長
ga:復号化された適応符号帳の音源のゲイン
A(i):復号化された適応符号帳の音源波形
gs:復号化された確率的符号帳の音源のゲイン
S(i):復号化された確率的符号帳の音源波形
生成されたローカルな音源波形D(i)は、復号化波形挿入部202に出力される。
【0030】
復号化波形挿入部202は、復号化音源データメモリ204に記憶されている復号化音源データを未来から過去にメモリシフトしてメモリから出た部分を破棄し、未来の空いた部分にローカルな復号化音源波形D(i)を格納する。以下の式(2)は、この手順を表わしたものである。
M(i)=M(i+L) (ただし、i=0〜P-L-1)
M(P-L+I)=D(i) (ただし、i=0〜L-1)・・・(2)
M(i):適応符号帳としての復号化音源データ
i:波形のインデクス(i=0〜L−1)
L:サブフレーム長
P:適応符号帳としての復号化音源データの格納するメモリ長
【0031】
上記処理の完了を示す信号が、フィルタ処理部203に出力される。フィルタ処理部203は、ローカルな復号化音源波形D(i)を挿入された後の復号化音源データに対してフィルタリングを行う。
【0032】
ここで、本実施の形態においては、後ろ向きフィルタリングを用いた場合を説明する。なお、前向きフィルタリングでもピッチ強調や周波数適応等の効果は得られるが、誤りの伝播が若干長くなることに注意されたい。
【0033】
そして、後ろ向きフィルタの例として、ピッチフィルタを例として説明する。なお、ピッチフィルタ以外でも、低域/高域強調フィルタや、バンドパスフィルタ等を用いることにより効果を得ることができる。
【0034】
フィルタ処理部203は、ピッチフィルタリングを適応符号帳の符号に対応するラグと復号化された適応符号帳の音源のゲインを用いて行う。具体的処理を以下の式(3)に示す。
M(i)=M(i)+a×M(i+T) (ただし、i=P-T-1〜0)・・・(3)
M(i):適応符号帳としての復号化音源データ
a:フィルタ係数(a=0.05×ga+0.09)
i:波形のインデクス
T:復号化されたラグ
ga:復号化された適応符号帳の音源のゲイン
【0035】
なお、上記において、「0.05」、「0.09」という定数は復号化されたゲインとピッチフィルタの係数との関係を表わす1次式の定数である(本実施の形態では実験的に最も性能がよかった値を示した)。この定数を調節することにより、適応符号帳のピッチ成分の強弱を変化させることができる。もちろん、2次以上の式や特殊関数を用いた式等、より複雑な式を用いてより性能を上げることは容易である。
【0036】
音声符号化装置は、フィルタ処理部203にてピッチフィルタリングされた後の復号化音源データを、更新された適応符号帳とし、次のサブフレームの符号化/復号化を行っていく。
【0037】
このように、復号化音源データに対してフィルタリングを行うことにより、適応符号帳のピッチ構造を強調することができる。また、最新のラグによるピッチフィルタにより、より最新のピッチ構造が強化され、処理された適応符号帳を用いることによってより高品質の音声を得ることができる。
【0038】
なお、上記で示した後ろ向きフィルタはAR型(一度フィルタリングされた値がそのままフィルタの状態となるタイプ)であるが、MA型のフィルタとしても同様の効果は得られる。ただし、長期相関が強く(ピッチ構造がはっきりしており)且つラグが短い場合にはよりピッチ成分を強調できるAR型が有効である。
【0039】
また、上記説明はCELP型の符号化装置を例としたが、CELPだけに留まらず復号化波形データ(なお、本実施の形態では「復号化音源データ」としている)として過去の復号化音源波形または復号化音声波形を用いる符号化装置の場合でも、同波形データに対して本発明を適用すれば同様の効果を得ることができる。
【0040】
なお、音声復号化装置(デコーダ)では、図1に示したLPC分析部101、適応符号帳102、確率的符号帳103、音源作成部104、LPC合成部105と同一の構成を備え、音声符号化装置から伝送されてきた各符号を復号化して音源波形を得る。この際、本発明は適応符号帳の更新の部分で用いられる。
【0041】
【発明の効果】
以上説明したように、本発明では、適応符号帳等、過去の復号化音源データまたは復号化音声波形を復号化音源データとして蓄積・更新するCELP型符号化装置において、復号化音源データの状態更新を行う際に、最新の復号化波形により復号化音源データの追加とシフトを行った後にフィルタリングを行うこととした。これにより、その結果得られた波形を次の符号化または復号化に使用する復号化音源データとすれば、復号化音源データをより良好な音質が得られるように加工することができる。また、未来から過去に向かってかける後ろ向きフィルタリングを用いることにより、その加工による伝送誤りの伝播を少なくすることができる。また、後ろ向きフィルタリングが復号化したラグを用いたピッチフィルタリングを含むことにより、よりピッチ構造のはっきりした復号化音源データを用意することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態1に係るCELP方式の音声符号化装置の構成を示すブロック図
【図2】上記実施の形態に係る適応符号帳の内部構成を示す機能ブロック図
【符号の説明】
101 LPC分析部
102 適応符号帳
103 確率的符号帳
104 音源作成部
105 LPC合成部
106 比較部
107 パラメータ符号化部
201 復号化波形生成部
202 復号化波形挿入部
203 フィルタ処理部
204 復号化音源データメモリ
Claims (5)
- 適応符号帳である復号化音源データを未来から過去にメモリシフトしてメモリから出た部分を破棄する工程と、未来の空いた部分にローカルな復号化音源波形を格納する工程と、ローカルな復号化音源波形を挿入した後の復号化音源データに対してフィルタリングを行う工程とを具備することを特徴とする適応符号帳の更新方法。
- フィルタリングを行う工程において、未来から過去に向かってフィルタをかける後ろ向きフィルタリングを用いることを特徴とする請求項1記載の適応符号帳の更新方法。
- フィルタリングを行う工程において、後ろ向きフィルタのピッチフィルタにより、適応符号帳の符号に対応するラグと復号化された適応符号帳の音源のゲインを用いてピッチフィルタリングを行うことを特徴とする請求項2記載の適応符号帳の更新方法。
- 請求項1から請求項3のいずれかに記載の方法により適応符号帳の更新を行うことを特徴とする音声符号化装置。
- 請求項1から請求項3のいずれかに記載の方法に対応した適応符号帳の更新を行うことを特徴とする音声復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002364109A JP4373667B2 (ja) | 2002-12-16 | 2002-12-16 | 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002364109A JP4373667B2 (ja) | 2002-12-16 | 2002-12-16 | 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004198522A true JP2004198522A (ja) | 2004-07-15 |
JP4373667B2 JP4373667B2 (ja) | 2009-11-25 |
Family
ID=32762072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002364109A Expired - Lifetime JP4373667B2 (ja) | 2002-12-16 | 2002-12-16 | 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4373667B2 (ja) |
-
2002
- 2002-12-16 JP JP2002364109A patent/JP4373667B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP4373667B2 (ja) | 2009-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102648493B (zh) | 音频信号处理方法和设备 | |
EP0409239B1 (en) | Speech coding/decoding method | |
JP4005359B2 (ja) | 音声符号化及び音声復号化装置 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
US20100010810A1 (en) | Post filter and filtering method | |
JP2002328700A (ja) | フレーム消去の隠蔽およびその方法 | |
CN1957399B (zh) | 语音/音频解码装置以及语音/音频解码方法 | |
JP4789430B2 (ja) | 音声符号化装置、音声復号化装置、およびこれらの方法 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP2004138756A (ja) | 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム | |
CN108053830B (zh) | 解码方法、解码装置、和计算机可读取的记录介质 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JP4438280B2 (ja) | トランスコーダ及び符号変換方法 | |
JP4373667B2 (ja) | 適応符号帳の更新方法、適応符号帳更新装置、音声符号化装置及び音声復号化装置 | |
JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3232701B2 (ja) | 音声符号化方法 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
JPH11259098A (ja) | 音声符号化/復号化方法 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3468862B2 (ja) | 音声符号化装置 | |
WO2005045808A1 (en) | Harmonic noise weighting in digital speech coders | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051003 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080901 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090811 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090904 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120911 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4373667 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130911 Year of fee payment: 4 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |