JP3042886B2

JP3042886B2 - ベクトル量子化器の方法および装置

Info

Publication number: JP3042886B2
Application number: JP6522073A
Authority: JP
Inventors: エイジャーソン・イラ; エイジャシウク・マーク; エイハートマン・マシュー
Original assignee: モトローラ・インコーポレーテッド
Priority date: 1993-03-26
Filing date: 1994-03-07
Publication date: 2000-05-22
Anticipated expiration: 2015-05-22
Also published as: AU6084396A; AU6397094A; GB2282943B; CN1166019A; DE4492048T1; CN1109697A; CA2135629A1; AU668817B2; SE524202C2; CA2135629C; CN1150516C; FR2706064A1; US5826224A; BR9404725A; SE9404086D0; US5675702A; GB9422823D0; SE9404086L; GB2282943A; JPH07507885A

Description

【発明の詳細な説明】発明の分野本発明は一般的にはコード駆動リニア予測符号化（Co
de Excited Linear Predictive Coding:CELP）、推
計符号化（Stochastic Coding）、またはベクトル駆動
音声符号化（Vector Excited Speech Coding）を使
用した音声符号器に関し、かつより特定的にはベクトル
和駆動リニア予測符号化（Vector−Sum Excited Line
ar Predictive Coding:VSELP）のためのベクトル量子
化器（vector quantizers）に関する。

発明の背景コード駆動リニア予測（CELP）は高品位の合成音声を
生成するために使用される音声符号化技術である。ベク
トル駆動リニア予測としても知られている、この種の音
声符号化は数多くの音声通信および音声合成の用途に使
用されている。CELPは特に音声品質、データレート、サ
イズおよびコストが重要な事項であるデジタル音声の暗
号化およびデジタル無線電話通信システムに適用可能で
ある。

CELP音声符号器においては、入力音声信号の特性をモ
デル化する長時間（ピッチ）および短時間（フォルマン
ト）予測器が１組の時変フィルタに導入される。特に、
長時間および短時間フィルタが使用できる。該フィルタ
に対する励起または駆動信号（excitation signal）は
記憶されたイノベイション（innovation）シーケンスま
たはコードベクトルから選択される。

各々の音声フレームに対し、最適の駆動信号が選択さ
れる。音声符号器は個々のコードベクトルを前記フィル
タに供給して再生された音声信号を発生する。再生され
た音声信号は元の入力音声信号と比較され、エラー信号
を生成する。このエラー信号は次にそれをスペクトルノ
イズ重み付けフィルタ（spectral noise weighting
filter）を通すことにより重み付けされる。該スペクト
ルノイズ重み付けフィルタは人間の聴覚に基づく応答を
有する。最適の駆動信号は現在の音声フレームに対し最
小のエネルギを有する重み付けされたエラー信号を生成
する選択されたコードベクトルである。

典型的には、リニア予測符号化（LPC）は、短時間フ
ィルタとも称される、１つのブロックのサンプルにわた
る短時間信号相関をモデル化するために使用される。該
短時間信号相関は声道（vocal tract）の共振周波数を
表わす。前記LPC係数は１組の音声モデルのパラメータ
である。短時間予測器フィルタに供給される駆動信号を
特徴付けるために他のパラメータセットを使用できる。
これら他の音声モデルのパラメータは、ラインスペクト
ル周波数（LSF）、セプストラル係数（cepstral coeff
icients）、反射係数、対数領域比（log area ratio
s）、およびアークサインを含む。

音声符号器は典型的には信号を特徴づけるのに必要な
ビットの数を低減するために駆動信号をベクトル量子化
する。前記LPC係数は量子化の前に他の前に述べたパラ
メータセットへと変換することができる。該係数は個別
的に量子化することができ（スカラー量子化）またはそ
れらは組として量子化することができる（ベクトル量子
化）。スカラー量子化はベクトル量子化ほど効率的では
ないが、スカラー量子化はベクトル量子化よりも計算上
の要求およびメモリの要求の上で費用がかからない。LP
Cパラメータのベクトル量子化は符号化の効率が最も重
要な事項である場合の用途に使用される。

マルチセグメントベクトル量子化は符号化効率、ベク
トル量子化サーチの複雑さ、およびベクトル量子化器の
記憶要件をバランスさせるために使用できる。第１の形
式のマルチセグメントベクトル量子化はN_pエレメントの
LPCパラメータベクトルをｎのセグメントに区分する。
該ｎのセグメントの各々は別々にベクトル量子化され
る。第２の形式のマルチセグメントベクトル量子化はLP
Cパラメータをｎのベクトルコードブックの間で区分
し、この場合各々のベクトルコードブックは全てのN_pの
ベクトルエレメントに及んでいる。ベクトル量子化の説
明のために、N_p＝10のエレメントを想定しかつ各々のエ
レメントが２ビットで表わされるものと仮定する。伝統
的なベクトル量子化は全ての可能なコードベクトルの可
能性を表わすために各々10エレメントの2²⁰のコードベ
クトルを必要とする。前記第１の種類の２つのセグメン
トを備えたマルチセグメントベクトル量子化は各々５エ
レメントの2¹⁰＋2¹⁰のコードベクトルを必要とする。２
セグメントを備えた第２の種類のマルチセグメントベク
トル量子化は各々５エレメントの2¹⁰＋2¹⁰のコードベク
トルを必要とする。これらのベクトル量子化の方法の各
々は符号化効率、サーチの複雑さおよび記憶上の要求の
点で異なる利点を与える。したがって、音声符号器の技
術水準は、対応する要件を変えることなく符号化効率を
増大しあるいはサーチの複雑さまたは記憶上の要件を低
減するベクトル量子化器の方法および装置によって利益
を受けることになる。

図面の簡単な説明図１は、本発明に係わる音声符号器を含む無線通信シ
ステムのブロック図である。

図２は、本発明に係わる音声符号器のブロック図であ
る。

図３は、本発明にしたがって使用されるアークサイン
関数のグラフである。

好ましい実施例の説明ここに説明される、ベクトル和駆動リニア予測符号化
（VSELP）と称されるコード駆動リニア予測符号化（CEL
P）に対する一変形は本発明の好ましい実施例である。V
SELPは予め規定された構造を有する駆動コードブックを
使用し、それによってコードブックサーチ処理のために
必要な計算が大幅に低減される。このVSELP音声符号器
は固定小数点ラチス技術（Fixed−Point−Lattice−Tec
hnique:FLAT）に基づく反射係数の単一セグメントまた
はマルチセグメントのベクトル量子化器を使用する。さ
らに、この音声符号器はベクトルコードブックサーチの
複雑さを軽減するために前置量子化器（pre−quantize
r）を使用し、かつ前記反射係数のベクトルコードブッ
クを記憶するのに必要なメモリ量を低減するために高分
解能スカラ量子化器を使用する。結果として得られるも
のは反射係数の高性能のベクトル量子化器であり、これ
はまた計算機的に効率がよく、かつ低減された記憶上の
要求を有する。

図１は、無線通信システム100のブロック図である。
該無線通信システム100は互いに音声データを送信しか
つ受信する２つの送受信機101,113を含む。２つの送受
信機101,113は、トランク式（trunked）無線システムま
たは無線電話通信システムあるいは音声データを送信お
よび受信する任意の他の無線通信システムの一部とする
ことができる。送信機においては、音声信号はマイクロ
ホン108へと入力され、かつ音声符号器が音声モデルの
量子化されたパラメータを選択する。該量子化されたパ
ラメータに対するコードが次に他の送受信機113に送信
される。他の送受信機113においては、前記量子化され
たパラメータに対する送信されたコードが受信機121に
よって受信されかつ音声復号器（speech decoder）123
において音声を再発生するために使用される。再発生さ
れた音声はスピーカ124に出力される。

図２は、VSELP音声符号器200のブロック図である。VS
ELP音声符号器200はコードブックからのどの駆動ベクト
ルを使用するかを決定するために受信されたコードを使
用する。VSELP符号器はＭの基礎ベクトル（basis vect
ors）から構成される2^Mのコードベクトルの駆動コード
ブックを使用する。v_m（ｎ）をＭ番目の基礎ベクトルと
しかつu_i（ｎ）をコードブックにおけるｉ番目のコード
ベクトルとすると次式が得られる。

この場合０≦ｉ≦2^M−１、および０≦ｎ≦Ｎ−１であ
る。言い換えれば、前記コードブックにおける各々のコ
ードベクトルはＭの基礎ベクトルの線形結合（linear
combination）として構成される。該線形結合はθのパ
ラメータにより定義される。

θ_imは次のように定義される。

もしコードワードｉのビットｍ＝１であれば、θ_im＝
＋１もしコードワードｉのビットｍ＝０であれば、θ_im＝
−１コードベクトルｉはＭの基礎ベクトルの和として構成
され、この場合各々の基礎ベクトルの符号（プラスまた
はマイナス）はコードワードｉの対応するビットの状態
により決定される。もしコードワードｉの全てのビット
を補数化すれば、対応するコードベクトルはコードベク
トルｉの否定または負の値となる。したがって、それぞ
れのコードベクトルに対し、その負の値はまた前記コー
ドブックにおけるコードベクトルである。これらの対は
相補（complementary）コードベクトルと称されるが、
それは対応するコードベクトルはお互いの補数であるか
らである。

適切なベクトルが選択された後、ゲインブロック205
は前記ゲイン項、γ、によって前記選択されたベクトル
をスケーリングする。ゲインブロック205の出力は１組
のリニアフィルタ207,209に供給されてＮサンプルの再
生された音声を得る。該フィルタは前記駆動に対しピッ
チの周期性を挿入する「長時間（long−term）」（また
は「ピッチ」）フィルタ207を含む。該「長時間」フィ
ルタ207の出力は次に「短時間（short−term）」（また
は「フォルマント」）フィルタ209へと供給される。短
時間フィルタ209は信号にスペクトルエンベロープを付
加する。

長時間フィルタ207は長時間予測器係数（LTP）を導入
する。長時間フィルタ207は遠い過去の１つまたはそれ
以上のサンプルから次の出力サンプルを予測しようと試
みる。もし１つの過去のサンプルのみが前記予測器にお
いて使用されれば、前記予測器は単一タップ予測器であ
る。典型的には１〜３タップが使用される。単一タップ
の長時間予測器を導入した長時間（「ピッチ」）フィル
タ207の伝達関数は次の式（1.1）によって与えられる。

Ｂ（ｚ）＝1/（１−βz^-L）（1.1）Ｂ（ｚ）は２つの量Ｌおよびβによって特徴づけられ
る。Ｌは「遅れ（lag）」と称される。有声音の（voice
d）音声に対しては、Ｌは典型的にはピッチ周期または
その倍数である。Ｌはまた整数でない値とすることもで
きる。もしＬが整数でなければ、分数的または端数的に
（fractionally）遅延したサンプルを発生するために補
間有限インパルス応答（FIR）フィルタが使用される。
βは長時間（または「ピッチ」）予測器係数である。

短時間フィルタ209は、先行するN_pの出力サンプルか
ら次の出力サンプルを予測するよう試みる、短時間予測
器係数、α_ｉ、を導入する。N_pは典型的には８から12の
範囲に及ぶ。好ましい実施例では、N_pは10に等しい。短
時間フィルタ209は伝統的なLPC合成フィルタと等価であ
る。短時間フィルタ209の伝達関数は次の式（1.2）で与
えられる。

短時間フィルタ209は、オールポール（all−pole）
「合成（synthesis）」フィルタに対する直接形式のフ
ィルタ係数である、α_ｉパラメータによって特徴づけら
れる。α_ｉパラメータに関する詳細は後に説明する。

種々のパラメータ（コード、ゲイン、フィルタパラメ
ータ）は全てが同じレートでシンセサイザ（音声復号
器）に送信されるわけではない。典型的には、短時間パ
ラメータはコードよりも少ない頻度で更新される。ここ
では短時間パラメータの更新レートを「フレームレー
ト」と定義し、かつ更新の間のインターバルを「フレー
ム」と定義する。前記コードの更新ハートはベクトル
長、Ｎ、によって決定される。ここでは該コードの更新
レートを「サブフレームレート」と定義し、かつ前記コ
ードの更新インターバルを「サブフレーム」と定義す
る。フレームは通常整数個のサブフレームから構成され
る。ゲインおよび長時間パラメータは音声符号器の設計
に応じて前記サブフレームのレート、フレームのレー
ト、または中間的ないずれかのレートで更新することが
できる。

コードブックサーチ手順は各々のコードベクトルをCE
LPシンセサイザに対する可能な駆動として試みることか
ら構成される。合成された音声、ｓ′（ｎ）、は211に
おいて入力音声、ｓ（ｎ）と、比較され、かつ差分信
号、e_i、が発生される。この差分信号、e_i（ｎ）、は次
にスペクトル重み付けフィルタ、Ｗ（ｚ）213、（か
つ、たぶん第２の重み付けフィルタ、Ｃ（ｚ））によっ
てろ波されて重み付けされたエラー信号、ｅ′（ｎ）、
を発生する。エネルギ計算機215においてｅ′（ｎ）に
おけるパワーが計算される。最小の重み付けされたエラ
ーパワーを発生するコードベクトルがそのサブフレーム
に対するコードベクトルとして選択される。スペクトル
重み付けフィルタ213は知覚的な考慮事項に基づき前記
エラースペクトルに重み付けするよう作用する。この重
み付けフィルタ213は音声スペクトルの関数でありかつ
前記短時間（スペクトル）フィルタ209のαパラメータ
によって表現できる。

前記ゲイン、γ、を計算するために使用できる２つの
手法がある。前記ゲインは残留エネルギに基づきコード
ブックサーチの前に決定できる。このゲインは次に該コ
ードブックサーチに対して固定される。他の手法はコー
ドブックサーチの間に各々のコードベクトルに対するゲ
インを最適化するものである。最小の重み付けされたエ
ラーを生じるコードベクトルが選択されかつその対応す
る最適のゲインがγに対して使用される。後者の手法は
一般により良好な結果を生じるが、それらは各々のコー
ドベクトルに対しゲインが最適化されるからである。こ
の手法はまたはゲイン項がサブフレームのレートで更新
されなければならないことを意味する。この技術に対す
る最適のコードおよびゲインは次のようにして計算でき
る。

1.サブフレームに対する、ｙ（ｎ）、すなわち重み付け
された入力信号、を計算する。

2.d（ｎ）、すなわち前記サブフレームに対するＢ
（ｚ）およびＷ（ｚ）（および、もし使用されればＣ
（ｚ））フィルタのゼロ入力応答、を計算する。（ゼロ
入力応答は入力のないフィルタの応答、すなわちフィル
タの減衰（decay）状態である。） 3.サブフレームにわたり（０≦ｎ≦Ｎ−１）、ｐ（ｎ）
＝ｙ（ｎ）−ｄ（ｎ）を得る。

4.各々のコードｉに対し、 a.g_i（ｎ）、すなわちＢ（ｚ）およびＷ（ｚ）（もし使
用されれば、Ｃ（ｚ））のコードベクトルｉに対するゼ
ロ状態応答、を計算する。（ゼロ状態応答は初期フィル
タ状態をゼロにセットしたフィルタ出力である。） b.次式のろ波されたコードベクトルｉおよびｐ（ｎ）の
間の相互相関、を計算する。

c.前記ろ波されたコードベクトルｉにおけるパワー、を計算する。

5. ｛C_i｝²/G_i （1.7）を最大にするｉを選択する。

6.選択されたワードコードおよびその対応する量子化さ
れたゲインを使用してＢ（ｚ）およびＷ（ｚ）（および
もし使用されれば、Ｃ（ｚ））のフィルタのフィルタ状
態を更新する。これは前記シンセサイザが前記段階２に
対する次のサブフレームのスタート時に有するのと同じ
フィルタ状態を得るために行なわれる。

コードベクトルｉに対する最適のゲインは次の式（1.
8）によって与えられる。

γ_ｉ＝C_i/G_i （1.8）また、前記最適のゲインγ_ｉ、を使用したコードベク
トルｉに対する総合的な重み付けされたエラーは次の式
（1.9）によって与えられる。

短時間予測器パラメータは図２の短時間フィルタ209
のα_ｉ′である。これらは標準のLPC直接形式のフィル
タ係数でありかつこれらの係数を決定するために任意の
数のLPC分析技術を使用できる。好ましい実施例では、
高速固定小数点共変ラチスアルゴリズム（fast fixed
point covariance lattice algorithm:FLAT）が使
用された。FLATは保証されたフィルタ安定性、非ウィン
ドウ分析、および再帰内での反射係数の量子化の能力を
含むラチスアルゴリズムの全ての利点を有する。さら
に、FLATは数値的に頑健であり（robust）および固定小
数点プロセッサにより容易に実施できる。

前記短時間予測器パラメータは入力音声から計算され
る。プリエンファシスは使用されない。パラメータの計
算のために使用される分析の長さは170サンプル（N_A＝1
70）である。予測器の次数は10（N_p＝10）である。

このセクションは前記FLATアルゴリズムの詳細を説明
する。前記分析インターバルに入る入力音声のサンプル
がｓ（ｎ）;0≦ｎ≦N_A−１で表わされるものとする。FL
ATはラチスアルゴリズムであるから、該技術はステージ
毎に最適の（残留エネルギを最小にする）逆ラチスフィ
ルタを構築するよう試みるものとみることができる。

b_j（ｎ）が逆ラチスフィルタのステージｊからの逆方
向残渣であり、かつf_j（ｎ）が逆ラチスフィルタのステ
ージｊからの順方向残差であると定義すると、次のよう
になる。

f_j（ｎ）の自己相関は、であり、b_j（ｎ−１）の自己相関は次のようになり、そしてf_j（ｎ）およびb_j（ｎ−１）の間の相互相関は
次のようになる。

r_jが前記逆ラチスのステージｊに対する反射係数を表
わすものとすると、次式が得られる。

r_jの決定のために選択した公式は次のように表わすこ
とができる。

次に前記FLATアルゴリズムは次のように説明すること
ができる。

1.最初に、入力音声から共変（自己相関）マトリクスを
計算する。

この場合０≦i,k≦NPである。

2. 3.j＝１にセットする。

4.式（2.7）を使用してr_jを計算する。

5.もしｊ＝NPであれば完了。

6.式（2.4）を使用してF_j（i,k）を計算する。

ここで、０≦i,k≦NP−ｊ−１である。

式（2.5）を使用してB_j（i,k）を計算する。ここで、
０≦i,k≦NP−ｊ−１である。

式（2.6）を使用してC_j（i,k）を計算する。ここで、
０≦i,k≦NP−ｊ−１である。

7.j＝ｊ＋１とし、4.に移る。

前記反射係数について解く前にφアレイは前記自己相
関関数をウィンドウ処理する（windowing）によって修
正する。

φ′（i,k）＝φ（i,k）ｗ（|i−k|）（2.12）反射係数の計算の前に自己相関関数のウィンドウ処理
を行なうことはスペクトルのスムージング（SST）とし
て知られている。

反射係数、r_j、から、短時間LPC予測器係数、α_ｉ、
が計算できる。

反射係数の28ビットの３セグメントベクトル量子化器
が使用される。ベクトル量子化器のセグメントはそれぞ
れ反射係数r1〜r3,r4〜r6およびr7〜r10に及ぶ。ベクト
ル量子化器のセグメントに対するビット割当ては次のよ
うになる。

Q1 11ビット Q2 9ビット Q3 8ビット疲弊的なベクトル量子化器サーチの計算機的な複雑さ
を避けるため、反射係数のベクトル前置量子化が各々の
セグメントで使用される。各々のセグメントの前置量子
化器のサイズは次のようになる。

P1 ６ビット P2 ５ビット P3 ４ビット与えられたセグメントにおいて、前記前置量子化器か
らの各々のベクトルによる残留エラーが計算されかつ一
時メモリに格納される。このリストは最も低いひずみを
有する４つの前置量子化器ベクトルを識別するためにサ
ーチされる。各々の選択された前置量子化器ベクトルの
インデクスが使用されてその量子化器ベクトルに関連す
る量子化器ベクトルの隣接する部分集合が始まるベクト
ル量子化器テーブルへのオフセットを計算する。ｋ番目
のセグメントにおける各々のベクトル量子化器の部分集
合の大きさは次の式で与えられる。

選択された前置量子化器ベクトルに関連する、４つの
部分集合の量子化器ベクトルは最も低い残留エラーを生
じる量子化器ベクトルについてサーチされる。したがっ
て、第１のセグメントにおいて、64の前置量子化器ベク
トルおよび128の量子化器ベクトルが評価され、第２の
セグメントにおいて32の前置量子化器ベクトルおよび64
の量子化器ベクトルが評価され、そして第３のセグメン
トにおいて16の前置量子化器ベクトルおよび64の量子化
器ベクトルが評価される。前に述べた帯域幅拡張を備え
たFLAT技術によって計算された、最適の反射係数がベク
トル量子化の前に自己相関ベクトルへと変換される。

前記FLATアルゴリズムの自己相関バージョン、AFLA
T、は評価される反射係数ベクトルに対する残留エラー
エネルギを計算するために使用される。FLATと同様に、
このアルゴリズムは、最適の反射係数を計算する場合ま
たは現在のセグメントにおけるベクトル量子化器から反
射係数ベクトルを選択する場合に、前のラチスステージ
からの反射係数量子化エラーを部分的に補償する能力を
有する。この改善は高い反射係数量子化ひずみを有する
フレームに対しては大きなものとなり得る。前記AFLAT
アルゴリズムを前置量子化器を備えたマルチセグメント
のベクトル量子化に関して、次に説明する。

前記最適の反射係数から、０≦ｉ≦N_Pの範囲にわた
り、自己相関シーケンスＲ（ｉ）を計算する。あるい
は、該自己相関シーケンスは、直接形式のLPC予測器係
数、α_ｉ、のような、他のLPCパラメータ表現から、ま
たは入力音声から直接計算できる。

前記AFLAT再帰（AFLAT recursion）に対する初期条
件を規定する。_０（ｉ）＝Ｒ（ｉ）,0≦ｉ≦N_P−１（2.14）ｋ、すなわちベクトル量子化器セグメントインデクス
を初期化する。

ｋ＝１（2.16） I₁（ｋ）がｋ番目のセグメントにおける最初のラチス
ステージの指数であるとし、かつI_h（ｋ）がｋ番目のセ
グメントにおける最後のラチスステージの指数であると
する。前記ｋ番目のセグメントにおけるラチスステージ
I_h（ｋ）の残留エラー出力を評価するための再帰方法
を、^r、すなわち前置量子化器からの反射係数ベクトル
または量子化器からの反射係数ベクトルが与えられた場
合につき、以下に説明する。

ｊ、すなわちラチスステージの指数、を前記ｋ番目の
セグメントの始めを指し示すように初期化する。

ｊ＝I₁（ｋ）（2.17）初期条件P_j-1およびV_j-1を次のようにセットする。

次の式を使用してV_jおよびP_jのアレイを計算する。

ｊを次のように増分する。

ｊ＝ｊ＋１（2.22）もしｊ≦I_h（ｋ）であれば、（2.20）へ移る。

反射係数ベクトル^rが与えられたとき、ラチスステー
ジI_h（ｋ）の残留エラー出力は次の式で与えられる。

E_r＝P_Ih(k)（０）（2.23）概説したAFLAT再帰を使用して、ｋ番目のセグメント
における前置量子化器（prequantizer）からの各々のベ
クトルによる残留エラーが評価され、サーチのための４
つの部分集合の量子化器ベクトルが識別され、かつ前記
選択された４つの部分集合からの各々の量子化器ベクト
ルによる残留エラーが計算される。^〜ｒの指数、すなわ
ち前記４つの部分集合における全ての量子化器ベクトル
にわたりE_rを最小化した量子化器ベクトルがQ_kビットに
よって符号化される。

もしｋ＜３であれば、セグメントｋ＋１における再帰
を行なうための初期条件が計算される必要がある。ｊ、
すなわちラチスステージ指数、を次のようにセットす
る。

ｊ＝I₁（ｋ）（2.24）次に、以下の式を計算する。

ｊを次のように増分する。

ｊ＝ｊ＋１（2.27）もしｊ≦I_h（ｋ）であれば、（2.25）へ移る。

ｋ、すなわちベクトル量子化器セグメント指数、を次
のように増分する。

ｋ＝ｋ＋１（2.28）もしｋ≦３であれば、（2.17）へ移る。さもなけれ
ば、３つのセグメントに対する反射係数ベクトルの指数
が選択され、かつ該反射係数ベクトル量子化器のサーチ
が終了される。

反射係数のベクトル量子化器に対する記憶上の要求を
最小にするため、個々の反射係数に対する８ビットのコ
ードが実際に反射係数値の代わりに、ベクトル量子化器
テーブルに記憶される。該コードは256のエントリを有
するスカラ量子化テーブルから反射係数の値をルックア
ップするために使用される。８ビットのコードは図３に
示されるアークサイン関数を一様にサンプリングするこ
とによって得られる反射係数値を表わす。反射係数は−
１から＋１まで変化する。反射係数領域（Ｘ軸）におけ
る非線形の間隔は前記値が＋／−１の両極端に近い場合
に反射係数のより大きな精度を与え、かつ前記値がゼロ
に近い場合に低い精度を与える。これは反射係数領域に
おける一様なサンプリングと比較して、256の量子化レ
ベルが与えられたとき、反射係数のスカラ量子化による
スペクトルひずみを低減する。

フロントページの続き (72)発明者ハートマン・マシューエイアメリカ合衆国イリノイ州 60194、シャンバーグ、ティベイ・プレイス 520 (56)参考文献特開平１−296300（ＪＰ，Ａ) 特開平１−233500（ＪＰ，Ａ) 特開昭59−178032（ＪＰ，Ａ) 特開平４−363000（ＪＰ，Ａ) 特表昭60−500274（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04 ＪＩＣＳＴファイル（ＪＯＩＳ) ＷＰＩ（ＤＩＡＬＯＧ)

Claims

(57)【特許請求の範囲】

【請求項１】Ｍのエレメントを有する反射係数ベクトル
をベクトル量子化する方法であって、前記反射係数ベク
トルは入力音声信号を表わし、前記方法は、ａ）前記反射係数ベクトルを少なくとも第１のセグメン
トおよび第２のセグメントに区分する段階、ｂ）反射係数の所定のベクトルの第１のアレイを提供す
る段階であって、各々の所定のベクトルは複数のＬのエ
レメントを有し、ここでＬ＜Ｍであるもの、ｃ）前記入力音声信号を相関して第１のセグメント相関
を形成する段階、ｄ）前記所定のベクトルの第１のアレイから第１のベク
トルを選択し、第１の選択されたベクトルを提供する段
階、ｅ）前記第１の選択されたベクトルおよび前記第１のセ
グメント相関に対応する第１のセグメント残留エラーを
計算する段階、ｆ）前記所定のベクトルの第１のアレイの各々の所定の
ベクトルに対して前記段階ｄおよびｅを反復する段階、ｇ）前記第１のアレイから最も低い第１のセグメント残
留エラーを有するベクトルを選択し、第１の選択された
ベクトルを形成する段階、ｈ）前記第１の選択されたベクトルおよび前記第１のセ
グメント相関に応じて、一組の第２のセグメント相関を
規定する段階、ｉ）反射係数の所定のベクトルの第２のアレイを提供す
る段階であって、各々の所定のベクトルはＫのエレメン
トを有し、ここでＬ＋Ｋ≦Ｍであるもの、ｊ）前記所定のベクトルの第２のアレイから第２のベク
トルを選択し、第２の選択されたベクトルを提供する段
階、ｋ）前記第２の選択されたベクトルおよび前記一組の第
２のセグメント相関に対応する第２のセグメント残留エ
ラーを計算する段階、ｌ）前記所定のベクトルの第２のアレイに対し前記段階
ｊおよびｋを反復する段階、ｍ）前記第２のアレイから最も近い第２のセグメント残
留エラーを有するベクトルを選択し、第２の選択された
ベクトルを形成する段階、そしてｎ）少なくとも前記第１の選択されたベクトルおよび前
記第２の選択されたベクトルを組み合わせて量子化され
た反射係数ベクトルを形成する組み合わせ段階、を具備するＭのエレメントを有する反射係数ベクトルを
ベクトル量子化する方法。
【請求項２】前記方法はさらに、ｏ）前記第２の選択されたベクトルおよび前記第２のセ
グメント相関に応じて、一組の第３のセグメント相関を
規定する段階、ｐ）反射係数の所定のベクトルの第３のアレイを提供す
る段階であって、各々の所定のベクトルはＰのエレメン
トを有し、この場合Ｌ＋Ｋ＋Ｐ≦Ｍであるもの、ｑ）前記所定のベクトルの第３のアレイから第３の選択
されたベクトルを選択する段階、ｒ）前記第３の選択されたベクトルおよび前記一組の第
３のセグメント相関に対応する第３のセグメント残留エ
ラーを計算する段階、ｓ）前記第３のアレイにおける各々の所定のベクトルに
対し前記段階ｑおよびｒを反復する段階、そしてｔ）最も近い第３のセグメント残留エラーを有するベク
トルを前記第３のアレイから選択し、第３の選択された
ベクトルを形成する段階、を具備し、前記組み合わせ段階は前記第３の選択されたベクトルを
前記第１の選択されたベクトルおよび前記第２の選択さ
れたベクトルと組み合わせて量子化された反射係数ベク
トルを形成する段階を含む請求項１に記載の方法。
【請求項３】さらに、前記入力音声信号に対応する自己相関シーケンスを計算
することにより第１のセグメント相関を初期化する段階
を具備する請求項２に記載の方法。
【請求項４】前記第２のセグメント相関を規定する段階
は前記第１の選択されたベクトルおよび前記第１のセグ
メント相関に応じて自己相関シーケンスを計算する段階
を具備し、そして前記第３のセグメント相関を規定する
段階は前記第２の選択されたベクトルおよび前記第２の
セグメント相関に応じて自己相関シーケンスを計算する
段階を具備する請求項３に記載の方法。
【請求項５】前記所定のベクトルの第１のアレイを提供
する段階は第１のセグメントの反射係数ベクトルコード
ブックを規定する段階を具備し、かつ前記所定のベクト
ルの第２のアレイを提供する段階は第２のセグメントの
反射係数ベクトルコードブックを規定する段階を具備
し、そして前記所定のベクトルの第３のアレイを提供す
る段階は第３のセグメントの反射係数ベクトルコードブ
ックを規定する段階を具備する請求項２に記載の方法。
【請求項６】前記一組の第２のセグメント相関を規定す
る段階は前記第１のセグメント相関および前記第１の選
択されたベクトルに応じて自己相関ラチス再帰技術を使
用することを含む請求項１に記載の方法。
【請求項７】前記自己相関ラチス再帰技術は固定小数点
ラチス再帰技術からなる請求項６に記載の方法。
【請求項８】前記残留エラーを計算する段階は自己相関
ラチス技術再帰を使用する段階を具備する請求項１に記
載の方法。
【請求項９】前記自己相関ラチス技術再帰は固定小数点
ラチス技術再帰からなる請求項８に記載の方法。
【請求項１０】前記Ｍは10の値を有しかつ前記第１のア
レイの各ベクトルは３つのエレメントを有し、前記第２
のアレイの各ベクトルは３つのエレメントを有し、そし
て前記第３のアレイの各ベクトルは４つのエレメントを
有する請求項２に記載の方法。
【請求項１１】各々の反射係数ベクトルは反射係数１〜
10で示される10個の反射係数を含み、かつ前記所定のベ
クトルの第１のアレイの各々の所定のベクトルは反射係
数１、反射係数２、および反射係数３に及び、前記所定
のベクトルの第２のアレイの各々の所定のベクトルは反
射係数４、反射係数５、および反射係数６に及び、そし
て前記所定のベクトルの第３のアレイの各々の所定のベ
クトルは反射係数７、反射係数８、反射係数９、および
反射係数10に及ぶ請求項10に記載の方法。