JP3042886B2 - ベクトル量子化器の方法および装置 - Google Patents
ベクトル量子化器の方法および装置Info
- Publication number
- JP3042886B2 JP3042886B2 JP6522073A JP52207394A JP3042886B2 JP 3042886 B2 JP3042886 B2 JP 3042886B2 JP 6522073 A JP6522073 A JP 6522073A JP 52207394 A JP52207394 A JP 52207394A JP 3042886 B2 JP3042886 B2 JP 3042886B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- segment
- reflection coefficient
- array
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Analogue/Digital Conversion (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
de Excited Linear Predictive Coding:CELP)、推
計符号化(Stochastic Coding)、またはベクトル駆動
音声符号化(Vector Excited Speech Coding)を使
用した音声符号器に関し、かつより特定的にはベクトル
和駆動リニア予測符号化(Vector−Sum Excited Line
ar Predictive Coding:VSELP)のためのベクトル量子
化器(vector quantizers)に関する。
生成するために使用される音声符号化技術である。ベク
トル駆動リニア予測としても知られている、この種の音
声符号化は数多くの音声通信および音声合成の用途に使
用されている。CELPは特に音声品質、データレート、サ
イズおよびコストが重要な事項であるデジタル音声の暗
号化およびデジタル無線電話通信システムに適用可能で
ある。
デル化する長時間(ピッチ)および短時間(フォルマン
ト)予測器が1組の時変フィルタに導入される。特に、
長時間および短時間フィルタが使用できる。該フィルタ
に対する励起または駆動信号(excitation signal)は
記憶されたイノベイション(innovation)シーケンスま
たはコードベクトルから選択される。
れる。音声符号器は個々のコードベクトルを前記フィル
タに供給して再生された音声信号を発生する。再生され
た音声信号は元の入力音声信号と比較され、エラー信号
を生成する。このエラー信号は次にそれをスペクトルノ
イズ重み付けフィルタ(spectral noise weighting
filter)を通すことにより重み付けされる。該スペクト
ルノイズ重み付けフィルタは人間の聴覚に基づく応答を
有する。最適の駆動信号は現在の音声フレームに対し最
小のエネルギを有する重み付けされたエラー信号を生成
する選択されたコードベクトルである。
ィルタとも称される、1つのブロックのサンプルにわた
る短時間信号相関をモデル化するために使用される。該
短時間信号相関は声道(vocal tract)の共振周波数を
表わす。前記LPC係数は1組の音声モデルのパラメータ
である。短時間予測器フィルタに供給される駆動信号を
特徴付けるために他のパラメータセットを使用できる。
これら他の音声モデルのパラメータは、ラインスペクト
ル周波数(LSF)、セプストラル係数(cepstral coeff
icients)、反射係数、対数領域比(log area ratio
s)、およびアークサインを含む。
ビットの数を低減するために駆動信号をベクトル量子化
する。前記LPC係数は量子化の前に他の前に述べたパラ
メータセットへと変換することができる。該係数は個別
的に量子化することができ(スカラー量子化)またはそ
れらは組として量子化することができる(ベクトル量子
化)。スカラー量子化はベクトル量子化ほど効率的では
ないが、スカラー量子化はベクトル量子化よりも計算上
の要求およびメモリの要求の上で費用がかからない。LP
Cパラメータのベクトル量子化は符号化の効率が最も重
要な事項である場合の用途に使用される。
トル量子化サーチの複雑さ、およびベクトル量子化器の
記憶要件をバランスさせるために使用できる。第1の形
式のマルチセグメントベクトル量子化はNpエレメントの
LPCパラメータベクトルをnのセグメントに区分する。
該nのセグメントの各々は別々にベクトル量子化され
る。第2の形式のマルチセグメントベクトル量子化はLP
Cパラメータをnのベクトルコードブックの間で区分
し、この場合各々のベクトルコードブックは全てのNpの
ベクトルエレメントに及んでいる。ベクトル量子化の説
明のために、Np=10のエレメントを想定しかつ各々のエ
レメントが2ビットで表わされるものと仮定する。伝統
的なベクトル量子化は全ての可能なコードベクトルの可
能性を表わすために各々10エレメントの220のコードベ
クトルを必要とする。前記第1の種類の2つのセグメン
トを備えたマルチセグメントベクトル量子化は各々5エ
レメントの210+210のコードベクトルを必要とする。2
セグメントを備えた第2の種類のマルチセグメントベク
トル量子化は各々5エレメントの210+210のコードベク
トルを必要とする。これらのベクトル量子化の方法の各
々は符号化効率、サーチの複雑さおよび記憶上の要求の
点で異なる利点を与える。したがって、音声符号器の技
術水準は、対応する要件を変えることなく符号化効率を
増大しあるいはサーチの複雑さまたは記憶上の要件を低
減するベクトル量子化器の方法および装置によって利益
を受けることになる。
ステムのブロック図である。
る。
関数のグラフである。
(VSELP)と称されるコード駆動リニア予測符号化(CEL
P)に対する一変形は本発明の好ましい実施例である。V
SELPは予め規定された構造を有する駆動コードブックを
使用し、それによってコードブックサーチ処理のために
必要な計算が大幅に低減される。このVSELP音声符号器
は固定小数点ラチス技術(Fixed−Point−Lattice−Tec
hnique:FLAT)に基づく反射係数の単一セグメントまた
はマルチセグメントのベクトル量子化器を使用する。さ
らに、この音声符号器はベクトルコードブックサーチの
複雑さを軽減するために前置量子化器(pre−quantize
r)を使用し、かつ前記反射係数のベクトルコードブッ
クを記憶するのに必要なメモリ量を低減するために高分
解能スカラ量子化器を使用する。結果として得られるも
のは反射係数の高性能のベクトル量子化器であり、これ
はまた計算機的に効率がよく、かつ低減された記憶上の
要求を有する。
該無線通信システム100は互いに音声データを送信しか
つ受信する2つの送受信機101,113を含む。2つの送受
信機101,113は、トランク式(trunked)無線システムま
たは無線電話通信システムあるいは音声データを送信お
よび受信する任意の他の無線通信システムの一部とする
ことができる。送信機においては、音声信号はマイクロ
ホン108へと入力され、かつ音声符号器が音声モデルの
量子化されたパラメータを選択する。該量子化されたパ
ラメータに対するコードが次に他の送受信機113に送信
される。他の送受信機113においては、前記量子化され
たパラメータに対する送信されたコードが受信機121に
よって受信されかつ音声復号器(speech decoder)123
において音声を再発生するために使用される。再発生さ
れた音声はスピーカ124に出力される。
ELP音声符号器200はコードブックからのどの駆動ベクト
ルを使用するかを決定するために受信されたコードを使
用する。VSELP符号器はMの基礎ベクトル(basis vect
ors)から構成される2Mのコードベクトルの駆動コード
ブックを使用する。vm(n)をM番目の基礎ベクトルと
しかつui(n)をコードブックにおけるi番目のコード
ベクトルとすると次式が得られる。
る。言い換えれば、前記コードブックにおける各々のコ
ードベクトルはMの基礎ベクトルの線形結合(linear
combination)として構成される。該線形結合はθのパ
ラメータにより定義される。
+1 もしコードワードiのビットm=0であれば、θim=
−1 コードベクトルiはMの基礎ベクトルの和として構成
され、この場合各々の基礎ベクトルの符号(プラスまた
はマイナス)はコードワードiの対応するビットの状態
により決定される。もしコードワードiの全てのビット
を補数化すれば、対応するコードベクトルはコードベク
トルiの否定または負の値となる。したがって、それぞ
れのコードベクトルに対し、その負の値はまた前記コー
ドブックにおけるコードベクトルである。これらの対は
相補(complementary)コードベクトルと称されるが、
それは対応するコードベクトルはお互いの補数であるか
らである。
は前記ゲイン項、γ、によって前記選択されたベクトル
をスケーリングする。ゲインブロック205の出力は1組
のリニアフィルタ207,209に供給されてNサンプルの再
生された音声を得る。該フィルタは前記駆動に対しピッ
チの周期性を挿入する「長時間(long−term)」(また
は「ピッチ」)フィルタ207を含む。該「長時間」フィ
ルタ207の出力は次に「短時間(short−term)」(また
は「フォルマント」)フィルタ209へと供給される。短
時間フィルタ209は信号にスペクトルエンベロープを付
加する。
する。長時間フィルタ207は遠い過去の1つまたはそれ
以上のサンプルから次の出力サンプルを予測しようと試
みる。もし1つの過去のサンプルのみが前記予測器にお
いて使用されれば、前記予測器は単一タップ予測器であ
る。典型的には1〜3タップが使用される。単一タップ
の長時間予測器を導入した長時間(「ピッチ」)フィル
タ207の伝達関数は次の式(1.1)によって与えられる。
る。Lは「遅れ(lag)」と称される。有声音の(voice
d)音声に対しては、Lは典型的にはピッチ周期または
その倍数である。Lはまた整数でない値とすることもで
きる。もしLが整数でなければ、分数的または端数的に
(fractionally)遅延したサンプルを発生するために補
間有限インパルス応答(FIR)フィルタが使用される。
βは長時間(または「ピッチ」)予測器係数である。
ら次の出力サンプルを予測するよう試みる、短時間予測
器係数、αi、を導入する。Npは典型的には8から12の
範囲に及ぶ。好ましい実施例では、Npは10に等しい。短
時間フィルタ209は伝統的なLPC合成フィルタと等価であ
る。短時間フィルタ209の伝達関数は次の式(1.2)で与
えられる。
「合成(synthesis)」フィルタに対する直接形式のフ
ィルタ係数である、αiパラメータによって特徴づけら
れる。αiパラメータに関する詳細は後に説明する。
ータ)は全てが同じレートでシンセサイザ(音声復号
器)に送信されるわけではない。典型的には、短時間パ
ラメータはコードよりも少ない頻度で更新される。ここ
では短時間パラメータの更新レートを「フレームレー
ト」と定義し、かつ更新の間のインターバルを「フレー
ム」と定義する。前記コードの更新ハートはベクトル
長、N、によって決定される。ここでは該コードの更新
レートを「サブフレームレート」と定義し、かつ前記コ
ードの更新インターバルを「サブフレーム」と定義す
る。フレームは通常整数個のサブフレームから構成され
る。ゲインおよび長時間パラメータは音声符号器の設計
に応じて前記サブフレームのレート、フレームのレー
ト、または中間的ないずれかのレートで更新することが
できる。
LPシンセサイザに対する可能な駆動として試みることか
ら構成される。合成された音声、s′(n)、は211に
おいて入力音声、s(n)と、比較され、かつ差分信
号、ei、が発生される。この差分信号、ei(n)、は次
にスペクトル重み付けフィルタ、W(z)213、(か
つ、たぶん第2の重み付けフィルタ、C(z))によっ
てろ波されて重み付けされたエラー信号、e′(n)、
を発生する。エネルギ計算機215においてe′(n)に
おけるパワーが計算される。最小の重み付けされたエラ
ーパワーを発生するコードベクトルがそのサブフレーム
に対するコードベクトルとして選択される。スペクトル
重み付けフィルタ213は知覚的な考慮事項に基づき前記
エラースペクトルに重み付けするよう作用する。この重
み付けフィルタ213は音声スペクトルの関数でありかつ
前記短時間(スペクトル)フィルタ209のαパラメータ
によって表現できる。
手法がある。前記ゲインは残留エネルギに基づきコード
ブックサーチの前に決定できる。このゲインは次に該コ
ードブックサーチに対して固定される。他の手法はコー
ドブックサーチの間に各々のコードベクトルに対するゲ
インを最適化するものである。最小の重み付けされたエ
ラーを生じるコードベクトルが選択されかつその対応す
る最適のゲインがγに対して使用される。後者の手法は
一般により良好な結果を生じるが、それらは各々のコー
ドベクトルに対しゲインが最適化されるからである。こ
の手法はまたはゲイン項がサブフレームのレートで更新
されなければならないことを意味する。この技術に対す
る最適のコードおよびゲインは次のようにして計算でき
る。
された入力信号、を計算する。
(z)およびW(z)(および、もし使用されればC
(z))フィルタのゼロ入力応答、を計算する。(ゼロ
入力応答は入力のないフィルタの応答、すなわちフィル
タの減衰(decay)状態である。) 3.サブフレームにわたり(0≦n≦N−1)、p(n)
=y(n)−d(n)を得る。
用されれば、C(z))のコードベクトルiに対するゼ
ロ状態応答、を計算する。(ゼロ状態応答は初期フィル
タ状態をゼロにセットしたフィルタ出力である。) b.次式のろ波されたコードベクトルiおよびp(n)の
間の相互相関、 を計算する。
れたゲインを使用してB(z)およびW(z)(および
もし使用されれば、C(z))のフィルタのフィルタ状
態を更新する。これは前記シンセサイザが前記段階2に
対する次のサブフレームのスタート時に有するのと同じ
フィルタ状態を得るために行なわれる。
8)によって与えられる。
トルiに対する総合的な重み付けされたエラーは次の式
(1.9)によって与えられる。
のαi′である。これらは標準のLPC直接形式のフィル
タ係数でありかつこれらの係数を決定するために任意の
数のLPC分析技術を使用できる。好ましい実施例では、
高速固定小数点共変ラチスアルゴリズム(fast fixed
point covariance lattice algorithm:FLAT)が使
用された。FLATは保証されたフィルタ安定性、非ウィン
ドウ分析、および再帰内での反射係数の量子化の能力を
含むラチスアルゴリズムの全ての利点を有する。さら
に、FLATは数値的に頑健であり(robust)および固定小
数点プロセッサにより容易に実施できる。
る。プリエンファシスは使用されない。パラメータの計
算のために使用される分析の長さは170サンプル(NA=1
70)である。予測器の次数は10(Np=10)である。
する。前記分析インターバルに入る入力音声のサンプル
がs(n);0≦n≦NA−1で表わされるものとする。FL
ATはラチスアルゴリズムであるから、該技術はステージ
毎に最適の(残留エネルギを最小にする)逆ラチスフィ
ルタを構築するよう試みるものとみることができる。
向残渣であり、かつfj(n)が逆ラチスフィルタのステ
ージjからの順方向残差であると定義すると、次のよう
になる。
次のようになる。
わすものとすると、次式が得られる。
とができる。
ができる。
計算する。
0≦i,k≦NP−j−1である。
0≦i,k≦NP−j−1である。
関関数をウィンドウ処理する(windowing)によって修
正する。
を行なうことはスペクトルのスムージング(SST)とし
て知られている。
が計算できる。
が使用される。ベクトル量子化器のセグメントはそれぞ
れ反射係数r1〜r3,r4〜r6およびr7〜r10に及ぶ。ベクト
ル量子化器のセグメントに対するビット割当ては次のよ
うになる。
を避けるため、反射係数のベクトル前置量子化が各々の
セグメントで使用される。各々のセグメントの前置量子
化器のサイズは次のようになる。
らの各々のベクトルによる残留エラーが計算されかつ一
時メモリに格納される。このリストは最も低いひずみを
有する4つの前置量子化器ベクトルを識別するためにサ
ーチされる。各々の選択された前置量子化器ベクトルの
インデクスが使用されてその量子化器ベクトルに関連す
る量子化器ベクトルの隣接する部分集合が始まるベクト
ル量子化器テーブルへのオフセットを計算する。k番目
のセグメントにおける各々のベクトル量子化器の部分集
合の大きさは次の式で与えられる。
部分集合の量子化器ベクトルは最も低い残留エラーを生
じる量子化器ベクトルについてサーチされる。したがっ
て、第1のセグメントにおいて、64の前置量子化器ベク
トルおよび128の量子化器ベクトルが評価され、第2の
セグメントにおいて32の前置量子化器ベクトルおよび64
の量子化器ベクトルが評価され、そして第3のセグメン
トにおいて16の前置量子化器ベクトルおよび64の量子化
器ベクトルが評価される。前に述べた帯域幅拡張を備え
たFLAT技術によって計算された、最適の反射係数がベク
トル量子化の前に自己相関ベクトルへと変換される。
T、は評価される反射係数ベクトルに対する残留エラー
エネルギを計算するために使用される。FLATと同様に、
このアルゴリズムは、最適の反射係数を計算する場合ま
たは現在のセグメントにおけるベクトル量子化器から反
射係数ベクトルを選択する場合に、前のラチスステージ
からの反射係数量子化エラーを部分的に補償する能力を
有する。この改善は高い反射係数量子化ひずみを有する
フレームに対しては大きなものとなり得る。前記AFLAT
アルゴリズムを前置量子化器を備えたマルチセグメント
のベクトル量子化に関して、次に説明する。
り、自己相関シーケンスR(i)を計算する。あるい
は、該自己相関シーケンスは、直接形式のLPC予測器係
数、αi、のような、他のLPCパラメータ表現から、ま
たは入力音声から直接計算できる。
件を規定する。0 (i)=R(i),0≦i≦NP−1 (2.14) k、すなわちベクトル量子化器セグメントインデクス
を初期化する。
ステージの指数であるとし、かつIh(k)がk番目のセ
グメントにおける最後のラチスステージの指数であると
する。前記k番目のセグメントにおけるラチスステージ
Ih(k)の残留エラー出力を評価するための再帰方法
を、^r、すなわち前置量子化器からの反射係数ベクトル
または量子化器からの反射係数ベクトルが与えられた場
合につき、以下に説明する。
セグメントの始めを指し示すように初期化する。
ジIh(k)の残留エラー出力は次の式で与えられる。
における前置量子化器(prequantizer)からの各々のベ
クトルによる残留エラーが評価され、サーチのための4
つの部分集合の量子化器ベクトルが識別され、かつ前記
選択された4つの部分集合からの各々の量子化器ベクト
ルによる残留エラーが計算される。〜rの指数、すなわ
ち前記4つの部分集合における全ての量子化器ベクトル
にわたりErを最小化した量子化器ベクトルがQkビットに
よって符号化される。
を行なうための初期条件が計算される必要がある。j、
すなわちラチスステージ指数、を次のようにセットす
る。
のように増分する。
ば、3つのセグメントに対する反射係数ベクトルの指数
が選択され、かつ該反射係数ベクトル量子化器のサーチ
が終了される。
最小にするため、個々の反射係数に対する8ビットのコ
ードが実際に反射係数値の代わりに、ベクトル量子化器
テーブルに記憶される。該コードは256のエントリを有
するスカラ量子化テーブルから反射係数の値をルックア
ップするために使用される。8ビットのコードは図3に
示されるアークサイン関数を一様にサンプリングするこ
とによって得られる反射係数値を表わす。反射係数は−
1から+1まで変化する。反射係数領域(X軸)におけ
る非線形の間隔は前記値が+/−1の両極端に近い場合
に反射係数のより大きな精度を与え、かつ前記値がゼロ
に近い場合に低い精度を与える。これは反射係数領域に
おける一様なサンプリングと比較して、256の量子化レ
ベルが与えられたとき、反射係数のスカラ量子化による
スペクトルひずみを低減する。
Claims (11)
- 【請求項1】Mのエレメントを有する反射係数ベクトル
をベクトル量子化する方法であって、前記反射係数ベク
トルは入力音声信号を表わし、前記方法は、 a)前記反射係数ベクトルを少なくとも第1のセグメン
トおよび第2のセグメントに区分する段階、 b)反射係数の所定のベクトルの第1のアレイを提供す
る段階であって、各々の所定のベクトルは複数のLのエ
レメントを有し、ここでL<Mであるもの、 c)前記入力音声信号を相関して第1のセグメント相関
を形成する段階、 d)前記所定のベクトルの第1のアレイから第1のベク
トルを選択し、第1の選択されたベクトルを提供する段
階、 e)前記第1の選択されたベクトルおよび前記第1のセ
グメント相関に対応する第1のセグメント残留エラーを
計算する段階、 f)前記所定のベクトルの第1のアレイの各々の所定の
ベクトルに対して前記段階dおよびeを反復する段階、 g)前記第1のアレイから最も低い第1のセグメント残
留エラーを有するベクトルを選択し、第1の選択された
ベクトルを形成する段階、 h)前記第1の選択されたベクトルおよび前記第1のセ
グメント相関に応じて、一組の第2のセグメント相関を
規定する段階、 i)反射係数の所定のベクトルの第2のアレイを提供す
る段階であって、各々の所定のベクトルはKのエレメン
トを有し、ここでL+K≦Mであるもの、 j)前記所定のベクトルの第2のアレイから第2のベク
トルを選択し、第2の選択されたベクトルを提供する段
階、 k)前記第2の選択されたベクトルおよび前記一組の第
2のセグメント相関に対応する第2のセグメント残留エ
ラーを計算する段階、 l)前記所定のベクトルの第2のアレイに対し前記段階
jおよびkを反復する段階、 m)前記第2のアレイから最も近い第2のセグメント残
留エラーを有するベクトルを選択し、第2の選択された
ベクトルを形成する段階、そして n)少なくとも前記第1の選択されたベクトルおよび前
記第2の選択されたベクトルを組み合わせて量子化され
た反射係数ベクトルを形成する組み合わせ段階、 を具備するMのエレメントを有する反射係数ベクトルを
ベクトル量子化する方法。 - 【請求項2】前記方法はさらに、 o)前記第2の選択されたベクトルおよび前記第2のセ
グメント相関に応じて、一組の第3のセグメント相関を
規定する段階、 p)反射係数の所定のベクトルの第3のアレイを提供す
る段階であって、各々の所定のベクトルはPのエレメン
トを有し、この場合L+K+P≦Mであるもの、 q)前記所定のベクトルの第3のアレイから第3の選択
されたベクトルを選択する段階、 r)前記第3の選択されたベクトルおよび前記一組の第
3のセグメント相関に対応する第3のセグメント残留エ
ラーを計算する段階、 s)前記第3のアレイにおける各々の所定のベクトルに
対し前記段階qおよびrを反復する段階、そして t)最も近い第3のセグメント残留エラーを有するベク
トルを前記第3のアレイから選択し、第3の選択された
ベクトルを形成する段階、 を具備し、 前記組み合わせ段階は前記第3の選択されたベクトルを
前記第1の選択されたベクトルおよび前記第2の選択さ
れたベクトルと組み合わせて量子化された反射係数ベク
トルを形成する段階を含む請求項1に記載の方法。 - 【請求項3】さらに、 前記入力音声信号に対応する自己相関シーケンスを計算
することにより第1のセグメント相関を初期化する段階
を具備する請求項2に記載の方法。 - 【請求項4】前記第2のセグメント相関を規定する段階
は前記第1の選択されたベクトルおよび前記第1のセグ
メント相関に応じて自己相関シーケンスを計算する段階
を具備し、そして前記第3のセグメント相関を規定する
段階は前記第2の選択されたベクトルおよび前記第2の
セグメント相関に応じて自己相関シーケンスを計算する
段階を具備する請求項3に記載の方法。 - 【請求項5】前記所定のベクトルの第1のアレイを提供
する段階は第1のセグメントの反射係数ベクトルコード
ブックを規定する段階を具備し、かつ前記所定のベクト
ルの第2のアレイを提供する段階は第2のセグメントの
反射係数ベクトルコードブックを規定する段階を具備
し、そして前記所定のベクトルの第3のアレイを提供す
る段階は第3のセグメントの反射係数ベクトルコードブ
ックを規定する段階を具備する請求項2に記載の方法。 - 【請求項6】前記一組の第2のセグメント相関を規定す
る段階は前記第1のセグメント相関および前記第1の選
択されたベクトルに応じて自己相関ラチス再帰技術を使
用することを含む請求項1に記載の方法。 - 【請求項7】前記自己相関ラチス再帰技術は固定小数点
ラチス再帰技術からなる請求項6に記載の方法。 - 【請求項8】前記残留エラーを計算する段階は自己相関
ラチス技術再帰を使用する段階を具備する請求項1に記
載の方法。 - 【請求項9】前記自己相関ラチス技術再帰は固定小数点
ラチス技術再帰からなる請求項8に記載の方法。 - 【請求項10】前記Mは10の値を有しかつ前記第1のア
レイの各ベクトルは3つのエレメントを有し、前記第2
のアレイの各ベクトルは3つのエレメントを有し、そし
て前記第3のアレイの各ベクトルは4つのエレメントを
有する請求項2に記載の方法。 - 【請求項11】各々の反射係数ベクトルは反射係数1〜
10で示される10個の反射係数を含み、かつ前記所定のベ
クトルの第1のアレイの各々の所定のベクトルは反射係
数1、反射係数2、および反射係数3に及び、前記所定
のベクトルの第2のアレイの各々の所定のベクトルは反
射係数4、反射係数5、および反射係数6に及び、そし
て前記所定のベクトルの第3のアレイの各々の所定のベ
クトルは反射係数7、反射係数8、反射係数9、および
反射係数10に及ぶ請求項10に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3779393A | 1993-03-26 | 1993-03-26 | |
US037,793 | 1993-03-26 | ||
PCT/US1994/002370 WO1994023426A1 (en) | 1993-03-26 | 1994-03-07 | Vector quantizer method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07507885A JPH07507885A (ja) | 1995-08-31 |
JP3042886B2 true JP3042886B2 (ja) | 2000-05-22 |
Family
ID=21896370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6522073A Expired - Lifetime JP3042886B2 (ja) | 1993-03-26 | 1994-03-07 | ベクトル量子化器の方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (2) | US5826224A (ja) |
JP (1) | JP3042886B2 (ja) |
CN (2) | CN1051392C (ja) |
AU (2) | AU668817B2 (ja) |
BR (1) | BR9404725A (ja) |
CA (1) | CA2135629C (ja) |
DE (2) | DE4492048C2 (ja) |
FR (1) | FR2706064B1 (ja) |
GB (2) | GB2282943B (ja) |
SE (2) | SE518319C2 (ja) |
SG (1) | SG47025A1 (ja) |
WO (1) | WO1994023426A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
IT1277194B1 (it) * | 1995-06-28 | 1997-11-05 | Alcatel Italia | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato |
FR2738383B1 (fr) * | 1995-09-05 | 1997-10-03 | Thomson Csf | Procede de quantification vectorielle de vocodeurs bas debit |
JP3680380B2 (ja) * | 1995-10-26 | 2005-08-10 | ソニー株式会社 | 音声符号化方法及び装置 |
TW307960B (en) * | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
JP2914305B2 (ja) * | 1996-07-10 | 1999-06-28 | 日本電気株式会社 | ベクトル量子化装置 |
FI114248B (fi) * | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
US6826524B1 (en) | 1998-01-08 | 2004-11-30 | Purdue Research Foundation | Sample-adaptive product quantization |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
IL129752A (en) | 1999-05-04 | 2003-01-12 | Eci Telecom Ltd | Telecommunication method and system for using same |
GB2352949A (en) * | 1999-08-02 | 2001-02-07 | Motorola Ltd | Speech coder for communications unit |
US6910007B2 (en) * | 2000-05-31 | 2005-06-21 | At&T Corp | Stochastic modeling of spectral adjustment for high quality pitch modification |
JP2002032096A (ja) * | 2000-07-18 | 2002-01-31 | Matsushita Electric Ind Co Ltd | 雑音区間/音声区間判定装置 |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
AU2002218501A1 (en) * | 2000-11-30 | 2002-06-11 | Matsushita Electric Industrial Co., Ltd. | Vector quantizing device for lpc parameters |
JP4857468B2 (ja) * | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
US6584437B2 (en) * | 2001-06-11 | 2003-06-24 | Nokia Mobile Phones Ltd. | Method and apparatus for coding successive pitch periods in speech signal |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
CN100346392C (zh) * | 2002-04-26 | 2007-10-31 | 松下电器产业株式会社 | 编码设备、解码设备、编码方法和解码方法 |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US7337110B2 (en) * | 2002-08-26 | 2008-02-26 | Motorola, Inc. | Structured VSELP codebook for low complexity search |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
US7047188B2 (en) * | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US7272557B2 (en) * | 2003-05-01 | 2007-09-18 | Microsoft Corporation | Method and apparatus for quantizing model parameters |
EP1673764B1 (en) * | 2003-10-10 | 2008-04-09 | Agency for Science, Technology and Research | Method for encoding a digital signal into a scalable bitstream, method for decoding a scalable bitstream |
US8473286B2 (en) * | 2004-02-26 | 2013-06-25 | Broadcom Corporation | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure |
US7697766B2 (en) * | 2005-03-17 | 2010-04-13 | Delphi Technologies, Inc. | System and method to determine awareness |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
CN101030377B (zh) * | 2007-04-13 | 2010-12-15 | 清华大学 | 提高声码器基音周期参数量化精度的方法 |
KR101592968B1 (ko) | 2008-07-10 | 2016-02-11 | 보이세지 코포레이션 | 수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법 |
US8363957B2 (en) * | 2009-08-06 | 2013-01-29 | Delphi Technologies, Inc. | Image classification system and method thereof |
CN101968778A (zh) * | 2010-08-13 | 2011-02-09 | 广州永日电梯有限公司 | 点阵串行显示方法 |
ES2745143T3 (es) * | 2012-03-29 | 2020-02-27 | Ericsson Telefon Ab L M | Cuantificador vectorial |
SG11201608787UA (en) * | 2014-03-28 | 2016-12-29 | Samsung Electronics Co Ltd | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
EP4375992A3 (en) | 2014-05-07 | 2024-07-10 | Samsung Electronics Co., Ltd. | Method and device for quantizing linear predictive coefficient, and method and device for dequantizing same |
PH12017500352B1 (en) * | 2014-08-28 | 2022-07-06 | Nokia Technologies Oy | Audio parameter quantization |
CN109887519B (zh) * | 2019-03-14 | 2021-05-11 | 北京芯盾集团有限公司 | 提高语音信道数据传输准确性的方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
JPS59116698A (ja) * | 1982-12-23 | 1984-07-05 | シャープ株式会社 | 音声デ−タ圧縮方法 |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
EP0331857B1 (en) * | 1988-03-08 | 1992-05-20 | International Business Machines Corporation | Improved low bit rate voice coding method and system |
DE3883519T2 (de) * | 1988-03-08 | 1994-03-17 | Ibm | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. |
JPH02250100A (ja) * | 1989-03-24 | 1990-10-05 | Mitsubishi Electric Corp | 音声符合化装置 |
US4974099A (en) * | 1989-06-21 | 1990-11-27 | International Mobile Machines Corporation | Communication signal compression system and method |
US5012518A (en) * | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
US4975956A (en) * | 1989-07-26 | 1990-12-04 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
US4963030A (en) * | 1989-11-29 | 1990-10-16 | California Institute Of Technology | Distributed-block vector quantization coder |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
JP3129778B2 (ja) * | 1991-08-30 | 2001-01-31 | 富士通株式会社 | ベクトル量子化器 |
US5307460A (en) * | 1992-02-14 | 1994-04-26 | Hughes Aircraft Company | Method and apparatus for determining the excitation signal in VSELP coders |
US5351338A (en) * | 1992-07-06 | 1994-09-27 | Telefonaktiebolaget L M Ericsson | Time variable spectral analysis based on interpolation for speech coding |
-
1994
- 1994-03-07 DE DE4492048A patent/DE4492048C2/de not_active Expired - Lifetime
- 1994-03-07 BR BR9404725A patent/BR9404725A/pt not_active IP Right Cessation
- 1994-03-07 CA CA002135629A patent/CA2135629C/en not_active Expired - Lifetime
- 1994-03-07 WO PCT/US1994/002370 patent/WO1994023426A1/en active Application Filing
- 1994-03-07 GB GB9422823A patent/GB2282943B/en not_active Expired - Lifetime
- 1994-03-07 DE DE4492048T patent/DE4492048T1/de active Pending
- 1994-03-07 SG SG1996002558A patent/SG47025A1/en unknown
- 1994-03-07 AU AU63970/94A patent/AU668817B2/en not_active Expired
- 1994-03-07 JP JP6522073A patent/JP3042886B2/ja not_active Expired - Lifetime
- 1994-03-07 CN CN94190277A patent/CN1051392C/zh not_active Expired - Lifetime
- 1994-03-23 FR FR9403414A patent/FR2706064B1/fr not_active Expired - Lifetime
- 1994-11-25 SE SE9404086A patent/SE518319C2/sv not_active IP Right Cessation
-
1996
- 1996-02-29 US US08/609,027 patent/US5826224A/en not_active Expired - Lifetime
- 1996-03-08 US US08/611,608 patent/US5675702A/en not_active Expired - Lifetime
- 1996-08-01 AU AU60843/96A patent/AU678953B2/en not_active Expired
-
1997
- 1997-03-12 CN CNB971034516A patent/CN1150516C/zh not_active Expired - Lifetime
-
1998
- 1998-02-12 GB GBGB9802900.2A patent/GB9802900D0/en active Pending
-
2002
- 2002-04-12 SE SE0201109A patent/SE524202C2/sv not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
AU6084396A (en) | 1996-10-10 |
AU6397094A (en) | 1994-10-24 |
GB2282943B (en) | 1998-06-03 |
CN1166019A (zh) | 1997-11-26 |
DE4492048T1 (de) | 1995-04-27 |
CN1109697A (zh) | 1995-10-04 |
CA2135629A1 (en) | 1994-10-13 |
AU668817B2 (en) | 1996-05-16 |
SE524202C2 (sv) | 2004-07-06 |
CA2135629C (en) | 2000-02-08 |
CN1150516C (zh) | 2004-05-19 |
FR2706064A1 (fr) | 1994-12-09 |
US5826224A (en) | 1998-10-20 |
BR9404725A (pt) | 1999-06-15 |
SE9404086D0 (sv) | 1994-11-25 |
US5675702A (en) | 1997-10-07 |
GB9422823D0 (en) | 1995-01-04 |
SE9404086L (sv) | 1995-01-25 |
GB2282943A (en) | 1995-04-19 |
JPH07507885A (ja) | 1995-08-31 |
SE0201109D0 (sv) | 2002-04-12 |
GB9802900D0 (en) | 1998-04-08 |
FR2706064B1 (fr) | 1997-06-27 |
DE4492048C2 (de) | 1997-01-02 |
SG47025A1 (en) | 1998-03-20 |
WO1994023426A1 (en) | 1994-10-13 |
CN1051392C (zh) | 2000-04-12 |
AU678953B2 (en) | 1997-06-12 |
SE0201109L (sv) | 2002-04-12 |
SE518319C2 (sv) | 2002-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3042886B2 (ja) | ベクトル量子化器の方法および装置 | |
US6014618A (en) | LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation | |
US5359696A (en) | Digital speech coder having improved sub-sample resolution long-term predictor | |
JPH03211599A (ja) | 4.8kbpsの情報伝送速度を有する音声符号化/復号化器 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
JP3089769B2 (ja) | 音声符号化装置 | |
EP0865027A2 (en) | Method for coding the random component vector in an ACELP coder | |
JPH0771045B2 (ja) | 音声符号化方法、音声復号方法、およびこれらを使用した通信方法 | |
JP3095133B2 (ja) | 音響信号符号化方法 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3232701B2 (ja) | 音声符号化方法 | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP3102017B2 (ja) | 音声符号化方法 | |
JPH11259098A (ja) | 音声符号化/復号化方法 | |
JP3520955B2 (ja) | 音響信号符号化法 | |
JP3024467B2 (ja) | 音声符号化装置 | |
JP2808841B2 (ja) | 音声符号化方式 | |
JP3065638B2 (ja) | 音声符号化方式 | |
JPH0455899A (ja) | 音声信号符号化方式 | |
JP2000242299A (ja) | 重み符号帳とその作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090310 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090310 Year of fee payment: 9 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100310 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110310 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110310 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120310 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130310 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130310 Year of fee payment: 13 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130310 Year of fee payment: 13 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130310 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140310 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term |