JP2002503834A - スプリット・ベクトル量子化データ符号化のためのシステムおよび方法 - Google Patents
スプリット・ベクトル量子化データ符号化のためのシステムおよび方法Info
- Publication number
- JP2002503834A JP2002503834A JP2000531838A JP2000531838A JP2002503834A JP 2002503834 A JP2002503834 A JP 2002503834A JP 2000531838 A JP2000531838 A JP 2000531838A JP 2000531838 A JP2000531838 A JP 2000531838A JP 2002503834 A JP2002503834 A JP 2002503834A
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- vector
- data
- lsp
- reconstructed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
データ圧縮システムにおいてスペクトル・パラメータを判定するために、線スペクトル・ペア・パラメータなどの束縛順序集合値を判定する際に用いられるスプリット・ベクトル量子化を行う方法およびシステムは、上限および下限に正規化されたデルタ符号化束縛順序集合値を収容する多重コードブック(22a〜22c)を利用する。LSP再構築器(34)は、スプリット・ベクトル再構築コードブック(22a〜22c)から取得された線スペクトル・ペア・パラメータの正規化デルタ量子化データに基づいて、スピーチなどのデータを復号するために、受信したスペクトル・パラメータを再構築する。LSP再構築器(34)は、正規化したデルタ量子化データに基づいて、線スペクトル・ペア・パラメータをダイナミックに生成する。別の実施例では、線スペクトル・ペア・パラメータの絶対値をセグメント化したコードブックに格納する代わりに、少なくとも2つの絶対値ベクトルと、少なくとも一つの正規化デルタ量子化ベクトルとの組合せがスペクトル量子化のために用いられる。
Description
(産業上の利用分野) 本発明は、一般に、束縛順序集合(constrained ordered set)のスカラ量子化 またはベクトル量子化を利用するデータ符号化システムおよび方法に関し、さら
に詳しくは、音声または映像符号化システムで用いられるようなスペクトル・パ
ラメータまたは他のパラメータを判定するために、線スペクトル・ペア・パラメ
ータ(line spectrum pair parameters)などの順序パラメータ(ordered paramete
rs)の集合を判定する際に用いられるスプリット・ベクトル量子化(split vector
quantization)を行う方法に関する。
に詳しくは、音声または映像符号化システムで用いられるようなスペクトル・パ
ラメータまたは他のパラメータを判定するために、線スペクトル・ペア・パラメ
ータ(line spectrum pair parameters)などの順序パラメータ(ordered paramete
rs)の集合を判定する際に用いられるスプリット・ベクトル量子化(split vector
quantization)を行う方法に関する。
【0001】 (従来の技術) 束縛順序集合の量子化は、線スペクトル・ペア・パラメータなどの順序パラメ
ータの集合を符号化するために最近のスピーチおよび音声圧縮システムにおいて
一般に用いられる。線スペクトル・ペア・パラメータは、線形予測符号化(linea
r predictive coding)解析によって生成されるような粗スペクトル情報(coarse
spectral information)を表すために用いられる。適切な安定性束縛(stability
constraints)があれば、線スペクトル・ペア・パラメータ変換に対する線形予測
符号化解析は、一般に0.0〜0.5の範囲に及ぶ、挙動の良いランク順序集合
(rank ordered set)を生成する。線スペクトル・ペアの相関特性は、いくつかの
近年のスピーチ圧縮規格において用いられるさまざまなスカラおよびベクトル量
子化方法にとって魅力的なものにしている。
ータの集合を符号化するために最近のスピーチおよび音声圧縮システムにおいて
一般に用いられる。線スペクトル・ペア・パラメータは、線形予測符号化(linea
r predictive coding)解析によって生成されるような粗スペクトル情報(coarse
spectral information)を表すために用いられる。適切な安定性束縛(stability
constraints)があれば、線スペクトル・ペア・パラメータ変換に対する線形予測
符号化解析は、一般に0.0〜0.5の範囲に及ぶ、挙動の良いランク順序集合
(rank ordered set)を生成する。線スペクトル・ペアの相関特性は、いくつかの
近年のスピーチ圧縮規格において用いられるさまざまなスカラおよびベクトル量
子化方法にとって魅力的なものにしている。
【0002】 例えば、1997年1月付け米国電気通信工業会(TIA:Telecommunicatio
ns Industry Association)からのIS−127規格 "Enhanced Variable Rate
Codec, Speech Service Option 3 For Wideband Spread Spectrum Digital Syst
ems"は、LSPパラメータを量子化するために用いられる「加重スプリット・ベ
クトル量子化(weighted split vector quantization)」と呼ばれる手法を利用す
る。10次元線スペクトル・ペア・ベクトルは、多重サブベクトル(multi-subve
ctors)またはセグメントに分割され、これらは、コードブック・メモリの観点、
およびコード検索(code search)の複雑さの観点の両方から、管理しやすい。例 えば、IS−127レート1/2コーデックは、22ビット3セグメントの加重
スプリット・ベクトル量子化方式を採用する。10次元LSPベクトルは、3つ
のセグメントに分割され、3+3+4要素になる。この方式は、各ベクトル・セ
グメント・コードブックについて7,7,8ビット指定を利用する。各セグメン
トに対して個別のコードブックが用いられる。従って、この方式は、3x27+ 3x27+4x28=1792ワードのコードブック・メモリ(ROM)を必要と
し、それぞれは加重二乗誤差(weighted squared error)計算を必要とする。この
方法は、42メガワードの格納および加重二乗誤差計算を必要とする強引(brute
force)な22ビット10要素コード・ベクトル設計に比べて、ベクトルをコー ドブック・セグメントに分割することにより、コードブック・メモリの量を低減
するが、加重スプリット・ベクトル量子化方式は、この強引な方法と同じ性能効
果を発揮しない。その理由の一つは、ベクトル・セグメント間に重複が生じ、そ
の結果、一部のコードブック・データの組合せがLSP順序特性を保持せず、そ
のため与えられた線形予測符号化係数に対して有効でなくなることである。この
影響は、コードブックにおけるコード・ベクトルが実質的に剪定(prune)され、 それによりベクトル量子化符号化利得を低減する。
ns Industry Association)からのIS−127規格 "Enhanced Variable Rate
Codec, Speech Service Option 3 For Wideband Spread Spectrum Digital Syst
ems"は、LSPパラメータを量子化するために用いられる「加重スプリット・ベ
クトル量子化(weighted split vector quantization)」と呼ばれる手法を利用す
る。10次元線スペクトル・ペア・ベクトルは、多重サブベクトル(multi-subve
ctors)またはセグメントに分割され、これらは、コードブック・メモリの観点、
およびコード検索(code search)の複雑さの観点の両方から、管理しやすい。例 えば、IS−127レート1/2コーデックは、22ビット3セグメントの加重
スプリット・ベクトル量子化方式を採用する。10次元LSPベクトルは、3つ
のセグメントに分割され、3+3+4要素になる。この方式は、各ベクトル・セ
グメント・コードブックについて7,7,8ビット指定を利用する。各セグメン
トに対して個別のコードブックが用いられる。従って、この方式は、3x27+ 3x27+4x28=1792ワードのコードブック・メモリ(ROM)を必要と
し、それぞれは加重二乗誤差(weighted squared error)計算を必要とする。この
方法は、42メガワードの格納および加重二乗誤差計算を必要とする強引(brute
force)な22ビット10要素コード・ベクトル設計に比べて、ベクトルをコー ドブック・セグメントに分割することにより、コードブック・メモリの量を低減
するが、加重スプリット・ベクトル量子化方式は、この強引な方法と同じ性能効
果を発揮しない。その理由の一つは、ベクトル・セグメント間に重複が生じ、そ
の結果、一部のコードブック・データの組合せがLSP順序特性を保持せず、そ
のため与えられた線形予測符号化係数に対して有効でなくなることである。この
影響は、コードブックにおけるコード・ベクトルが実質的に剪定(prune)され、 それによりベクトル量子化符号化利得を低減する。
【0003】 例えば、図1は、LSPパラメータのサンプル分布図を示す。LSPは厳密に
昇順のランク順序集合となるように与えられるので、第2コード・ベクトルにお
ける最初の要素は、第1コード・ベクトルにおける最後の要素よりも大きくなけ
ればならない。3−3−4WSVQの第1セグメントの最適コード・ベクトルが
{ω1,ω2,ω3}:{0.10,0.15,0.20}であると判明すると、 第2コード・ベクトルの第1要素ω4は、0.20よりも大きくなければならな い(ω4>0.20)。しかし、LSPトレーニング・データベースにおける統 計および各セグメントのコードブックの独立したトレーニングのため、この条件
を満たさない非常に多くのベクトル(エントリ)がコードブックに存在すること
がある。この影響は、この条件を満たさないコードブック内のコード・ベクトル
は無効となり、エンコーダによって可能な候補として拒絶され、コードブックは
実質的に剪定される。
昇順のランク順序集合となるように与えられるので、第2コード・ベクトルにお
ける最初の要素は、第1コード・ベクトルにおける最後の要素よりも大きくなけ
ればならない。3−3−4WSVQの第1セグメントの最適コード・ベクトルが
{ω1,ω2,ω3}:{0.10,0.15,0.20}であると判明すると、 第2コード・ベクトルの第1要素ω4は、0.20よりも大きくなければならな い(ω4>0.20)。しかし、LSPトレーニング・データベースにおける統 計および各セグメントのコードブックの独立したトレーニングのため、この条件
を満たさない非常に多くのベクトル(エントリ)がコードブックに存在すること
がある。この影響は、この条件を満たさないコードブック内のコード・ベクトル
は無効となり、エンコーダによって可能な候補として拒絶され、コードブックは
実質的に剪定される。
【0004】 この問題に対処することを試みる既知の方法では、加重スプリット・ベクトル
量子化(weighted split vector quantization)方式を採用し、ここでコードブッ
ク値は、現行および以前の量子化線スペクトル・ペアの間の差に基づく。実際に
は、システムは、指定されたコードブック値(△ωiハット)を以前構築された線
スペクトル・ペアに追加することによって、現行の量子化線スペクトル・ペア値
を構築する:
量子化(weighted split vector quantization)方式を採用し、ここでコードブッ
ク値は、現行および以前の量子化線スペクトル・ペアの間の差に基づく。実際に
は、システムは、指定されたコードブック値(△ωiハット)を以前構築された線
スペクトル・ペアに追加することによって、現行の量子化線スペクトル・ペア値
を構築する:
【0005】
【数1】
【0006】 デルタ符号化(delta decoding)として知られるこの方法は、(デルタ・オメガ
が厳密に正である限り)コードブック要素の重複を一般に除去するが、各デルタ
値が比較的大きい場合、同様な剪定効果(pruning effect)が生じることがある。
例えば、最後の量子化LSP値(ωi-1ハット)が0.3であり、現行のLSP デルタ・コードブック(△ωiハット)の値が(0.05,0.30)に及ぶ場合
、0.2より大きい任意のコードブック値は、LSP値が0.5以上になるので
、無効となる。さらに、0.2に近づくコードブック値は、この空間で生じる対
応するLSPの確率は大幅に低減されるので、実質的に「剪定(prune)」される 。ここでも、この剪定により、スピーチ符号化システムにおける全体的な量子化
性能の劣化が生じることがあり、これはプロセスのどの段階でも生じることがあ
る。また、フレーム間予測(interframe prediction)を利用して、線スペクトル ・ペア・パラメータから冗長性を除去することを試みる他の方法も存在するが、
一般にこれらの方法では、既存のワイヤレス通信システムにおいて固有のチャネ
ル・エラーに対して感受性が高くなる。
が厳密に正である限り)コードブック要素の重複を一般に除去するが、各デルタ
値が比較的大きい場合、同様な剪定効果(pruning effect)が生じることがある。
例えば、最後の量子化LSP値(ωi-1ハット)が0.3であり、現行のLSP デルタ・コードブック(△ωiハット)の値が(0.05,0.30)に及ぶ場合
、0.2より大きい任意のコードブック値は、LSP値が0.5以上になるので
、無効となる。さらに、0.2に近づくコードブック値は、この空間で生じる対
応するLSPの確率は大幅に低減されるので、実質的に「剪定(prune)」される 。ここでも、この剪定により、スピーチ符号化システムにおける全体的な量子化
性能の劣化が生じることがあり、これはプロセスのどの段階でも生じることがあ
る。また、フレーム間予測(interframe prediction)を利用して、線スペクトル ・ペア・パラメータから冗長性を除去することを試みる他の方法も存在するが、
一般にこれらの方法では、既存のワイヤレス通信システムにおいて固有のチャネ
ル・エラーに対して感受性が高くなる。
【0007】 格子量子化(lattice quantization)として知られる、スピーチ符号化における
LPC係数量子化の別のシステムについては、1995年音響学,スピーチおよ
び信号処理に関する国際会議(1995 International Conference on Acoustics, S
peech and Signal Processing)からのIEEE会報のMinjie Xieらによる論文 "
Fast and Low-Complexity LSF Quantization using Algebraic Vector Quantize
r" (1995)において開示されている。この手法では、最大セグメント長が3であ る4セグメント・スプリット・ベクトル量子化器を利用して、フレーム毎に10
個のLSPが量子化される。唯一一つのセグメントの成分(components)は絶対L
SP値を表し、残りのセグメントは、各セグメントについて、成分の和が1より
も大きくない値に追加するように正規化されたLSP差を表す。絶対LSP値を
表す一つのセグメントについてコードブック・エントリを与えるために、一つの
格納済みコードブックが用いられ、一方、残りのセグメントのコードブック・エ
ントリは、コードベクトル・インデクスおよび暗黙格子構造(implicit lattice
structure)を利用してリアルタイムで判定される。格子構造を利用することは、
格納済みコードブックのみを利用することに比べて、必要なメモリおよび検索複
雑さ(search complexity)は少なくてすむ。また、このようなシステムにおいて 正規化LSP差を利用することは、剪定の発生を防ぐことができる。しかし、正
規化は全てのコードブック・エントリが有効であることを保証することを助ける
が、正規化はデータを再整合(realign)することがあり、そのため元のパラメー タから特性の変化が生じることがある。
LPC係数量子化の別のシステムについては、1995年音響学,スピーチおよ
び信号処理に関する国際会議(1995 International Conference on Acoustics, S
peech and Signal Processing)からのIEEE会報のMinjie Xieらによる論文 "
Fast and Low-Complexity LSF Quantization using Algebraic Vector Quantize
r" (1995)において開示されている。この手法では、最大セグメント長が3であ る4セグメント・スプリット・ベクトル量子化器を利用して、フレーム毎に10
個のLSPが量子化される。唯一一つのセグメントの成分(components)は絶対L
SP値を表し、残りのセグメントは、各セグメントについて、成分の和が1より
も大きくない値に追加するように正規化されたLSP差を表す。絶対LSP値を
表す一つのセグメントについてコードブック・エントリを与えるために、一つの
格納済みコードブックが用いられ、一方、残りのセグメントのコードブック・エ
ントリは、コードベクトル・インデクスおよび暗黙格子構造(implicit lattice
structure)を利用してリアルタイムで判定される。格子構造を利用することは、
格納済みコードブックのみを利用することに比べて、必要なメモリおよび検索複
雑さ(search complexity)は少なくてすむ。また、このようなシステムにおいて 正規化LSP差を利用することは、剪定の発生を防ぐことができる。しかし、正
規化は全てのコードブック・エントリが有効であることを保証することを助ける
が、正規化はデータを再整合(realign)することがあり、そのため元のパラメー タから特性の変化が生じることがある。
【0008】 例えば、正規化デルタ量子化値を利用することは、正規化デルタ量子化値の分
布および他の統計を変えることによって、量子化誤差に影響を及ぼし、そのため
これらの統計は、これらが導出された絶対値の統計とは異なる。正規化デルタ・
エントリを含むコードブックでは、正規化デルタLSP値は固定範囲にマッピン
グされる。正規化されるあるLSPの正規化下限および上限の値は、以前に量子
化したフレーム・データの関数なので、絶対LSP値から正規化範囲へのマッピ
ングは非線形となる。この非線形マッピング(ワーピング(warping))は、正規 化デルタ値の分布および他の統計を変える効果があり、そのためこれらの統計は
、これらが導出された絶対値の統計とは異なる。これらの差は、コードブック・
エントリの設計およびそれに起因する量子化誤差に影響を及ぼすことがある。こ
のワーピング効果によって、検討対象のデータの統計に応じて、性能の利得ある
いは損失が生じることがある。ワーピングによって損失が生じる場合、正規化デ
ルタ値を利用することが量子化誤差の全体的な低減を達成するためには、剪定の
阻止に起因する利得は、ワーピングに起因する損失よりも大きくなければならな
い。ワーピングに起因する損失が剪定の阻止に起因する利得を打ち消す場合、絶
対値を利用することを優先できる。従って、正規化ベクトルからLSPパラメー
タを判定することにより、符号化性能が低下することがある。
布および他の統計を変えることによって、量子化誤差に影響を及ぼし、そのため
これらの統計は、これらが導出された絶対値の統計とは異なる。正規化デルタ・
エントリを含むコードブックでは、正規化デルタLSP値は固定範囲にマッピン
グされる。正規化されるあるLSPの正規化下限および上限の値は、以前に量子
化したフレーム・データの関数なので、絶対LSP値から正規化範囲へのマッピ
ングは非線形となる。この非線形マッピング(ワーピング(warping))は、正規 化デルタ値の分布および他の統計を変える効果があり、そのためこれらの統計は
、これらが導出された絶対値の統計とは異なる。これらの差は、コードブック・
エントリの設計およびそれに起因する量子化誤差に影響を及ぼすことがある。こ
のワーピング効果によって、検討対象のデータの統計に応じて、性能の利得ある
いは損失が生じることがある。ワーピングによって損失が生じる場合、正規化デ
ルタ値を利用することが量子化誤差の全体的な低減を達成するためには、剪定の
阻止に起因する利得は、ワーピングに起因する損失よりも大きくなければならな
い。ワーピングに起因する損失が剪定の阻止に起因する利得を打ち消す場合、絶
対値を利用することを優先できる。従って、正規化ベクトルからLSPパラメー
タを判定することにより、符号化性能が低下することがある。
【0009】 さらに、このようなシステムにおいて適用される正規化は、各セグメントにお
ける正規化された成分の和が1よりも大きくならないように一般に制限される。
この制限は、三角(triangular)および単向(simplex)格子構造の利用を可能にす るために必要となる。しかし、符号化システムをこの格子構造に制限することは
、符号化性能を無駄に制限することになりうる。
ける正規化された成分の和が1よりも大きくならないように一般に制限される。
この制限は、三角(triangular)および単向(simplex)格子構造の利用を可能にす るために必要となる。しかし、符号化システムをこの格子構造に制限することは
、符号化性能を無駄に制限することになりうる。
【0010】 また、Xieらの格子構造に基づくコードブック・エントリの利用は、LSPデ ータの量子化にとって最適以下(suboptimal)になりうる。コードブック・エント
リを正規の格子構造上の点となるように制限することにより、コードブック・エ
ントリは量子化されるデータの統計分布に最適に適合せず、そのため平均量子化
誤差が増加する。対照的に、格納済みコードブックを利用することは、量子化さ
れるデータの統計分布に一致する統計分布を有するトレーニング・データの集合
に、コードブック・エントリを最適に適合させることができ、これは平均量子化
誤差を低減するのに役立つ。従って、与えられたコードブック・エントリ数につ
いて、トレーニングされ格納されたコードブックの性能は、厳しいメモリ条件を
有する極めて複雑な格子構造に基づくコードブックの性能に比べて一般に優れて
いる。
リを正規の格子構造上の点となるように制限することにより、コードブック・エ
ントリは量子化されるデータの統計分布に最適に適合せず、そのため平均量子化
誤差が増加する。対照的に、格納済みコードブックを利用することは、量子化さ
れるデータの統計分布に一致する統計分布を有するトレーニング・データの集合
に、コードブック・エントリを最適に適合させることができ、これは平均量子化
誤差を低減するのに役立つ。従って、与えられたコードブック・エントリ数につ
いて、トレーニングされ格納されたコードブックの性能は、厳しいメモリ条件を
有する極めて複雑な格子構造に基づくコードブックの性能に比べて一般に優れて
いる。
【0011】 従って、処理時間の短縮を促進することを助け、剪定を低減することを助け、
束縛順序集合の量子化における符号化性能を改善できる、データ圧縮または符号
化システムにおいて改善されたスプリット・ベクトル量子化を行うための方法お
よびシステムが必要とされる。
束縛順序集合の量子化における符号化性能を改善できる、データ圧縮または符号
化システムにおいて改善されたスプリット・ベクトル量子化を行うための方法お
よびシステムが必要とされる。
【0012】 (好適な実施例の説明) データ圧縮システムにけるスペクトル・パラメータを判定するために、線スペ
クトル・ペア・パラメータなどの束縛順序集合値を判定する際に用いられるスプ
リット・ベクトル量子化を行う方法およびシステムは、制約空間(constraint sp
ace)の有効ダイナミック範囲などの上限および下限に正規化された、線スペクト
ル・ペア値などのデルタ符号化束縛順序集合値を収容する多重コードブック(mul
tiple codebooks)を利用する。セグメント化されたコードブックにおいて量子化
された値は、線スペクトル・ペア値など、最後に量子化された束縛順序集合値と
、線スペクトル・ペア値など、別のより高い(あるいはできるだけ最高の)束縛
順序集合値との間の距離の割合(percentage)を表す。従って、コードブック・メ
モリに格納される全ての値は、有効なLSP値になり、そのためコードブック剪
定が防がれる。本明細書で用いられる、スプリット・ベクトル量子化は、ベクト
ル長が1であるスカラ量子化を含む。
クトル・ペア・パラメータなどの束縛順序集合値を判定する際に用いられるスプ
リット・ベクトル量子化を行う方法およびシステムは、制約空間(constraint sp
ace)の有効ダイナミック範囲などの上限および下限に正規化された、線スペクト
ル・ペア値などのデルタ符号化束縛順序集合値を収容する多重コードブック(mul
tiple codebooks)を利用する。セグメント化されたコードブックにおいて量子化
された値は、線スペクトル・ペア値など、最後に量子化された束縛順序集合値と
、線スペクトル・ペア値など、別のより高い(あるいはできるだけ最高の)束縛
順序集合値との間の距離の割合(percentage)を表す。従って、コードブック・メ
モリに格納される全ての値は、有効なLSP値になり、そのためコードブック剪
定が防がれる。本明細書で用いられる、スプリット・ベクトル量子化は、ベクト
ル長が1であるスカラ量子化を含む。
【0013】 LSP再構築器(LSP reconstructor)は、セグメント化されたコードブック内 の正規化デルタ量子化データにアクセスし、このデータは、スピーチまたは他の
データを復号するために、線スペクトル・ペア・パラメータなどの束縛順序集合
値を判定するために用いられる。LSP再構築器は、再構築コード・データ、す
なわち、スプリット・ベクトル再構築コードブックから取得された線スペクトル
・ペア・パラメータの正規化デルタ量子化データ、に基づいて、受信したスペク
トル・パラメータを再構築する。LSP再構築器は、正規化デルタ量子化データ
に基づいて、線スペクトル・ペア・パラメータをダイナミックに生成する。次に
、再構築されたパラメータは、スピーチなどのデータを復号するために、短期合
成フィルタ(short term synthesis filter)に送られる。
データを復号するために、線スペクトル・ペア・パラメータなどの束縛順序集合
値を判定するために用いられる。LSP再構築器は、再構築コード・データ、す
なわち、スプリット・ベクトル再構築コードブックから取得された線スペクトル
・ペア・パラメータの正規化デルタ量子化データ、に基づいて、受信したスペク
トル・パラメータを再構築する。LSP再構築器は、正規化デルタ量子化データ
に基づいて、線スペクトル・ペア・パラメータをダイナミックに生成する。次に
、再構築されたパラメータは、スピーチなどのデータを復号するために、短期合
成フィルタ(short term synthesis filter)に送られる。
【0014】 好適な実施例では、線スペクトル・ペア・パラメータの絶対値をセグメント化
コードブックに格納する代わりに、開示のシステムはおよび方法は、少なくとも
2つの絶対値ベクトルと、スペクトル量子化で用いるための正規化デルタ量子化
データの少なくとも一つのベクトルとの組合せを格納・利用する。
コードブックに格納する代わりに、開示のシステムはおよび方法は、少なくとも
2つの絶対値ベクトルと、スペクトル量子化で用いるための正規化デルタ量子化
データの少なくとも一つのベクトルとの組合せを格納・利用する。
【0015】 図2は、エア・インタフェース(air interface)またはチャネル上で送信され たスピーチを再構築するために、スペクトル・パラメータなどのスピーチ・パラ
メータ14を介して符号化スピーチを表す符号化入力データ12を受信する、無
線電話通信システムなどの通信システムにおけるスピーチ・デコーダ10を示す
。スピーチ・パラメータ14は、パラメータ・デコーダによって、当技術分野で
周知なように復号される。スピーチ・デコーダ10は、例えば、当技術分野で周
知なような関連ベクトル付きの固定コードブックと、当技術分野で周知なような
長期予測ブロック(long term prediction block)18と、短期予測LPC合成フ
ィルタ(short term prediction LPC synthesis filter)20とを含む。短期予測
LPC合成フィルタ20は、スプリット・ベクトルLSP再構築コードブック2
2a〜22cを利用することで導出されたLSPデータに基づいて生成されたL
PC情報を利用する。
メータ14を介して符号化スピーチを表す符号化入力データ12を受信する、無
線電話通信システムなどの通信システムにおけるスピーチ・デコーダ10を示す
。スピーチ・パラメータ14は、パラメータ・デコーダによって、当技術分野で
周知なように復号される。スピーチ・デコーダ10は、例えば、当技術分野で周
知なような関連ベクトル付きの固定コードブックと、当技術分野で周知なような
長期予測ブロック(long term prediction block)18と、短期予測LPC合成フ
ィルタ(short term prediction LPC synthesis filter)20とを含む。短期予測
LPC合成フィルタ20は、スプリット・ベクトルLSP再構築コードブック2
2a〜22cを利用することで導出されたLSPデータに基づいて生成されたL
PC情報を利用する。
【0016】 スプリット・ベクトルLSP再構築コードブック22a〜22cは、線スペク
トル・ペア・パラメータまたは他の束縛順序集合パラメータを判定するための正
規化デルタ量子化データ表す再構築コード・データを収容するスプリット・ベク
トル再構築コード・ソースとして機能する。コードブック22a〜22cにおけ
る再構築コード・データの各エントリは、線スペクトル・ペア・パラメータなど
の束縛順序集合データを判定するための有効なデータに対応し、受信した符号化
入力データ12または他のスペクトル・パラメータの再構築を促進する。スピー
チ・パラメータ14は、とりわけ、固定コードブック・インデクス・パラメータ
24,固定コードブック利得パラメータ26,長期遅延パラメータ28,長期予
測利得パラメータ30および正規化デルタ量子化(NDQ:normalization delt
a quantization)コードブック・インデクス・パラメータ32を含んでもよい。
トル・ペア・パラメータまたは他の束縛順序集合パラメータを判定するための正
規化デルタ量子化データ表す再構築コード・データを収容するスプリット・ベク
トル再構築コード・ソースとして機能する。コードブック22a〜22cにおけ
る再構築コード・データの各エントリは、線スペクトル・ペア・パラメータなど
の束縛順序集合データを判定するための有効なデータに対応し、受信した符号化
入力データ12または他のスペクトル・パラメータの再構築を促進する。スピー
チ・パラメータ14は、とりわけ、固定コードブック・インデクス・パラメータ
24,固定コードブック利得パラメータ26,長期遅延パラメータ28,長期予
測利得パラメータ30および正規化デルタ量子化(NDQ:normalization delt
a quantization)コードブック・インデクス・パラメータ32を含んでもよい。
【0017】 NDQコードブック・インデクス・パラメータ32は、スプリット・ベクトル
LSP再構築コードブック22a〜22cの一つまたはそれ以上においてベクト
ルをインデクスする。線スペクトル・ペア・パラメータは、スプリット・ベクト
ルLSP再構築コードブック22a〜22cにおけるインデクスされた正規化デ
ルタ量子化データに基づいて、LSP再構築器34によって再構築される。LS
P/LPC変換器(LSP to LPC transformer)36は、当技術分野で周知なように
、LSPパラメータをLPC情報に変換する。次に、LPC情報は、出力スピー
チを生成するために、長期予測情報とともに、従来の短期予測LPC合成フィル
タ20によって用いられる。
LSP再構築コードブック22a〜22cの一つまたはそれ以上においてベクト
ルをインデクスする。線スペクトル・ペア・パラメータは、スプリット・ベクト
ルLSP再構築コードブック22a〜22cにおけるインデクスされた正規化デ
ルタ量子化データに基づいて、LSP再構築器34によって再構築される。LS
P/LPC変換器(LSP to LPC transformer)36は、当技術分野で周知なように
、LSPパラメータをLPC情報に変換する。次に、LPC情報は、出力スピー
チを生成するために、長期予測情報とともに、従来の短期予測LPC合成フィル
タ20によって用いられる。
【0018】 具体的には、固定コードブック・インデクス・パラメータ24は、符号化スピ
ーチ波形の確率成分(stochastic component)を判定するために、固定コードブッ
ク16における確率コード・ベクトル(stochastic code vectors)の集合に対す るアドレスをインデクスする。固定コードブック利得パラメータ26は、符号化
スピーチからのエネルギがどれだけ強いかを表す。固定コードブック利得パラメ
ータ26は、固定コードブック16からの出力ベクトルと、乗算器(ミキサ)2
7において乗算され、利得を固定コードブック・データに与える。当技術分野で
周知な長期予測ブロック18は、遅延パラメータ28を受信し、この遅延パラメ
ータは、スピーチ波形のピッチ期間(pitch period)を判定するために用いられる
。また、長期予測ブロック18は、当技術分野で周知なように、ピッチの量を判
定するために、利得パラメータ30を受信する。
ーチ波形の確率成分(stochastic component)を判定するために、固定コードブッ
ク16における確率コード・ベクトル(stochastic code vectors)の集合に対す るアドレスをインデクスする。固定コードブック利得パラメータ26は、符号化
スピーチからのエネルギがどれだけ強いかを表す。固定コードブック利得パラメ
ータ26は、固定コードブック16からの出力ベクトルと、乗算器(ミキサ)2
7において乗算され、利得を固定コードブック・データに与える。当技術分野で
周知な長期予測ブロック18は、遅延パラメータ28を受信し、この遅延パラメ
ータは、スピーチ波形のピッチ期間(pitch period)を判定するために用いられる
。また、長期予測ブロック18は、当技術分野で周知なように、ピッチの量を判
定するために、利得パラメータ30を受信する。
【0019】 短期予測LPC合成フィルタ20は、線形予測符号化情報から取得された短期
パラメータを利用して、当技術分野で周知なように符号化スピーチのスペクトル
・エンベロープを判定するCELP(code excited linear predictor)でもよい 。線形予測符号化フィルタ係数は、LDQ LSP再構築コードブック22a〜
22cにおける正規化デルタ量子化データに基づいて、線スペクトル・ペア・パ
ラメータの束縛順序集合から変換され、この集合によって表される。ただし、開
示の発明は、非CELP方式のデコーダや、他の適切な符号化および/または復
号デバイスにも適用可能であることが理解される。
パラメータを利用して、当技術分野で周知なように符号化スピーチのスペクトル
・エンベロープを判定するCELP(code excited linear predictor)でもよい 。線形予測符号化フィルタ係数は、LDQ LSP再構築コードブック22a〜
22cにおける正規化デルタ量子化データに基づいて、線スペクトル・ペア・パ
ラメータの束縛順序集合から変換され、この集合によって表される。ただし、開
示の発明は、非CELP方式のデコーダや、他の適切な符号化および/または復
号デバイスにも適用可能であることが理解される。
【0020】 セグメント化LSP再構築コードブック22a〜22cにおける正規化デルタ
量子化データは、短期予測LPC合成フィルタ20に必要な線スペクトル・ペア
・パラメータ値の絶対値を判定(再構築)するために用いられる。
量子化データは、短期予測LPC合成フィルタ20に必要な線スペクトル・ペア
・パラメータ値の絶対値を判定(再構築)するために用いられる。
【0021】 図3および図4を参照して、適切な正規化デルタ量子化データ、△ωlエント リ(図5参照)は、ブロック50に示すように、各エントリが有効なLSPパラ
メータを判定するために利用できるように、スプリット・ベクトルLSP再構築
コードブック22a〜22cについて判定される。これは、トレーニング・スピ
ーチ・フレームや、復号される他の適切な情報に基づいて、コンピュータによっ
て実行される。剪定の影響を避けるために、デルタ符号化LSPは、有効ダイナ
ミック範囲など、制約空間の範囲に正規化される。すなわち、コードブック・エ
ントリは、下限(lower bound)と上限(upper bound)との間の距離の割合を表す。
下限は、同一スピーチ・フレームからのより小さなLSPの以前取得した量子化
値、あるいは可能な最小値である0.0に設定できる。同様に、上限は、同一ス
ピーチ・フレームからのより大きなLSPの以前取得した量子化値、あるいは可
能な最大値である0.5に設定できる。これは次のように表すことができる:
メータを判定するために利用できるように、スプリット・ベクトルLSP再構築
コードブック22a〜22cについて判定される。これは、トレーニング・スピ
ーチ・フレームや、復号される他の適切な情報に基づいて、コンピュータによっ
て実行される。剪定の影響を避けるために、デルタ符号化LSPは、有効ダイナ
ミック範囲など、制約空間の範囲に正規化される。すなわち、コードブック・エ
ントリは、下限(lower bound)と上限(upper bound)との間の距離の割合を表す。
下限は、同一スピーチ・フレームからのより小さなLSPの以前取得した量子化
値、あるいは可能な最小値である0.0に設定できる。同様に、上限は、同一ス
ピーチ・フレームからのより大きなLSPの以前取得した量子化値、あるいは可
能な最大値である0.5に設定できる。これは次のように表すことができる:
【0022】
【数2】
【0023】 ここで、ωiはi番目の非量子化LSPであり、ωHは上限であり、ωLは下限で ある。
【0024】 ブロック52において、正規化デルタ量子化データは、デコーダ10のスプリ
ット・ベクトル・コードブック22a〜22cに格納される。これは、デコーダ
製造時に、現場における要求時に、あるいは任意の適切な時点で行うことができ
る。デコーダ10は、ブロック54に示すように、元のスピーチに関連するスペ
クトル情報についてスピーチ・パラメータ14を受信する。LSP再構築器34
は、NDQインデクス・パラメータ32に基づいて、スプリット・ベクトルLS
P再構築コードブック22a〜22cからコード・ベクトルを取り出す。スプリ
ット・ベクトルLSP再構築コードブック22a〜22cからのコード・ベクト
ルは、被推定LSPパラメータの表現を含む。これをブロック56に示す。LS
P再構築器34は、ブロック58に示すように、コードブック22a〜22cか
らの正規化デルタ量子化データに基づいて、LSPパラメータを再構築する。
ット・ベクトル・コードブック22a〜22cに格納される。これは、デコーダ
製造時に、現場における要求時に、あるいは任意の適切な時点で行うことができ
る。デコーダ10は、ブロック54に示すように、元のスピーチに関連するスペ
クトル情報についてスピーチ・パラメータ14を受信する。LSP再構築器34
は、NDQインデクス・パラメータ32に基づいて、スプリット・ベクトルLS
P再構築コードブック22a〜22cからコード・ベクトルを取り出す。スプリ
ット・ベクトルLSP再構築コードブック22a〜22cからのコード・ベクト
ルは、被推定LSPパラメータの表現を含む。これをブロック56に示す。LS
P再構築器34は、ブロック58に示すように、コードブック22a〜22cか
らの正規化デルタ量子化データに基づいて、LSPパラメータを再構築する。
【0025】 上記の関係を利用して、LSP(ωiハット)は、次式により、コードブック 値(△ωiハット)と、以前取得した下限および上限から再構築される:
【0026】
【数3】
【0027】 各フレームに対するLSPの再構築は、所望の下限値および上限値が各LSP
について利用可能となるような順序で行うべきである。この方法において暗黙的
な点は、再構築すべき少なくとも最初のLSPは、フレームLSPデータとは無
関係な固定下限値および上限値を割り当てなければならないという事実である。
例えば、再構築すべき最初のLSPに対するこれらの固定値は、可能な最小値で
ある0.0および可能な最大値である0.5に設定でき、これは絶対LSP値を
対応する正規化デルタLSP値に設定することに相当する。再構築の後、LSP
パラメータは、LSP/LPC変換器36によって、当技術分野で周知なように
、線形予測符号化係数を判定するために用いられる。次に、短期予測LPC合成
フィルタ20は、ブロック60に示すように、次のスピーチ・パラメータを評価
する。
について利用可能となるような順序で行うべきである。この方法において暗黙的
な点は、再構築すべき少なくとも最初のLSPは、フレームLSPデータとは無
関係な固定下限値および上限値を割り当てなければならないという事実である。
例えば、再構築すべき最初のLSPに対するこれらの固定値は、可能な最小値で
ある0.0および可能な最大値である0.5に設定でき、これは絶対LSP値を
対応する正規化デルタLSP値に設定することに相当する。再構築の後、LSP
パラメータは、LSP/LPC変換器36によって、当技術分野で周知なように
、線形予測符号化係数を判定するために用いられる。次に、短期予測LPC合成
フィルタ20は、ブロック60に示すように、次のスピーチ・パラメータを評価
する。
【0028】 図5は、スプリット・ベクトル・コードブック22a〜22cの正規化デルタ
量子化データを生成するための一つの方法を示す。ある解析済みフレーム数につ
いてLSP値ωiの分布を利用して、ユーザは、コンピュータを用いて、トレー ニング・セットについて△ωiの全ての可能な値を生成できる。例えば、エンコ ーダから予期される音声,ミュージックまたは他のデータのフレームのモデルを
利用して、各△ωiについて分布範囲を生成できる。これは、ブロック70に示 される。次に、コンピュータは、ブロック72に示すように、各量子化期間につ
いて等誤差確率分布(equal error probability distribution)を得るために値を
評価する。次に、コンピュータは、各量子化レベルについて分布平均を取り、こ
の平均を(△ωiハット)としてスプリット・ベクトル・コードブック22a〜2
2cに格納して、ブロック74に示すように、各スプリット・ベクトル・コード
ブックの有効なLSPパラメータにインデクスを与える。
量子化データを生成するための一つの方法を示す。ある解析済みフレーム数につ
いてLSP値ωiの分布を利用して、ユーザは、コンピュータを用いて、トレー ニング・セットについて△ωiの全ての可能な値を生成できる。例えば、エンコ ーダから予期される音声,ミュージックまたは他のデータのフレームのモデルを
利用して、各△ωiについて分布範囲を生成できる。これは、ブロック70に示 される。次に、コンピュータは、ブロック72に示すように、各量子化期間につ
いて等誤差確率分布(equal error probability distribution)を得るために値を
評価する。次に、コンピュータは、各量子化レベルについて分布平均を取り、こ
の平均を(△ωiハット)としてスプリット・ベクトル・コードブック22a〜2
2cに格納して、ブロック74に示すように、各スプリット・ベクトル・コード
ブックの有効なLSPパラメータにインデクスを与える。
【0029】 なお、好適なシステムおよび方法は、絶対および正規化デルタ量子化データの
両方を利用することを含むべきであることが判明している。上記の正規化は、ど
のターゲット・ベクトルに対しても、全てのコード・ベクトルが有効なことを保
証するが、別の実施例では、絶対LSP値は、さらに改善されたスペクトル量子
化を行うために、スプリット・ベクトルNDQ LSP再構築コードブック22
a〜22cに含まれる。
両方を利用することを含むべきであることが判明している。上記の正規化は、ど
のターゲット・ベクトルに対しても、全てのコード・ベクトルが有効なことを保
証するが、別の実施例では、絶対LSP値は、さらに改善されたスペクトル量子
化を行うために、スプリット・ベクトルNDQ LSP再構築コードブック22
a〜22cに含まれる。
【0030】 図6を参照して、ハイブリッド再構築コードブック80a〜80cは、スプリ
ット・ベクトル・コードブックである。コードブック80aおよび80cは、絶
対LSP値などの絶対スプリット・ベクトル・コード・ソース・データを収容す
る少なくとも2つのスプリット・ベクトル・セグメント(グループ)を格納する
。コードブック80bは、LSPパラメータなどの順序パラメータの集合の正規
化デルタ量子化を表す再構築コード・データの少なくとも一つのセグメントを格
納する。順序パラメータの集合の正規化デルタ量子化を表す再構築コード・デー
タは、トレーニング・データの集合に基づいて最適化される。ハイブリッド再構
築コードブック80a〜80cは、少なくとも2つの絶対ベクトルを採用するこ
とにより、既知の格子コードブック構造および図2に示す構造に対して優位性を
提供できる。
ット・ベクトル・コードブックである。コードブック80aおよび80cは、絶
対LSP値などの絶対スプリット・ベクトル・コード・ソース・データを収容す
る少なくとも2つのスプリット・ベクトル・セグメント(グループ)を格納する
。コードブック80bは、LSPパラメータなどの順序パラメータの集合の正規
化デルタ量子化を表す再構築コード・データの少なくとも一つのセグメントを格
納する。順序パラメータの集合の正規化デルタ量子化を表す再構築コード・デー
タは、トレーニング・データの集合に基づいて最適化される。ハイブリッド再構
築コードブック80a〜80cは、少なくとも2つの絶対ベクトルを採用するこ
とにより、既知の格子コードブック構造および図2に示す構造に対して優位性を
提供できる。
【0031】 LSP再構築器82は、絶対スプリット・ベクトル・コード・ソース・データ
と、順序パラメータの集合の正規化デルタ量子化を表す再構築コード・データの
少なくとも2つの集合に基づいて、順序パラメータの集合を再構築する。LSP
再構築器は、絶対スプリット・ベクトル・コード・ソース・データの少なくとも
2つのセグメントと、正規化デルタ量子化データの少なくとも一つのセグメント
を利用して、LSP/LPC変換器36によって用いるために正規化量子化デー
タを絶対量子化データに変換する。前述のように、順序パラメータの集合の正規
化デルタ量子化を表す再構築コード・データは、2つの絶対量子化線スペクトル
・ペア・パラメータ値または他の以前に取得した上限および下限の間の距離パー
セントを表すべく量子化されたスプリット・ベクトル・コードブック値を含む。
と、順序パラメータの集合の正規化デルタ量子化を表す再構築コード・データの
少なくとも2つの集合に基づいて、順序パラメータの集合を再構築する。LSP
再構築器は、絶対スプリット・ベクトル・コード・ソース・データの少なくとも
2つのセグメントと、正規化デルタ量子化データの少なくとも一つのセグメント
を利用して、LSP/LPC変換器36によって用いるために正規化量子化デー
タを絶対量子化データに変換する。前述のように、順序パラメータの集合の正規
化デルタ量子化を表す再構築コード・データは、2つの絶対量子化線スペクトル
・ペア・パラメータ値または他の以前に取得した上限および下限の間の距離パー
セントを表すべく量子化されたスプリット・ベクトル・コードブック値を含む。
【0032】 一例として、コードブック80aは、LSP1〜3を収容する一つのセグメン
トまたはグループを量子化するためのコードブック・エントリを収容でき、コー
ドブック80cは、LSP7〜10を収容でき、コードブック80bは、LSP
4〜6を収容できる。そのため、コードブック80aおよび80cは絶対LSP
値を収容し、一方、コードブック80bは正規化デルタ量子化データを収容する
。さらに、コードブック80bについてコードブック値を導出する際に用いられ
る正規化デルタ量子化データを算出する際に、下限ωLは、LSP3の量子化値 に等しく設定され、上限ωHは、LSP7の量子化値に設定される。図1から、 LSP3とLSP7の分布にはほとんど重複がないことがわかる。従って、コー
ドブック80cを剪定することに起因する損失は小さい。下限をLSP3の量子
化値に設定し、かつ上限を可能な最大値である0.5に設定することによって決
定される、コードブック80cを量子化するための正規化デルタ量子化値を利用
することによって、この剪定損失を実質的に削除することは可能であるが、この
場合のワーピングに起因する損失は、剪定を阻止することに起因する利得よりも
大きくなり、そのためコードブック80cは絶対LSP値を収容する。
トまたはグループを量子化するためのコードブック・エントリを収容でき、コー
ドブック80cは、LSP7〜10を収容でき、コードブック80bは、LSP
4〜6を収容できる。そのため、コードブック80aおよび80cは絶対LSP
値を収容し、一方、コードブック80bは正規化デルタ量子化データを収容する
。さらに、コードブック80bについてコードブック値を導出する際に用いられ
る正規化デルタ量子化データを算出する際に、下限ωLは、LSP3の量子化値 に等しく設定され、上限ωHは、LSP7の量子化値に設定される。図1から、 LSP3とLSP7の分布にはほとんど重複がないことがわかる。従って、コー
ドブック80cを剪定することに起因する損失は小さい。下限をLSP3の量子
化値に設定し、かつ上限を可能な最大値である0.5に設定することによって決
定される、コードブック80cを量子化するための正規化デルタ量子化値を利用
することによって、この剪定損失を実質的に削除することは可能であるが、この
場合のワーピングに起因する損失は、剪定を阻止することに起因する利得よりも
大きくなり、そのためコードブック80cは絶対LSP値を収容する。
【0033】 コードブック80bについて、LSP6およびLSP7の分布と、LSP3お
よびLSP4の分布においてかなりの重複があることが図1からわかる。従って
、コードブック80について絶対LSP値が用いられる場合、剪定に起因するか
なりの損失が生じる。コードブック80bにおいて正規化デルタ量子化データを
利用することにより、ワーピングに起因する損失よりも大きい、剪定損失を阻止
することに起因する符号化利得が得られる。
よびLSP4の分布においてかなりの重複があることが図1からわかる。従って
、コードブック80について絶対LSP値が用いられる場合、剪定に起因するか
なりの損失が生じる。コードブック80bにおいて正規化デルタ量子化データを
利用することにより、ワーピングに起因する損失よりも大きい、剪定損失を阻止
することに起因する符号化利得が得られる。
【0034】 別の例では、粗スペクトル情報を表すために、フレーム毎に14個のLPCを
利用できる。この14個のLPCの集合は、0.0〜0.5の範囲の14個のL
SPの順序集合に変換される。3つのコードブックではなく、4つのコードブッ
クを有する4セグメント・スプリット・ベクトル量子化器が用いられる。第1コ
ードブックは、LSP1〜3までの絶対値を表すエントリを収容する。第2コー
ドブックは、LSP11〜14までの絶対値を表すエントリを収容する。第3コ
ードブックは、LSP7〜10から導出された正規化デルタLSP値を表すエン
トリを収容する。これらの正規化デルタ量子化値を算出する際に、下限はLSP
3の量子化値に等しく設定され、上限はLSP11の量子化値に等しく設定され
る。第4コードブックは、LSP4〜6から導出された正規化デルタLSP値を
表すエントリを収容する。これらの正規化デルタLSP値を算出する際に、下限
はLSP3の量子化値に等しく設定され、上限はLSP7の量子化値に設定され
る。
利用できる。この14個のLPCの集合は、0.0〜0.5の範囲の14個のL
SPの順序集合に変換される。3つのコードブックではなく、4つのコードブッ
クを有する4セグメント・スプリット・ベクトル量子化器が用いられる。第1コ
ードブックは、LSP1〜3までの絶対値を表すエントリを収容する。第2コー
ドブックは、LSP11〜14までの絶対値を表すエントリを収容する。第3コ
ードブックは、LSP7〜10から導出された正規化デルタLSP値を表すエン
トリを収容する。これらの正規化デルタ量子化値を算出する際に、下限はLSP
3の量子化値に等しく設定され、上限はLSP11の量子化値に等しく設定され
る。第4コードブックは、LSP4〜6から導出された正規化デルタLSP値を
表すエントリを収容する。これらの正規化デルタLSP値を算出する際に、下限
はLSP3の量子化値に等しく設定され、上限はLSP7の量子化値に設定され
る。
【0035】 なお、さまざまな態様における本発明の他の変形および修正の実施は当業者に
明白であり、本発明は説明した特定の実施例に限定されないことを理解されたい
。例えば、本システムおよび方法は、さまざまな次元およびセグメンテーション
を有するスカラ,ベクトル,マトリクスあるいは他の適切な量子化器に適用でき
る。さらに、コードブック剪定を阻止する効果を有し、故に順序集合のスプリッ
ト・ベクトル量子化の性能における同様な改善を達成するために利用できる、他
の同様な正規化方法もある。例えば、正規化LSPは次式に従って算出できる:
明白であり、本発明は説明した特定の実施例に限定されないことを理解されたい
。例えば、本システムおよび方法は、さまざまな次元およびセグメンテーション
を有するスカラ,ベクトル,マトリクスあるいは他の適切な量子化器に適用でき
る。さらに、コードブック剪定を阻止する効果を有し、故に順序集合のスプリッ
ト・ベクトル量子化の性能における同様な改善を達成するために利用できる、他
の同様な正規化方法もある。例えば、正規化LSPは次式に従って算出できる:
【0036】
【数4】
【0037】 ここで、ωL<ωi<ωHであり、ωL≦ωr≦ωHであり、また△ωiは正規化LS P値であり、ωiは絶対LSP値であり、ωHおよびωLは上記の制約を満たす以 前取得した上限および下限であり、ωrは上記の制約を満たす以前取得した基準 値であり、符号(sign)は、エンコーダおよびデコーダの両方において、同じ極性
に演繹的に設定される。この場合、絶対量子化LSP値は、次式に従って△ωi (または(△ωiハット))の量子化値から得られる。
に演繹的に設定される。この場合、絶対量子化LSP値は、次式に従って△ωi (または(△ωiハット))の量子化値から得られる。
【0038】
【数5】
【0039】 また、絶対および正規化デルタ量子化値の組合せは、量子化されるデータの統
計に応じて異なるこことが理解される。従って、本発明は、本明細書で開示・請
求される基本原理の精神および範囲内のあらゆる修正,変形または同等を網羅す
るものとする。
計に応じて異なるこことが理解される。従って、本発明は、本明細書で開示・請
求される基本原理の精神および範囲内のあらゆる修正,変形または同等を網羅す
るものとする。
【図1】 多数の解析済みスピーチ・フレームの線スペクトル・ペア・パラ
メータ分布を示すグラフである。
メータ分布を示すグラフである。
【図2】 ワイヤレス通信システムにおける本発明の一実施例を内蔵するス
ピーチ・デコーダを概略的に示すブロック図である。
ピーチ・デコーダを概略的に示すブロック図である。
【図3】 本発明の一実施例による正規化量子化を内蔵するコードブック構
造の一例を概略的に示す図である。
造の一例を概略的に示す図である。
【図4】 本発明の一実施例により、スペクトル・パラメータを判定するた
めにスプリット・ベクトル量子化を行う方法を概略的に示すフロー図である。
めにスプリット・ベクトル量子化を行う方法を概略的に示すフロー図である。
【図5】 本発明の一実施例により、スプリット・ベクトル線スペクトル・
ペア・コードブックについて正規化デルタ量子化データを判定する方法を概略的
に示すフロー図である。
ペア・コードブックについて正規化デルタ量子化データを判定する方法を概略的
に示すフロー図である。
【図6】 ワイヤレス通信システムにおける本発明の別の実施例を内蔵する
スピーチ・デコーダを概略的に示すブロック図であり、ここでコードブック・メ
モリは、絶対LSP値と正規化デルタ量子化データの両方の組合せを収容する。
スピーチ・デコーダを概略的に示すブロック図であり、ここでコードブック・メ
モリは、絶対LSP値と正規化デルタ量子化データの両方の組合せを収容する。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マーク・エー・ジャシウク アメリカ合衆国イリノイ州シカゴ、ノー ス・メルビナ・アベニュー6221 (72)発明者 アーロン・エム・スミス アメリカ合衆国イリノイ州ストリームウッ ド、ジャクソン・レーン64 Fターム(参考) 5D045 CA03 CC07 5J064 BA12 BA13 BB03 BC02 BC14 BC17 BD02
Claims (10)
- 【請求項1】 符号化のための順序パラメータの集合を調べる際に用いられ
るスプリット・ベクトル量子化を行う方法であって: 順序パラメータの集合を調べるための正規化デルタ量子化データを表す再構築
コード・データを含むスプリット・ベクトル再構築コード・ソースを格納する段
階であって、再構築コード・データの各エントリは、前記順序パラメータの集合
を調べるための有効なデータに相当し、受信したスペクトル・パラメータの再構
築を促進する、段階;および 前記スプリット・ベクトル再構築コード・ソースからの前記順序パラメータの
集合の正規化デルタ量子化を表す再構築コード・データに基づいて、前記受信し
たスペクトル・パラメータを再構築する段階; によって構成されることを特徴とする方法。 - 【請求項2】 前記スプリット・ベクトル再構築コード・ソースは、スプリ
ット・ベクトル・コードブックであり、前記順序パラメータの集合は、前記正規
化デルタ量子化データから求められることを特徴とする請求項1記載の方法。 - 【請求項3】 前記順序パラメータの集合の正規化デルタ量子化を表す前記
再構築コード・データは、下限値と上限値との間の距離パーセントを表すべく量
子化されたスプリット・ベクトル・コードブック値を含むことを特徴とする請求
項2記載の方法。 - 【請求項4】 受信したパラメータを再構築する前記段階は、前記順序パラ
メータの集合の正規化デルタ量子化を表す前記再構築コード・データに基づいて
、線スペクトル・ペア(LSP)パラメータを動的に生成し、動的に生成された
LSPパラメータに基づく線形予測符号化係数を利用して、前記受信したパラメ
ータを再構築することを特徴とする請求項1記載の方法。 - 【請求項5】 前記スプリット・ベクトル再構築コード・ソース内の異なる
スプリット・ベクトルからのベクトル・エントリの選択を促進するため、前記ス
プリット・ベクトル再構築コード・ソースの各ベクトル・エントリを指示する段
階を含んで構成されることを特徴とする請求項1記載の方法。 - 【請求項6】 スピーチ・エンコーダから符号化スペクトル・パラメータを
動作可能に受信する段階を含んで構成されることを特徴とする請求項1記載の方
法。 - 【請求項7】 前記順序パラメータの集合は、線スペクトル・ペア値からな
ることを特徴とする請求項1記載の方法。 - 【請求項8】 絶対スプリット・ベクトル・コード・ソース・データの少な
くとも2つのグループを格納する段階をさらに含んで構成される請求項1記載の
方法であって、受信したパラメータを再構築する前記段階は、絶対スプリット・
ベクトル・コード・ソース・データと、前記順序パラメータの集合の正規化デル
タ量子化を表す前記再構築コード・データの2つの集合に基づいて、受信したパ
ラメータを再構築することを含むことを特徴とする請求項1記載の方法。 - 【請求項9】 前記順序パラメータの集合の正規化デルタ量子化を表す前記
再構築コード・データは、2つの量子化LSP値および絶対量子化値の間の距離
パーセントを表すべく量子化されたスプリット・ベクトル・コードブック値を含
むことを特徴とする請求項2記載の方法。 - 【請求項10】 順序パラメータの集合を判定する際に用いられるスプリッ
ト・ベクトル量子化を行う符号化システムであって: 前記順序パラメータの集合を判定するための正規化デルタ量子化データを表す
再構築コード・データを収容するスプリット・ベクトル再構築コード・ソースを
格納する手段であって、再構築コード・データの各エントリは、前記順序パラメ
ータの集合を判定するための有効なデータに相当し、受信したスペクトル・パラ
メータの再構築を促進する、格納する手段;および 前記格納する手段に動作可能に結合され、前記スプリット・ベクトル再構築コ
ード・ソースからの前記順序パラメータの集合の正規化デルタ量子化を表す再構
築コード・データに基づいて、前記受信したパラメータを再構築する手段; によって構成されることを特徴とするシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2243798A | 1998-02-12 | 1998-02-12 | |
US09/022,437 | 1998-02-12 | ||
PCT/US1999/002431 WO1999041736A2 (en) | 1998-02-12 | 1999-02-04 | A system and method for providing split vector quantization data coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002503834A true JP2002503834A (ja) | 2002-02-05 |
Family
ID=21809582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000531838A Pending JP2002503834A (ja) | 1998-02-12 | 1999-02-04 | スプリット・ベクトル量子化データ符号化のためのシステムおよび方法 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1062657A4 (ja) |
JP (1) | JP2002503834A (ja) |
KR (1) | KR20010040902A (ja) |
WO (1) | WO1999041736A2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100324204B1 (ko) * | 1999-12-24 | 2002-02-16 | 오길록 | 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법 |
WO2007058465A1 (en) * | 2005-11-15 | 2007-05-24 | Samsung Electronics Co., Ltd. | Methods and apparatuses to quantize and de-quantize linear predictive coding coefficient |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3151874B2 (ja) * | 1991-02-26 | 2001-04-03 | 日本電気株式会社 | 音声パラメータ符号化方式および装置 |
US5651026A (en) * | 1992-06-01 | 1997-07-22 | Hughes Electronics | Robust vector quantization of line spectral frequencies |
US5668925A (en) * | 1995-06-01 | 1997-09-16 | Martin Marietta Corporation | Low data rate speech encoder with mixed excitation |
US5649051A (en) * | 1995-06-01 | 1997-07-15 | Rothweiler; Joseph Harvey | Constant data rate speech encoder for limited bandwidth path |
US5636231A (en) * | 1995-09-05 | 1997-06-03 | Motorola, Inc. | Method and apparatus for minimal redundancy error detection and correction of voice spectrum parameters |
KR100322706B1 (ko) * | 1995-09-25 | 2002-06-20 | 윤종용 | 선형예측부호화계수의부호화및복호화방법 |
-
1999
- 1999-02-04 JP JP2000531838A patent/JP2002503834A/ja active Pending
- 1999-02-04 KR KR1020007008810A patent/KR20010040902A/ko not_active Ceased
- 1999-02-04 EP EP99905742A patent/EP1062657A4/en not_active Withdrawn
- 1999-02-04 WO PCT/US1999/002431 patent/WO1999041736A2/en not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
WO1999041736A3 (en) | 1999-10-21 |
KR20010040902A (ko) | 2001-05-15 |
EP1062657A2 (en) | 2000-12-27 |
WO1999041736A2 (en) | 1999-08-19 |
EP1062657A4 (en) | 2004-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7680670B2 (en) | Dimensional vector and variable resolution quantization | |
US7502734B2 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in sound signal coding | |
US6807526B2 (en) | Method of and apparatus for processing at least one coded binary audio flux organized into frames | |
US7953595B2 (en) | Dual-transform coding of audio signals | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
JP6779966B2 (ja) | 先進量子化器 | |
US10504525B2 (en) | Adaptive forward error correction redundant payload generation | |
CN111133510B (zh) | 用于在celp编解码器中高效地分配比特预算的方法和设备 | |
CN1890713B (zh) | 用于数字信号压缩编码的多脉冲字典的索引间的编码转换的方法及系统 | |
WO2011045926A1 (ja) | 符号化装置、復号装置およびこれらの方法 | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
JP3255022B2 (ja) | 適応変換符号化方式および適応変換復号方式 | |
JP5337305B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体 | |
KR100467326B1 (ko) | 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기 | |
JP2002503834A (ja) | スプリット・ベクトル量子化データ符号化のためのシステムおよび方法 | |
CN103503065B (zh) | 用于衰减低精确度重构的信号区域的方法和解码器 | |
US20070061137A1 (en) | Method for recovering frame erasure at voice over internet protocol (VoIP) environment | |
JP4574320B2 (ja) | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 | |
Bouzid et al. | Channel optimized switched split vector quantization for wideband speech LSF parameters | |
Das et al. | Multimode spectral coding of speech for satellite communications | |
Nanjundaswamy | Advances in audio coding and networking by effective exploitation of long term correlations | |
HK1240699B (en) | Advanced quantizer | |
HK1082587B (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |