JP4618823B2 - 信号符号化装置及び方法 - Google Patents
信号符号化装置及び方法 Download PDFInfo
- Publication number
- JP4618823B2 JP4618823B2 JP30150498A JP30150498A JP4618823B2 JP 4618823 B2 JP4618823 B2 JP 4618823B2 JP 30150498 A JP30150498 A JP 30150498A JP 30150498 A JP30150498 A JP 30150498A JP 4618823 B2 JP4618823 B2 JP 4618823B2
- Authority
- JP
- Japan
- Prior art keywords
- lpc
- pitch
- analysis
- coefficient
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000013139 quantization Methods 0.000 claims abstract description 98
- 238000010606 normalization Methods 0.000 claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 230000009466 transformation Effects 0.000 claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims description 24
- 238000009499 grossing Methods 0.000 claims description 8
- 230000002441 reversible effect Effects 0.000 abstract description 6
- 239000013598 vector Substances 0.000 description 55
- 230000005236 sound signal Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 230000002087 whitening effect Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000002940 Newton-Raphson method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、入力信号を時間軸/周波数軸変換して量子化を行う信号符号化装置及び方法に関し、特に、オーディオ信号を高能率符号化する場合に好適な信号符号化装置及び方法に関する。
【0002】
【従来の技術】
従来において、オーディオ信号(音声信号や音楽信号を含む)の時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して信号圧縮を行うような符号化方法が種々知られている。この符号化方法としては、大別して時間領域での符号化、周波数領域での符号化、分析合成符号化等が挙げられる。
【0003】
【発明が解決しようとする課題】
ところで、時間軸の入力信号を周波数軸の信号に直交変換して符号化を行う変換符号化においては、入力信号の時間軸波形の特徴を除去して変換符号化することが、符号化効率を高める上で望ましい。
【0004】
また、直交変換された周波数軸上の係数データを量子化する際に、重み付けを施してビット割当をすることが多く行われているが、このビット割当のための情報を付加情報あるいはサイドインフォメーションとして伝送するのは、ビットレートが増加することになり好ましくない。
【0005】
本発明は、このような実情に鑑みてなされたものであり、直交変換に先立って時間軸波形信号の特徴あるいは相関性を除去し、符号化効率を高めることができると共に、量子化の際のビット割当の情報を直接送らなくともデコーダ側でビット割当を再現できビットレート低減に貢献し得るような信号符号化装置及び方法の提供を目的とする。
【0006】
【課題を解決するための手段】
本発明は、上述した課題を解決するために、時間軸上の入力信号に対して線形予測符号化(LPC)分析及びピッチ分析を行うことにより得られた情報に基づいて残差を取り出し、量子化された時間軸上のエンベロープ値によりゲインの平滑化のためのゲインコントロールを行うことにより正規化し、この時間軸で平滑化された出力に対して直交変換を施し、この直交変換された出力を量子化する。
【0007】
ここで、上記直交変換は、改良離散コサイン変換(MDCT)により入力された時間軸信号を周波数軸の係数データに変換することが好ましい。また、上記正規化は、上記入力信号をLPC分析して得られたLPC係数に基づき上記入力信号のLPC予測残差を出力し、上記LPC予測残差をピッチ分析して得られたピッチパラメータに基づき上記LPC予測残差のピッチの相関性を除去することが好ましい。さらに、上記量子化手段は、上記LPC分析結果及び上記ピッチ分析結果に基づいて決定される割当ビット数に従って量子化を行うことが好ましい。
【0008】
【発明の実施の形態】
以下、本発明に係る実施の形態について、図面を参照しながら説明する。
図1は、本発明に係る実施の形態となる信号符号化装置の概略構成を示すブロック図である。
【0009】
この図1において、入力端子10には時間軸上の波形信号、例えばディジタルオーディオ信号が入力される。具体的には、例えばサンプリング周波数Fs が16kHzで0〜8kHz程度のいわゆる広帯域音声信号が挙げられるが、これに限定されるものではない。
【0010】
入力端子10からの入力信号は、正規化回路部11に送られる。この正規化回路部11は、白色化回路とも呼ばれ、入力された時間波形信号の特徴を抽出して予測残差を取り出すような白色化を行うものである。時間波形の白色化は、線形若しくは非線形の予測により行うことができ、例えばLPC(線形予測符号化:Linear Predictive Coding)及びピッチ分析により入力時間波形信号を白色化することができる。
【0011】
図1の例においては、正規化(白色化)回路部11は、LPC逆フィルタ12とピッチ逆フィルタ13とから成っており、入力端子10からの入力信号をLPC分析回路39に送ってLPC分析し、分析の結果得られたLPC係数(いわゆるαパラメータ)をLPC逆フィルタ12に送ってLPC予測残差を取り出すようにしている。LPC逆フィルタ12からのLPC予測残差は、ピッチ分析回路15及びピッチ逆フィルタ13に送られ、ピッチ分析回路15では後述するようなピッチ分析によりピッチパラメータ(ピッチゲイン及びピッチラグ)が取り出されてピッチ逆フィルタ13に送られている。ピッチ逆フィルタ13では、上記LPC予測残差からピッチ相関を除去してピッチ残差を求め、直交変換回路25に送っている。また、LPC分析回路39からのLPC係数及びピッチ分析回路15のピッチパラメータは、量子化の際のビット割当(ビットアロケーション)を決定するためのビット割当算出回路41に送られている。
【0012】
正規化回路部11からの白色化された時間波形信号、すなわちLPC残差のピッチ残差は、時間軸/周波数軸変換(T/F mapping)処理を行う直交変換回路部25に送られて、周波数軸の信号(係数データ)に変換される。このT/F変換としては、例えばDCT(離散コサイン変換:Discrete Cosine Transform) 、MDCT(改良DCT:Modified Discrete Cosine Transform)、FFT(高速フーリエ変換:Fast Fourier Transform)等が多く用いられる。直交変換回路部25から得られたMDCT係数、FFT係数等のパラメータあるいは係数データは、係数量子化部40に送られて、SQ(スカラ量子化)あるいはVQ(ベクトル量子化)等が施される。この係数量子化を効率的に行うためには、各係数に対する量子化のビット割当(ビットアロケーション)を決定する必要がある。このビット割当は、聴覚マスキングモデル、あるいは上記正規化回路部11での白色化の際に得られるLPC係数やピッチパラメータ等の各種パラメータ、あるいは上記係数データから計算されるバークスケールファクタ等に基づいて算出することができる。なお、バークスケールファクタとしては、直交変換されて得られた係数を、人間の聴覚特性に合わせて高域ほどバンド幅が広くなるような周波数帯域、いわゆる臨界帯域(クリティカルバンド)に分割したときの、各クリティカルバンド毎のピーク値あるいはrms(二乗平均の平方根)値等が用いられる。
【0013】
本実施の形態においては、LPC係数、ピッチパラメータ、及びバークスケールファクタのみによってビット割当を算出するように規定しておき、これらのパラメータのみを送ることによって、デコーダ側でエンコーダ側と同一のビット割当が再現でき、割当ビット数そのものを表す付加情報(サイドインフォメーション)を送る必要がなく、ビットレート低減に貢献できる。
【0014】
なお、正規化回路部11のLPC逆フィルタ12で用いるLPC係数(αパラメータ)や、ピッチ逆フィルタ13で用いるピッチパラメータ(のピッチゲイン)については、デコーダ側での再現性を考慮して、後述するように量子化された値を用いている。
【0015】
この図1の信号符号化装置は、ハードウェア構成として示しているが、いわゆるDSP(ディジタル信号プロセッサ)等を用いてソフトウェア的に実現することも可能である。
【0016】
次に、図2を参照しながら、上述した本発明の実施の形態のより具体的な構成例としてのオーディオ信号符号化装置について説明する。
【0017】
この図2に示すオーディオ信号符号化装置は、供給された時間軸信号を、直交変換部25で例えばMDCT(改良離散コサイン変換)により時間軸/周波数軸変換(T/F変換)を施して周波数軸上のデータ(MDCT係数)とし、これを係数量子化部40で量子化することで符号化を行うものであるが、この実施の形態においては、直交変換の前の時間軸信号に対して、LPC分析、ピッチ分析、エンベロープ抽出等により入力信号波形の特徴を抽出し、これらの特徴を表すパラメータは別途量子化して取り出すようにし、正規化(白色化)回路部11においてこれらの特徴を除去、あるいは信号の相関性を除去することで、白色雑音に近い、いわゆるノイズライクな信号とすることで、符号化効率を高めている。
【0018】
また、直交変換後の係数データの量子化の際のビット割当(ビットアロケーション)の決定には、上記LPC分析で求められたLPC係数、ピッチ分析で求められたピッチパラメータを用いている。この他、周波数軸上で臨界帯域(クリティカルバンド)毎のピーク値やrms値等を取り出して正規化ファクタとするバークスケールファクタを用いてもよい。これらのLPC係数、ピッチパラメータ、バークスケールファクタにより、MDCT係数のような直交変換係数データに対する量子化時の重みを算出し、これにより全帯域のビット割当を決定して係数量子化を行う。量子化時の重み決定が、予め規定されたパラメータによってなされる場合、例えば上記LPC係数、ピッチパラメータ、バークスケールファクタのみによってなされる場合には、これらのパラメータのみをデコーダ側に伝送するだけで、エンコーダ側と全く同じビット割当(ビットアロケーション)が再現されるため、ビット割当そのものに関する付加情報(サイドインフォメーション)を送る必要がなくなる。
【0019】
さらに、係数量子化の際には、上記量子化時の重みあるいは割当ビット数に従った順序で係数データを並べ替え(ソート)し、順に精度の高い量子化を行うようにしている。この量子化は、ソートされた係数を先頭から順にサブベクトルに区切り、それぞれベクトル量子化を行うことが好ましい。ソートについては、全帯域の係数データに対して行ってもよいが、いくつかの帯域に区切って、それぞれの帯域の範囲内毎にソートするようにしてもよい。この場合も、ビット割当に用いられるパラメータが予め規定されていれば、そのパラメータを送るだけで、ビット割当情報やソートされた係数の位置情報等を直接送らなくても、ビット割当やソート順序等をデコーダ側で再現できる。
【0020】
図2において、入力端子10には、例えば、0〜8kHz程度のいわゆる広帯域音声信号をサンプリング周波数Fs =16kHzでA/D変換したディジタルオーディオ信号が供給されている。この入力信号は、正規化(白色化)回路部11のLPC逆フィルタ12に送られると共に、例えば1024サンプルずつ切り出され、LPC分析・量子化部30に送られている。このLPC分析・量子化部30では、ハミング窓かけをした上で、20次程度のLPC係数、すなわちαパラメータを算出し、LPC逆フィルタ11によりLPC残差を求めている。このLPC分析の際には、分析の単位となる1フレーム1024サンプルの内の一部サンプル、例えば1/2の512サンプルを次のブロックとオーバーラップさせており、フレームインターバルは512サンプルとなっている。これは、後段の直交変換として採用されているMDCT(改良離散コサイン変換)のエリアシングキャンセレーションを利用するためである。このLPC分析・量子化部30では、LPC係数であるαパラメータをLSP(線スペクトル対)パラメータに変換して量子化したものを伝送するようにしている。
【0021】
LPC分析回路32からのαパラメータは、α→LSP変換回路33に送られて、線スペクトル対(LSP)パラメータに変換される。これは、直接型のフィルタ係数として求まったαパラメータを、例えば20個、すなわち10対のLSPパラメータに変換する。変換は例えばニュートン−ラプソン法等を用いて行う。このLSPパラメータに変換するのは、αパラメータよりも補間特性に優れているからである。
【0022】
α→LSP変換回路33からのLSPパラメータは、LSP量子化器34によりベクトル量子化あるいはマトリクス量子化される。このとき、フレーム間差分をとってからベクトル量子化、あるいは、複数フレーム分をまとめてマトリクス量子化してもよい。
【0023】
このLSP量子化器34からの量子化出力、すなわちLSPベクトル量子化のインデクスは、端子31を介して取り出され、また量子化済みのLSPベクトルあるいは逆量子化出力は、LSP補間回路36及びLSP→α変換回路38に送られる。
【0024】
LSP補間回路36は、LSP量子化器34で上記フレーム毎にベクトル量子化されたLSPのベクトルの前フレームと現フレームとの組を補間し、後の処理で必要となるレートにするためのものであり、この例では、8倍のレートに補間している。
【0025】
このような補間が行われたLSPベクトルを用いて入力音声の逆フィルタリングを実行するために、LSP→α変換回路37により、LSPパラメータを例えば20次程度の直接型フィルタの係数であるαパラメータに変換する。このLSP→α変換回路37からの出力は、上記LPC残差を求めるためのLPC逆フィルタ回路12に送られ、このLPC逆フィルタ12では、8倍のレートで更新されるαパラメータにより逆フィルタリング処理を行って、滑らかな出力を得るようにしている。
【0026】
また、LSP量子化回路34からの1倍レートのLSP係数は、LSP→α変換回路38に送られてαパラメータに変換され、上述したようなビット割当を行わせるためのビット割当算出回路(ビットアロケーション決定回路)41に送られる。ビット割当算出回路41では、割当ビットの他に、後述するMDCT係数の量子化に使用する重みw(ω) の計算も行っている。
【0027】
正規化(白色化)回路部11のLPC逆フィルタ12からの出力は、長期予測であるピッチ予測のためのピッチ逆フィルタ13及びピッチ分析回路15に送られる。
【0028】
次に、長期予測について説明する。長期予測は、ピッチ分析により求められたピッチ周期あるいはピッチラグ分だけ時間軸上でずらした波形を元の波形から減算してピッチ予測残差を求めることにより行っており、この例では3点ピッチ予測によって行っている。なお、ピッチラグとは、サンプリングされた時間軸データのピッチ周期に対応するサンプル数のことである。
【0029】
すなわち、ピッチ分析回路15では1フレームに1回の割合、すなわち分析長が1フレームでピッチ分析が行われ、ピッチ分析結果の内のピッチラグはピッチ逆フィルタ13及びビット割当算出回路41に送られ、ピッチゲインはピッチゲイン量子化器16に送られる。また、ピッチ分析回路15からのピッチラグインデクスは端子52から取り出されてデコーダ側に送られる。
【0030】
ピッチゲイン量子化器16では、上記3点予測に対応する3点でのピッチゲインがベクトル量子化され、コードブックインデクス(ピッチゲインインデクス)が出力端子53より取り出され、代表値ベクトルあるいは逆量子化出力がピッチ逆フィルタ13に送られる。ピッチ逆フィルタ13は、上記ピッチ分析結果に基づいて3点ピッチ予測されたピッチ予測残差を出力する。このピッチ予測残差は、割り算回路14及びエンベロープ抽出回路17にそれぞれ送られている。
【0031】
上記ピッチ分析についてさらに説明すると、このピッチ分析においては、上記LPC残差を用いピッチパラメータを抽出する。ピッチパラメータは、ピッチラグ、ピッチゲインにより構成される。
【0032】
まず、ピッチラグを決定する。上記LPC残差の中央部を例えば512サンプル切り出し、x(n) (n=0〜511)とし、xと表記する。xからkサンプル過去の512サンプルをx k とすると、ピッチkは、
‖x−gx k‖2
を最小にするものとして与えられる。すなわち、
g=(x,x k)/‖x k‖2
として、
(x,x k)2/‖x k‖2
を最大にするkをサーチすることで、最適ラグKを決定できる。本実施の形態では、Kは、12≦K≦240である。このKをそのまま使用するか、あるいは過去のフレームのピッチラグを用いたトラッキングの結果を用いてもよい。このようにして決定したKについて、次に3点(K,K−1,K+1)での最適ピッチゲインを求める。すなわち、
‖x−(g-1 x L+1+g0 x L+g1 x L-1)‖2
を最小にする g-1,g0,g1 を求め、最適ラグKに対する3点ピッチゲインとする。この3点ピッチゲインはピッチゲイン量子化器16に送られて、まとめてベクトル量子化され、また、量子化されたピッチゲイン及び最適ラグKを用いてピッチ逆フィルタ13を構成し、これによりピッチ残差を求める。求まったピッチ残差は既に求められている過去のピッチ残差と連結され、後述するようにMDCT変換される。このとき、MDCT変換前に時間軸ゲインコントロールを行ってもよい。
【0033】
ここで、図3は、入力信号に対する上記LPC分析処理及びピッチ分析処理の関係を示しており、1フレームFRが例えば1024サンプルの分析長は、後述するMDCT変換ブロックに対応した長さとなっている。時刻t1 が現在の新しいLPC分析中心(LSP1) を示し、時刻t0 が1フレーム前のLPC分析中心(LSP0) を示している。現在フレームの後半は新しいデータ(new data)ND、前半は前データ(previous data)PD であり、図中のaはLSP0 とLSP1 の補間により得られるLPC残差を、bは1フレーム前のLPC残差を、cはこの部分(bの後半+aの前半)をターゲットとするピッチ分析より得られる新しいピッチ残差を、dは過去のピッチ残差をそれぞれ示している。この図3における新しいデータNDが全て入力された時点で、データaを求めることができ、このaと、既に求められているbとを用いて新しいピッチ残差cを算出でき、これと既に求められているピッチ残差dとをつなぎ合わせることで、直交変換すべき1フレームのデータFRが作成できる。この1フレームFRのデータをMDCT等の直交変換処理することができる。
【0034】
次に、図4は、LPC分析に基づくLPC逆フィルタ及びピッチ分析に基づくピッチ逆フィルタを介すことによる時間軸信号の変化を、また図5は、LPC逆フィルタ及びピッチ逆フィルタを介すことによる信号の周波数軸上での変化をそれぞれ示している。すなわち、図4の(A)は入力信号波形を、図5の(A)はその周波数スペクトルを示し、これにLPC分析に基づくLPC逆フィルタを介すことにより、波形の特徴が抽出され除去されて、図4の(B)に示すようなほぼ周期的なパルス状の時間軸波形(LPC残差波形)となる。このLPC残差波形に対応する周波数上のスペクトルは、図5の(B)のようになる。このLPC残差に対して上述したようなピッチ分析に基づくピッチ逆フィルタを介すことにより、ピッチ成分が抽出されて除去され、図4の(C)に示すような白色雑音に近い(ノイズライクな)時間軸信号になり、その周波数軸上のスペクトルは図5の(C)のようになる。
【0035】
さらに、本発明の実施の形態においては、正規化(白色化)回路部11において、フレーム内データのゲインの平滑化を行っている。これは、フレーム内の時間軸波形(本実施の形態ではピッチ逆フィルタ13からの残差)から、エンベロープ抽出回路17によりエンベロープを抽出し、抽出されたエンベロープを、スイッチ19を介してエンベロープ量子化器20に送り、量子化されたエンベロープの値により上記時間軸波形(ピッチ逆フィルタ13からの残差)を割り算器14で割り込むことにより、時間軸で平滑化された信号を得ている。この割り算器14からの信号が、正規化(白色化)回路部11の出力として、次段の直交変換回路部25に送られる。
【0036】
この平滑化により、量子化後の直交変換係数を時間信号に逆変換したときの量子化誤差の大きさをオリジナル信号のエンベロープに追従させる、いわゆるノイズシェイピングが実現できる。
【0037】
上記エンベロープ抽出回路17におけるエンベロープ抽出について説明する。このエンベロープ抽出回路17に供給される信号、すなわち上記LPC逆フィルタ12及びピッチ逆フィルタ13により正規化処理された残差信号を、x(n),n=0〜N−1(Nは上記1フレームFRのサンプル数、直交変換窓長、例えばN=1024)とするとき、この変換窓長Nより短い長さM、例えばM=N/8の窓で切り出された各サブブロックあるいはサブフレーム毎のrms(二乗平均の平方根)値をエンベロープとしている。すなわち、正規化された各サブブロック(サブフレーム)のrmsとして、i番目のサブブロック(i=0〜M−1)のrmsi は、次の式(1)により定義される。
【0038】
【数1】
【0039】
上記式(1)により求められるrmsi の各iについて、スカラ量子化を施し、あるいはrmsi 全体を1つのベクトルとしてベクトル量子化を行うことができる。本実施の形態では、エンベロープ量子化器20においてベクトル量子化を行っており、そのインデクスは時間軸ゲインコントロールのためのパラメータ、すなわちエンベロープインデクスとして端子21より取り出され、デコーダ側に伝送される。
【0040】
このようにして量子化された各サブブロック(サブフレーム)毎のrmsi をqrmsi とし、この値により上記入力残差信号x(n)を割り算器14にて割り込むことにより、時間軸で平滑化された信号xs(n) を得る。ただし、このようにして求めたrmsi の内、フレーム内で最大のものと最小のものとの比が、ある一定の値(例えば4)以上のとき、上述したゲインコントロールを行い、パラメータ(上記エンベロープインデクス)の量子化のために所定のビット数(例えば7ビット)を割り当てているが、フレーム内の各サブブロック(サブフレーム)毎のrmsi の比が上記一定の値よりも小さいときにはゲインコントロールを行わない通常の処理を行い、ゲインコントロールのためのビットは、他のパラメータ、例えば周波数軸パラメータ(直交変換係数データ)の量子化に割り当てられる。このゲインコントロールを行うか否かの判別は、ゲインコントロールオン/オフ決定回路18により行われ、その判別出力(ゲインコントロールSW)は、エンベロープ量子化器20の入力側のスイッチ19のスイッチング制御信号として送られるとともに、後述する係数量子化部40内の係数量子化回路45に送られて、ゲインコントロールがオンのときとオフのときの係数の割当ビット数の切り換えに使用される。また、このゲインコントロールオン/オフ判別出力(ゲインコントロールSW)は、端子22を介して取り出され、デコーダ側に送られる。
【0041】
割り算器41でゲインコントロール(あるいはゲイン圧縮)されて時間軸で平滑化された信号xs(n) は、正規化回路部11の出力として、直交変換回路部25に送られ、例えばMDCTにより周波数軸パラメータ(係数データ)に変換される。この直交変換回路部25は、窓掛け回路26とMDCT回路27とから成る。窓掛け回路26では、1/2フレームオーバーラップによるMDCTのエリアシングキャンセレーションが利用できるような窓関数による窓掛けが施される。
【0042】
デコーダ側での復号の際には、伝送された周波数軸パラメータ(例えばMDCT係数)の量子化インデクスから逆量子化を行い、その後、周波数軸/時間軸変換である逆直交変換により時間軸信号に戻され、その後、逆量子化された上記時間軸ゲインコントロールパラメータを用いて、オーバーラップ加算、及びエンコード時のゲイン平滑化の逆の処理(ゲイン伸長、あるいはゲイン復元処理)を行うわけであるが、ゲイン平滑化を用いた場合には、通常の対称かつ重畳位置の窓の値の二乗和が一定値になるような窓を仮定したオーバーラップ加算は使用できないため、次のよう処理が必要とされる。
【0043】
すなわち、図6は、デコーダ側でのオーバーラップ加算及びゲインコントロールの様子を示す図であり、この図6において、w(n),n=0〜N−1、は分析・合成窓を示し、g(n)は時間軸ゲインコントロールパラメータ、すなわち、
g(n) = qrmsj (jは、jM≦n≦(j+1)M を満足)
であり、g1(n) は現フレームFR1 のg(n)、g0(n) は1フレーム過去(前フレームFR0) のg(n)とする。また、この図6では、1フレームを8分割してサブブロック(サブフレーム)SBとしている(M=8)。
【0044】
前フレームFR0 の後半のデータに対し、エンコーダ側ではゲインコントロールのためのg0(n+(N/2))による除算後、MDCTのための分析窓w((N/2)-1-n) がかかっているため、デコーダ側で逆MDCT後、再び分析窓w((N/2)-1-n) をかけて得られる信号、すなわち、主成分とエリアシング(aliasing)成分との和P(n)は、次の式(2)のようになる。
【0045】
【数2】
【0046】
また、現フレームFR1 の前半のデータに対し、エンコーダ側では、ゲインコントロールのためのg0(n)による除算後、MDCTのための分析窓w(n)がかかっているため、デコーダ側で逆MDCT後、再び分析窓w(n)をかけて得られる信号、すなわち、主成分とエリアシング成分との和Q(n)は、次の式(3)のようになる。
【0047】
【数3】
【0048】
従って、再生すべきx(n)は、次の式(4)として求められる。
【0049】
【数4】
【0050】
このような窓掛けを行い、上記サブブロック(サブフレーム)毎のrmsをエンベロープとしてゲインコントロールを行うことにより、時間変化の激しい音、例えば鋭いアタックを有する楽音や、ピッチピークの間で比較的早い減衰をするような音声に対して、プリエコーのような耳につきやすい量子化雑音を低減することができる。
【0051】
次に、直交変換回路部25のMDCT回路27でMDCT処理されて得られたMDCT係数データは、係数量子化部40のフレームゲイン正規化回路43及びフレームゲイン算出・量子化回路47に送られる。本実施の形態の係数量子化部40では、先ず上記MDCT変換ブロックである1フレームの係数全体のフレームゲイン(ブロックゲイン)を算出してゲイン正規化を行った後、さらに聴覚に合わせて高域ほどバンド幅を広くしたサブバンドである臨界帯域(クリティカルバンド)に分割して、それぞれのバンド毎のスケールファクタ、いわゆるバークスケールファクタを算出し、これによって再び正規化を行っている。上記バークスケールファクタとしては、各帯域毎にその帯域内の係数のピーク値や、あるいは二乗平均の平方根(rms)等を用いることができ、各バンドのバークスケールファクタはまとめてベクトル量子化される。
【0052】
すなわち、係数量子化部40のフレームゲイン算出・量子化回路47では、上記MDCT変換ブロックであるフレーム毎のゲインが算出されて量子化され、そのコードブックインデクス(フレームゲインインデクス)が端子55を介して取り出されてデコーダ側に送られると共に、量子化された値のフレームゲインがフレームゲイン正規化回路43に送られて、入力をフレームゲインで割ることによる正規化が行われる。このフレームゲインで正規化された出力は、バークスケールファクタ算出・量子化回路42及びバークスケールファクタ正規化回路44に送られる。
【0053】
バークスケールファクタ算出・量子化回路42では、上記各臨界帯域毎のバークスケールファクタが算出されて量子化され、コードブックインデクス(バークスケールファクタインデクス)が端子54を介して取り出されてデコーダ側に送られると共に、量子化された値のバークスケールファクタがビット割当算出回路41及びバークスケールファクタ正規化回路44に送られる。バークスケールファクタ正規化回路44では、上記臨界帯域毎に帯域内の係数の正規化が行われ、バークスケールファクタで正規化された係数が係数量子化回路45に送られる。
【0054】
係数量子化回路45では、ビット割当算出回路41からのビット割当情報に従って各係数に量子化ビット数が割り当てられて量子化が行われ、このとき、上述したゲインコントロールオン/オフ決定回路18からのゲインコントロールSW情報に応じて全体の割当ビット数の切換が行われる。これは、例えばベクトル量子化を行う場合には、上記ゲインコントロールオン時用と、オフ時用との2組のコードブックを用意しておき、上記ゲインコントロールSW情報に応じてこれらのコードブックを切り換えるようにすればよい。
【0055】
ここで、ビット割当算出回路41におけるビット割当(ビットアロケーション)について説明すると、上述のようにして求められたLPC係数、ピッチパラメータ、バークスケールファクタ等により、各MDCT係数に対する量子化時の重みを算出し、これにより全帯域のMDCT係数のビット割当を決定して量子化を行う。この重みは、ノイズシェイピングファクタと考えることができ、また、各パラメータを変更することで所望のノイズシェイピング特性を持たせることが可能である。一例として、本実施の形態においては、次の式に示すように、LPC係数、ピッチパラメータ、及びバークスケールファクタのみを用いて、重みW(ω)を算出している。
【0056】
【数5】
【0057】
このように量子化時の重み決定は、LPC、ピッチ、バークスケールファクタのみによってなされるため、この3種類のパラメータのみをデコーダに伝送すれば、エンコーダと全く同じビットアロケーションが再現され、アロケーションの一情報等は一切送る必要はなくなり、サイドインフォメーション(補助情報)のレートを下げることができる。
【0058】
次に、係数量子化回路45での量子化の具体例について、図7〜図9を参照しながら説明する。
【0059】
図7は、図2の係数量子化回路45の具体的な構成の一例を示すものであり、入力端子1には、図2のバークスケールファクタ正規化回路44からの正規化された係数データ(例えばMDCT係数)yが供給されている。重み計算回路2は、図2のビット割当算出回路41にほぼ相当するが、量子化ビットを割り当てるための各係数の重みを計算する部分のみを取り出したものである。この重み計算回路2では、上述したLPC係数、ピッチパラメータ、バークスケールファクタ等のパラメータに基づいて重みwが計算される。ここで、1フレーム分の係数をベクトルy、1フレーム分の重みをベクトルwで表すものとする。
【0060】
これらの係数ベクトルy、重みベクトルwを、必要に応じてバンド分割回路3に送ることにより、L個(L≧1)のバンドに分割する。バンド数としては、例えば低域、中域、高域の3バンド程度(L=3)が挙げられるが、これに限定されず、またバンド分割しなくてもよい。この各バンド毎の係数、例えば第k番目のバンドの係数をy k、 重みをw k (0≦k≦L−1)とするとき、
y=(y 0,y 1,...,y L-1)
w=(w 0,w 1,...,w L-1)
となる。このバンド分割のバンド数や各バンド毎の係数の個数は、予め設定された数値に固定されている。
【0061】
次に、各バンドの係数ベクトルy 0,y 1,...,y L-1 をそれぞれソート回路40,41,...,4L-1 に送って、各バンド毎に、それぞれのバンド内の係数に対して、重みの順に従って順位をつける。これは、各バンド内の係数自体を、重みの順に従って並び替え(ソート)すればよいが、各係数の周波数軸上での位置あるいは順番を表す指標(インデクス)のみを重みの順にソートして、ソートされた指標(インデクス)に対応して各係数の量子化時の精度(割当ビット数等)を決定するようにしてもよい。係数自体をソートする場合には、任意の第k番目のバンドについて、係数ベクトルy k の各係数を重みの順にソートし、重み順にソートされた係数ベクトルy'kを得る。
【0062】
図8は、このソートの様子を示したものであり、図8の(A)は第kバンドの重みベクトルw k を、図8の(B)は第kバンドの係数ベクトルy k をそれぞれ示している。この図8の例においては、第k番目のバンド内の要素数を例えば8としており、重みベクトルw k の各要素となる8個の重みをw1,w2,...,w8 、係数ベクトルy k の各要素となる8個の係数をy1,y2,...,y8 にてそれぞれ表している。図8の(A)、(B)の例においては、係数y3 に対応する重みw3 が最も大きく、以下重みの順に、w2,w6,...,w4 となっている。図8の(C)は、この重みの順に係数y1,y2,...,y8 を並べ替え(ソート)して、順にy3,y2,y6,...,y4 とした係数ベクトルy'kを示している。
【0063】
次に、上述のように各バンド毎に重みの順に従ってソートされた各バンドの係数ベクトルy'0,y'1,...,y'L-1 をそれぞれベクトル量子化器50,51,...,5L-1 に送って、それぞれベクトル量子化を行う。ここで、各バンド毎の割当ビット数を予め固定しておき、バンド毎のエネルギが変化しても各バンドへの量子化ビット数の割当が変動することを防止することが好ましい。
【0064】
このバンド毎のベクトル量子化について、1つのバンド内の要素数が多い場合には、いくつかのサブベクトルに区切って、各サブベクトル毎にベクトル量子化すればよい。すなわち、任意の第kバンドのソート後の係数ベクトルy'kを、図9に示すように、予め定めた要素数に従っていくつかのサブベクトルに区切り、例えば3つのサブベクトルy'k1,y'k2,y'k3 とし、これらをそれぞれベクトル量子化して、コードブックインデクスck1,ck2,ck3を得るようにすればよい。この第kバンドのインデクスck1,ck2,ck3をまとめて係数インデクスのベクトルc k とする。ここで、サブベクトルの量子化においては、先頭側のベクトルほど量子化ビット数を多く割り当てることで、重みに従った量子化となる。これは、例えば図9において、ベクトルy'k1 を8ビット、ベクトルy'k2 を6ビット、ベクトルy'k3 を8ビット、のように割り当てることにより、係数1個当たりの割り当てビット数が多いものから順に少なくなり、重みに従ったビット割当が実現できることになる。
【0065】
次に、図7の各ベクトル量子化器50,51,...,5L-1 からの各バンド毎の係数インデクスのベクトルc 0,c 1,...,c L-1 をまとめて、全バンドの係数インデクスのベクトルcとし、端子6から取り出している。この端子6は、図2の端子51に相当する。
【0066】
なお、上記図7〜図9の具体例では、直交変換された周波数軸上の係数(例えばMDCT係数)自体を、上記重みに従ってソートし、ソートされた係数の順序に従って割当ビット数を多いものから少なくするようにして(ソート後の順位の上位側の係数ほど多くのビットを割り当てて)いるが、直交変換されて得られた各係数の周波数軸上での位置あるいは順番を表す指標(インデクス)のみを上記重みの順にソートして、ソートされた指標(インデクス)に対応して各係数の量子化時の精度(割当ビット数等)を決定するようにしてもよい。また、上述した具体例では、係数の量子化としてベクトル量子化を用いているが、スカラ量子化、あるいはスカラ量子化とベクトル量子化とを併用するような量子化に本発明を適用することも容易である。
【0067】
次に、上述した図2に示すようなオーディオ信号符号化装置(エンコーダ側)に対応するオーディオ信号復号装置(デコーダ側)の構成の一例について、図10を参照しながら説明する。
【0068】
この図10において、各入力端子60〜67には上記図2の各出力端子からのデータが供給されており、図10の入力端子60には、上記図2の出力端子51からの直交変換係数(例えばMDCT係数)のインデクスが供給されている。入力端子61には、図2の出力端子31からのLSPインデクスが供給され、入力端子62〜65には、図2の各出力端子52〜55からのデータ、すなわち、ピッチラグインデクス、ピッチゲインインデクス、バークスケールファクタインデクス、フレームゲインインデクスがそれぞれ供給され、入力端子66、67には、図2の各出力端子21、22からのエンベロープインデクス、ゲインコントロールSWがそれぞれ供給されている。
【0069】
入力端子60からの係数インデクスは、係数逆量子化回路71で逆量子化され、掛け算器73を介して、例えばIMDCT(逆MDCT)等の逆直交変換回路74に送られる。
【0070】
入力端子61からのLSPインデクスは、LPCパラメータ再生部80の逆量子化器81に送られてLSPデータに逆量子化され、LSP→α変換回路82及びLSP補間回路83に送られる。LSP→α変換回路82からのαパラメータ(LPC係数)は、ビット割当回路72に送られる。LSP補間回路83からのLSPデータは、LSP→α変換回路84でαパラメータ(LPC係数)に変換され、後述するLPC合成回路77に送られる。
【0071】
ビット割当回路72には、LSP→α変換回路82からの上記LPC係数の他に、入力端子62からのピッチラグと、入力端子63から逆量子化器91を介して得られたピッチゲインと、入力端子64から逆量子化器92を介して得られたバークスケールファクタとが供給されており、これらのパラメータのみに基づいて、エンコーダ側と同一のビット割当を再現することができる。ビット割当回路72からのビット割当情報は、係数逆量子化器71に送られて、各係数の量子化割当ビットの決定に使用される。
【0072】
入力端子65からのフレームゲインインデクスは、フレームゲイン逆量子化器86に送られて逆量子化され、得られたフレームゲインが掛け算器73に送られる。
【0073】
入力端子66からのエンベロープインデクスは、スイッチ87を介してエンベロープ逆量子化器88に送られて逆量子化され、得られたエンベロープデータがオーバーラップ加算回路75に送られる。また、入力端子67からのゲインコントロールSW情報は、上記係数逆量子化器71及びオーバーラップ加算回路75に送られると共に、スイッチ87の制御信号として用いられる。記係数逆量子化器71は、上述したようなゲインコントロールのオン/オフに応じて、全体の割当ビット数を切り換えており、逆ベクトル量子化の場合には、ゲインコントロールのオン時のコードブックとオフ時のコードブックとを切り換えるようにしてもよい。
【0074】
オーバラップ加算回路75は、IMDCT等の逆直交変換回路74からの上記フレーム毎に時間軸に戻された信号を、1/2フレームずつオーバーラップさせながら加算するものであり、ゲインコントロールのオン時には、上記エンベロープ逆量子化器88からのエンベロープデータによるゲインコントロール(上述したゲイン伸長あるいはゲイン復元)処理しながらオーバーラップ加算する。
【0075】
オーバラップ加算回路75からの時間軸信号は、ピッチ合成回路76に送られて、ピッチ成分が復元される。これは、図2のピッチ逆フィルタ13での処理の逆処理に相当するものであり、端子62からのピッチラグ及び逆量子化器91からのピッチゲインが用いられる。
【0076】
ピッチ合成回路76からの出力は、LPC合成回路77に送られて、図2のLPC逆フィルタ12での処理の逆の処理に対応するLPC合成処理が施され、出力端子78より取り出される。
【0077】
ここで、上記エンコーダ側の係数量子化部40の係数量子化回路45として、上記図7に示すような重みに従って各バンド毎にソートされた係数をベクトル量子化するものを用いる場合には、係数逆量子化回路71として、図11に示すような構成を用いることができる。
【0078】
この図11において、入力端子60は上記図10の入力端子60に相当し、上記係数インデクス(MDCT係数等の直交変換係数が量子化されることで得られたコードブックインデクス)が供給され、重み計算回路79には、図10のLSP→α変換回路82からのαパラメータ(LPC係数)、入力端子62からのピッチラグ、逆量子化器91からのピッチゲイン、逆量子化器92からのバークスケールファクタ等が供給されている。重み計算回路79は、図10のビット割当回路72中の、量子化ビット割当の計算途中に求められる各係数の重みを算出するまでの構成部分を取り出したものである。この重み計算回路79では、上述したように、上記式(5)の計算により、上記LPC係数、ピッチパラメータ(ピッチラグ及びピッチゲイン)、及びバークスケールファクタのみを用いて、重みW(ω)を計算している。入力端子93には、周波数軸上の係数の位置あるいは順番を示す指標(インデクス)、すなわち全帯域でN個の係数データがある場合には、0〜N−1の数値(これをベクトルIとする)が供給されている。なお、重み計算回路79からの上記N個の各係数に対するN個の重みをベクトルwで表す。
【0079】
重み計算回路79からの重みw及び入力端子93からの指標Iは、バンド分割回路94に送られて、エンコーダ側と同様にL個のバンドに分割される。エンコーダ側で例えば低域、中域、高域の3バンド(L=3)に分割されていれば、デコーダ側でも同じく3バンドに分割する。これらのバンド分割された各バンド毎の指標及び重みは、それぞれソート回路950,951,...,95L-1 に送られる。例えば第k番目のバンド内の指標I k 及び重みw k は、第k番目のソート回路95k に送られる。ソート回路95k では、第k番目のバンド内の指標I k が、各係数の重みw k の順序に従って並べ替え(ソート)され、ソートされた指標I'k が出力される。各ソート回路950,951,...,95L-1 からのそれぞれのバンド毎にソートされた指標I 0,I 1,...,I L-1 は、係数再構成回路97に送られる。
【0080】
また、図10の入力端子60からの直交変換係数のインデクスは、エンコーダ側で量子化される際に、上記図7〜図9と共に説明したように、Lバンドにバンド分割され、各バンド毎に重み順にソートされた係数が、1つのバンド内で予め定められた規則に基づく個数毎に区切られたサブベクトル毎にベクトル量子化されて得られたものである。具体的には、L個のバンドについて、それぞれのバンド毎の係数インデクスの集合をそれぞれベクトルc 0,c 1,...,c L-1 としたものであり、これらの各バンドの係数インデクスのベクトルc 0,c 1,...,c L-1 が、それぞれ逆量子化器960,951,...,95L-1 に送られている。これらの逆量子化器960,951,...,95L-1 で逆量子化されて得られた係数データは、各バンド内で上記重みの順にソートされているもの、すなわち上記図7の各ソート回路40,41,...,4L-1 からの係数ベクトルy'0,y'1,...,y'L-1 に相当するものであり、配列順序は周波数軸上の位置とは異なっている。そこで、係数の時間軸上での位置を表す指標Iを上記重みに従って先にソートしておき、このソートされた指標と、上記逆量子化されて得られた係数データとを対応させて、元の時間軸上の順序に戻すのが係数再構成回路97の機能である。すなわち、係数再構成回路97では、各逆量子化器960,951,...,95L-1 からの、各バンド内で重み順にソートされた係数データに対して、各ソート回路950,951,...,95L-1 からのそれぞれのバンド毎にソートされた指標を対応させ、このソートされた指標に従って逆量子化された係数データを並べ替える(逆ソートする)ことにより、元の時間軸上の順序に並んだ係数データyを得て、出力端子98より取り出している。この出力端子98からの係数データは、図10の掛け算器73に送られる。
【0081】
なお、本発明は上記実施の形態のみに限定されるものではなく、例えば、入力時間軸信号は音声や音楽を含むオーディオ信号以外に、電話帯域の音声信号や、ビデオ信号等でもよい。また、正規化回路部11の構成や、LPC分析及びピッチ分析は、これらに限定されず、線形予測あるいは非線形予測等により時間軸入力波形の特徴あるいは相関性を抽出して除去する種々の構成がとり得る。また、各量子化器には、ベクトル量子化以外にも、スカラ量子化や、スカラ量子化とベクトル量子化とを併用するようにしてもよい。
【0082】
【発明の効果】
以上の説明から明らかなように、本発明によれば、時間軸上の入力信号に対して直交変換を用いて符号化を行う信号符号化において、直交変換に先立って、時間軸上で線形予測符号化(LPC)分析及びピッチ分析を行うことにより得られたに基づいて信号波形の相関性あるいは特徴部分を除去しているため、ほぼ白色雑音に近いノイズライクな残差信号を直交変換することになり、符号化効率を高めることができる。
【0083】
また、時間軸上の入力信号に対して直交変換を用いて符号化を行う際に、上記直交変換されて得られた係数の量子化の際のビット割当を、上記入力信号の線形予測符号化(LPC)分析の結果及びピッチ分析の結果に基づいて決定することにより、ビット割当のためだけの情報を送らなくとも、LPC分析結果及びピッチ分析結果の各パラメータを送るだけでデコーダ側でエンコーダ側と同じビット割当を再現でき、付加情報(サイドインフォメーション)のレートを抑えて、全体的なビットレートを低減することができ、符号化効率の向上に貢献する。
【0084】
また、上記直交変換として、改良離散コサイン変換(MDCT)を用いることにより、良好な音質でのオーディオ信号の高能率符号化が行える。
【図面の簡単な説明】
【図1】本発明の実施の形態の概略構成を示すブロック図である。
【図2】本発明の実施の形態のより具体的な構成例であるオーディオ信号符号化装置を示すブロック図である。
【図3】入力信号に対するLPC分析処理及びピッチ分析処理の関係を示す図である。
【図4】時間軸入力信号のLPC分析及びピッチ分析による相関性の除去を説明するための時間軸信号波形図である。
【図5】時間軸入力信号のLPC分析及びピッチ分析による相関性の除去を説明するための周波数特性を示す図である。
【図6】デコーダ側でのオーバーラップ加算を説明するための時間軸信号波形図である。
【図7】係数量子化回路の具体的構成の一例を示すブロック図である。
【図8】バンド分割された1つのバンド内の係数の重みに応じたソートを説明するための図である。
【図9】バンド分割された1つのバンド内で重みに応じてソートされた係数をサブベクトルに区切ってベクトル量子化する処理を説明するための図である。
【図10】図2のオーディオ信号符号化装置に対応する復号側構成としてのオーディオ信号復号装置の一例を示すブロック図である。
【図11】図10のオーディオ信号復号装置の逆量子化回路の一具体例を示すブロック図である。
【符号の説明】
11 正規化回路部、 12 LPC逆フィルタ、 13 ピッチ逆フィルタ、 15 ピッチ分析回路、 16 ピッチゲイン量子化回路、 17 エンベロープ抽出回路、 18 ゲインコントロールオン/オフ決定回路、 20 エンベロープ量子化回路、 25 直交変換回路部、 26窓掛け回路、 27 MDCT回路、 30 LPC分析・量子化部、 32 LPC分析回路、 33 α→LSP変換回路、 34 LSP量子化回路、 36 LSP補間回路、 37,38 LSP→α変換回路、 40 係数量子化回路部、 41 ビット割当算出回路、 42 バークスケールファクタ算出・量子化回路、 43フレームゲイン正規化回路、 44 バークスケールファクタ正規化回路、 45 係数量子化回路、 47 フレームゲイン算出・量子化回路
Claims (13)
- 時間軸上の入力信号に対して線形予測符号化(LPC)分析及びピッチ分析を行うことにより得られた情報に基づいて残差を取り出し、量子化された時間軸上のエンベロープ値によりゲインの平滑化のためのゲインコントロールを行う正規化手段と、
この正規化手段からの時間軸で平滑化された出力に対して直交変換を施す直交変換手段と、
この直交変換手段からの出力を量子化する量子化手段と
を有する信号符号化装置。 - 上記直交変換手段は、改良離散コサイン変換(MDCT)により入力された時間軸信号を周波数軸の係数データに変換する請求項1記載の信号符号化装置。
- 上記正規化手段は、上記入力信号をLPC分析して得られたLPC係数に基づき上記入力信号のLPC予測残差を出力するLPC逆フィルタと、上記LPC予測残差をピッチ分析して得られたピッチパラメータに基づき上記LPC予測残差のピッチの相関性を除去するピッチ逆フィルタとを有する請求項2記載の信号符号化装置。
- 上記量子化手段は、上記LPC分析結果及び上記ピッチ分析結果に基づいて決定される割当ビット数に従って量子化を行う請求項2記載の信号符号化装置。
- 時間軸上の入力信号に対して線形予測符号化(LPC)分析及びピッチ分析を行うことにより得られた情報に基づいて残差を取り出し、量子化された時間軸上のエンベロープ値により平滑化(ゲインコントロール)を行うことにより正規化し、
この時間軸で平滑化された出力に対して直交変換を施し、
この直交変換された出力を量子化する
信号符号化方法。 - 上記直交変換として、改良離散コサイン変換(MDCT)を用いる
請求項5記載の信号符号化方法。 - 時間軸上の入力信号を分析して信号波形の特徴を抽出する分析手段と、
この分析手段からの分析結果に基づいて残差を取り出し、量子化された時間軸上のエンベロープ値によりゲインの平滑化のためのゲインコントロールを行う正規化手段と、
この正規化手段からの時間軸で平滑化された出力に対して直交変換を施す直交変換手段と、
この直交変換手段からの出力を量子化する量子化手段と、
上記分析手段からの分析結果に基づいて上記量子化手段での量子化のビット割当を決定するビット割当算出手段と
を有する信号符号化装置。 - 上記直交変換手段は、改良離散コサイン変換(MDCT)により入力された時間軸信号を周波数軸の係数データに変換する請求項7記載の信号符号化装置。
- 上記分析手段は、上記入力信号を線形予測符号化(LPC)分析してLPC係数を出力するLPC分析手段と、LPC予測残差をピッチ分析してピッチパラメータを出力するピッチ分析手段とを有し、
上記正規化手段は、上記LPC分析手段からの上記LPC係数に基づき上記入力信号のLPC予測残差を出力するLPC逆フィルタと、上記ピッチ分析手段からの上記ピッチパラメータに基づき上記LPC予測残差のピッチの相関性を除去するピッチ逆フィルタとを有する請求項8記載の信号符号化装置。 - 上記ビット割当算出手段は、上記LPC分析手段からの上記LPC係数と、上記ピッチ分析手段からの上記ピッチパラメータと、上記直交変換手段からの係数出力の臨界帯域毎に得られるバークスケールファクタとに基づいて、上記直交変換手段からの係数出力の量子化のビット割当を決定する請求項9記載の信号符号化装置。
- 時間軸上の入力信号に対して線形予測符号化(LPC)分析及びピッチ分析を行うことにより得られた分析結果に基づいて残差を取り出し、量子化された時間軸上のエンベロープ値によりゲインの平滑化のためのゲインコントロールを行うことにより正規化し、
この時間軸で平滑化された出力に対して直交変換を施し、
この直交変換された出力を量子化し、該量子化の際のビット割当を上記分析結果に基づいて決定する
信号符号化方法。 - 上記直交変換として、改良離散コサイン変換(MDCT)を用いる請求項11記載の信号符号化方法。
- 上記ビット割当の決定には、上記直交変換されて得られた係数の臨界帯域毎に得られるバークスケールファクタも用いる請求項11記載の信号符号化方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30150498A JP4618823B2 (ja) | 1998-10-22 | 1998-10-22 | 信号符号化装置及び方法 |
US09/422,250 US6353808B1 (en) | 1998-10-22 | 1999-10-21 | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
US09/935,931 US6681204B2 (en) | 1998-10-22 | 2001-08-23 | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
US09/935,881 US6484140B2 (en) | 1998-10-22 | 2001-08-23 | Apparatus and method for encoding a signal as well as apparatus and method for decoding signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30150498A JP4618823B2 (ja) | 1998-10-22 | 1998-10-22 | 信号符号化装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000132195A JP2000132195A (ja) | 2000-05-12 |
JP4618823B2 true JP4618823B2 (ja) | 2011-01-26 |
Family
ID=17897720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30150498A Expired - Fee Related JP4618823B2 (ja) | 1998-10-22 | 1998-10-22 | 信号符号化装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4618823B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4009781B2 (ja) * | 2003-10-27 | 2007-11-21 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
JP4626261B2 (ja) * | 2004-10-21 | 2011-02-02 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
WO2007083934A1 (en) * | 2006-01-18 | 2007-07-26 | Lg Electronics Inc. | Apparatus and method for encoding and decoding signal |
-
1998
- 1998-10-22 JP JP30150498A patent/JP4618823B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000132195A (ja) | 2000-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6681204B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
CN1838239B (zh) | 一种用于增强信源解码器的设备及方法 | |
JP3391686B2 (ja) | 符号化されたオーディオ信号を復号する方法及び装置 | |
KR101213840B1 (ko) | 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치 | |
US6871106B1 (en) | Audio signal coding apparatus, audio signal decoding apparatus, and audio signal coding and decoding apparatus | |
US6678655B2 (en) | Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH0869299A (ja) | 音声符号化方法、音声復号化方法及び音声符号化復号化方法 | |
JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
JP3765171B2 (ja) | 音声符号化復号方式 | |
JP3186007B2 (ja) | 変換符号化方法、復号化方法 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3684751B2 (ja) | 信号符号化方法及び装置 | |
JPH09106299A (ja) | 音響信号変換符号化方法および復号化方法 | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP3353267B2 (ja) | 音響信号変換符号化方法及び復号化方法 | |
JP3348759B2 (ja) | 変換符号化方法および変換復号化方法 | |
JP3353266B2 (ja) | 音響信号変換符号化方法 | |
JPH05265499A (ja) | 高能率符号化方法 | |
JP4274614B2 (ja) | オーディオ信号復号方法 | |
JP2842276B2 (ja) | 広帯域信号符号化装置 | |
JP2006171751A (ja) | 音声符号化装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080407 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090420 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090427 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20090626 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101026 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131105 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131105 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |