JP4024185B2 - デジタルデータ符号化装置 - Google Patents
デジタルデータ符号化装置 Download PDFInfo
- Publication number
- JP4024185B2 JP4024185B2 JP2003189179A JP2003189179A JP4024185B2 JP 4024185 B2 JP4024185 B2 JP 4024185B2 JP 2003189179 A JP2003189179 A JP 2003189179A JP 2003189179 A JP2003189179 A JP 2003189179A JP 4024185 B2 JP4024185 B2 JP 4024185B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- quantization
- unit
- constant
- digital data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、ミニディスクなどの記録媒体に楽音や音声等のデジタルデータを記録するにあたって、前記楽音や音声等に適応して各周波数帯域のスペクトルに対するビット割当てを行い、データ量を圧縮するデジタルデータ符号化装置に関するものである。
【0002】
【従来の技術】
従来より、楽音や音声等のデジタルデータを高能率で圧縮符号化する方法として、ミニディスクで用いられているATRAC(Adaptive TRansform Acoustic Coding)が上げられる。このATRACでは、高能率で圧縮するために、入力デジタルデータは、複数の周波数帯域(以下、適宜サブバンドと呼ぶ)に分割された後、可変長の時間単位でブロック化される。そして、このブロック化されたデジタルデータは、MDCT(Modified Discrete Cosine Transform)処理によりスペクトルデータに変換され、さらに、聴覚心理特性を利用して割当てられたビット数で各スペクトルデータがそれぞれ符号化される。
【0003】
前記の圧縮符号化に適応することができる聴覚心理特性には、等ラウドネス特性やマスキング効果が挙げられる。等ラウドネス特性とは、同じ音圧レベルの音であっても、人間が感じ取る音の大きさが周波数によって変化することを表すものである。従って、人間が感じ取ることができる音の大きさである最小可聴限が、その音の周波数によって変化することを表している。
【0004】
一方、マスキング効果には、同時マスキング効果と経時マスキング効果があり、同時マスキング効果とは、複数の周波数成分の音が同時に発生しているときに、ある音が別の音を聴き取り難くさせる現象をいう。また、経時マスキング効果とは、大きな音の時間軸方向の前後では、別の音が聞き取り難くなる現象をいう。
【0005】
このような聴覚心理特性を利用したビット割り当て法、例えば、反復法と呼ばれる割り当て法では、入力デジタルデータに適応した実際のビット割り当てを以下のようにして行っている。
【0006】
先ず、各周波数帯域のパワーSを求め、そのパワーSによる他の周波数帯域に対するマスキング閾値Mを求める。次に、このマスキング閾値Mと、各周波数帯域をnビットで量子化したときの量子化雑音パワーN(n)とから、マスキング閾値対雑音比MNR(n)=M/N(n)を求める。続いて、そのマスキング閾値対雑音比MNR(n)が最小となる周波数帯域にビット割り当てを行った後、このマスキング閾値対雑音比MNR(n)を更新し、再び最小の周波数帯域にビット割り当てが行われる。
【0007】
このようにして、聴覚心理特性を利用したビット割り当てにより、各周波数帯域の量子化ビット数(量子化語長)が算出される。また、周波数帯域毎のスペクトルの最大振幅レベルに関連するスケールファクタが算出され、このスケールファクタと前記量子化ビット数に基づいて各周波数帯域のスペクトルデータが量子化され、その後、圧縮データに符号化される。
【0008】
また、この符号化処理で符号化されたデータを復号化する装置において、逆量子化時には、量子化ビット数とスケールファクタ、及び、量子化時に求められた量子化係数から各周波数帯域毎にスペクトルデータに展開される。そして、展開されたスペクトルデータは可変長の時間単位でブロック化され、逆MDCT処理が施されて時間領域のデータに変換される。さらに、この変換された時間領域のデータは、複数の周波数帯域(サブバンド)を合成した後、楽音や音声等のデジタルデータに復元される。
【0009】
ところで、量子化時における最大量子化雑音を低減する方法として、量子化ビット数に対応する一定の係数を所定の周波数間隔内の全てのサンプルに掛ける方法、即ち、WL(量子化ビット数)がXより小さい場合に、k=(2WL[n]-2)/(2WL[n]-1)をユニット(量子化を行う周波数帯域単位)内の全てのスペクトルサンプルに掛け、修正スペクトルサンプルを求め、さらに、修正された量子化器で量子化を行う方法がある(例えば、特許文献1参照)。
【0010】
また、量子化器そのものを強化する方法、即ち、量子化を行う周波数帯域単位内のスペクトルの絶対値の最大値に係数k(0<k<1)を掛けてスケールファクタを算出し、スペクトルサンプルを修正しないで量子化する方法もある(例えば、特許文献2参照)。
【0011】
【特許文献1】
特許第3150475号公報
【特許文献2】
特開平11−177435号公報
【0012】
【発明が解決しようとする課題】
しかしながら、特許文献1に記載の従来技術では、最大量子化雑音を低減させることは可能であるが、量子化を行う周波数帯域単位のスペクトル分布によっては、修正を行わない方が真値に近いスペクトルサンプルがあり、これらのスペクトルサンプルに対しては効果が逆になるという問題があった。また、量子化ビット数に対応する2種類の量子化器が必要となるという問題もあった。
【0013】
また、特許文献2に記載の従来技術では、量子化を行う周波数帯域のスペクトルデータの絶対値の最大値に係数k(0<k<1)を掛けてスケールファクタを算出している為、スペクトル分布によっては正規化値(SD(m)/SF)が1を越える、即ち、オーバーフローが発生する場合があるという問題があった。
【0014】
本発明は、上記の問題点に鑑み、1種類の量子化器を用いて、量子化時における各周波数帯域の最大スペクトルの量子化雑音を低減するとともに、最大スペクトルを除く量子化後の周波数帯域のスペクトルレベルを従来の量子化値と比較して低くすることのできるデジタルデータ符号化装置を提供することを目的とする。
【0015】
【課題を解決するための手段】
上記目的を達成するために本発明は、時間領域のデジタルデータを周波数領域に変換したスペクトルを複数の周波数帯域に分割し、各周波数帯域毎に最大スペクトルに関連するスケールファクタを生成し、聴覚心理特性を利用して前記周波数帯域毎の量子化ビット数を算出し、前記スケールファクタと量子化ビット数を用いて前記スペクトルを量子化した量子化係数を算出して符号化するデジタルデータ符号化装置において、量子化される前記スペクトルに前記スケールファクタと量子化ビット数とに基づいて算出した定数を乗算して修正するスペクトルデータ修正部を設けたものである。
【0016】
このようにすると、入力されたデジタルデータの量子化時において、前記各周波数帯域のスペクトルの量子化誤差を低減して符号化することができ、この符号化されたデジタルデータの復号化時の量子化雑音を低減することができる。
【0017】
また、例えば、時間領域のデジタルデータを周波数領域に変換する時間周波数変換部と、該時間周波数変換部により変換されたスペクトルを複数の周波数帯域に分割し各周波数帯域毎に最大スペクトルに関連するスケールファクタを生成するスケールファクタ生成部と、聴覚心理特性を利用して前記周波数帯域毎の量子化ビット数を算出する量子化ビット数算出部と、前記スケールファクタと量子化ビット数を用いて前記スペクトルを量子化した量子化係数を算出して符号化する量子化部を備えたデジタルデータ符号化装置において、前記量子化部により量子化される前記スペクトルに前記スケールファクタと前記量子化ビット数とに基づいて算出した定数を乗算して修正するスペクトルデータ修正部を設けると良い。
【0018】
このようにすると、入力されたデジタルデータの量子化時において、前記各周波数帯域のスペクトルの量子化誤差を低減して符号化することができ、この符号化されたデジタルデータの復号化時の量子化雑音を低減することができる。
【0019】
また、例えば、前記スペクトルデータ修正部が、前記スペクトルを前記スケールファクタで正規化した仮正規化係数を算出する仮正規化部と、前記量子化ビット数に応じた比較閾値を算出する比較閾値算出部と、前記仮正規化係数と比較閾値に基づいた定数を算出する定数算出部と、前記スペクトルに前記定数を乗算して重み付けするスペクトルデータ重み付け部を備えていると良い。
【0020】
このようにすると、前記各周波数帯域のスペクトルの大きさに応じた定数を算出し、前記スペクトルに前記定数を乗算して重み付けすることにより前記スペクトルの量子化時における量子化誤差を低減することができる。
【0021】
また、例えば、前記時間周波数変換部で変換されたスペクトルに前記定数算出部で算出される定数を乗算した修正スペクトルを前記量子化部で量子化した量子化係数が逆量子化されたときのスペクトル振幅は、前記スペクトルに前記定数を乗算していない無修正スペクトルを前記量子化部で量子化した量子化係数が逆量子化されたときのスペクトル振幅を超えないようになっていると、逆量子化された前記各周波数帯域のスペクトルレベルを従来の量子化値よりも低くして、量子化雑音を低減することができる。
【0022】
また、例えば、前記定数算出部により算出される定数が、前記各周波数帯域の最大スペクトルに乗算される第1の定数と、前記各周波数帯域の最大スペクトル以外のスペクトルに乗算される第2の定数とから成ると、1種類の量子化器を用いて、量子化時における各周波数帯域の最大スペクトルの量子化雑音を低減できるとともに、最大スペクトルを除く量子化後の周波数帯域のスペクトルレベルを、従来の量子化値と比較して低くすることができる。
【0023】
また、例えば、前記スケールファクタ生成部が、前記定数算出部により算出される定数に応じて前記スケールファクタを減算して前記量子化部に与えるスケールファクタ減算部を備えていると、前記スペクトルが正規化された正規化値が1を越える、即ち、オーバーフローの発生を防止することができる。
【0024】
また、例えば、前記量子化ビット数が所定のビット数より小なるときに、前記スペクトルデータ修正部が前記スペクトルに前記定数を乗算して修正すると、前記スペクトルデータ修正部の演算量が低減し、デジタルデータ符号化装置の演算量を効果的に削減できる。
【0025】
また、例えば、前記量子化ビット数が所定のビット数より小なるときに、前記定数算出部が前記定数を算出し、前記スペクトルデータ重み付け部が前記スペクトルに前記定数を乗算して重み付けすると、前記定数算出部及び前記スペクトルデータ重み付け部の演算量が低減し、デジタルデータ符号化装置の演算量を効果的に削減できる。
【0026】
【発明の実施の形態】
以下に、本発明の実施形態を図面を参照して説明する。図1は、本発明の実施形態に係るデジタルデータ符号化装置の電気的構成を示すブロック図であり、説明の理解を深めるために復号化装置も合わせて示している。以下、ミニディスク等で利用するATRAC(Adaptive TRanceform Acoustic Coding)方式で行われる符号化復号化処理を図1を用いて説明する。図1において、1はデジタルデータ符号化装置、15は復号化装置、10はミニディスク等の記録メディアを示す。
【0027】
デジタルデータ符号化装置1は、周波数帯域分割部2、時間周波数変換部3、帯域毎のパワー算出部4、マスキング算出部5、量子化ビット数算出部6、量子化部7、パッキング部8、スケールファクタ生成部9、及び、スペクトルデータ修正部10を備えている。また、復号化装置15は、アンパッキング部11、逆量子化部12、周波数時間変換部13、周波数帯域合成部14を備えている。
【0028】
次に、このような構成のデジタルデータ符号化装置1の符号化処理を説明する。デジタルデータ符号化装置1の入力端には、44.1kHzでサンプリングされたデジタルデータであるオーディオ信号が入力される。この入力オーディオ信号は、周波数帯域分割部3において、帯域分割フィルタであるQMF(Quadrature Mirror Filter)によって複数の周波数帯域(サブバンドフレーム)に分割される。例えば、0〜5.5kHzの低帯域サブバンドフレームSB1と、5.5〜11kHzの中帯域サブバンドフレームSB2と、11〜22kHzの高帯域サブバンドフレームSB3の3帯域である。
【0029】
次に、時間周波数変換部3は、周波数帯域分割部2で得られたサブバンドフレーム単位毎にMDCT(Modified Discrete Cosine Tranceform)処理を施すことで、入力オーディオ信号を周波数成分のMDCT係数(スペクトルデータ)に変換する。このときのMDCT処理によって得られる変換データXm(k)は次の(1)式で示される。
【0030】
【数1】
【0031】
尚、上式中の変数mはフレーム番号を表しており、関数xm(i)は入力信号を表している。また、関数h(i)は順変換用窓関数を表している。
【0032】
そして、帯域毎のパワー算出部4は、時間周波数変換部3で得られたMDCT係数を、更に、i個の各周波数帯域のスペクトルパワーSi(i=1,2,…,I、例えばI=25)に変換する。ここで、前記周波数帯域には臨界帯域(単位Bark)等が用いられる。このようにして得られた各スペクトルパワーに対して、マスキング算出部5では、聴覚心理特性を用いてマスキングカーブが作成され、量子化ビット数算出部6では、マスキング算出部5で作成されたマスキングカーブと各スペクトルパワーによりビット割当処理が行われる。
【0033】
また、スケールファクタ生成部9において、時間周波数変換部3で変換された各周波数帯域のMDCT係数の絶対最大値から約2dB毎にスケールファクタが算出される。また、スペクトルデータ修正部10において、このスケールファクタにより前記MDCT係数が仮正規化された仮正規化係数と量子化ビット数算出部6のビット割当処理から求められた各周波数帯域の量子化ビット数とから求められた定数が前記MDCT係数に乗算されて重み付けされたMDCT係数が生成される。そして、この重み付けされたMDCT係数と一部が減算されたスケールファクタとが量子化部7に与えられる。尚、このスケールファクタ生成部9とスペクトルデータ修正部10の構成及び動作についての詳細は後述する。
【0034】
そして、量子化部7は、量子化ビット数算出部6のビット割当処理から求められた各周波数帯域の量子化ビット数と、スケールファクタ生成部9から与えられたスケールファクタとから、スペクトルデータ修正部10から与えられたスペクトルデータを次の(2)式によって量子化した量子化係数MK(m)を算出する。
【0035】
【数2】
【0036】
尚、上式中の変数mはMDCT係数のインデックス、iは量子化周波数帯域のインデックス、K(m)はMDCT係数、WL(i)は量子化ビット数、SF(i)はスケールファクタを表しており、Roundは小数点以下を四捨五入する関数である。
【0037】
そして、量子化部7で量子化された、量子化係数、量子化ビット数、スケールファクタはフレーム情報とともにパッキング部8でパッキング、符号化され、記録メディア20に記録される。
【0038】
次に、復号化装置15の復号化処理について説明する。上述のように記録メディア20に記録された符号化データは、フレーム情報から量子化係数、量子化ビット数、スケールファクタがアンパッキング部11でアンパッキングされる。そして、逆量子化部12において、この量子化係数、量子化ビット数、スケールファクタが逆量子化され、IMDCT(Inverse Modified Discrete Cosine Transform)処理を施す周波数時間変換部13に入力される。この周波数時間変換部13に入力されるIMDCT入力信号I(m)は、次の(3)式によって逆量子化される。
【0039】
【数3】
【0040】
尚、上式中の変数mはIMDCT入力信号のインデックス、iは逆量子化周波数帯域のインデックス、MK(m)は量子化係数、WL(i)は量子化ビット数、SF(i)はスケールファクタを表している。
【0041】
逆量子化部12で逆量子化され、再び、スペクトルに復元されたスペクトルデータは、サブバンドフレーム毎に周波数時間変換部13でIMDCT処理が施され、時間軸のデータに変換される。この周波数時間変換部13のIMDCT処理による逆変換データym(i)は次の(4)式で示される。
【0042】
【数4】
【0043】
尚、上式中の変数mはフレーム番号、f(i)は逆変換用窓関数、Xm(k)は変換データを表している。
【0044】
更に、周波数帯域合成部14において、逆変換された周波数サブバンドフレームは、帯域合成フィルタであるIQMF(Inverse Quadrature Mirror Filter)によって帯域合成され、オーディオデータに復号化される。
【0045】
次に、量子化部7に与えられるスケールファクタの生成方法と、同じく量子化部7に与えられるMDCT係数(スペクトルデータ)の修正方法を説明する。図2は、スケールファクタ生成部9とスペクトルデータ修正部10の電気的構成を示すブロック図である。図2において、図1と同一の部分には同一の符号を付し、その詳細な説明を省略する。
【0046】
スケールファクタ生成部9は、スケールファクタ算出部21とスケールファクタ減算部22とから構成されている。また、スペクトルデータ修正部10は、仮正規化部23、定数算出部24、比較閾値算出部25、及び、スペクトルデータ重み付け部26から構成されている。
【0047】
先ず、図1に示す時間周波数変換部3において、上記(1)式によって変換されたMDCT係数(スペクトルデータ)は、スケールファクタ算出部9において、各周波数帯域のMDCT係数の絶対最大値から約2dB毎にスケールファクタが算出される。即ち、各周波数帯域のMDCT係数の絶対最大値をKmax(i)、その時のスケールファクタをSF(i)とすれば、SF(i)×2-1/3=<Kmax(i)<SF(i)となるようなSF(i)が算出される。
【0048】
また、仮正規化部23においては、変換されたMDCT係数K(m)とスケールファクタSF(i)から、各周波数帯域毎に上記(2)式のK(m)/SF(i)部分(仮正規化係数)が算出される。このとき−1<K(m)/SF(i)<1である。また、帯域毎のパワー算出部4、マスキング算出部5、量子化ビット数算出部6においては、上述したように、聴覚心理特性を利用してマスキングカーブを作成し、ビット割当処理が行われる。そして、比較閾値算出部25においては、ビット割当処理から求めた各周波数帯域の量子化ビット数より、最終的に量子化される値とその中点を算出する。例えば、量子化ビット数WL(i)=2の時は、最終的に量子化される値が{−1,0,1}に対して{−1,−0.5,0,0.5,1}が算出される。これらは、予めテーブルROMに記憶しておいてもよい。
【0049】
そして、定数算出部24においては、仮正規化値K(m)/SF(i)が比較閾値のどの領域に入るかを比較する。これにより、量子化雑音による振幅が真値と比較して増加するのか減少するのかを判断する。例えば、WL(i)=2の時は、−1<K(m)/SF(i)=<−0.5、または、0.5<K(m)/SF(i)=<1ならば量子化雑音による振幅が真値より増加し、−0.5<K(m)/SF(i)<0.5ならば量子化雑音による振幅が真値より減少する。ここで、スケールファクタの算出に用いたMDCT係数の絶対最大値Kmax(i)は、量子化雑音による振幅が真値より必ず増加するので比較対象から除外する。
【0050】
更に、Kmax(i)とSF(i)との差分、即ち、SF(i)−Kmax(i)と、Kmax(i)とSF(i)×2-1/3との差分、即ち、Kmax(i)−SF(i)×2-1/3とを比較し、以下のような条件により、Kmax(i)に掛ける定数fmax(i)と、Kmax(i)以外のMDCT係数に掛ける定数fexmax(i)とを算出する。
【0051】
先ず、SF(i)−Kmax(i)>= Kmax(i)−SF(i)×2-1/3、且つ、Qup(i)>=Qdown(i)ならば、fmax(i)=2-1/3、fexmax(i)=MIN(2-1/3,(2WL(i)-1 −2)/(2WL(i)-1 −1))とする。
【0052】
また、SF(i)−Kmax(i)>= Kmax(i)−SF(i)×2-1/3、且つ、Qup(i)<Qdown(i)ならば、fmax(i)=2-1/3,fexmax(i)=2-1/3とする。
【0053】
また、SF(i)−Kmax(i)< Kmax(i)−SF(i)×2-1/3、且つ、Qup(i)>=Qdown(i)ならば、fmax(i)=1、fexmax(i)=MAX(2-1/3,(2WL(i)-1 −2)/(2WL(i)-1 −1))とする。
【0054】
また、SF(i)−Kmax(i)< Kmax(i)−SF(i)×2-1/3、且つ、Qup(i)<Qdown(i)ならば、fmax(i)=1、fexmax(i)=2-1/3とする。尚、MIN(x,y)は引数の最小値を返す関数であり、MAX(x,y)は引数の最大値を返す関数である。
【0055】
ここで、Qup(i)は量子化雑音による振幅が真値より増加する場合の量子化誤差のパワーまたはエネルギ値であり、Qdown(i)は量子化雑音による振幅が真値より減少する場合の量子化誤差のパワーまたはエネルギ値である。または、単純に、真値より増加または減少する場合のMDCT係数の本数であってもよい。図3に、WL(i)=2、SF(i)=25、周波数帯域iのスペクトル本数が6のときのMDCT係数の一例を示している。この例の場合、量子化誤差パワーQup(i)=SA(2)2+SA(3)2、量子化誤差パワーQdown(i)=SA(1)2+SA(3)2+SA(4)2+SA(5)2+SA(6)2として算出する。
【0056】
図4は、定数算出部24における、Kmax(i)に掛ける定数fmax(i)と、Kmax(i)以外のMDCT係数に掛ける定数fexmax(i)との算出動作を示すフローチャートである。先ず、量子化雑音による振幅が真値より増加する場合の誤差のパワーである量子化誤差パワーQup(i)を上述のようにして、即ち、最終的に量子化される値の中点以上にあるスペクトルとSF(i)との差分の2乗和を算出する(ステップP1)。次に、量子化雑音による振幅が真値より減少する場合の誤差のパワーである量子化誤差パワーQdown(i)を上述のようにして、即ち、Kmax(i)以外のスペクトルと最終的に量子化される値との差分の2乗和を算出する(ステップP2)。
【0057】
次に、Kmax(i)とSF(i)との差分、即ち、SF(i)−Kmax(i)と、Kmax(i)とSF(i)×2-1/3との差分、即ち、Kmax(i)−SF(i)×2-1/3とを比較する(ステップP3)。そして、比較した結果、SF(i)−Kmax(i)>= Kmax(i)−SF(i)×2-1/3の場合、Qup(i)とQdown(i)を比較し(ステップP4)、Qup(i)>=Qdown(i)の場合、fmax(i)とfexmax(i)を、fmax(i)=2-1/3、fexmax(i)=MIN(2-1/3,(2WL(i)-1 −2)/(2WL(i)-1 −1))と決定する(ステップP6)。一方、ステップP4において、Qup(i)<Qdown(i)の場合、fmax(i)とfexmax(i)を、fmax(i)=2-1/3、fexmax(i)=2-1/3と決定する(ステップP7)。
【0058】
また、ステップP3での比較結果が、SF(i)−Kmax(i)< Kmax(i)−SF(i)×2-1/3の場合、Qup(i)とQdown(i)を比較し(ステップP5)、Qup(i)>=Qdown(i)の場合、fmax(i)とfexmax(i)を、fmax(i)=1、fexmax(i)=MAX(2-1/3,(2WL(i)-1 −2)/(2WL(i)-1 −1))と決定する(ステップP8)。一方、ステップP5において、Qup(i)<Qdown(i)の場合、fmax(i)とfexmax(i)を、fmax(i)=1、fexmax(i)=2-1/3と決定する(ステップP9)。
【0059】
そして、このようにして求めた定数fmax(i)とfexmax(i)を、スペクトルデータ重み付け部26において、個々のMDCT係数(スペクトルデータ)に掛けて重み付けを行う。また、スケールファクタ減算部22では、fmax(i)=2-1/3となるiの周波数帯域のスケールファクタSF(i)を、スケールファクタ算出部21で算出したスケールファクタから1分解能だけ減算する。そして、量子化部7において、量子化ビット数算出部6で算出された量子化ビット数WL(i)と、スペクトルデータ重み付け部26で重み付けされたMDCT係数(スペクトルデータ)K’(m)と、スケールファクタ減算部22で減算されたスケールファクタSF’(i)とを用いて、上述の(2)式により量子化係数が算出され、それを符号化した符号化データが出力される。
【0060】
また、演算量を削減することや、効果の程度から、聴覚心理上比較的重要でないと判断される場合、即ち、量子化ビット数WL(i)が小なる場合、例えば、WL(i)<4の場合にのみ、上記実施例を実施することが好ましい。
【0061】
このようにして、デジタルデータ符号化装置1により、入力されたオーディオ信号の符号化を行うと、1つの量子化部7だけであるにも拘わらず、各周波数帯域のMDCT係数の絶対最大値Kmax(i)の量子化誤差を低減できるとともに、各周波数帯域のMDCT係数の絶対最大値Kmax(i)以外のMDCT係数の量子化誤差も低減でき、復号化されたオーディオ信号の量子化雑音を低減して音質を向上させることができる。
【0062】
尚、上記の実施形態では、デジタルデータ符号化装置1により符号化されるデジタルデータをオーディオ信号とした例を挙げて説明したが、オーディオ信号に限定されず、他のデジタルデータの場合であっても適用可能であることは言うまでもない。
【0063】
【発明の効果】
以上のように、本発明によれば、時間領域のデジタルデータを周波数領域に変換する時間周波数変換部と、該時間周波数変換部により変換されたスペクトルを複数の周波数帯域に分割し各周波数帯域毎に最大スペクトルに関連するスケールファクタを生成するスケールファクタ生成部と、聴覚心理特性を利用して前記周波数帯域毎の量子化ビット数を算出する量子化ビット数算出部と、前記スケールファクタと量子化ビット数を用いて前記スペクトルを量子化した量子化係数を算出して符号化する量子化部を備えたデジタルデータ符号化装置において、前記スペクトルを前記スケールファクタで正規化した仮正規化係数を算出する仮正規化部と、前記量子化ビット数に応じた比較閾値を算出する比較閾値算出部と、前記仮正規化係数と比較閾値に基づいた定数を算出する定数算出部と、前記スペクトルに前記定数を乗算して重み付けするスペクトルデータ重み付け部を設けたので、入力されたデジタルデータの量子化時において、前記各周波数帯域のスペクトルの量子化誤差を低減して符号化することができ、この符号化されたデジタルデータの復号化時の量子化雑音を低減することができる。
【0064】
また、本発明によれば、前記時間周波数変換部で変換されたスペクトルに前記定数算出部で算出される定数を乗算した修正スペクトルを前記量子化部で量子化した量子化係数が逆量子化されたときのスペクトル振幅は、前記スペクトルに前記定数を乗算していない無修正スペクトルを前記量子化部で量子化した量子化係数が逆量子化されたときのスペクトル振幅を超えないようになっており、また、前記定数は、前記各周波数帯域の最大スペクトルに乗算される第1の定数と、前記各周波数帯域の最大スペクトル以外のスペクトルに乗算される第2の定数とから成る定数としたので、1種類の量子化器を用いて、量子化時における各周波数帯域の最大スペクトルの量子化雑音を低減できるとともに、最大スペクトルを除く量子化後の周波数帯域のスペクトルレベルを、従来の量子化値と比較して低くすることができる。
【0065】
また、本発明によれば、量子化ビット数が小なる時にのみ前記スペクトルの修正を施すことで、デジタルデータ符号化装置の演算量を効果的に削減できる。
【図面の簡単な説明】
【図1】は、本発明の実施形態に係るデジタルデータ符号化装置の電気的構成を示すブロック図である。
【図2】は、図1に示すデジタルデータ符号化装置のスケールファクタ生成部とスペクトルデータ修正部の電気的構成を示すブロック図である。
【図3】は、MDCT係数の一例を示す図である。
【図4】は、図2に示す定数算出部の定数算出動作を示すフローチャートである。
【符号の説明】
1 デジタルデータ符号化装置
2 周波数帯域分割部
3 時間周波数変換部
4 帯域毎のパワー算出部
5 マスキング算出部
6 量子化ビット算出部
7 量子化部
8 パッキング部
9 スケールファクタ生成部
10 スペクトルデータ修正部
11 アンパッキング部
12 逆量子化部
13 周波数時間変換部
14 周波数帯域合成部
15 復号化装置
20 記録メディア
21 スケールファクタ算出部
22 スケールファクタ減算部
23 仮正規化部
24 定数算出部
25 比較閾値算出部
26 スペクトルデータ重み付け部
Claims (8)
- 時間領域のデジタルデータを周波数領域に変換したスペクトルを複数の周波数帯域に分割し、各周波数帯域毎に最大スペクトルに関連するスケールファクタを生成し、聴覚心理特性を利用して前記周波数帯域毎の量子化ビット数を算出し、前記スケールファクタと量子化ビット数を用いて前記スペクトルを量子化した量子化係数を算出して符号化するデジタルデータ符号化装置において、
前記量子化の前に、前記スペクトルに前記スケールファクタと前記量子化ビット数とに基づいて算出した定数を乗算することにより、該スペクトルを修正するスペクトルデータ修正部を設けたことを特徴とするデジタルデータ符号化装置。 - 時間領域のデジタルデータを周波数領域に変換する時間周波数変換部と、該時間周波数変換部により変換されたスペクトルを複数の周波数帯域に分割し各周波数帯域毎に最大スペクトルに関連するスケールファクタを生成するスケールファクタ生成部と、聴覚心理特性を利用して前記周波数帯域毎の量子化ビット数を算出する量子化ビット数算出部と、前記スケールファクタと量子化ビット数を用いて前記スペクトルを量子化した量子化係数を算出して符号化する量子化部を備えたデジタルデータ符号化装置において、
前記量子化部により量子化される前に、前記スペクトルに前記スケールファクタと前記量子化ビット数とに基づいて算出した定数を乗算することにより、該スペクトルを修正するスペクトルデータ修正部を設けたことを特徴とするデジタルデータ符号化装置。 - 前記スペクトルデータ修正部は、前記スペクトルを前記スケールファクタで正規化した仮正規化係数を算出する仮正規化部と、前記量子化ビット数に応じた比較閾値を算出する比較閾値算出部と、前記仮正規化係数と比較閾値に基づいた定数を算出する定数算出部と、
前記スペクトルに前記定数を乗算して重み付けするスペクトルデータ重み付け部を備えていることを特徴とする請求項2に記載のデジタルデータ符号化装置。 - 前記時間周波数変換部で変換されたスペクトルに前記定数算出部で算出される定数を乗算した修正スペクトルを前記量子化部で量子化した量子化係数が逆量子化されたときのスペクトル振幅は、前記スペクトルに前記定数を乗算していない無修正スペクトルを前記量子化部で量子化した量子化係数が逆量子化されたときのスペクトル振幅を超えないことを特徴とする請求項3に記載のデジタルデータ符号化装置。
- 前記定数算出部により算出される定数は、前記各周波数帯域の最大スペクトルに乗算される第1の定数と、前記各周波数帯域の最大スペクトル以外のスペクトルに乗算される第2の定数とから成ることを特徴とする請求項3に記載のデジタルデータ符号化装置。
- 前記スケールファクタ生成部は、前記定数算出部により算出される定数に応じて前記スケールファクタを減算して前記量子化部に与えるスケールファクタ減算部を備えていることを特徴とする請求項3に記載のデジタルデータ符号化装置。
- 前記量子化ビット数が所定のビット数より小なるときに、前記スペクトルデータ修正部は前記スペクトルに前記定数を乗算して修正することを特徴とする請求項1または請求項2に記載のデジタルデータ符号化装置。
- 前記量子化ビット数が所定のビット数より小なるときに、前記定数算出部は前記定数を算出し、前記スペクトルデータ重み付け部は前記スペクトルに前記定数を乗算して重み付けすることを特徴とする請求項3〜請求項6のいずれかに記載のデジタルデータ符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003189179A JP4024185B2 (ja) | 2003-07-01 | 2003-07-01 | デジタルデータ符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003189179A JP4024185B2 (ja) | 2003-07-01 | 2003-07-01 | デジタルデータ符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005026940A JP2005026940A (ja) | 2005-01-27 |
JP4024185B2 true JP4024185B2 (ja) | 2007-12-19 |
Family
ID=34187460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003189179A Expired - Fee Related JP4024185B2 (ja) | 2003-07-01 | 2003-07-01 | デジタルデータ符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4024185B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101767527B (zh) * | 2008-12-26 | 2013-06-19 | 本田技研工业株式会社 | 鞍乘型电动车辆的蓄电池收纳箱结构 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004050A (ja) * | 2005-06-27 | 2007-01-11 | Nippon Hoso Kyokai <Nhk> | ステレオ信号の符号化装置及び符号化プログラム |
KR100724986B1 (ko) | 2005-06-28 | 2007-06-04 | 삼성전자주식회사 | 부호분할 다중접속 시스템에서 터보 복호기의 입력데이터를 위한 스케일링 인자의 결정 방법 및 장치 |
DE602007005729D1 (de) | 2006-06-19 | 2010-05-20 | Sharp Kk | Signalverarbeitungsverfahren, Signalverarbeitungsvorrichtung und Aufzeichnungsmedium |
-
2003
- 2003-07-01 JP JP2003189179A patent/JP4024185B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101767527B (zh) * | 2008-12-26 | 2013-06-19 | 本田技研工业株式会社 | 鞍乘型电动车辆的蓄电池收纳箱结构 |
Also Published As
Publication number | Publication date |
---|---|
JP2005026940A (ja) | 2005-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
JP3297051B2 (ja) | 適応ビット配分符号化装置及び方法 | |
US7613603B2 (en) | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model | |
JP4168976B2 (ja) | オーディオ信号符号化装置及び方法 | |
JP5048697B2 (ja) | 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体 | |
JP3926726B2 (ja) | 符号化装置および復号化装置 | |
US20080243518A1 (en) | System And Method For Compressing And Reconstructing Audio Files | |
JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
JP2005534947A (ja) | 心理音響ベースで圧縮する際に形成されるノイズの許容可能な歪みに基づくスケールファクタのフィードフォワード予測 | |
CN101131820A (zh) | 编码设备、解码设备、编码方法和解码方法 | |
US8149927B2 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
JP3353868B2 (ja) | 音響信号変換符号化方法および復号化方法 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4024185B2 (ja) | デジタルデータ符号化装置 | |
US7668715B1 (en) | Methods for selecting an initial quantization step size in audio encoders and systems using the same | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP2010175633A (ja) | 符号化装置及び方法、並びにプログラム | |
JP4649351B2 (ja) | デジタルデータ復号化装置 | |
JP4627737B2 (ja) | デジタルデータ復号化装置 | |
JP4641272B2 (ja) | デジタルデータ復号化装置 | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
Gunjal et al. | Traditional psychoacoustic model and Daubechies wavelets for enhanced speech coder performance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070730 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071002 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101012 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111012 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121012 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131012 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |