JP3725876B2 - オーディオ符号化器とその符号化処理プログラム - Google Patents
オーディオ符号化器とその符号化処理プログラム Download PDFInfo
- Publication number
- JP3725876B2 JP3725876B2 JP2003033915A JP2003033915A JP3725876B2 JP 3725876 B2 JP3725876 B2 JP 3725876B2 JP 2003033915 A JP2003033915 A JP 2003033915A JP 2003033915 A JP2003033915 A JP 2003033915A JP 3725876 B2 JP3725876 B2 JP 3725876B2
- Authority
- JP
- Japan
- Prior art keywords
- bits
- scale factor
- audio signal
- masking level
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
この発明は、例えばMPEG(Moving Picture Coding Experts Group)オーディオレコーダに設けられるオーディオ符号化器と、この符号化器においてオーディオ信号を符号化するために使用される符号化処理プログラムに関する。
【0002】
【従来の技術】
MPEGオーディオレコーダでは、心理聴覚分析を採用したオーディオ符号化器が用いられている。この種の符号化器は、入力されたオーディオ信号を、先ず時間/周波数変換部により時間領域の信号から周波数領域の信号に変換する。またそれと共に心理聴覚分析部により、高速フーリエ変換(FFT)分析等を用いてスケールファクタバンドごとの信号対マスク比(SMR)及び心理聴覚エントロピーをそれぞれ算出する。次に、量子化/可変長符号化/バッファ制御の繰り返しループにより、スケールファクタバンドごとのSMRから心理聴覚に基づいた量子化誤差のマスキングレベルを算出する。そして、利用可能なビット数の範囲内で量子化処理及び可変長符号化処理を繰り返し実行し、これにより量子化誤差がマスキングレベル以下になるような最適なスケールファクタを求める。
【0003】
また上記繰り返しループでは、符号化方式として可変長符号化方式を用いているため、各フレームで発生する符号化量は変化する。このため、ビット保存(bit reservoir)技術を用いている。すなわち、符号化発生量が少ないフレームでは、余ったビットを最大保存量を超えない範囲でビット保存に蓄積する。そして、この蓄積したビットを、オーディオ信号の立ち上がり等のように多くの符号化用のビットを必要とするフレームで利用する。多くのビットを必要とするか否かは、心理聴覚エントロピーに基づいて判定する。
【0004】
上記繰り返しループにより得られたスケールファクタは、ビットストリーム形成部に入力される。ビットストリーム形成部では、上記繰り返しループにより得られた最適なスケールファクタの符号と、そのときの量子化値の可変長符号と、サイド情報とをもとに、所定のフォーマットのオーディオビットストリームを形成する。そして、この形成されたオーディオビットストリームを送信又は記録メディアへの蓄積に供する(例えば、非特許文献1参照。)。
【0005】
ところで、上記量子化/可変長符号化/バッファ制御の繰り返しループでは、次のような処理が行われる。すなわち、先ず先に述べたスケールファクタバンドごとのSMRから、心理聴覚に基づいた量子化誤差のマスキングレベルがスケールファクタバンドごとに計算される。続いて、ビット保存に蓄積されているビット数と、心理聴覚エントロピーとを考慮して、付加するビット数(add_bits)が求められる。そして、この算出された付加ビット数(add_bits)は、設定されたビットレートに基づく1フレームあたりの平均ビット数(mean_bits)に加算され、これにより利用可能な最大ビット数(max_bits)が決定される。
【0006】
そうして、利用可能な最大ビット数(max_bits)が決定されると、スケールファクタ等を初期設定するための処理が行われ、続いて実際の周波数サンプルが現在のスケールファクタに基づき量子化される。その量子化値は可変長符号化され、これにより必要なビット数が求められる。もし、必要なビット数が利用可能な最大ビット数を超えている場合には、必要なビット数が利用可能なビット数以下になるまで量子化ステップサイズが大きな値に変更され、これにより必要なビット数が抑制される。
【0007】
続いて、以上のように求められた量子化値と元の周波数サンプルとが比較され、スケールファクタバンドごとの量子化歪みが求められる。そして、量子化歪みがマスキングレベルを超えているスケールファクタバンド数(over)を求める。その結果、すべてのスケールファクタバンドにおいてその量子化歪みがマスキングレベル以下であれば(over=0)、繰り返しループから抜け出してそのときのスケールファクタが保存され、符号化に使用されたビット数が計算される。そして、この計算された使用ビット数と利用可能な最大ビット数との間に差(未使用ビット数)があれば、この未使用ビットが次フレーム以降のフレームの符号化処理に使用するためにビット保存に蓄積される。
【0008】
一方、あるスケールファクタバンドにおいてその量子化歪みがマスキングレベルを超えていれば(over!=0)、それらすべてのスケールファクタが上限を超えずに修正可能であるか否かが判定される。そして、修正可能であればそれらのスケールファクタが増加される。以後、以上のループが繰り返し実行される。
【0009】
設定されたビットレートが高く、利用可能な最大ビット数が十分にあるときには、量子化歪みが許容範囲以下のスケールファクタの組み合わせが見つかる。利用可能なビット数が少ないときにはループが繰り返し実行され、スケールファクタが上限値に達してしまう。この場合には、スケールファクタが修正不可能と判断され、準最適なスケールファクタの組み合わせが保存される。そして、符号化に使用されたビット数が計算され、この使用されたビット数と利用可能な最大ビット数との間に差(未使用ビット数)があれば、この未使用ビットが次フレーム以降のフレームの符号化処理に使用するためにビット保存に蓄積される。
【0010】
入力されたオーディオ信号がステレオ信号の場合には、左右の各チャネルの信号ごとに、上述した量子化/可変長符号化/バッファ制御の繰り返しループの過程が繰り返し実行される。
【0011】
【非特許文献1】
総合マルチメディア選書 「MPEG」 映像情報メディア学会 編
第6章 MPEGオーディオ符号化(特にP141〜P153)
【0012】
【発明が解決しようとする課題】
ところが、このような従来のオーディオ符号化器では、入力されたオーディオ信号のフレームごとに、ビット保存に蓄積されたビット数から利用可能な最大ビット数が順次計算され、この計算されたビット数が当該フレームの符号化処理のために割り当てられる。この処理は、入力されたオーディオ信号がステレオ信号の場合にも、一方のチャネルについての処理結果を他方のチャネルの処理に引き継ぐかたちで行われる。
【0013】
このため、設定されたビットレートが低く、利用可能な最大ビット数が十分でない場合には、ステレオ信号の左右各チャネルのうち先に符号化処理されるチャネルの方に多くのビット数が割り当てられてしまい、後に符号化されるチャネルの符号化品質が劣化し易くなるという不具合を生じる。
【0014】
この発明は上記事情に着目してなされたもので、その目的とするところは、ステレオ信号のように複数チャネルを有するオーディオ信号を符号化する場合に、設定されたビットレートが低い場合でも、複数のチャネルの各々についてそれぞれ適当なビット数を割り当てることを可能にし、これによりチャネル間における符号化品質のばらつきを低減したオーディオ符号化器とその符号化処理プログラムを提供することにある。
【0015】
【課題を解決するための手段】
上記目的を達成するためにこの発明は、複数チャネルからなるオーディオ信号を、可変長符号化方式とビット保存技術を使用して符号化するオーディオ符号化器とその符号化プログラムにおいて、入力された上記オーディオ信号の各チャネル間における情報量の相違を検出し、その検出結果に基づいて、上記オーディオ信号の各フレームに割り当てる利用可能ビット数を補正する。そして、上記各チャネルのオーディオ信号をそれぞれスケールファクタに基づいて量子化及び可変長符号化する処理を、上記補正された利用可能ビット数の範囲内で、量子化歪みがマスキングレベル以下になるまで繰り返し実行し、この量子化処理及び可変長符号化処理により得られた結果をオーディオビットストリームにフォーマット化するようにしたものである。
【0016】
具体的には、オーディオ信号のチャネル間におけるパワー比を検出し、この検出されたパワー比に基づいて、上記ビット割当てにより決定される利用可能ビット数を補正する。
【0017】
また別の手段としては、心理聴覚分析によりオーディオ信号から求められる心理聴覚エントロピーのチャネル間の比を検出し、この検出された心理聴覚エントロピーの比に基づいて、上記ビット割当てにより決定される利用可能ビット数を補正する。
【0018】
したがってこの発明によれば、量子化/可変長符号化/バッファ制御の繰り返しループの処理に先立ち、オーディオ信号のチャネル間における情報量の相違が検出され、その検出結果に基づいてビット割当てにより決定される利用可能ビット数が補正される。このため、設定されたビットレートが低く、利用可能な最大ビット数が十分でない場合であっても、複数のチャネルにそれぞれ適切なビット数が割り当てられる。したがって、先に符号化されるチャネルは勿論のこと、後に符号化されるチャネルについても、品質の劣化を招くことなく符号化を行うことが可能となり、これによりチャネル間の符号化品質のばらつきを低減することができる。
【0019】
またこの発明は、上記繰り返しループにおいて、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める際に、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、準最適なスケールファクタの組み合わせを求めることを特徴とする。
【0020】
準最適なスケールファクタの組み合わせを求める手段としては、次の各手段が考えられる。
第1の手段は、量子化歪みがマスキングレベルを超えるスケールファクタバンド数が最小となるときのスケールファクタを保持しておく。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合に、上記保持されているスケールファクタをもとに準最適なスケールファクタの組み合わせを求めるものである。
【0021】
第2の手段は、量子化歪みがマスキングレベルを超えるスケールファクタバンドのバンド幅に応じて重み付けされた値の合計、つまり量子化歪みがマスキングレベルを超えるスケールファクタバンドのバンド幅の合計が最小となるときのスケールファクタを保持しておく。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合に、上記保持されているスケールファクタをもとに準最適なスケールファクタの組み合わせを求めるものである。
第3の手段は、量子化歪みがマスキングレベルを超えるスケールファクタバンドの、量子化歪みとマスキングレベルとの差の合計、つまり量子化歪みがマスキングレベルを超えるスケールファクタバンドの量子化歪みの誤差の合計が最小のときのスケールファクタを保持しておく。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されているスケールファクタをもとに準最適なスケールファクタの組み合わせを求めるものである。
【0022】
以上のように、準最適なスケールファクタを用意することによって、設定ビットレートが低く、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタバンドの組み合わせが見つからなかった場合でも、符号化されたオーディオ信号の品質劣化を抑制することが可能となる。
【0023】
【発明の実施の形態】
(第1の実施形態)
図1は、この発明に係わるオーディオ符号化器の第1の実施形態を示す機能ブロック図である。このオーディオ符号化器は、ハイブリッドフィルタバンク1と、心理聴覚分析部2と、繰り返しループ3と、ビットストリーム形成部4とを備えている。
【0024】
先ず心理聴覚分析部2は、高速フーリエ変換(FFT:First Fourier Transform)部21と、非予測可能性測定部22と、信号対マスク比(SMR:Signal-to-Mask Ratio)計算部23と、心理聴覚エントロピー評価部24とを有している。
【0025】
心理聴覚分析部2には、例えば図示しないPCM(Pulse Code Modulation)符号化部により16ビット直線量子化されたPCMステレオオーディオ信号ASが入力される。入力されたPCMステレオオーディオ信号ASは、高速フーリエ変換部21でFFT分析されたのち、非予測可能性測定部22により予測不可能性(Unpredictability)が測定される。SMR計算部23は、上記FFT分析に基づいて、入力されたPCMステレオオーディオ信号ASのサブバンド(スケールファクタバンド)ごとのSMRを計算する。心理聴覚エントロピー評価部24は、上記計算されたSMRをもとに心理聴覚エントロピーを求める。
【0026】
なお、心理聴覚分析のモデルについては、杉山:“音響信号の高能率符号化”,連載講座「ディジタルテレビ放送の基礎技術」,テレビ誌,48,4,pp.447-454(Apr.1994)に詳しく述べられている。
【0027】
ハイブリッドフィルタバンク1は、サブバンド分析フィルタバンク11と、適応ブロック長の変形離散コサイン変換(MDCT:Modified Discrete Cosine Transform)部12と、折り返し歪み削減バタフライ13とを有している。
【0028】
入力された上記PCMステレオオーディオ信号ASは、サブバンド分析フィルタバンク11により時間領域の信号から周波数領域の信号に変換されたのち、例えば32帯域のサブバンド(スケールファクタバンド)の信号に分割される。サブバンド分析には、例えば512タップのポリフェーズフィルタバンク(PFB:Polyphase Filter Bank)が用いられる。
【0029】
適応ブロック長MDCT部12は、プリエコーを抑圧するためのもので、上記分割された各サブバンド信号をさらに細かいスペクトルラインに写像する。このとき、適応ブロック長MDCT部12のブロック長は、上記心理聴覚エントロピー評価部24により求められる、予測不可能性を用いた心理聴覚エントロピーに基づいて決定される。折り返し歪み削減バタフライ13は、上記適応ブロック長MDCT部12により得られた写像信号に含まれる、周波数領域の折り返し歪みを除去する。
【0030】
繰り返しループ3は、非線形量子化部31と、スケールファクタ計算部32と、バッファ制御部33と、ハフマン符号化部34と、サイド情報符号化部35とを有している。
【0031】
スケールファクタ計算部32は、上記SMR計算部23により求められたスケールファクタバンドごとの信号対マスク比(SMR)をもとに、心理聴覚モデルに基づいた量子化誤差のマスキングレベルをスケールファクタバンドごとに計算する。また、バッファ制御部33のビット保存に蓄えられているビット数と、上記心理聴覚エントロピー評価部24により求められた心理聴覚エントロピーとに基づいて、非線形量子化に利用可能な最大ビット数を決定する。さらにスケールファクタ計算部32は、この利用可能な最大ビット数の決定に先立ち、前記入力されるオーディオ信号の左右各チャネル間のパワー比を算出する。算出されたパワー比は、上記利用可能な最大ビット数を補正するために用いられる。この補正された利用可能ビット数は、非線形量子化処理のために非線形量子化部31に与えられる。
【0032】
非線形量子化部31は、上記スケールファクタ計算部32によるビット割当てに従い、上記折り返し歪み削減バタフライ13から出力された写像信号の非線形量子化を行う。この非線形量子化により得られた量子化値はハフマン符号化部34により可変長符号化され、必要なビット数が求められる。この求められた必要ビット数は利用可能な最大ビット数と比較され、その比較結果をもとに量子化ステップサイズの変更が行われる。
【0033】
以上の非線形量子化及び可変長符号化は繰り返しループを伴っており、すべてのスケールファクタバンドで量子化誤差がマスキングレベル以下になるまで繰り返される。そして、すべてのスケールファクタバンドで量子化誤差がマスキングレベル以下になると、このとき得られたスケールファクタが用いられる。またこの繰り返しループでは、符号化に使用されたビット数が計算され、未使用ビット数は次フレーム以降の符号化のためにバッファ制御部33のビット保存に蓄積される。
【0034】
サイド情報符号化部35は、上記繰り返しループの終了後に、スケールファクタ計算部32により算出されたスケールファクタをビット割当て情報やハフマンテーブルと共にサイド情報として符号化する。
【0035】
ビットストリーム生成部4は、ヘッダと、上記ハフマン符号化部34により符号化されたデータと、上記サイド情報符号化部35により符号化されたサイド情報とを、所定のフォーマットに従い多重化してビットストリームを形成する。そして、この生成されたビットストリームを蓄積メディアへの蓄積に供するか、或いは通信路への送信に供する。
【0036】
次に、以上のように構成されたオーディオ符号化器におけるステレオ信号の量子化/可変長符号化/バッファ制御の繰り返しループ3による処理動作を説明する。この処理動作は、プログラムをマイクロコンピュータ或いはDSP(Digital Signal Processor)に実行させることにより実現される。
【0037】
図2は、その全体の処理手順と処理内容(メインルーチン)を示すフローチャートである。繰り返しループ3では、先ずステップ2aにより、入力されるステレオオーディオ信号ASの左右各チャネル間のパワー比が算出される。このパワー比の算出は次式により行われる。
【数1】
【0038】
繰り返しループ3では次に、入力されたステレオオーディオ信号ASの左右両チャネルについて順次、量子化/可変長符号化/バッファ制御の繰り返しループ処理が行われる。
【0039】
すなわち、ステップ2bで先ずチャネル番号chが初期化(ch=0)される。そして、この初期化したチャネル番号ch=0に対応するチャネル、例えば左チャネルの入力オーディオ信号について、ステップ2dにより量子化/可変長符号化/バッファ制御の繰り返しループ処理が実行される。
【0040】
この左チャネルに対する繰り返しループ処理が終了すると、ステップ2eでチャネル番号chがインクリメント(ch++)され、続いてこのインクリメントされたチャネル番号ch=1に対応するチャネル、例えば右チャネルについて、ステップ2dにより量子化/可変長符号化/バッファ制御の繰り返しループ処理が実行される。そうして左右両チャネルに対する繰り返しループ処理が終了すると、ステップ2cでこの処理の終了が確認されて繰り返しループ処理は終了となる。
【0041】
ところで、上記左右各チャネルに対する量子化/可変長符号化/バッファ制御の繰り返しループ処理は、次のように行われる。図3は、そのサブルーチンの処理手順と処理内容を示すフローチャートである。
【0042】
すなわち、先ずステップ3aでは、SMR計算部3により計算されたスケールファクタバンドごとのSMRから、心理聴覚に基づいた量子化誤差のマスキングレベルがスケールファクタバンドごとに計算される。続いてステップ3bでは、バッファ制御部33のビット保存に蓄積されているビット数と、心理聴覚エントロピーとを考慮して、付加するビット数(add_bits)が求められる。この求められた付加ビット(add_bits)は、先にステップ2aで算出された左右各チャネル間のパワー比(x_ratio[ch] )をもとに、次のように補正される。
add_bits=add_bits*x_ratio[ch] (4)
【0043】
そして、この補正された付加ビット数(add_bits)は、設定されたビットレートに基づく1フレームあたりの平均ビット数(mean_bits)に加算され、これにより利用可能な最大ビット数(max_bits)が決定される。その計算式を以下に示す。
max_bits=mean_bits+add_bits (5)
【0044】
そうして利用可能な最大ビット数(max_bits)が算出されると、ステップ3cにおいてスケールファクタ等の初期設定が行われ、しかる後ステップ3dにより量子化及び可変長符号化処理が実行される。このステップ3dでは、実際の周波数サンプルを現在のスケールファクタに基づき量子化する処理が行われる。そして、その量子化値がハフマン符号化部34により可変長符号化され、これにより符号化に必要なビット数が求められる。
【0045】
この求められた必要ビット数は上記利用可能な最大ビット数(max_bits)と比較される。この比較の結果、符号化に必要な必要ビット数が利用可能な最大ビット数(max_bits)を超えている場合には、符号化に必要な必要ビット数が利用可能な最大ビット数(max_bits)以下になるまで量子化ステップサイズを大きくして必要ビット数を抑制する。
【0046】
ステップ3eでは、上記ステップ3dにより決定された量子化値と元の周波数サンプルとが比較され、スケールファクタバンドごとの量子化歪みが求められる。ステップ3mでは、上記求められた量子化歪みがマスキングレベルを超えているスケールファクタバンド数(over)が求められる。そして、この求められたoverが0であるか否か(over=0?)がステップ3fで判定される。
【0047】
この判定の結果、overが0であれば、すなわちすべてのスケールファクタバンドの量子化歪みがマスキングレベル以下であれば、繰り返しループから抜け出してステップ3gに移行する。そして、このステップ3gにおいて、このときのスケールファクタが保存される。また、符号化に使用されたビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降の符号化のためにビット保存に蓄積される。
【0048】
一方、上記ステップ3fの比較の結果、あるスケールファクタバンドで量子化歪みがマスキングレベルを超えていた(over!=0)とする。この場合には、ステップ3iによりスケールファクタの修正が可能であるか否かが判定される。そして、すべてのスケールファクタが上限を越えずに修正可能ならば、ステップ3jによりこれらのスケールファクタを増加するように修正が行われる。そして、この修正後にステップ3dに戻り、以後すべてのスケールファクタバンドの量子化歪みが許容範囲内になるまで、ステップ3d乃至ステップ3jによる量子化および可変長符号化処理の繰り返しループが実行される。
【0049】
上記繰り返しループにおいては、設定ビットレートが高く利用可能な最大ビット数が十分にある場合には、量子化歪みが許容範囲内のスケールファクタの組み合わせが見つかる。これに対し、設定ビットレートが低く利用可能なビット数が少ない場合には、上記ループが繰り返されてスケールファクタが上限値に達してしまう。ステップ3iにおいてスケールファクタが上限値を超えて修正不可能と判定された場合には、ステップ3kにより準最適なスケールファクタの組み合わせが選択されて保存される。またそれと共に、符号化に使用したビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降の符号化のためにバッファ制御部33のビット保存に蓄積される。
【0050】
以上述べたように第1の実施形態では、繰り返しループ3において、先ずステレオオーディオ信号ASの左右各チャネル間のパワー比(x_ratio[ch])を算出する。そして、このチャネル間のパワー比(x_ratio[ch])をもとに付加ビット数(add_bits)を補正することにより、ステレオオーディオ信号ASのフレームごとに利用可能な最大ビット数(max_bits)を決定する。そして、この決定された利用可能な最大ビット数(max_bits)の範囲内で、ステレオオーディオ信号ASのフレームに対し量子化及び可変長符号化を行い、量子化歪みがマスキングレベル以下となるスケールファクタを求めている。
【0051】
したがって、利用可能な最大ビット数(max_bits)が入力オーディオ信号ASの左右両チャネル間のパワー比(x_ratio[ch])をもとに制御される。このため、設定ビットレートが低く利用可能な最大ビット数(max_bits)が十分でない場合でも、先に符号化されるチャネルに多くのビットが割り当てられて、後に符号化されるチャネルに利用可能なビット数が不足気味になる不具合は解消される。この結果、先に符号化されるチャネルは勿論のこと、後から符号化されるチャネルについても、品質の劣化を生じることなく符号化を行うことが可能となり、これによりチャネル間の符号化品質のばらつきを低減することができる。
【0052】
(第2の実施形態)
この発明の第2の実施形態は、量子化/可変長符号化/バッファ制御の繰り返しループにおいて、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める際に、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、量子化歪みがマスキングレベルを超えるスケールファクタバンド数が最小となるときのスケールファクタをもとに、準最適なスケールファクタの組み合わせを求めるものである。
【0053】
図4は、この第2の実施形態に係わるオーディオ符号化器による、量子化/可変長符号化/バッファ制御の繰り返しループのサブルーチンの処理手順と処理内容を示すフローチャートである。なお、同図において前記図3と同一部分には同一符号を付して詳しい説明は省略する。また、オーディオ符号化器の構成についても図1と同一なので、ここでの説明は省略する。
【0054】
ステップ3mにおいて量子化歪みがマスキングレベルを超えているスケールファクタバンド数(over)が算出されると、続いてステップ3nにおいて、上記ステップ3mで求められたoverがスケールファクタバンド数の最小値(over_min)と比較される。この比較の結果、上記求められたoverがover_minより小さければ、ステップ3oにおいてスケールファクタバンド数の最小値(over_min)がいま求められたoverに更新される。またそれと共にステップ3oでは、現在のスケールファクタが準最適なスケールファクタとして保存される。
【0055】
続いてステップ3fでは、上記ステップ3mで求められたoverが0であるか否か(over=0?)が判定される。この判定の結果、over=0、つまりすべてのスケールファクタバンドの量子化歪みがマスキングレベル以下であれば、繰り返しループから抜け出してステップ3gに移行する。そして、このステップ3gにおいて、このときのスケールファクタが保存される。また、符号化に使用されたビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降の符号化のためにビット保存に蓄積される。
【0056】
一方、上記ステップ3fの比較の結果、あるスケールファクタバンドで量子化歪みがマスキングレベルを超えていた(over!=0)とする。この場合には、ステップ3iによりスケールファクタの修正が可能であるか否かが判定される。そして、すべてのスケールファクタが上限を越えずに修正可能ならば、ステップ3jによりこれらのスケールファクタを増加するように修正が行われる。そして、この修正後にステップ3dに戻り、以後すべてのスケールファクタバンドの量子化歪みが許容範囲内になるまで、ステップ3d乃至ステップ3jによる量子化及び可変長符号化処理の繰り返しループが実行される。
【0057】
上記繰り返しループにおいて、設定ビットレートが高く利用可能な最大ビット数が十分にある場合には、量子化歪みが許容範囲内のスケールファクタの組み合わせが見つかる。これに対し、設定ビットレートが低く利用可能なビット数が少ない場合には、上記ループが繰り返されてスケールファクタが上限値に達してしまう。ステップ3iにおいてスケールファクタが上限値を超えて修正不可能と判定された場合には、ステップ3pにより準最適なスケールファクタの組み合わせが元の値に復帰される。またそれと共に、符号化に使用したビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降のフレームの符号化のためにビット保存に蓄積される。
【0058】
以上述べたように第2の実施形態では、ステップ3n、ステップ3o、ステップ3f、ステップ3i及びステップ3pを実行することにより、ループ内において量子化歪みがマスキングレベルを超えているスケールファクタバンド数(over)が最小(over_min)となるときのスケールファクタが保存され、すべてのスケールファクタバンドにおいて量子化歪みをマスキングレベル以下にするスケールファクタの組み合わせが見つからない場合には、上記保存されたスケールファクタから準最適なスケールファクタの組み合わせが得られる。
【0059】
このため、設定ビットレートが低く、かつ利用可能な最大ビット数が十分でないことが原因で、すべてのスケールファクタバンドにおいて量子化歪みをマスキングレベル以下にするスケールファクタの組み合わせが見つからない場合でも、準最適なスケールファクタを用いて符号化が行われる。
【0060】
したがって、第2の実施形態によれば、第1の実施形態で述べた左右両チャネル間における利用可能最大ビット数(max_bits)の偏重の解消と相俟って、入力オーディオ信号ASのオーディオ符号化の品質劣化をさらに効果的に回避することができる。また、第2の実施形態であれば、スケールファクタバンド数を比較するだけの比較的簡単な処理により、準最適なスケールファクタの組み合わせが得られる利点がある。
【0061】
(第3の実施形態)
この発明の第3の実施形態は、マスキングレベルを満たさない帯域を少なくするためにスケールファクタバンド幅は非一様、つまり低域が狭く広域になるほど広くなるように設定される点に着目する。そして、量子化/可変長符号化/バッファ制御の繰り返しループにおいて、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める際に、量子化歪みがマスキングレベルを超えるスケールファクタバンドのバンド幅の合計が最小となるときのスケールファクタを保持しておく。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合に、上記保持されているスケールファクタをもとに準最適なスケールファクタの組み合わせを求めるようにしたものである。
【0062】
図5は、この第3の実施形態に係わるオーディオ符号化器による、量子化/可変長符号化/バッファ制御の繰り返しループの処理手順と処理内容を示すフローチャートである。なお、同図において前記図3と同一部分には同一符号を付して詳しい説明は省略する。また、オーディオ符号化器の構成についても図1と同一なので、ここでの説明は省略する。
【0063】
ステップ3mにおいて量子化歪みがマスキングレベルを超えているスケールファクタバンド数(over)が算出されると、ステップ5aでは、上記量子化歪みがマスキングレベルを超えているすべてのスケールファクタバンドのバンド幅の合計(width)が算出される。次にステップ5bにおいて、上記算出されたwidthが最小値(width_min)と比較される。この比較の結果、width<width_minであれば、ステップ5cによりwidth_minが上記算出されたwidthに更新される。またそれと共に、ステップ5cにおいて、現在のスケールファクタが準最適なスケールファクタとして保存される。
【0064】
続いてステップ3fでは、上記ステップ3mで求められたoverが0であるか否か(over=0?)が判定される。この判定の結果、over=0、つまりすべてのスケールファクタバンドの量子化歪みがマスキングレベル以下であれば、繰り返しループから抜け出してステップ3gに移行する。そして、このステップ3gにおいて、このときのスケールファクタが保存される。また、符号化に使用されたビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降の符号化のためにビット保存に蓄積される。
【0065】
一方、上記ステップ3fの比較の結果、あるスケールファクタバンドで量子化歪みがマスキングレベルを超えていた(over!=0)とする。この場合には、ステップ3iによりスケールファクタの修正が可能であるか否かが判定される。そして、すべてのスケールファクタが上限を越えずに修正可能ならば、ステップ3jによりこれらのスケールファクタを増加するように修正が行われる。そして、この修正後にステップ3dに戻り、以後すべてのスケールファクタバンドの量子化歪みが許容範囲内になるまで、ステップ3d乃至ステップ3jによる量子化及び可変長符号化処理の繰り返しループが実行される。
【0066】
上記繰り返しループにおいて、設定ビットレートが高く利用可能な最大ビット数が十分にある場合には、量子化歪みが許容範囲内のスケールファクタの組み合わせが見つかる。これに対し、設定ビットレートが低く利用可能なビット数が少ない場合には、上記ループが繰り返されてスケールファクタが上限値に達してしまう。ステップ3iにおいてスケールファクタが上限値を超えて修正不可能と判定された場合には、ステップ5dにより準最適なスケールファクタの組み合わせが元の値に復帰される。またそれと共に、符号化に使用したビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降のフレームの符号化のためにビット保存に蓄積される。
【0067】
以上のように第3の実施形態では、ステップ5a、ステップ5b及びステップ5cを実行することにより、ループ内において量子化歪みがマスキングレベルを超えているすべてのスケールファクタバンドのバンド幅の合計(width)が最小(width_min)となるときのスケールファクタが保存される。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、上記保存されたスケールファクタが準最適なスケールファクタの組み合わせとして量子化及び符号化の処理に供される。
【0068】
このため、前記第2の実施形態と同様に、設定ビットレートが低く、かつ利用可能な最大ビット数が十分でないことが原因で、すべてのスケールファクタバンドにおいて量子化歪みをマスキングレベル以下にするスケールファクタの組み合わせが見つからない場合でも、準最適なスケールファクタを用いて符号化が行われることになる。
【0069】
したがって、第3の実施形態においても、第1の実施形態で述べた左右両チャネル間における利用可能最大ビット数(max_bits)の偏重の解消と相俟って、入力オーディオ信号ASのオーディオ符号化の品質劣化を効果的に回避することができる。また、バンド幅の狭いスケールファクタバンド、つまりオーディオ信号の低域成分を重要視した量子化及び符号化処理を行うことが可能となる。
【0070】
(第4の実施形態)
この発明の第4の実施形態は、量子化/可変長符号化/バッファ制御の繰り返しループにおいて、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める際に、量子化歪みがマスキングレベルを超えるスケールファクタバンドの量子化歪みの誤差の合計が最小のときのスケールファクタを保持しておく。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されているスケールファクタをもとに準最適なスケールファクタの組み合わせを求めるものである。
【0071】
図6は、この第4の実施形態に係わるオーディオ符号化器による、量子化/可変長符号化/バッファ制御の繰り返しループの処理手順と処理内容を示すフローチャートである。なお、同図において前記図3と同一部分には同一符号を付して詳しい説明は省略する。また、オーディオ符号化器の構成についても図1と同一なので、ここでの説明は省略する。
【0072】
ステップ3mにおいて量子化歪みがマスキングレベルを超えているスケールファクタバンド数(over)が算出されると、ステップ6aでは、上記量子化歪みがマスキングレベルを超えているすべてのスケールファクタバンドの、量子化歪みとマスキングレベルとの差の絶対値(|量子化歪み−マスキングレベル|)の合計(maskerr)が算出される。すなわち、量子化歪みがマスキングレベルを超えるスケールファクタバンドの量子化歪みの誤差の合計が算出される。次にステップ6bにおいて、上記算出されたmaskerrが最小値(maskerr_min)と比較される。この比較の結果、maskerr<maskerr_minであれば、ステップ6cによりmaskerr_minが上記算出されたmaskerrに更新される。またそれと共に、ステップ6cにおいて、現在のスケールファクタが準最適なスケールファクタとして保存される。
【0073】
続いてステップ3fでは、上記ステップ3mで求められたoverが0であるか否か(over=0?)が判定される。この判定の結果、over=0、つまりすべてのスケールファクタバンドの量子化歪みがマスキングレベル以下であれば、繰り返しループから抜け出してステップ3gに移行する。そして、このステップ3gにおいて、このときのスケールファクタが保存される。また、符号化に使用されたビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降の符号化のためにビット保存に蓄積される。
【0074】
一方、上記ステップ3fの比較の結果、あるスケールファクタバンドで量子化歪みがマスキングレベルを超えていた(over!=0)とする。この場合には、ステップ3iによりスケールファクタの修正が可能であるか否かが判定される。そして、すべてのスケールファクタが上限を越えずに修正可能ならば、ステップ3jによりこれらのスケールファクタを増加するように修正が行われる。そして、この修正後にステップ3dに戻り、以後すべてのスケールファクタバンドの量子化歪みが許容範囲内になるまで、ステップ3d乃至ステップ3jによる量子化及び可変長符号化処理の繰り返しループが実行される。
【0075】
上記繰り返しループにおいて、設定ビットレートが高く利用可能な最大ビット数が十分にある場合には、量子化歪みが許容範囲内のスケールファクタの組み合わせが見つかる。これに対し、設定ビットレートが低く利用可能なビット数が少ない場合には、上記ループが繰り返されてスケールファクタが上限値に達してしまう。ステップ3iにおいてスケールファクタが上限値を超えて修正不可能と判定された場合には、ステップ6dにより準最適なスケールファクタの組み合わせが元の値に復帰される。またそれと共に、符号化に使用したビット数がステップ3hで計算され、この使用ビット数と利用可能な最大ビット数との差(未使用ビット数)が、次フレーム以降のフレームの符号化のためにビット保存に蓄積される。
【0076】
以上のように第4の実施形態では、ステップ6a、ステップ6b及びステップ6cを実行することにより、ループ内において量子化歪みがマスキングレベルを超えているすべてのスケールファクタバンドの|量子化歪み−マスキングレベル|の合計(maskerr)が最小(maskerr_min)となるときのスケールファクタが保存される。そして、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合に、上記保存されたスケールファクタが準最適なスケールファクタの組み合わせとして量子化及び符号化の処理に供される。
【0077】
このため、前記第2及び第3の実施形態と同様に、設定ビットレートが低く、かつ利用可能な最大ビット数が十分でないことが原因で、すべてのスケールファクタバンドにおいて量子化歪みをマスキングレベル以下にするスケールファクタの組み合わせが見つからない場合でも、準最適なスケールファクタを用いて符号化が行われることになる。
【0078】
したがって、第4の実施形態においても、第1の実施形態で述べた左右両チャネル間における利用可能最大ビット数(max_bits)の偏重の解消と相俟って、入力オーディオ信号ASのオーディオ符号化の品質劣化を効果的に回避することができる。また、量子化歪みが最適化され、量子化歪みが最小となるように量子化及び符号化処理が行われることになる。
【0079】
(その他の実施形態)
上記第1の実施形態では、左右両チャネル間のパワー比を求め、このパワー比をもとにフレームごとに利用可能な最大ビット数を制御するようにした。しかし、それに限るものではなく、左右両チャネル間の心理聴覚エントロピーの比を求め、この求められた心理聴覚エントロピーの比をもとにフレームごとに利用可能な最大ビット数を制御するようにしてもよい。このとき、上記心理聴覚エントロピーの比は、以下の式により求めることが可能である。
sum_pe = x_pe[0] + x_pe[1] (6)
x_ratio[ch] = x_pe[ch] / sum_pe ch=0 ,1 (7)
【0080】
なお、チャネル間の情報量の相違を検出する手段は、パワー比や心理聴覚エントロピーの比以外に、パワーの差や心理聴覚エントロピーの差を求めるようにしてもよく、さらにはその他の要素の相違を検出するようにしてもよい。
【0081】
また、前記各実施形態では、左右2チャネルからなるオーディオ信号を符号化する場合を例にとって説明したが、3チャネル以上のオーディオ信号を符号化する場合にもこの発明は適用可能である。
【0082】
さらに、前記各実施形態では、繰り返しループの処理をプログラムの実行により実現する場合を例にとって説明したが、ハードウエアで実現することも可能である。
【0083】
その他、オーディオ符号化器の構成、繰り返しループの処理手順とその内容、チャネル間の情報量の相違を検出する手段などについても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
【0084】
【発明の効果】
以上詳述したようにこの発明では、複数チャネルからなるオーディオ信号を、可変長符号化方式とビット保存技術を使用して符号化するオーディオ符号化器とその符号化プログラムにおいて、入力された上記オーディオ信号の各チャネル間における情報量の相違を検出し、その検出結果に基づいて、上記オーディオ信号の各フレームに割り当てる利用可能ビット数を補正する。そして、上記各チャネルの信号に対し、上記補正された利用可能ビット数の範囲内で量子化処理及び可変長符号化処理を量子化歪みが所定量以下になるまで繰り返し実行し、この量子化処理及び可変長符号化処理により得られた結果をオーディオビットストリームにフォーマット化するようにしている。
【0085】
したがってこの発明によれば、ステレオ信号のように複数チャネルを有するオーディオ信号を符号化する場合に、設定されたビットレートが低く利用可能な最大ビット数が十分でない場合であっても、複数のチャネルの各々にそれぞれ適当なビット数を割り当てることができ、これによりチャネル間における符号化品質のばらつきを低減することができるオーディオ符号化器とその符号化処理プログラムを提供することができる。
【図面の簡単な説明】
【図1】 この発明に係わるオーディオ符号化器の第1の実施形態を示す機能ブロック図。
【図2】 図1に示したオーディオ符号化器による繰り返しループの全体の処理手順と処理内容を示すフローチャート。
【図3】 図1に示したオーディオ符号化器による繰り返しループのサブルーチンの処理手順と処理内容を示すフローチャート。
【図4】 この発明に係わるオーディオ符号化器の第2の実施形態による量子化/可変長符号化/バッファ制御の繰り返しループの処理手順と処理内容を示すフローチャート。
【図5】 この発明に係わるオーディオ符号化器の第3の実施形態による量子化/可変長符号化/バッファ制御の繰り返しループのサブルーチンの処理手順と処理内容を示すフローチャート。
【図6】 この発明に係わるオーディオ符号化器の第4の実施形態による量子化/可変長符号化/バッファ制御の繰り返しループのサブルーチンの処理手順と処理内容を示すフローチャート。
【符号の説明】
1…ハイブリッドフィルタバンク、2…心理聴覚分析部、3…繰り返しループ、4…ビットストリーム形成部、11…サブバンド分析フィルタバンク、12…適応ブロック長MDCT、13…折り返し歪み削減バタフライ、21…高速フーリエ変換部(FFT)、22…非予測可能性測定部、23…SMR計算部、24…心理聴覚エントロピー評価部、31…非線形量子化部、32…スケールファクタ計算部、33…バッファ制御部、34…ハフマン符号化部、35…サイド情報符号化部。
Claims (10)
- 複数チャネルからなるオーディオ信号を、可変長符号化方式によりビット保存を使用して符号化するオーディオ符号化器において、
前記ビット保存に蓄えられているビット数と、入力された前記オーディオ信号に対する心理聴覚分析の結果に基づき付加ビット数を求め、この求められた付加ビット数を、設定されたビットレートに基づく1フレームあたりの平均ビット数に加算することにより、前記オーディオ信号のフレームごとに符号化に利用可能なビット数を決定するビット割当て手段と、
前記入力されたオーディオ信号のチャネル間におけるパワー比を検出する検出手段と、
前記検出手段により検出されたチャネル間のパワー比を、前記ビット割当て手段により決定される利用可能ビット数のうちの前記付加ビット数に乗算することにより、当該付加ビット数を補正する補正手段と、
前記入力されたオーディオ信号をスケールファクタに基づいて量子化及び可変長符号化する処理を、前記補正された利用可能ビット数の範囲内で、量子化歪みがマスキングレベル以下になるまで繰り返し実行する繰り返しループ手段と、
前記量子化処理及び可変長符号化処理の繰り返し実行により得られた結果を含むオーディオビットストリームを形成する手段とを具備したことを特徴とするオーディオ符号化器。 - 複数チャネルからなるオーディオ信号を、可変長符号化方式によりビット保存を使用して符号化するオーディオ符号化器において、
前記ビット保存に蓄えられているビット数と、入力された前記オーディオ信号に対する心理聴覚分析の結果に基づき、付加ビット数を求め、この求められた付加ビット数を、設定されたビットレートに基づく1フレームあたりの平均ビット数に加算することにより、前記オーディオ信号のフレームごとに符号化に利用可能なビット数を決定するビット割当て手段と、
前記心理聴覚分析の結果に基づいて、入力された前記オーディオ信号の各チャネル間の心理聴覚エントロピーの比を検出する検出手段と、
前記検出手段により検出されたチャネル間の心理聴覚エントロピーの比を、前記ビット割当て手段により決定される利用可能ビット数のうち前記付加ビット数に乗算することにより当該付加ビット数を補正する補正手段と、
入力された前記オーディオ信号をスケールファクタに基づいて量子化及び可変長符号化する処理を、前記補正された利用可能ビット数の範囲内で、量子化歪みがマスキングレベル以下になるまで繰り返し実行する繰り返しループ手段と、
前記量子化処理及び可変長符号化処理の繰り返し実行により得られた結果を含むオーディオビットストリームを形成する手段とを具備したことを特徴とするオーディオ符号化器。 - 前記繰り返しループ手段は、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める処理手段を備え、
前記処理手段は、量子化歪みがマスキングレベルを超えるスケールファクタバンド数が最小となるときのスケールファクタを保持し、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されたスケールファクタをもとに準最適なスケールファクタの組み合わせを求めることを特徴とする請求項1又は2記載のオーディオ符号化器。 - 前記繰り返しループ手段は、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める処理手段を備え、
前記処理手段は、量子化歪みがマスキングレベルを超えるスケールファクタバンドのバンド幅に応じて重み付けされた値の合計が最小となるときのスケールファクタを保持し、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されたスケールファクタをもとに準最適なスケールファクタの組み合わせを求めることを特徴とする請求項1又は2記載のオーディオ符号化器。 - 前記繰り返しループ手段は、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求める処理手段を備え、
前記処理手段は、量子化歪みがマスキングレベルを超えるスケールファクタバンドの、量子化歪みとマスキングレベルとの差の合計が最小のときのスケールファクタを保持し、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されたスケールファクタをもとに準最適なスケールファクタの組み合わせを求めることを特徴とする請求項1又は2記載のオーディオ符号化器。 - コンピュータを使用し、複数チャネルからなるオーディオ信号を可変長符号化方式によりビット保存を用いて符号化するオーディオ符号化器で使用される符号化処理プログラムにおいて、
前記入力されたオーディオ信号のチャネル間におけるパワー比を検出する処理ステップと、
前記ビット保存に蓄えられているビット数と、入力された前記オーディオ信号に対する心理聴覚分析の結果に基づき、付加ビット数を求め、この求められた付加ビット数を、設定されたビットレートに基づく1フレームあたりの平均ビット数に加算することにより、前記オーディオ信号のフレームごとに符号化に利用可能なビット数を決定する処理ステップと、
前記検出されたチャネル間のパワー比を、前記決定される利用可能ビット数のうちの前記付加ビット数に乗算することにより、当該付加ビット数を補正する処理ステップと、
前記入力されたオーディオ信号をスケールファクタに基づいて量子化及び可変長符号化する処理を、前記補正された利用可能ビット数の範囲内で、量子化歪みがマスキングレベル以下になるまで繰り返し実行する処理ステップと、
前記量子化処理及び可変長符号化処理の繰り返し実行により得られた結果を含むオーディオビットストリームを形成する処理ステップと
を、前記コンピュータに実行させることを特徴とするオーディオ信号の符号化処理プログラム。 - コンピュータを使用し、複数チャネルからなるオーディオ信号を可変長符号化方式によりビット保存を用いて符号化するオーディオ符号化器で使用される符号化処理プログラムにおいて、
心理聴覚分析の結果に基づいて、入力された前記オーディオ信号の各チャネル間の心理聴覚エントロピーの比を検出する処理ステップと、
前記ビット保存に蓄えられているビット数と、入力された前記オーディオ信号に対する心理聴覚分析の結果に基づき、付加ビット数を求め、この求められた付加ビット数を、設定されたビットレートに基づく1フレームあたりの平均ビット数に加算することにより、前記オーディオ信号のフレームごとに符号化に利用可能なビット数を決定する処理ステップと、
前記検出されたチャネル間の心理聴覚エントロピーの比を、前記決定される利用可能ビット数のうちの前記付加ビット数に乗算することにより当該付加ビット数を補正する処理ステップと、
前記入力されたオーディオ信号をスケールファクタに基づいて量子化及び可変長符号化する処理を、前記補正された利用可能ビット数の範囲内で、量子化歪みがマスキングレベル以下になるまで繰り返し実行する処理ステップと、
前記量子化処理及び可変長符号化処理の繰り返し実行により得られた結果を含むオーディオビットストリームを形成する処理ステップと
を、前記コンピュータに実行させることを特徴とするオーディオ信号の符号化処理プログラム。 - 前記繰り返し実行する処理ステップは、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求めるステップを含み、
前記最適なスケールファクタの組み合わせを求めるステップは、量子化歪みがマスキングレベルを超えるスケールファクタバンド数が最小となるときのスケールファクタを保持し、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されたスケールファクタをもとに準最適なスケールファクタの組み合わせを求めることを特徴とする請求項6又は7記載のオーディオ信号の符号化処理プログラム。 - 前記繰り返し実行する処理ステップは、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求めるステップを含み、
前記最適なスケールファクタの組み合わせを求めるステップは、量子化歪みがマスキングレベルを超えるスケールファクタバンドのバンド幅に応じて重み付けされた値の合計が最小となるときのスケールファクタを保持し、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されたスケールファクタをもとに準最適なスケールファクタの組み合わせを求めることを特徴とする請求項6又は7記載のオーディオ信号の符号化処理プログラム。 - 前記繰り返し実行する処理ステップは、スケールファクタを繰り返し修正して量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせを求めるステップを含み、
前記最適なスケールファクタの組み合わせを求めるステップは、量子化歪みがマスキングレベルを超えるスケールファクタバンドの、量子化歪みとマスキングレベルとの差の合計が最小のときのスケールファクタを保持し、すべてのスケールファクタバンドにおいて量子化歪みがマスキングレベル以下になる最適なスケールファクタの組み合わせが見つからなかった場合には、前記保持されたスケールファクタをもとに準最適なスケールファクタの組み合わせを求めることを特徴とする請求項6又は7記載のオーディオ信号の符号化処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003033915A JP3725876B2 (ja) | 2002-03-27 | 2003-02-12 | オーディオ符号化器とその符号化処理プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002089947 | 2002-03-27 | ||
JP2003033915A JP3725876B2 (ja) | 2002-03-27 | 2003-02-12 | オーディオ符号化器とその符号化処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004004554A JP2004004554A (ja) | 2004-01-08 |
JP3725876B2 true JP3725876B2 (ja) | 2005-12-14 |
Family
ID=30446173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003033915A Expired - Fee Related JP3725876B2 (ja) | 2002-03-27 | 2003-02-12 | オーディオ符号化器とその符号化処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3725876B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7516064B2 (en) * | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
-
2003
- 2003-02-12 JP JP2003033915A patent/JP3725876B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004004554A (ja) | 2004-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8612219B2 (en) | SBR encoder with high frequency parameter bit estimating and limiting | |
JP4212591B2 (ja) | オーディオ符号化装置 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
US7283967B2 (en) | Encoding device decoding device | |
US8019601B2 (en) | Audio coding device with two-stage quantization mechanism | |
US8032371B2 (en) | Determining scale factor values in encoding audio data with AAC | |
JP4142292B2 (ja) | オーディオ信号の符号化効率を向上させる方法 | |
US20070078646A1 (en) | Method and apparatus to encode/decode audio signal | |
JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
JP2011013560A (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
TW201324500A (zh) | 無損編碼方法、音訊編碼方法、無損解碼方法以及音訊解碼方法 | |
US8149927B2 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
US9131290B2 (en) | Audio coding device, audio coding method, and computer-readable recording medium storing audio coding computer program | |
KR20160055266A (ko) | 인코딩 방법 및 장치 | |
JP5609591B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP2004029761A (ja) | 音声信号を送信およびパックするためのデジタル符号化方法およびアーキテクチャ | |
WO2006054583A1 (ja) | オーディオ信号符号化装置および方法 | |
US20010050959A1 (en) | Encoder and communication device | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3725876B2 (ja) | オーディオ符号化器とその符号化処理プログラム | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
JP4062971B2 (ja) | オーディオ信号符号化方法 | |
JP3616307B2 (ja) | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 | |
JP4024185B2 (ja) | デジタルデータ符号化装置 | |
JP3454394B2 (ja) | 音声の準可逆符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050922 |
|
LAPS | Cancellation because of no payment of annual fees |