JP2003271199A - Audio signal encoding method and encoding device - Google Patents
Audio signal encoding method and encoding deviceInfo
- Publication number
- JP2003271199A JP2003271199A JP2002072667A JP2002072667A JP2003271199A JP 2003271199 A JP2003271199 A JP 2003271199A JP 2002072667 A JP2002072667 A JP 2002072667A JP 2002072667 A JP2002072667 A JP 2002072667A JP 2003271199 A JP2003271199 A JP 2003271199A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- scale factor
- value
- audio signal
- factor band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000005236 sound signal Effects 0.000 title claims abstract description 37
- 238000013139 quantization Methods 0.000 claims abstract description 29
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000006866 deterioration Effects 0.000 abstract description 6
- 230000014509 gene expression Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 10
- 108010071289 Factor XIII Proteins 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 2
- 102000005717 Myeloma Proteins Human genes 0.000 description 1
- 108010045503 Myeloma Proteins Proteins 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 効率的に符号化を行い、オーディオ符号化に
おいて、使用できるビット数が少ない場合にも検知され
る音質の劣化を軽減することができるオーディオ信号の
符号化方法及び符号化装置を提供することを目的とす
る。
【解決手段】 オーディオ信号の符号化方法において、
時間領域の信号を周波数領域の信号に変換する変換手順
と、前記変換ステップにて変換された周波数係数群を複
数の帯域で分割する分割手順と、ゲインと量子化値の積
で表現される周波数係数の値における前記ゲイン又は前
記量子化値をステップ状に制御する制御手順と、前記量
子化値を符号化する符号化手順とを有することにより上
記課題を解決する。
(57) Abstract: An audio signal encoding method capable of performing efficient encoding and reducing deterioration of detected sound quality even when the number of usable bits is small in audio encoding. It is an object to provide an encoding device. SOLUTION: In the encoding method of the audio signal,
A conversion procedure for converting a signal in the time domain into a signal in the frequency domain, a division procedure for dividing the frequency coefficient group converted in the conversion step into a plurality of bands, and a frequency expressed by a product of a gain and a quantization value. The above object is achieved by including a control procedure for controlling the gain or the quantization value in a coefficient value in a step-like manner and an encoding procedure for encoding the quantization value.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、オーディオ信号の
符号化方法及び符号化装置に係り、特に、効率的にオー
ディオ信号の符号化を行うためのオーディオ信号の符号
化方法及び符号化装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal encoding method and an encoding apparatus, and more particularly to an audio signal encoding method and an encoding apparatus for efficiently encoding an audio signal.
【0002】[0002]
【従来の技術】一般に、AAC(Advanced Audio Codin
g)符号化等に代表されるオーディオ信号の変換符号化
では、時間領域の信号を周波数領域のDCT(Discrete
Cosine Transform)係数に変換する。また、符号化す
る場合にDCT係数の値をスケールファクターと呼ばれ
る量子化精度を制御する値(以下、スケールファクター
値という)と量子化値の積で表現し、ハフマン符号等の
符号語により符号化が行われる。ここで、量子化値と
は、DCT係数を浮動小数点形式で表現した場合の仮数
値を指し、スケールファクター値は、指数値に対応する
値を表す。また、指数部自体をゲインと呼ぶ。ここで、
上述の関係を簡単な数式で表現すると、DCT係数を
K、量子化値をR、スケールファクター値をS、ゲイン
をGSとすると、K=R×GSとなる。2. Description of the Related Art Generally, AAC (Advanced Audio Codin
g) In transform coding of an audio signal typified by coding, a time domain signal is converted into a frequency domain DCT (Discrete
Cosine Transform) Convert to coefficient. Also, when encoding, the value of the DCT coefficient is expressed by the product of a value that controls the quantization accuracy called scale factor (hereinafter referred to as scale factor value) and the quantized value, and is encoded by a code word such as Huffman code. Is done. Here, the quantized value refers to a mantissa value when the DCT coefficient is represented in a floating point format, and the scale factor value represents a value corresponding to the exponent value. Further, the exponent part itself is called a gain. here,
If the above relationship is expressed by a simple mathematical expression, K = R × G S , where DCT coefficient is K, quantized value is R, scale factor value is S, and gain is G S.
【0003】また、その他のオーディオ符号化方式とし
ては、国際標準機関であるISO/IEC JTC1/
SC29/WG11で標準化されたISO/IEC 1
3818(MPEG−2)がある。この標準方式は、符
号化されたビットストリーム(圧縮データ)の解釈とそ
の復号処理について規定しているだけであるため、符号
化でのビット割当てに関する処理については自由に行う
ことができる。Another audio encoding system is ISO / IEC JTC1 / which is an international standard organization.
ISO / IEC 1 standardized by SC29 / WG11
3818 (MPEG-2). Since this standard system only defines the interpretation of a coded bit stream (compressed data) and its decoding process, the process related to bit allocation in coding can be freely performed.
【0004】ところで、オーディオ信号の符号化におい
て、符号化に使用できるビット数が不足している場合、
聴覚的に許された量子化ノイズよりも大きな量子化ノイ
ズが発生するビット配分が行われるため、周波数領域全
体の量子化歪みが大きくなり、符号化の劣化が検知され
ることがある。By the way, in encoding an audio signal, when the number of bits available for encoding is insufficient,
Bit allocation is performed in which quantization noise larger than that permitted perceptually is generated, so that quantization distortion in the entire frequency domain becomes large, and deterioration of coding may be detected.
【0005】そこで、従来の技術では、必要な量子化ビ
ット数に足りない場合に各周波数係数群のゲインを決定
するスケールファクター値を1ずつ変化させて最適値を
求め、その値に基づいて符号化を行う符号化方法が提案
されている。Therefore, in the prior art, when the required number of quantization bits is insufficient, the scale factor value that determines the gain of each frequency coefficient group is changed by 1 to obtain an optimum value, and the code is coded based on that value. An encoding method for performing encoding has been proposed.
【0006】上述の方法により、符号化に必要な量子化
ビット数を算出して割当てることができる。By the above method, the number of quantization bits required for encoding can be calculated and assigned.
【0007】[0007]
【発明が解決しようとする課題】しかしながら、上述の
量子化ビットの割当て方法は、スケールファクター値を
1ずつ変化させる度に量子化値、及び必要なビット数を
再計算するため、計算量が膨大になってしまう。また、
符号語に変換際の効率的なビット配分という点に関して
考慮されていないので音質劣化の一因となっている。However, in the above-mentioned method of assigning quantized bits, the quantized value and the required number of bits are recalculated each time the scale factor value is changed by 1, so that the calculation amount is enormous. Become. Also,
This is one of the causes of sound quality deterioration because no consideration is given to efficient bit allocation when converting to codewords.
【0008】また、これまでは、割当ての決定をフレー
ム全体のビット数で判断し、特に大きな量子化値に割当
てるビット数の効率は考慮されていなかった。そのた
め、帯域によってはビット数の過不足で音質が劣化して
しまうことがあった。Up to now, the efficiency of the number of bits to be assigned to a large quantized value has not been taken into consideration by making the determination of the assignment based on the number of bits of the entire frame. Therefore, depending on the band, the sound quality may be deteriorated due to the excess or deficiency of the number of bits.
【0009】本発明は、上述した問題に鑑みなされたも
のであり、効率的に符号化を行いオーディオ符号化にお
いて、使用できるビット数が少ない場合にも検知される
音質の劣化を軽減することができるオーディオ信号の符
号化方法及び符号化装置を提供することを目的とする。The present invention has been made in view of the above-mentioned problems, and it is possible to reduce the deterioration of the sound quality that is detected even when the number of bits that can be used is small in audio encoding by performing efficient encoding. An object of the present invention is to provide an audio signal encoding method and an audio signal encoding apparatus which can be performed.
【0010】[0010]
【課題を解決するための手段】上記課題を解決するため
に、本件発明は、以下の特徴を有する課題を解決するた
めの手段を採用している。In order to solve the above problems, the present invention employs means for solving the problems having the following features.
【0011】請求項1に記載された発明は、オーディオ
信号の符号化方法において、時間領域の信号を周波数領
域の信号に変換する変換手順と、前記変換ステップにて
変換された周波数係数群を複数の帯域で分割する分割手
順と、ゲインと量子化値の積で表現される周波数係数の
値における前記ゲイン又は前記量子化値をステップ状に
制御する制御手順と、前記量子化値を符号化する符号化
手順とを有することを特徴とする。According to a first aspect of the invention, in the audio signal encoding method, a plurality of conversion procedures for converting a time domain signal into a frequency domain signal and a plurality of frequency coefficient groups converted in the conversion step are provided. , A division procedure for dividing in the band, a control procedure for stepwise controlling the gain or the quantized value in the value of the frequency coefficient represented by the product of the gain and the quantized value, and encoding the quantized value. And an encoding procedure.
【0012】請求項1記載の発明によれば、ゲイン又は
量子化値をステップ状に制御することにより、ビット数
を削減することができる。また、削減できたビットは、
音質にとって重要な部分に割当てることが可能であるた
め、相対的に聴覚的な音質を向上させることができる。According to the first aspect of the invention, the number of bits can be reduced by controlling the gain or the quantized value stepwise. Also, the bits that have been reduced are
Since it can be assigned to a portion that is important for sound quality, it is possible to improve a relatively audible sound quality.
【0013】請求項2に記載された発明は、前記ゲイン
をスケールファクターバンド毎に設定し、当該スケール
ファクターバンド内で最大の周波数係数の符号語が最大
の量子化値になるように符号化を行うことを特徴とす
る。According to a second aspect of the present invention, the gain is set for each scale factor band, and encoding is performed so that the code word of the maximum frequency coefficient in the scale factor band has the maximum quantization value. It is characterized by performing.
【0014】請求項2記載の発明によれば、ゲインの値
をハフマン符号化等の符号語に基づいて量子化値を決定
するため、符号語の長さを短くすることができ、結果と
してビット数を削減することができる。According to the second aspect of the present invention, since the quantized value of the gain value is determined based on the code word of Huffman coding or the like, the length of the code word can be shortened and, as a result, the bit value can be reduced. The number can be reduced.
【0015】請求項3に記載された発明は、前記ゲイン
をスケールファクターバンド毎に設定し、当該スケール
ファクターバンド内で最大の周波数係数の符号語の量子
化値を1又は任意の整数とすることを特徴とする。According to a third aspect of the present invention, the gain is set for each scale factor band, and the quantization value of the code word of the maximum frequency coefficient in the scale factor band is set to 1 or any integer. Is characterized by.
【0016】請求項3記載の発明によれば、スケールフ
ァクターバンド毎の音質を判断して必要な量子化値を設
定することで、符号化の制御を容易に行うことができ
る。According to the third aspect of the present invention, it is possible to easily control the encoding by determining the sound quality for each scale factor band and setting the required quantization value.
【0017】請求項4に記載された発明は、オーディオ
信号にMSステレオを適用した場合、前記スケールファ
クターバンドにおけるM成分とS成分のエナジー、若し
くは最大周波数係数の大きさ、又は聴覚エントロピーを
用いて、スケールファクターバンド内のM成分とS成分
夫々の最大周波数係数として異なる量子化値を用いるこ
とを特徴とする。According to a fourth aspect of the present invention, when MS stereo is applied to an audio signal, the energy of the M and S components in the scale factor band, or the magnitude of the maximum frequency coefficient, or the auditory entropy is used. , And different quantized values are used as the maximum frequency coefficients of the M component and the S component in the scale factor band.
【0018】請求項4記載の発明によれば、MSステレ
オを用いて、M成分、S成分毎にビット数を別々に割り
振ることができ、ビット数を減らした符号化を行うこと
ができる。According to the invention described in claim 4, the number of bits can be separately allocated to each of the M component and the S component by using the MS stereo, and the encoding with the reduced number of bits can be performed.
【0019】請求項5に記載された発明は、オーディオ
信号の符号化装置において、時間領域の信号を周波数領
域の信号に変換する変換手段と、前記変換ステップにて
変換された周波数係数群を複数の帯域で分割する分割手
段と、ゲインと量子化値の積で表現される周波数係数の
値における前記ゲイン又は前記量子化値をステップ状に
制御する制御手段と、前記量子化値を符号化する符号化
手段とを有することを特徴とする。According to a fifth aspect of the present invention, in the audio signal encoding device, a plurality of converting means for converting a time domain signal into a frequency domain signal and a plurality of frequency coefficient groups converted in the converting step are provided. Division means for dividing in the band of, the control means for controlling the gain or the quantized value in the value of the frequency coefficient represented by the product of the gain and the quantized value in steps, and encoding the quantized value. And an encoding unit.
【0020】請求項5記載の発明によれば、ゲイン又は
量子化値をステップ状に制御することにより、ビット数
を削減することができる。また、削減できたビットは、
音質にとって重要な部分に割当てることが可能であるた
め、相対的に聴覚的な音質を向上させることができる。According to the fifth aspect of the invention, the number of bits can be reduced by controlling the gain or the quantized value stepwise. Also, the bits that have been reduced are
Since it can be assigned to a portion that is important for sound quality, it is possible to improve a relatively audible sound quality.
【0021】請求項6に記載された発明は、前記制御手
段は、前記ゲインをスケールファクターバンド毎に設定
し、前記符号化手段は、当該スケールファクターバンド
内で最大の周波数係数の符号語が最大の量子化値になる
ように符号化を行うことを特徴とする。According to a sixth aspect of the present invention, the control means sets the gain for each scale factor band, and the encoding means has a maximum code word of a frequency coefficient within the scale factor band. The encoding is performed so that the quantized value of
【0022】請求項6記載の発明によれば、ゲインの値
をハフマン符号化等の符号語に基づいて量子化値を決定
するため、符号語の長さを短くすることができ、結果と
してビット数を削減することができる。According to the invention of claim 6, since the quantized value of the gain value is determined based on the code word of Huffman coding or the like, the length of the code word can be shortened, and as a result, the bit value can be reduced. The number can be reduced.
【0023】請求項7に記載された発明は、前記制御手
段は、前記ゲインをスケールファクターバンド毎に設定
し、前記符号化手段は、当該スケールファクターバンド
内で最大の周波数係数の符号語の量子化値を1又は任意
の整数とすることを特徴とする。In a seventh aspect of the present invention, the control means sets the gain for each scale factor band, and the encoding means quantizes a code word having a maximum frequency coefficient in the scale factor band. The characteristic value is 1 or an arbitrary integer.
【0024】請求項7記載の発明によれば、スケールフ
ァクターバンド毎の音質を判断して必要な量子化値を設
定することで、符号化の制御を容易に行うことができ
る。According to the seventh aspect of the invention, it is possible to easily control the coding by determining the sound quality for each scale factor band and setting the required quantization value.
【0025】請求項8に記載された発明は、オーディオ
信号にMSステレオを適用した場合、前記スケールファ
クターバンドにおけるM成分とS成分のエナジー、若し
くは最大周波数係数の大きさ、又は聴覚エントロピーを
用いて、スケールファクターバンド内のM成分とS成分
夫々の最大周波数係数として異なる量子化値を用いるこ
とを特徴とする。In the invention described in claim 8, when MS stereo is applied to an audio signal, the energy of the M component and the S component in the scale factor band, or the magnitude of the maximum frequency coefficient, or the auditory entropy is used. , And different quantized values are used as the maximum frequency coefficients of the M component and the S component in the scale factor band.
【0026】請求項8記載の発明によれば、MSステレ
オを用いて、M成分、S成分毎にビット数を別々に割り
振ることができ、ビット数を減らした符号化を行うこと
ができる。According to the invention described in claim 8, the number of bits can be separately allocated to each of the M component and the S component by using the MS stereo, and the encoding with the reduced number of bits can be performed.
【0027】請求項9に記載された発明は、符号化方法
が異なる複数の符号化手段と、スケールファクターバン
ド毎の必要なビットレート数に基づいて、前記複数の符
号化手段の中から1つの符号化手段を評価・選択する評
価・選択手段を有することを特徴する。According to a ninth aspect of the present invention, one of the plurality of encoding means is selected based on a plurality of encoding means having different encoding methods and the required number of bit rates for each scale factor band. It is characterized by having an evaluation / selection means for evaluating / selecting the encoding means.
【0028】請求項9記載の発明によれば、ビット数を
最小に減らすことができる符号化手段を用いることで、
効率的に符号化を行うことができる。According to the ninth aspect of the invention, by using the encoding means capable of reducing the number of bits to a minimum,
Encoding can be performed efficiently.
【0029】[0029]
【発明の実施の形態】本発明は、DCT変換により、4
9個のスケールファクターバンドから出力される周波数
係数の量子化精度を制御してビット数を減らし、効率的
にハフマン符号等による符号化を行い、オーディオ符号
化において使用できるビット数が少ない場合でも検知さ
れる音質の劣化を軽減させることを主眼とする。BEST MODE FOR CARRYING OUT THE INVENTION The present invention uses a DCT transformation to
Controls the quantization accuracy of the frequency coefficients output from the 9 scale factor bands to reduce the number of bits, efficiently encodes using Huffman code, and detects even when the number of bits that can be used in audio encoding is small. The main purpose is to reduce the deterioration of the sound quality.
【0030】また、各帯域周波数群の量子化値の値をハ
フマン符号に代表される符号語への変換を行う際、その
周波数帯域(バンド)内の最大量子化値によって異なる
符号語のテーブル或いは数式を使用するという特徴を利
用する。例えば、AACの場合は、11のハフマン符号
語テーブルを持っているが、夫々のテーブルの量子化値
の最大値は飛び飛びの値(例えば、16,12,7,
4,2,1)となっている。この最大値を考慮してビッ
ト数を割当てることで、効率的な符号化を行う。When converting the quantized value of each band frequency group into a code word represented by a Huffman code, a table of code words different depending on the maximum quantized value in the frequency band (band) or Utilizes the feature of using mathematical formulas. For example, AAC has 11 Huffman codeword tables, but the maximum quantized value of each table is a discrete value (for example, 16, 12, 7,
4, 2, 1). By assigning the number of bits in consideration of this maximum value, efficient encoding is performed.
【0031】ここで、上述した11種類のハフマン符号
語テーブルの一例を図1に示す。図1に示すテーブル
は、0から80まで(81種類)の「index」と、
「length」と、「codeword(16進
数)」とで構成されている。「index」に対応する
「length」と「codeword」を用いてステ
ップ毎にビット数を調整することで、ビット数を減少さ
せて伝送効率のよいオーディオ信号を生成することがで
きる。Here, an example of the 11 kinds of Huffman code word tables described above is shown in FIG. The table shown in FIG. 1 has 0 to 80 (81 types) of "index",
It is composed of "length" and "codeword (hexadecimal number)". By adjusting the number of bits for each step using “length” and “codeword” corresponding to “index”, it is possible to reduce the number of bits and generate an audio signal with good transmission efficiency.
【0032】例えば、符号化ビットが不足している場合
を考えた場合に、あるスケールファクターでの最大量子
化値が、例えば「12」であったとする。この時スケー
ルファクター値を1ずつ変化させるのでなく、最大量子
化値が「7」となるようにすることにより、量子化誤差
は大きくなるかわりに、符号化される周波数係数を減ら
すことができる。また、最大量子化係数が小さくなった
場合、それぞれのハフマン符号に割当てられる符号語の
長さも短くなることが期待され、結果としてビット数を
削減する効果が期待できる。こうした手法により,削減
できたビットは音質にとって重要な部分に割当てること
も可態であるため相対的に聴覚的な音質を向上させるこ
とができる。For example, when considering the case where the number of encoded bits is insufficient, it is assumed that the maximum quantized value at a certain scale factor is, for example, "12". At this time, the maximum quantization value is set to "7" instead of changing the scale factor value by one, so that the frequency error to be encoded can be reduced although the quantization error increases. Further, when the maximum quantization coefficient becomes small, it is expected that the length of the code word assigned to each Huffman code also becomes short, and as a result, the effect of reducing the number of bits can be expected. By such a method, it is possible to allocate the reduced bits to the important parts for the sound quality, so that the relatively perceptual sound quality can be improved.
【0033】また、スケールファクター値を1ずつ変化
させる手法と比較すると、スケールファクター値を大き
く変化させる場合が多いことから計算量を減らすことが
できる。上述した内容により、音質を劣化させずにビッ
ト数を削減することができる。Further, as compared with the method of changing the scale factor value by one, the amount of calculation can be reduced since the scale factor value is often changed greatly. With the contents described above, the number of bits can be reduced without deteriorating the sound quality.
【0034】次に、本発明における実施の形態につい
て、図面に基づいて説明する。なお、実施例では、20
48サンプルを1024本のDCT係数に変換した例で
説明する。Next, embodiments of the present invention will be described with reference to the drawings. In the example, 20
An example in which 48 samples are converted into 1024 DCT coefficients will be described.
【0035】図2は、本発明における符号化装置の構成
を示すブロック図の一例である。FIG. 2 is an example of a block diagram showing the configuration of the encoding apparatus according to the present invention.
【0036】図2の符号化装置は、聴覚モデル11と、
フィルターバンク12と、スケールファクター13と、
量子化器14と、ノイズレスコーディング15と、レー
ト/歪みコントローラ16と、ステップ制御コントロー
ラ17と、ビットストリームマルチプレクサ18とを有
するように構成されている。The encoding apparatus shown in FIG. 2 includes an auditory model 11,
Filter bank 12, scale factor 13,
It is configured to have a quantizer 14, noiseless coding 15, a rate / distortion controller 16, a step control controller 17, and a bitstream multiplexer 18.
【0037】図1において、聴覚モデル11は、入力さ
れる音声信号の量子化雑音のマスキングパターンの計算
を行う。つまり、音声信号の聴覚的なマスキングスレシ
ョルドの計算を行う。In FIG. 1, the auditory model 11 calculates a masking pattern of quantization noise of an input voice signal. That is, the auditory masking threshold of the audio signal is calculated.
【0038】更に具体的に説明すれば、後述するフィル
ターバンクでのDCTの分析位置と一致するように、入
力される音声信号をFFT(Fast Fourier Transform)
を用いて分析し、音声信号がマスキングできる最大のノ
イズ量(スレッシュホールド)を計算して、スケールフ
ァクターバンド毎のSignal to Mask比とスレッシュホー
ルド値を出力する。また、ロング、スタート、ストッ
プ、ショートのどのブロックタイプを選択するかの結果
を出力する。なお、上述した聴覚モデルの詳細は、IS
O/IEC 13817−7ANNEX B2章 ENC
ORDER 2.1Psychoacoustic Mo
delに記載されている。More specifically, the input audio signal is FFT (Fast Fourier Transform) so as to coincide with the DCT analysis position in the filter bank described later.
The maximum amount of noise (threshold) that can be masked by the voice signal is calculated by using, and the Signal to Mask ratio and threshold value for each scale factor band are output. It also outputs the result of whether to select the long, start, stop, or short block type. For details of the above-mentioned auditory model, see IS
O / IEC 13817-7 ANNEX B2 Chapter ENC
ORDER 2.1 Psychoacoustic Mo
It is described in del.
【0039】フィルターバンク12は、入力される音声
信号の時間領域の信号をFFT変換或いは、DCT変換
等を使用して周波数領域の信号に変換する。The filter bank 12 transforms the input voice signal in the time domain into a signal in the frequency domain using FFT transformation or DCT transformation.
【0040】ここで、変換方法について更に具体的に説
明すると、AACにおける符号化の基本処理は、エンコ
ーダにおいて、時間領域の信号を周波数領域の信号に変
換する。また、逆にデコーダにおいて、周波数領域の信
号を時間領域の信号に変換することである。これをMD
CT(Modified Discrete Cosine Transform)及びIM
DCT(Inverse Modified Discrete Cosine Transfor
m)によって実行している。また、MDCT、IMDC
Tにはブロック歪みを減少させるためにTDAC(時間
領域折り返し歪み除去技術)を利用する。The conversion method will be described more specifically. In the basic processing of encoding in AAC, an encoder converts a time domain signal into a frequency domain signal. On the contrary, in the decoder, the signal in the frequency domain is converted into the signal in the time domain. MD this
CT (Modified Discrete Cosine Transform) and IM
DCT (Inverse Modified Discrete Cosine Transfor
m) running by. In addition, MDCT, IMDC
For T, TDAC (time domain aliasing distortion removal technique) is used to reduce block distortion.
【0041】なお、詳細は、ISO/IEC 1381
7−7ANNEX B2章 ENCORDER 2.3 F
ilterbank and block switch
ingに記載されている。For details, refer to ISO / IEC 1381.
7-7 ANNEX B2 Chapter ENCORDER 2.3 F
ilterbank and block switch
It is described in ing.
【0042】スケールファクター13は、周波数係数を
変換するゲインを表現するスケールファクター値を作成
する。The scale factor 13 creates a scale factor value expressing a gain for converting a frequency coefficient.
【0043】ここで、スケールファクター値を示した一
例の数式を式(1)に示す。Here, an example of the formula showing the scale factor value is shown in the formula (1).
【0044】[0044]
【数1】
なお、scf[sb]は、sb番目のスケールファクター
バンドのスケールファクター値であり、この値を量子化
器14に出力する。また、QUANT_STEPは、ス
テップ制御コントローラ17から入力される量子化ステ
ップ値である。また、common_scfは補正項で
あり、例えば、100がセットされる。式(1)内のp
ow_spectrum[sb]は、フィルターバンク1
2より入力される値mdct[sb]を用いて、式(2)
のように計算する。[Equation 1] Note that scf [sb] is the scale factor value of the sbth scale factor band, and this value is output to the quantizer 14. QUANT_STEP is a quantization step value input from the step controller 17. Also, common_scf is a correction term, and for example, 100 is set. P in equation (1)
ow_spectrum [sb] is the filter bank 1
Using the value mdct [sb] input from 2, the formula (2)
Calculate as.
【0045】[0045]
【数2】
なお、式(2)のmdct[sb]は、sb番目のスケー
ルファクターバンド内の任意のmdct係数であり、例
えば、最大のmdct値が設定される。[Equation 2] Note that mdct [sb] in the equation (2) is an arbitrary mdct coefficient in the sbth scale factor band, and for example, the maximum mdct value is set.
【0046】量子化器14は、周波数係数を量子化値に
変換する。なお、変換手段は、詳細は、ISO/IEC
13817−7ANNEX B2章 ENCORDER
2.7 Quantizationに記載されている。
具体的には、式(3)、式(4)に示すような数式で表
現される。The quantizer 14 converts the frequency coefficient into a quantized value. The details of the conversion means are ISO / IEC.
13817-7 ANNEX B2 Chapter ENCORDER
2.7 Quantization.
Specifically, it is expressed by a mathematical expression as shown in Expressions (3) and (4).
【0047】[0047]
【数3】
ここで、x_quant[i]は、i番目のインデックス
(図1の「index」)を持つ周波数係数の量子化値
であり、ノイズレスコーディング15に出力される。ま
た、mdct_line[i]は、フィルターバンクでD
CT変換されたi番目のインデックスをもつ係数であ
り、スケールファクター13より入力される。また、M
AGIC_NUMBERには、一般値として0.405
4(固定値)がセットされる。[Equation 3] Here, x_quant [i] is the quantized value of the frequency coefficient having the i-th index (“index” in FIG. 1) and is output to the noiseless coding 15. Also, mdct_line [i] is a filter bank D
The coefficient is the CT-transformed i-th index and is input from the scale factor 13. Also, M
0.405 as a general value for AGIC_NUMBER
4 (fixed value) is set.
【0048】ノイズレスコーディング15は、ハフマン
符号化等、スケールファクター値、量子化値を符号語に
変換する。詳細は、ISO/IEC 13817−7A
NNEX B2章 ENCORDER 2.8 Noise
less Codingに記載されている。また、参照
までに4つの係数をハフマン符号語に変換する一例の数
式の手順をフローチャートを用いて説明する。なお、こ
こで、使用するハフマンコード表は、図1を用いるが、
ハフマンコード表は、発明の範囲においてこの限りでは
ない。The noiseless coding 15 converts scale factor values and quantized values into codewords such as Huffman coding. For details, see ISO / IEC 13817-7A.
NNEX B2 Chapter ENCORDER 2.8 Noise
It is described in less Coding. In addition, a procedure of an example of a mathematical expression for converting four coefficients into a Huffman code word will be described with reference to a flowchart before reference. The Huffman code table used here is as shown in FIG.
The Huffman code table is not limited to this within the scope of the invention.
【0049】図3は、ハフマン符号語に変換する処理の
流れをプログラム的に示す一例の図である。FIG. 3 is a diagram showing an example of the program flow of the process of converting to a Huffman code word.
【0050】図3において、スケールファクターバンド
毎に繰り返し処理を行う(S1)。まず、初期値をセッ
トして(S2)、offset(sb)からtop(sb)
になるまで、以下のS3からS8まで処理を行う(S
3)。また、4つの係数毎に処理を行うので、S3にお
ける増加分は+4となる。また、offset(sb)と
は、各スケールファクターバンドの下限のDCT係数の
インデックス(i)を表し、top(sb)はsbバンド
の上限のDCT係数のインデックスを表す。なお、上述
したsbとoffset(sb)とtop(sb)のDCT
係数のバンド分けの一例を図4に示す。図4に示すよう
に、1つのsbに対して、4つのDCT係数が割り振ら
れている(0〜1023の計1024本)。In FIG. 3, iterative processing is performed for each scale factor band (S1). First, the initial value is set (S2), and from offset (sb) to top (sb)
The following processes from S3 to S8 are performed until
3). Further, since the process is performed for each of the four coefficients, the increment in S3 is +4. Further, offset (sb) represents the index (i) of the lower limit DCT coefficient of each scale factor band, and top (sb) represents the index of the upper limit DCT coefficient of the sb band. The DCT of sb, offset (sb) and top (sb) described above
An example of band division of coefficients is shown in FIG. As shown in FIG. 4, four DCT coefficients are assigned to one sb (a total of 1024 0 to 1023).
【0051】次に、図1を参照するためのインデックス
を計算する(S4)。ここで、x_quant[i]とは
i番目の係数の量子化値であり、量子化器14から入力
される。S4にて計算されたindex値は、図1を参
照して、codeword(ハフマン符号)とtmpを
抽出する(S5、S6)。例えば、S4にてindex
が「10」とすると、codewordには「72」が
セットされtmp「7」がセットされる。また、量子化
値を符号化するのに必要なビット数の計算を行う(S
7)。S7の出力は、レート/歪みコントローラ16へ
出力する。これを、スケールファクターバンド毎(ステ
ップ毎)に分割した全ての帯域で繰り返し行うことによ
り、全ての係数をハフマン符号語に変換することができ
る(S8、S9)。Next, the index for referring to FIG. 1 is calculated (S4). Here, x_quant [i] is the quantized value of the i-th coefficient, and is input from the quantizer 14. For the index value calculated in S4, the codeword (Huffman code) and tmp are extracted with reference to FIG. 1 (S5, S6). For example, in S4, index
Is "10", the codeword is set to "72" and the tmp is set to "7". In addition, the number of bits required to encode the quantized value is calculated (S
7). The output of S7 is output to the rate / distortion controller 16. By repeating this for all bands divided for each scale factor band (for each step), all the coefficients can be converted into Huffman code words (S8, S9).
【0052】次に、レート/歪みコントローラ16と、
ステップ制御コントローラ17の動作について、数式の
フローチャートを用いて説明を行う。Next, the rate / distortion controller 16 and
The operation of the step controller 17 will be described with reference to a flowchart of mathematical expressions.
【0053】図5は、レート/歪みコントローラ及びス
テップ制御コントローラの動作の一例を示すフローチャ
ートである。FIG. 5 is a flow chart showing an example of the operation of the rate / distortion controller and the step controller.
【0054】図5において、ステップ制御コントローラ
17に設定してある値に基づいて、レート/歪みコント
ローラ16の動作を行う(S11)。なお、ステップ制
御コントローラに設定される値は、量子化値の最大値を
設定することが好ましい。なお、本発明では、設定した
値を{16,12,7,4,2,1}としたが、設定す
る値については、この限りではない。In FIG. 5, the rate / distortion controller 16 operates based on the value set in the step controller 17 (S11). The value set in the step controller is preferably the maximum value of the quantized value. In the present invention, the set value is set to {16,12,7,4,2,1}, but the set value is not limited to this.
【0055】まず、フィルターバンクでDCT変換され
たi番目のインデックスをもつ係数(mdct_lin
e[i]と聴覚モデルから入力される許容される量子化ノ
イズの大きさ(allwed_dist(sb))と比較
を行い(S13)、量子化ノイズの方が大きかった場
合、mdct_line[i]に0をセットする(S1
4)。これを、インデックスが最大になるまで、繰り返
し行う(S12、S15)。First, the coefficient (mdct_lin) having the i-th index that has been DCT-transformed by the filter bank
e (i) is compared with the size of the allowable quantization noise (allwed_dist (sb)) input from the auditory model (S13), and if the quantization noise is larger, 0 is set in mdct_line [i]. Set (S1
4). This is repeated until the index becomes maximum (S12, S15).
【0056】次に、レート/歪みの制御を行う。まず、
S11のSTEP_MATテーブルの添え字jを0(初
期化)にする(S16)。次に、スケールファクターバ
ンド内で使用できるビット数(average_bit
s)を、ビット数のカウント(bit_count())
が超えないで処理ができるかの判断をS17からS23
までの処理を繰り返し行うことで確認する(S17)。
なお、average_bitsは、予め設定してお
き、bit_count()は、ノイズレスコーディング
15で計算されたビット数の総和であり、スケールファ
クター又はハフマンテーブルのコードブック番号等、伝
送のために必要なビット数も含む。Next, rate / distortion control is performed. First,
The subscript j in the STEP_MAT table in S11 is set to 0 (initialization) (S16). Next, the number of bits that can be used in the scale factor band (average_bit)
s) is the number of bits (bit_count ())
Is determined from S17 to S23.
This is confirmed by repeating the above process (S17).
It should be noted that average_bits is set in advance, and bit_count () is the sum of the number of bits calculated by the noiseless coding 15, and the number of bits required for transmission such as the scale factor or the codebook number of the Huffman table is also included. Including.
【0057】まず、QUANT_STEPに量子化値の
最大値をセットする(S18)。なお、S11の設定値
の大きい値からセットする。次に、スケールファクター
バンド毎に処理を行う(S19)。まず、スケールファ
クター値(calc_scale())の計算を行う(S
20)。計算されたスケールファクター値はスケールフ
ァクター13に出力される。また、S21では量子化値
(calc_quant())の計算を行い、量子化器1
4に出力される。First, the maximum quantized value is set in QUANT_STEP (S18). It should be noted that the setting value is set from a larger value in S11. Next, processing is performed for each scale factor band (S19). First, the scale factor value (calc_scale ()) is calculated (S
20). The calculated scale factor value is output to the scale factor 13. Further, in S21, the quantization value (calc_quant ()) is calculated, and the quantizer 1
4 is output.
【0058】これを、スケールファクターバンド毎に行
い(S22)、ビットカウント(bit_coun
t())がaverage_bitsを超なくなるまで、
繰り返し行う(S23)。This is performed for each scale factor band (S22), and the bit count (bit_count) is calculated.
until t ()) no longer exceeds average_bits,
Repeatedly (S23).
【0059】もし、average_bitsを超える
ことがあれば、必要なビット数を得ることができず、符
号化ができない場合や符号化した際に音質が歪んでしま
う等の問題が発生してしまうため、その場合は、ステッ
プ制御コントローラ内の量子化値の値を低く設定して再
度処理を行う。If the average_bits is exceeded, the required number of bits cannot be obtained, and there arises a problem that encoding cannot be performed or sound quality is distorted when encoded. In that case, the value of the quantized value in the step controller is set low and the process is performed again.
【0060】つまり、S17からS23の処理でS17
の条件に満たなければ、次の値(例えば、16がセット
されて条件に合わなければ12)がセットされ、再度S
17からS23までの処理を行う。このようにして、処
理を行い条件が最初にあったQUANT_STEPが最
適値ということになり、この値を用いて符号化すること
で、必要なビット数で最高の音質を得ることができる。That is, in the processing from S17 to S23, S17
If the condition is not satisfied, the next value (for example, 16 is set and 12 is set if the condition is not satisfied) is set, and S is again set.
The processing from 17 to S23 is performed. In this way, the QUANT_STEP having the first condition under the processing is the optimum value, and by encoding using this value, the highest sound quality can be obtained with the required number of bits.
【0061】図5で示したフローチャートにより、ゲイ
ン又は前記量子化値の最適値を求めることができる。The gain or the optimum value of the quantized value can be obtained by the flowchart shown in FIG.
【0062】次に、ビットストリームマルチプレクサ1
8で、入力された符号化データ及びスケールファクター
又はハフマンテーブルのコードブック番号等の制御情報
をビットストリームに変換する。これにより、オーディ
オ信号の符号化を効率よく行うことができる。なお、ビ
ットストリームマルチプレクサ18の詳細については、
ISO/IEC13817−7 1章 syntaxに記
載されている。つまり、符号化装置の各ブロックで出力
されたパラメータをsyntaxで詳解された形式に並
べ変えて出力する。Next, the bit stream multiplexer 1
At 8, the input coded data and the control information such as the scale factor or the codebook number of the Huffman table are converted into a bitstream. As a result, it is possible to efficiently encode the audio signal. For details of the bitstream multiplexer 18,
It is described in ISO / IEC13817-7 Chapter 1, syntax. That is, the parameters output from each block of the encoding device are rearranged into the format detailed in syntax and output.
【0063】また、符号化装置の各ブロックの動作内容
はこの限りではなく、また、同ブロックに関して違う数
式による計算をさせてもよい。The operation content of each block of the encoding device is not limited to this, and the calculation may be performed by different mathematical expressions for the same block.
【0064】例えば、式(1)を下記式(5)に変更す
ることにより、1又は複数のスケールファクターバンド
群で最大の周波数係数値に基づいて、スケールファクタ
ー値を導出してもよい。For example, the scale factor value may be derived based on the maximum frequency coefficient value in one or a plurality of scale factor band groups by changing the formula (1) into the following formula (5).
【0065】[0065]
【数4】
なお、max_pow[sbm,sbn]は式(6)で計
算することができる。[Equation 4] Note that max_pow [sbm, sbn] can be calculated by equation (6).
【0066】[0066]
【数5】
また、max_mdct[sbm,sbn]は、mからn
番目のスケールファクターバンド内で最大のMDCT係
数である(m、n:整数)。[Equation 5] Also, max_mdct [sbm, sbn] is from m to n
The largest MDCT coefficient in the second scale factor band (m, n: integer).
【0067】更に、式(1)を下記式(7)に変更する
ことにより、任意のスケールファクターバンドのスケー
ルファクター値を各スケールファクターバンドで最大の
周波数係数値を用いて、更に分子を1或いは任意の整数
値として導出することもできる。Further, by changing the expression (1) to the following expression (7), the scale factor value of an arbitrary scale factor band is used as the maximum frequency coefficient value in each scale factor band, and the numerator is further set to 1 or It can also be derived as an arbitrary integer value.
【0068】[0068]
【数6】
なお、式(7)のkの値を1或いは、n<QUANT_
STEPを満たす正の整数とする。また、max_po
w_spectrumは式(8)で計算することができ
る。[Equation 6] Note that the value of k in equation (7) is 1 or n <QUANT_
It is a positive integer that satisfies STEP. Also, max_po
w_spectrum can be calculated by equation (8).
【0069】[0069]
【数7】
これにより、オーディオ信号の符号化における音質の制
御を行うことができる。[Equation 7] Thereby, it is possible to control the sound quality in encoding the audio signal.
【0070】次に、本発明における符号化装置にMSコ
ントローラが具備された場合の符号化装置の動作例をブ
ロック構成図を用いて説明する。Next, an operation example of the encoding device in the case where the encoding device according to the present invention is equipped with the MS controller will be described with reference to a block diagram.
【0071】図6は、本発明におけるMSコントローラ
を含む符号化装置の構成を示すブロック図の一例であ
る。FIG. 6 is an example of a block diagram showing a configuration of an encoding device including an MS controller according to the present invention.
【0072】図6の符号化装置は、聴覚モデル11と、
スケールファクター13と、量子化器14と、ノイズレ
スコーディング15と、レート/歪みコントローラ16
と、ステップ制御コントローラ17と、ビットストリー
ムマルチプレクサ18と、MSコントローラ19と、M
/Sステレオツール20とを有するように構成されてい
る。The encoding apparatus shown in FIG. 6 includes an auditory model 11,
Scale factor 13, quantizer 14, noiseless coding 15, rate / distortion controller 16
, Step controller 17, bitstream multiplexer 18, MS controller 19, M
/ S stereo tool 20.
【0073】ここで、各ブロックの動作について、主に
図2を用いて説明した各ブロック説明とことなる部分の
説明を行う。Here, the operation of each block will be described with respect to parts different from the description of each block mainly with reference to FIG.
【0074】図6において、聴覚モデル11は、量子化
雑音のマスキングパターンの計算を行う。MSコントロ
ーラ19は、M/Sエントロピーの計算を行う。つま
り、時間周波数変換された係数からL成分、R成分、M
成分(L+R成分)、S成分(L−R成分)のエナジー
を計算し、聴覚モデル11から入力されるマスキングパ
ターンの計算結果やエンコードに必要なビット数等の出
力情報に基づいて、MSモード、LRモードの切替えの
判定、又はMSモード時のチャンネル間のビット割当て
のための補助情報を作成する。In FIG. 6, the auditory model 11 calculates a masking pattern of quantization noise. The MS controller 19 calculates M / S entropy. That is, from the time-frequency converted coefficients, the L component, R component, M
The energy of the component (L + R component) and the S component (LR component) are calculated, and based on the calculation result of the masking pattern input from the auditory model 11 and output information such as the number of bits required for encoding, the MS mode, Auxiliary information is created for determination of LR mode switching or bit allocation between channels in MS mode.
【0075】ここで、MSコントローラ19におけるエ
ナジーの計算によるMSモードとLRモードの判定内容
について説明する。まず、下記式(9)〜(12)に夫
々のスケールファクターバンドの係数のM成分、S成
分、L成分、R成分のエナジー(eM(sb)、eS(s
b)、eL(sb)、eR(sb))の計算式を示す。Here, the determination contents of the MS mode and the LR mode by the energy calculation in the MS controller 19 will be described. First, in the following equations (9) to (12), the energy (eM (sb), eS (s) of the M component, S component, L component, and R component of each scale factor band coefficient is calculated.
b), eL (sb), eR (sb)) are shown.
【0076】[0076]
【数8】
また、eM(sb)、eS(sb)、eL(sb)、及びeR
(sb)成分の夫々のエネルギー比を式(13)、(1
4)を用いて計算し、MSモードとLRモードの切替え
を行う判定式を式(15)に示す。[Equation 8] Also, eM (sb), eS (sb), eL (sb), and eR
The energy ratio of each of the (sb) components is calculated by using equations (13) and (1
Equation (15) shows the determination formula for switching between the MS mode and the LR mode calculated by using 4).
【0077】[0077]
【数9】
式(15)におけるkは正の定数であり、例えば、k=
1とする。[Equation 9] K in Expression (15) is a positive constant, for example, k =
Set to 1.
【0078】なお、MSモードとLSモードの切替え方
法は、この限りではなく、本出願人にて出願されている
特願2001−70926号「ステレオ信号の符号化方
法及び符号化装置」に記載されているように聴覚的なエ
ントロピーを使ってM/Sエントロピーの計算を行い、
その結果によりLRモードとMSモードの切替えを行う
こともできる。The method of switching between the MS mode and the LS mode is not limited to this, and is described in Japanese Patent Application No. 2001-70926 “Stereo signal encoding method and encoding apparatus” filed by the present applicant. As you can see, we use auditory entropy to calculate M / S entropy,
Depending on the result, it is possible to switch between the LR mode and the MS mode.
【0079】次に、MSモードが適用された場合のスケ
ールファクター13におけるM成分とS成分の夫々のス
ケールファクター値(scf_M[sb]、scf_S
[sb])を計算する計算式を式(16)、式(17)に
示す。Next, the scale factor values (scf_M [sb], scf_S of the M component and the S component in the scale factor 13 when the MS mode is applied).
The formulas for calculating [sb]) are shown in formulas (16) and (17).
【0080】[0080]
【数10】
なお、QUANT_M及びQUANT_Sは、M成分、
S成分の夫々の量子化ステップ値であり、レート/歪み
コントローラ16から入力される。[Equation 10] QUANT_M and QUANT_S are M components,
It is the quantization step value of each S component and is input from the rate / distortion controller 16.
【0081】次に、レート/歪みコントローラ16と、
ステップ制御コントローラ17のプログラム動作をフロ
ーチャートを用いて説明する。Next, the rate / distortion controller 16
The program operation of the step controller 17 will be described with reference to a flowchart.
【0082】図7は、MSコントローラを有する場合の
レート/歪みコントローラ及びステップ制御コントロー
ラの動作の一例を示すフローチャートである。なお、M
Sモード以外の場合は、図5と同様の動作を行うため説
明を省略する。FIG. 7 is a flow chart showing an example of the operation of the rate / distortion controller and the step control controller having the MS controller. In addition, M
The operations other than the S mode are the same as those in FIG.
【0083】図7において、ステップ制御コントローラ
17に設定してある値に基づいて、レート/歪みコント
ローラ16の動作を行う(S31)。まず、フィルター
バンク12でDCT変換されたi番目のインデックスを
持つM成分、S成分夫々の係数(dM[i]、dS[i])
と聴覚モデル11(MSコントロール)から入力される
許容されるM成分及びS成分の量子化ノイズの大きさ
(allwed_dist_M(sb)、allwed_
dist_S(sb))とM成分、S成分を対応させて比
較を行い、許容される量子化ノイズの方が大きかった場
合、dM[i]、dS[i]に0をセットする(S33〜S
37)。これを、インデックスが最大になるまで繰り返
し行う(S32、S37)。In FIG. 7, the rate / distortion controller 16 operates based on the value set in the step controller 17 (S31). First, the coefficients (dM [i], dS [i]) of the M component and the S component having the i-th index that are DCT-transformed by the filter bank 12 respectively.
And the magnitudes of allowable M and S component quantization noises input from the auditory model 11 (MS control) (allwed_dist_M (sb), allwed_
dist_S (sb)) is compared with the M component and the S component, and when the allowable quantization noise is larger, 0 is set to dM [i] and dS [i] (S33 to S).
37). This is repeated until the index becomes maximum (S32, S37).
【0084】次に、レート/歪みの制御を行う。まず、
S11のSTEP_MATテーブルの添え字jを0(初
期化)にする(S38)。次に、スケールファクターバ
ンド内で使用できるビット数(average_bit
s)を、ビット数のカウント(bit_count())
が超えないで処理ができるかの判断をS39からS45
までの処理を繰り返し行うことで確認する(S39)。Next, rate / distortion control is performed. First,
The subscript j of the STEP_MAT table in S11 is set to 0 (initialization) (S38). Next, the number of bits that can be used in the scale factor band (average_bit)
s) is the number of bits (bit_count ())
It is judged from S39 to S45 whether processing can be performed without exceeding
This is confirmed by repeating the above process (S39).
【0085】なお、average_bitsは、予め
設定しておき、bit_count()は、ノイズレスコ
ーディング15で計算されたビット数の総和であり、ス
ケールファクター又はハフマンテーブルのコードブック
番号等、伝送のために必要なビット数(制御情報分)も
含む。It should be noted that the average_bits is set in advance, and the bit_count () is the sum of the number of bits calculated by the noiseless coding 15, which is necessary for transmission such as the scale factor or the codebook number of the Huffman table. It also includes the number of bits (control information).
【0086】まず、QUANT_STEP_MとQUA
NT_STEP_SにS31で設定した量子化値の最大
値をセットする(S40)。First, QUANT_STEP_M and QUA
The maximum value of the quantized value set in S31 is set in NT_STEP_S (S40).
【0087】なお、S31の設定値の大きい値をQUA
NT_STEP_Mにセットする。同時に、その次に大
きい値をQUANT_STEP_Sにセットする。次
に、スケールファクターバンド毎に処理を行う(S4
1)。まず、スケールファクター値(calc_sca
le())の計算を行う(S42)。計算されたスケール
ファクター値はスケールファクター13に出力される。
また、S43では量子化値(calc_quant())
の計算を行い量子化器14に出力される。It should be noted that a large value of the set value of S31 is set to QUA.
Set to NT_STEP_M. At the same time, the next largest value is set in QUANT_STEP_S. Next, processing is performed for each scale factor band (S4
1). First, the scale factor value (calc_sca
le ()) is calculated (S42). The calculated scale factor value is output to the scale factor 13.
In S43, the quantized value (calc_quant ())
Is calculated and output to the quantizer 14.
【0088】これを、スケールファクターバンド毎に行
い(S44)、ビットカウント(bit_coun
t())がaverage_bitsを超なくなるまで繰
り返し行う(S45)。This is performed for each scale factor band (S44), and the bit count (bit_count) is calculated.
It is repeated until t () does not exceed average_bits (S45).
【0089】もし、average_bitsを超える
ことがあれば、必要なビット数を得ることができず、符
号化ができない場合や符号化した際に符号化音質が歪ん
でしまう等の問題が発生してしまうため、その場合は、
ステップ制御コントローラ内の量子化値の値を低く設定
して再度処理を行う。If the average_bits is exceeded, the required number of bits cannot be obtained, and there arises a problem that encoding cannot be performed or the encoded sound quality is distorted when encoded. So in that case,
The value of the quantized value in the step controller is set low and the process is performed again.
【0090】つまり、S39からS45の処理で条件に
満たなければ、次の値(例えば、16がセットされて条
件に合わなければ12)がセットされ、再度S39から
S45までの処理を繰り返し行う。このようにして処理
を行い条件が最初にあったQUANT_STEPが最適
値ということになり、この値を用いて符号化すること
で、必要なビット数で最高の音質を得ることができる。That is, if the conditions are not satisfied in the processes of S39 to S45, the next value (for example, 16 is set and 12 is not satisfied) is set, and the processes of S39 to S45 are repeated. In this way, the QUANT_STEP with the first condition is the optimum value, and by encoding using this value, the highest sound quality can be obtained with the required number of bits.
【0091】図7で示したフローチャートにより、M成
分及びS成分のゲイン又は前記量子化値の最適値を求め
ることができる。The gain of the M component and the S component or the optimum value of the quantized value can be obtained by the flowchart shown in FIG.
【0092】なお、図7で示したフローチャートは、全
スケールファクターバンドについてMSモードを適用し
た場合であるが、本発明においてはこの限りではなく、
例えば、MSモードとLSモードの判定をスケールファ
クターバンド毎に行うことで、スケールファクターバン
ド毎にモードの切替えを行い、効率的にゲイン及び量子
化値の最適値を求めることができる。The flow chart shown in FIG. 7 shows the case where the MS mode is applied to all scale factor bands, but the present invention is not limited to this.
For example, by determining the MS mode and the LS mode for each scale factor band, the mode can be switched for each scale factor band, and the optimum values of the gain and the quantized value can be efficiently obtained.
【0093】MSステレオツール20は、周波数帯域の
信号の和信号(L+R)、と差信号(L−R)を作成
し、MSコントローラ19からの制御信号によりMSモ
ード或いはLRモードの切替えを行う。また、MSモー
ドのバンドの係数は、LR成分の夫々のmdct_li
ne[i]をdL(i)、dR(i)として、dM(i)、dS
(i)は夫々式(18)、式(19)で計算することがで
きる。The MS stereo tool 20 creates a sum signal (L + R) and a difference signal (LR) of frequency band signals, and switches between the MS mode and the LR mode by a control signal from the MS controller 19. The coefficient of the band in the MS mode is mdct_li of each LR component.
Let ne [i] be dL (i), dR (i), dM (i), dS
(i) can be calculated by equations (18) and (19), respectively.
【0094】[0094]
【数11】
なお、その他の各ブロックは、図2のブロック説明と同
様であるため、詳細な説明は省略する。[Equation 11] Note that the other blocks are the same as the block description in FIG. 2, and thus detailed description will be omitted.
【0095】上述により、任意のスケールファクターバ
ンドにMSステレオを適用した場合、スケールファクタ
ーバンドにおけるM成分とS成分のエナジー若しくは最
大周波数係数の大きさ、又は聴覚エントロピーに基づい
て、同じインデックス番号を持つスケールファクターバ
ンドのM成分とS成分の夫々の最大周波数係数の量子化
値を異なる大きさにすることができ、ビット数を成分に
より調整することができるため効率的なオーディオ信号
の符号化が可能となる。As described above, when MS stereo is applied to an arbitrary scale factor band, it has the same index number based on the magnitude of the energy or maximum frequency coefficient of the M component and S component in the scale factor band, or the auditory entropy. Since the quantized values of the maximum frequency coefficients of the M component and S component of the scale factor band can be made different and the number of bits can be adjusted by the component, efficient audio signal encoding is possible. Becomes
【0096】また、スケールファクターバンド毎にMS
モードとLSモードの判定及び切替えを行うことで、更
に効率的なオーディオ信号の符号化を行うことができ
る。In addition, MS for each scale factor band
By determining and switching between the mode and the LS mode, more efficient audio signal encoding can be performed.
【0097】なお、図2、図6における各ブロックの動
作内容は上述した限りではなく、同一ブロックに関して
違う数式による計算をさせてもよい。The operation contents of each block in FIG. 2 and FIG. 6 are not limited to those described above, and the same block may be calculated by different mathematical expressions.
【0098】例えば、スケールファクター13におい
て、スケールファクター値を求める計算式、式(5)と
式(7)とを所定の条件で分けて処理をさせてもよい。
ここで、一例として、条件1とした場合の数式を式(2
0)に、また、条件2とした場合の数式を式(21)に
示す。For example, in the scale factor 13, the calculation formula for obtaining the scale factor value, the formula (5) and the formula (7) may be divided and processed under predetermined conditions.
Here, as an example, the mathematical expression under the condition 1 is expressed by the formula (2
0) and the mathematical expression under the condition 2 are shown in Expression (21).
【0099】[0099]
【数12】 [Equation 12]
【0100】[0100]
【数13】
なお、scf_I[sb]は、条件1の場合のsb番目の
スケールファクター値を示し、scf_II[sb]は、
条件2の場合のsb番目のスケールファクター値を示
す。[Equation 13] Note that scf_I [sb] represents the sb-th scale factor value under condition 1, and scf_II [sb] is
The sb-th scale factor value in the case of condition 2 is shown.
【0101】なお、切替える条件としては、量子化器1
4の数式による計算式(式(3)、式(4))におい
て、最初に条件1としてx_quant[i]を計算し
て、全てのスケールファクターバンドにおける量子化値
が0になった場合に、条件2に変更するように制御を行
う。The condition for switching is that the quantizer 1
In the calculation formulas (Formulas (3) and (4)) based on Formula 4, when x_quant [i] is first calculated as the condition 1 and the quantized values in all scale factor bands become 0, The control is performed so that the condition 2 is changed.
【0102】次に、条件1及び2を含む符号化装置のレ
ート/歪みコントローラ16と、ステップコントローラ
17の動作について、数式のフローチャートを用いて説
明を行う。Next, the operation of the rate / distortion controller 16 and the step controller 17 of the coding apparatus including the conditions 1 and 2 will be described with reference to a flow chart of mathematical expressions.
【0103】図8、図9は、切替え条件を有するレート
/歪みコントローラ及びステップ制御コントローラの動
作の一例を示すフローチャートである。ここで、図8に
おいて、S51からS56までの処理は、図5に示した
S11からS16と同様であるため、ここでの説明は省
略する。8 and 9 are flow charts showing an example of the operations of the rate / distortion controller and the step controller having the switching condition. Here, in FIG. 8, the processing from S51 to S56 is the same as the processing from S11 to S16 shown in FIG. 5, so description thereof will be omitted here.
【0104】レート/歪みの制御において、スケールフ
ァクターバンド内で使用できるビット数(averag
e_bits)を、ビット数のカウント(bit_co
unt())が超えないで処理ができるかの判断を条件1
と条件2への切替え処理を含めて、S57からS72ま
での処理を繰り返し行うことで確認する(S57)。In rate / distortion control, the number of bits available in the scale factor band (averag)
e_bits) is a bit number count (bit_co
Condition 1 to judge whether processing can be performed without exceeding unt ())
This is confirmed by repeating the processing from S57 to S72 including the processing for switching to Condition 2 and (S57).
【0105】なお、average_bitsは、予め
設定しておき、bit_count()は、ノイズレスコ
ーディング15で計算されたビット数の総和であり、ス
ケールファクター又はハフマンテーブルのコードブック
番号等、伝送のために必要なビット数も含む。It should be noted that the average_bits is set in advance, and the bit_count () is the sum of the number of bits calculated by the noiseless coding 15, and is necessary for transmission such as the scale factor or the codebook number of the Huffman table. Including the number of bits.
【0106】まず、QUANT_STEPに量子化値の
最大値をセットする(S58)。次に、分割した全ての
スケールファクターバンドについて処理を行う(S5
9)。まず、初期値としてflag[sb]に1をセット
する(S60)。次に、条件1の数式(式(20))に
て、sb番目のスケールファクターバンドのスケールフ
ァクター値(scf[sb])を求め(S61)、量子化
値(calc_quant())の計算を行う(S6
2)。First, the maximum quantized value is set in QUANT_STEP (S58). Next, processing is performed on all the divided scale factor bands (S5).
9). First, 1 is set to flag [sb] as an initial value (S60). Next, the scale factor value (scf [sb]) of the sb-th scale factor band is obtained by the mathematical expression (Equation (20)) of Condition 1 (S61), and the quantized value (calc_quant ()) is calculated. (S6
2).
【0107】次に、flag[sb]に0をセットし(S
63)、S62までに計算された量子化値がoffse
t(sb)からtop(sb)までで全て0か否かを確認を
行う(S64〜S67)。最初に、量子化値が0か否か
を判断し(S65)、0でない量子化値があればfla
g[sb]に1をセットする(S66)。Next, 0 is set in flag [sb] (S
63), the quantized value calculated up to S62 is offse
Whether t (sb) to top (sb) are all 0 is confirmed (S64 to S67). First, it is judged whether or not the quantized value is 0 (S65), and if there is a quantized value other than 0, fla is determined.
1 is set to g [sb] (S66).
【0108】次に、flag[sb]が0か否かを判断し
(S68)、0であれば、式(21)を用いてsb番目
のスケールファクターバンドのスケールファクター値を
計算する(S69)。S68にて「NO」の場合、又は
S69の処理が終了後、量子化値の計算を行う(S7
0)。これを、スケールファクターバンド毎に行い(S
71)、ビットカウント(bit_count())がa
verage_bitsを超なくなるまで繰り返し行う
(S72)。Next, it is judged whether or not flag [sb] is 0 (S68), and if it is 0, the scale factor value of the sbth scale factor band is calculated using the equation (21) (S69). . If "NO" in S68 or after the process of S69 is completed, the quantized value is calculated (S7).
0). Do this for each scale factor band (S
71) and the bit count (bit_count ()) is a
It is repeated until the number of average_bits is exceeded (S72).
【0109】もし、average_bitsを超える
ことがあれば、必要なビット数を得ることができず、符
号化ができない場合や符号化した際に音質が歪んでしま
う等の問題が発生してしまうため、その場合は、ステッ
プ制御コントローラ内の量子化値の値を低く設定して再
度処理を行う。If the average_bits is exceeded, the required number of bits cannot be obtained, and there arises a problem that the encoding cannot be performed or the sound quality is distorted when encoded. In that case, the value of the quantized value in the step controller is set low and the process is performed again.
【0110】図8、図9で示したフローチャートによ
り、ゲイン又は前記量子化値の最適値を求めることがで
きる。The gain or the optimum value of the quantized value can be obtained by the flow charts shown in FIGS. 8 and 9.
【0111】更に、符号化装置のその他のブロック構成
例として、上述した式(1)、式(6)、式(20)及
び式(21)の数式による計算を夫々行う量子化器14
を有する各モジュール(スケールファクター13、量子
化器14、ノイズレスコーディング15及びレート/歪
みコントローラ16及びステップ制御コントローラ1
7)を符号化装置内に具備し、その中でビットカウント
数が少ないもので符号化を行うことにより、効率よく符
号化を行うことができる。Further, as another block configuration example of the encoding device, the quantizer 14 which respectively performs the calculation by the formulas of the above formulas (1), (6), (20) and (21).
Each module having (scale factor 13, quantizer 14, noiseless coding 15, rate / distortion controller 16 and step controller 1
7) is provided in the encoding device, and the one having a small bit count is used for the encoding, whereby the encoding can be performed efficiently.
【0112】上述したモジュールを有する符号化装置の
各ブロック構成の一例について、図10を用いて説明す
る。An example of each block configuration of the coding apparatus having the above-mentioned module will be described with reference to FIG.
【0113】図10の符号化装置は、聴覚モデル11
と、MSコントローラ19と、フィルターバンク12
と、M/Sステレオツール20と、モジュールA21
と、モジュールB22と、モジュールC23と、評価・
選択部24と、ビットストリームマルチプレクサ18と
を有するよう構成されている。また、モジュールA21
とモジュールB22とモジュールC23の夫々のブロッ
クの構成例を図11に示す。The coding apparatus shown in FIG.
, MS controller 19 and filter bank 12
, M / S stereo tool 20, and module A21
, Module B22, module C23, evaluation
It is configured to have a selection unit 24 and a bitstream multiplexer 18. In addition, the module A21
FIG. 11 shows a configuration example of each block of the module B22 and the module C23.
【0114】ここで、例えば、モジュールA21には、
上述した条件1及び条件2による切替え(式(20)、
式(21)を行って量子化値を計算する上述の図8、図
9を用いて説明した動作を有し、モジュールB22に
は、式(7)及び式(8)の数式により量子化値を計算
する動作を有し、また、モジュールC23には、式
(5)、式(6)の数式により量子化値を計算する処理
を有する。Here, for example, in the module A21,
Switching according to the conditions 1 and 2 described above (equation (20),
The module B22 has the operation described with reference to FIGS. 8 and 9 for calculating the quantized value by performing the expression (21), and the module B22 uses the quantized value according to the expressions (7) and (8). In addition, the module C23 has a process of calculating a quantized value according to the formulas (5) and (6).
【0115】評価・選択部24は、モジュールA21、
モジュールB22及びモジュールCの出力に基づいて、
どのモジュールの制御信号とデータ信号をビットストリ
ームマルチプレクサ18に出力するかを評価し選択する
機能を有する。なお、評価は、モジュールA21、モジ
ュールB22及びモジュールC23から夫々出力された
使用ビット数と、各モジュールから出力されるデータを
比較して、使用ビット数とデータ量が最小となるモジュ
ールを用いて符号化を行う。The evaluation / selection unit 24 uses the module A21,
Based on the outputs of module B22 and module C,
It has a function of evaluating and selecting which module control signal and data signal are output to the bitstream multiplexer 18. The evaluation is performed by comparing the number of used bits output from each of the modules A21, B22, and C23 with the data output from each module, and using the module having the smallest number of used bits and the minimum data amount To convert.
【0116】図10に示すブロック構成により、多種多
様なオーディオ信号において、効率のよい符号化を選択
して符号化を行うことができる。With the block configuration shown in FIG. 10, efficient encoding can be selected and encoded for a wide variety of audio signals.
【0117】上述したように本発明は、例えば、符号化
ビットが不足している場合等にハフマン符号化等の符号
語の特徴に基づいて量子化値を選定し符号化を行うこと
により、符号語の長さを短くすることができ、同時にビ
ット数を削減することができる。本発明により、削減で
きたビットは、音質にとって重要な部分に割当てられる
ことが可能であるため、相対的に聴覚的な音質を向上さ
せることができる。As described above, according to the present invention, for example, when a coding bit is insufficient, a quantized value is selected based on the characteristics of a code word such as Huffman coding, and the coding is performed. The word length can be reduced and at the same time the number of bits can be reduced. According to the present invention, the reduced bits can be assigned to a portion that is important for sound quality, so that the relatively perceptual sound quality can be improved.
【0118】また、スケールファクター値を量子化値の
最大値に基づいて、従来より大きく変化させる場合が多
いことから、計算量を減少させることができる。なお、
こうした変換符号化の規格は、デコーダのsyntax
であるので、本発明でエンコードしたビットストリーム
も既存のデコーダでデコードすることができる。Further, since the scale factor value is often changed largely based on the maximum value of the quantized value, the calculation amount can be reduced. In addition,
The standard of such transform coding is syntax of the decoder.
Therefore, the bitstream encoded by the present invention can be decoded by the existing decoder.
【0119】なお、本発明にて用いられた動作内容のフ
ローは一例であり、発明の範囲においては上述した限り
ではない。Note that the flow of operation contents used in the present invention is an example, and is not limited to the above description within the scope of the invention.
【0120】[0120]
【発明の効果】上述の如く本発明によれば、オーディオ
信号の符号化を効率的に行い、使用できるビット数を削
減することができる。また、オーディオ符号化において
使用できるビット数が少ない場合にも検知される音質の
劣化を軽減することができる。As described above, according to the present invention, it is possible to efficiently encode an audio signal and reduce the number of usable bits. In addition, even when the number of bits that can be used in audio encoding is small, it is possible to reduce deterioration in detected sound quality.
【図1】ハフマン符号語テーブルの一例を示す図であ
る。FIG. 1 is a diagram showing an example of a Huffman codeword table.
【図2】本発明における符号化装置の構成を示すブロッ
ク図の一例である。FIG. 2 is an example of a block diagram showing a configuration of an encoding device according to the present invention.
【図3】ハフマン符号語に変換する処理の流れをプログ
ラム的に示す一例の図である。FIG. 3 is an example of programmatically showing a flow of processing for converting into a Huffman code word.
【図4】DCT係数のバンド分けの一例を示す図であ
る。FIG. 4 is a diagram showing an example of band division of DCT coefficients.
【図5】レート/歪みコントローラ及びステップ制御コ
ントローラの動作の一例を示すフローチャートである。FIG. 5 is a flowchart showing an example of operations of a rate / distortion controller and a step controller.
【図6】本発明におけるMSコントローラを含む符号化
装置の構成を示すブロック図の一例である。FIG. 6 is an example of a block diagram showing a configuration of an encoding device including an MS controller according to the present invention.
【図7】MSコントローラを有する場合のレート/歪み
コントローラ及びステップ制御コントローラの動作の一
例を示すフローチャートである。FIG. 7 is a flowchart showing an example of operations of a rate / distortion controller and a step control controller having an MS controller.
【図8】切替え条件を有するレート/歪みコントローラ
及びステップ制御コントローラの動作の一例を示すフロ
ーチャート(1)である。FIG. 8 is a flowchart (1) showing an example of operations of a rate / distortion controller having a switching condition and a step controller.
【図9】切替え条件を有するレート/歪みコントローラ
及びステップ制御コントローラの動作の一例を示すフロ
ーチャート(2)である。FIG. 9 is a flowchart (2) showing an example of the operations of the rate / distortion controller having a switching condition and the step controller.
【図10】モジュールを有する符号化装置の各ブロック
構成の一例を示す図である。FIG. 10 is a diagram showing an example of each block configuration of an encoding device having a module.
【図11】本発明における夫々のモジュールのブロック
構成例を示す図である。FIG. 11 is a diagram showing a block configuration example of each module in the present invention.
11 聴覚モデル 12 フィルターバンク 13 スケールファクター 14 量子化器 15 ノイズレスコーディング 16 レート/歪みコントローラ 17 ステップ制御コントローラ 18 ビットストリームマルチプレクサ 19 MSコントローラ 20 M/Sステレオツール 21 モジュールA 22 モジュールB 23 モジュールC 24 評価・選択部 11 Hearing model 12 filter banks 13 Scale factor 14 Quantizer 15 Noiseless coding 16 rate / distortion controller 17 step controller 18 bitstream multiplexer 19 MS controller 20 M / S Stereo Tool 21 Module A 22 Module B 23 Module C 24 Evaluation / Selection Section
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA20 5J064 AA02 BA09 BA16 BB05 BC01 BC08 BC09 BC11 BC16 BC23 BD01 ─────────────────────────────────────────────────── ─── Continued front page F-term (reference) 5D045 DA20 5J064 AA02 BA09 BA16 BB05 BC01 BC08 BC09 BC11 BC16 BC23 BD01
Claims (9)
と、 前記変換ステップにて変換された周波数係数群を複数の
帯域で分割する分割手順と、 ゲインと量子化値の積で表現される周波数係数の値にお
ける前記ゲイン又は前記量子化値をステップ状に制御す
る制御手順と、 前記量子化値を符号化する符号化手順とを有することを
特徴とするオーディオ信号の符号化方法。1. An audio signal encoding method, comprising: a conversion procedure for converting a time domain signal into a frequency domain signal; and a division procedure for dividing the frequency coefficient group converted in the conversion step into a plurality of bands. A control procedure for controlling the gain or the quantized value at a value of a frequency coefficient represented by a product of a gain and a quantized value in a stepwise manner, and an encoding procedure for encoding the quantized value. A characteristic audio signal encoding method.
毎に設定し、当該スケールファクターバンド内で最大の
周波数係数の符号語が最大の量子化値になるように符号
化を行うことを特徴とする請求項1に記載のオーディオ
信号の符号化方法。2. The gain is set for each scale factor band, and encoding is performed so that the code word of the maximum frequency coefficient in the scale factor band has the maximum quantized value. 1. The audio signal encoding method according to 1.
毎に設定し、当該スケールファクターバンド内で最大の
周波数係数の符号語の量子化値を1又は任意の整数とす
ることを特徴とする請求項1又は2に記載のオーディオ
信号の符号化方法。3. The gain is set for each scale factor band, and the quantization value of the code word of the maximum frequency coefficient in the scale factor band is set to 1 or an arbitrary integer. 2. The audio signal encoding method as described in 2.
た場合、 前記スケールファクターバンドにおけるM成分とS成分
のエナジー、若しくは最大周波数係数の大きさ、又は聴
覚エントロピーを用いて、スケールファクターバンド内
のM成分とS成分夫々の最大周波数係数として異なる量
子化値を用いることを特徴とする請求項2又は3に記載
のオーディオ信号の符号化方法。4. When MS stereo is applied to an audio signal, the energy of M component and S component in the scale factor band, or the magnitude of the maximum frequency coefficient, or the auditory entropy is used to determine the M component in the scale factor band. 4. The audio signal encoding method according to claim 2, wherein different quantization values are used as the maximum frequency coefficients of the S component and the S component, respectively.
と、 前記変換ステップにて変換された周波数係数群を複数の
帯域で分割する分割手段と、 ゲインと量子化値の積で表現される周波数係数の値にお
ける前記ゲイン又は前記量子化値をステップ状に制御す
る制御手段と、 前記量子化値を符号化する符号化手段とを有することを
特徴とするオーディオ信号の符号化装置。5. An audio signal coding apparatus, comprising: a transforming unit that transforms a time domain signal into a frequency domain signal; and a splitting unit that splits the frequency coefficient group transformed in the transforming step into a plurality of bands. A control unit that controls the gain or the quantized value at a value of a frequency coefficient represented by a product of a gain and a quantized value in a stepwise manner, and an encoding unit that encodes the quantized value. A characteristic audio signal encoding device.
ファクターバンド毎に設定し、前記符号化手段は、当該
スケールファクターバンド内で最大の周波数係数の符号
語が最大の量子化値になるように符号化を行うことを特
徴とする請求項5に記載のオーディオ信号の符号化装
置。6. The control means sets the gain for each scale factor band, and the encoding means sets the code word of the maximum frequency coefficient within the scale factor band to be the maximum quantized value. The audio signal encoding apparatus according to claim 5, wherein the audio signal encoding apparatus performs encoding.
ファクターバンド毎に設定し、前記符号化手段は、当該
スケールファクターバンド内で最大の周波数係数の符号
語の量子化値を1又は任意の整数とすることを特徴とす
る請求項5又は6に記載のオーディオ信号の符号化装
置。7. The control means sets the gain for each scale factor band, and the encoding means sets the quantized value of the code word of the maximum frequency coefficient in the scale factor band to 1 or an arbitrary integer. 7. The audio signal encoding device according to claim 5, wherein:
た場合、 前記スケールファクターバンドにおけるM成分とS成分
のエナジー、若しくは最大周波数係数の大きさ、又は聴
覚エントロピーを用いて、スケールファクターバンド内
のM成分とS成分夫々の最大周波数係数として異なる量
子化値を用いることを特徴とする請求項6又は7に記載
のオーディオ信号の符号化装置。8. When MS stereo is applied to an audio signal, the energy of M component and S component in the scale factor band, or the magnitude of the maximum frequency coefficient, or the auditory entropy is used to determine the M component in the scale factor band. 9. The audio signal coding apparatus according to claim 6, wherein different quantization values are used as the maximum frequency coefficients of the S component and the S component, respectively.
と、スケールファクターバンド毎の必要なビットレート
数に基づいて、前記複数の符号化手段の中から1つの符
号化手段を評価・選択する評価・選択手段を有すること
を特徴する請求項5乃至8の何れか一項に記載のオーデ
ィオ信号の符号化装置。9. One of the plurality of encoding means is evaluated / selected based on a plurality of encoding means having different encoding methods and a required number of bit rates for each scale factor band. 9. The audio signal encoding apparatus according to claim 5, further comprising an evaluation / selection unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002072667A JP2003271199A (en) | 2002-03-15 | 2002-03-15 | Audio signal encoding method and encoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002072667A JP2003271199A (en) | 2002-03-15 | 2002-03-15 | Audio signal encoding method and encoding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003271199A true JP2003271199A (en) | 2003-09-25 |
Family
ID=29202603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002072667A Pending JP2003271199A (en) | 2002-03-15 | 2002-03-15 | Audio signal encoding method and encoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003271199A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007183528A (en) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | Encoding apparatus, encoding method, and encoding program |
US7613605B2 (en) | 2004-11-18 | 2009-11-03 | Canon Kabushiki Kaisha | Audio signal encoding apparatus and method |
WO2021136344A1 (en) * | 2019-12-31 | 2021-07-08 | 华为技术有限公司 | Audio signal encoding and decoding method, and encoding and decoding apparatus |
-
2002
- 2002-03-15 JP JP2002072667A patent/JP2003271199A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613605B2 (en) | 2004-11-18 | 2009-11-03 | Canon Kabushiki Kaisha | Audio signal encoding apparatus and method |
JP2007183528A (en) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | Encoding apparatus, encoding method, and encoding program |
WO2021136344A1 (en) * | 2019-12-31 | 2021-07-08 | 华为技术有限公司 | Audio signal encoding and decoding method, and encoding and decoding apparatus |
CN113129913A (en) * | 2019-12-31 | 2021-07-16 | 华为技术有限公司 | Coding and decoding method and coding and decoding device for audio signal |
CN113129913B (en) * | 2019-12-31 | 2024-05-03 | 华为技术有限公司 | Encoding and decoding method and encoding and decoding device for audio signal |
US12272364B2 (en) | 2019-12-31 | 2025-04-08 | Huawei Technologies Co., Ltd. | Audio signal encoding method and apparatus, and audio signal decoding method and apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111656442B (en) | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding | |
JP4212591B2 (en) | Audio encoding device | |
US7212973B2 (en) | Encoding method, encoding apparatus, decoding method, decoding apparatus and program | |
EP2346029B1 (en) | Audio encoder, method for encoding an audio signal and corresponding computer program | |
EP2006840B1 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
CN100546233C (en) | Method and device for supporting multi-channel audio extension | |
JP4168976B2 (en) | Audio signal encoding apparatus and method | |
US8032371B2 (en) | Determining scale factor values in encoding audio data with AAC | |
WO1998000837A1 (en) | Audio signal coding and decoding methods and audio signal coder and decoder | |
JP2010538316A (en) | Improved transform coding of speech and audio signals | |
AU2011361945B2 (en) | Filing of non-coded sub-vectors in transform coded audio signals | |
CN117316168A (en) | Audio encoder and method for encoding an audio signal | |
CN1922656B (en) | Apparatus and method for determining quantizer step size | |
US20090132238A1 (en) | Efficient method for reusing scale factors to improve the efficiency of an audio encoder | |
JP4673882B2 (en) | Method and apparatus for determining an estimate | |
EP3175457B1 (en) | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals | |
JP2000151413A (en) | Adaptive dynamic variable bit allocation method in audio coding | |
US6678653B1 (en) | Apparatus and method for coding audio data at high speed using precision information | |
WO2006008817A1 (en) | Audio encoding apparatus and audio encoding method | |
JP2003233397A (en) | Device, program, and data transmission device for audio encoding | |
JP2003271199A (en) | Audio signal encoding method and encoding device | |
JP5379871B2 (en) | Quantization for audio coding | |
JP2002091498A (en) | Audio signal encoding device | |
JP4409733B2 (en) | Encoding apparatus, encoding method, and recording medium therefor | |
JP4721355B2 (en) | Coding rule conversion method and apparatus for coded data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040405 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060110 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061114 |