JP2898377B2 - Code-excited linear prediction encoder and decoder - Google Patents
Code-excited linear prediction encoder and decoderInfo
- Publication number
- JP2898377B2 JP2898377B2 JP2225250A JP22525090A JP2898377B2 JP 2898377 B2 JP2898377 B2 JP 2898377B2 JP 2225250 A JP2225250 A JP 2225250A JP 22525090 A JP22525090 A JP 22525090A JP 2898377 B2 JP2898377 B2 JP 2898377B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- vector
- fixed
- encoder
- point representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000013598 vector Substances 0.000 claims description 88
- 230000005284 excitation Effects 0.000 claims description 41
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 description 39
- 238000003786 synthesis reaction Methods 0.000 description 39
- 238000000034 method Methods 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は、原音声を符号化するコード励振線形予測符
号化器及びこれに対応する復号化器に関するものであ
る。Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a code-excited linear prediction encoder for encoding original speech and a decoder corresponding thereto.
[従来の技術] 音声情報はその情報量が多大であるため、伝送する場
合や認識処理する場合に、原音声を符号化して圧縮する
ようにしている。このような符号化方式の一つとして、
コード励振線形予測符号化方式が提案されている。例え
ば、下記文献に記載されている。[Prior Art] Since voice information has a large amount of information, an original voice is encoded and compressed when transmitting or performing recognition processing. As one of such encoding methods,
A code-excited linear predictive coding scheme has been proposed. For example, it is described in the following literature.
文献『M.R.Schroeder(シュロイダー)、B.S.Atal
(エイタル)共著、“Code−Excited Linear Predictio
n(CELP):High Quality Speech at Very Low Bit Rate
(コード励振線形予測:低ビットレートでの高品質音
声)":Proc.ICASSP,pp937−940,March 1985. 第2図は、このようなコード励振線形予測符号化器の
従来の概念図を示す。Literature [MRSchroeder, BSAtal
Co-author, "Code-Excited Linear Predictio"
n (CELP): High Quality Speech at Very Low Bit Rate
(Code Excited Linear Prediction: High Quality Speech at Low Bit Rate) ": Proc. ICASSP, pp937-940, March 1985. FIG. 2 shows a conventional conceptual diagram of such a code excited linear predictive encoder. .
第2図において、このコード励振線形予測符号化器10
の入力端子11には原音声ベクトルSが入力される。この
原音声ベクトルSは、原音声をサンプリングした際にお
ける隣接する複数のサンプルよりなるベクトルである
(なお、同一サンプルが複数のベクトルの要素になって
いても良く、また、1サンプルはいずれか一つのベクト
ルだけの要素になるようにしていても良い)。原音声ベ
クトルSは、短時間分析部12及び減算器18に与えられ
る。In FIG. 2, the code excitation linear predictive encoder 10
The original speech vector S is input to the input terminal 11. The original audio vector S is a vector composed of a plurality of adjacent samples when the original audio is sampled (the same sample may be an element of a plurality of vectors, and one sample is any one of the samples). It may be an element of only one vector). The original speech vector S is provided to the short-time analyzer 12 and the subtractor 18.
短時間分析部12は、原音声ベクトルSに対する短時間
予測係数αjを計算する。一例としては、短時間のLPC
分析によって短時間予測係数αjを計算する。短時間分
析部12は、このようにして得られた短時間予測係数αj
を短時間合成フィルタ13及び量子化器14に送出する。ま
た、短時間分析部12は、音声のフォルマント成分(短時
間成分)を除去したベクトルS1を長時間分析部15に送出
する。The short-time analysis unit 12 calculates a short-term prediction coefficient αj for the original speech vector S. One example is a short LPC
The short-term prediction coefficient αj is calculated by the analysis. The short-term analysis unit 12 calculates the short-term prediction coefficient αj thus obtained.
Is transmitted to the short-time synthesis filter 13 and the quantizer 14. In addition, the short-time analysis unit 12 sends the vector S1 from which the formant component (short-time component) of the voice has been removed to the long-time analysis unit 15.
長時間分析部15は、ベクトルS1に対して長時間分析
(分析の一例としてはLPC分析)を行ない、ピッチ予測
係数βと、ラグ(ピッチ周期)Lを計算し、長時間合成
フィルタ16及び量子化器14に送出する。The long-time analysis unit 15 performs a long-time analysis (LPC analysis as an example of the analysis) on the vector S1, calculates a pitch prediction coefficient β and a lag (pitch cycle) L, To the generator 14.
量子化器14は、短時間予測係数αj、ピッチ予測係数
β、ラグL及び後述する最適励振コードベクトルのイン
デックスIを量子化し、トータルコードCとして出力端
子112より出力する。The quantizer 14 quantizes the short-term prediction coefficient αj, the pitch prediction coefficient β, the lag L, and the index I of the optimal excitation code vector described later, and outputs the result from the output terminal 112 as a total code C.
量子化器14に与えられるインデックスIは、励振コー
ドテーブル17、長時間合成フィルタ16、短時間合成フィ
ルタ13、減算器18、知覚重み付けフィルタ19、2乗計算
部110及び平均操作部111の処理によって、次のように決
定される。The index I given to the quantizer 14 is obtained by the processing of the excitation code table 17, the long-time synthesis filter 16, the short-time synthesis filter 13, the subtractor 18, the perceptual weighting filter 19, the square calculation unit 110, and the average operation unit 111. Is determined as follows.
励振コードテーブル17には、各インデックスi(i=
1〜n)に対応付けられて励振コードベクトルeiが格納
されており、各励振コードベクトルeiは、時間順次に又
は一括的に長時間合成フィルタ16に与えられる。In the excitation code table 17, each index i (i =
Excitation code vectors ei are stored in association with 1 to n), and each excitation code vector ei is applied to the long-time synthesis filter 16 in time sequence or collectively.
長時間合成フィルタ16は、励振コードベクトルeiに対
して、ピッチ予測係数β及びラグLを用いて長時間分析
部15の逆処理(合成処理)を施し、処理出力ベクトルS
Tiを短時間合成フィルタ13に送出する。短時間合成フィ
ルタ13は、ベクトルSTiに対して、短時間予測係数αj
を用いて短時間分析部12の逆処理(合成処理)を行なっ
て処理出力ベクトルSWiを減算器18に送出する。The long-time synthesis filter 16 performs inverse processing (synthesis processing) of the long-time analysis unit 15 on the excitation code vector ei using the pitch prediction coefficient β and the lag L, and outputs the processed output vector S
The Ti is sent to the synthesis filter 13 for a short time. The short-time synthesis filter 13 generates a short-time prediction coefficient αj
And the inverse processing (synthesis processing) of the short-time analysis unit 12 is performed, and the processing output vector SWi is sent to the subtractor 18.
このn個の各ベクトルSWiは、各励振コードベクトル
eiにより合成した合成音(予測ベクトル)を意味するも
のであり、それぞれ原音声ベクトルSに対応する。Each of the n vectors SWi is represented by each excitation code vector
ei means a synthesized sound (prediction vector) synthesized by ei, and corresponds to the original speech vector S, respectively.
減算器18は、各予測ベクトルSWiと原音声ベクトルS
との成分単位の減算を行ない、得られた誤差ベクトルe
riを知覚重み付けフィルタ19に送出する。The subtracter 18 calculates each predicted vector SWi and the original speech vector S
And the resulting error vector e
ri is sent to the perceptual weighting filter 19.
知覚重み付けフィルタ19は、人間の知覚特性を考慮し
て設けられたものであり、誤差ベクトルeriに対して知
覚特性に対応した重み付けを施し、得られたベクトルε
iを2乗計算部110に送出する。The perceptual weighting filter 19 is provided in consideration of human perceptual characteristics, and weights the error vector eri in accordance with the perceptual characteristics to obtain a vector ε.
i is sent to the square calculator 110.
2乗計算部110は、知覚重み付けされた誤差ベクトル
εiの各成分の2乗を計算し、平均操作部111は、得ら
れたベクトルεiの各成分の2乗の和の平均giを計算す
る。さらに、平均操作部111は、n個の平均値g1〜gnの
中から最小の平均値gI(予測誤差が最小のもの)を検出
し、そのインデックスを最適励振コードベクトルのイン
デックスIとして励振コードテーブル17から量子化器14
に出力させる。The square calculation unit 110 calculates the square of each component of the perceptually weighted error vector εi, and the average operation unit 111 calculates the average gi of the sum of the squares of the obtained components of the vector εi. Further, the average operation unit 111 detects the minimum average value gI (the one with the smallest prediction error) from the n average values g1 to gn, and uses the index as an index I of the optimal excitation code vector as an excitation code table. 17 to quantizer 14
Output.
なお、以上のような各部11〜112によってコード励振
線形符号化器10が構成されているのであるが、短時間分
析部12、短時間合成フィルタ13、長時間分析部15、長時
間合成フィルタ16、減算器18、知覚重み付けフィルタ1
9、2乗計算部110及び平均操作部111は、その本来的な
処理機能を除外してみれば共に演算処理を実行するもの
であるということができる。The above-described units 11 to 112 constitute the code excitation linear encoder 10.The short-time analysis unit 12, the short-time synthesis filter 13, the long-time analysis unit 15, and the long-time synthesis filter 16 , Subtractor 18, perceptual weighting filter 1
It can be said that the ninth-square calculation unit 110 and the average operation unit 111 execute arithmetic processing together if their essential processing functions are excluded.
図示しない復号化器においては、インデックスIから
これに対応した励振コードベクトルeIを取出し、この励
振コードベクトルeIに対して、ピッチ予測係数β及びラ
グLを用いた長時間分析部15の逆処理(合成処理)、及
び、短時間予測係数αjを用いた短時間分析部12の逆処
理(合成処理)を順次行なって原音声ベクトルSに対応
した再生音声ベクトルSWIを得る。A decoder (not shown) extracts an excitation code vector eI corresponding to the index I from the index I, and inverts the excitation code vector eI of the long time analysis unit 15 using the pitch prediction coefficient β and the lag L ( (Synthesis process) and the inverse process (synthesis process) of the short-time analysis unit 12 using the short-term prediction coefficient αj are sequentially performed to obtain a reproduced speech vector SWI corresponding to the original speech vector S.
[発明が解決しようとする課題] 上述したコード励振線形予測符号化器10は、主として
デジタル移動体通信における音声の圧縮符号化に適用さ
れると考えられる。移動体通信機器はその可搬性や移動
性のために小形化が求められており、また、バッテリー
電源を用いているために低消費電力が求められてる。従
って、コード励振線形予測符号化器10も、可能な限り小
型で消費電力が少ないことが求められている。[Problem to be Solved by the Invention] The above-described code excitation linear prediction encoder 10 is considered to be mainly applied to compression encoding of voice in digital mobile communication. Mobile communication devices are required to be miniaturized due to their portability and mobility, and low power consumption is required due to the use of a battery power supply. Therefore, the code excitation linear predictive encoder 10 is also required to be as small as possible and consume less power.
ところで、コード励振線形予測符号化器10は、上述し
たように演算処理によって所望の機能を行なう各機能部
を備えている。符号化器10を小型、低消費電力化しよう
とすると、演算処理によって所望の機能を行なう各機能
部を小型、低消費電力化することが求められる。演算処
理に供するビット数が少ない場合には、演算処理によっ
て所望の機能を行なう各機能部に小型、低消費電力化す
ることができる。By the way, the code excitation linear prediction encoder 10 is provided with each functional unit that performs a desired function by arithmetic processing as described above. In order to reduce the size and power consumption of the encoder 10, it is required to reduce the size and power consumption of each functional unit that performs a desired function through arithmetic processing. When the number of bits provided for the arithmetic processing is small, the size and power consumption of each functional unit that performs a desired function by the arithmetic processing can be reduced.
しかしながら、現状のコード励振線形予測符号化器10
は音声の大きさによって表現しなければならない内部の
値が大きく変動するために、固定小数点で、しかも計算
精度を落とさずに意味のある処理(例えば短時間分析
等)を行なおうとすると、非常に大きなビット数の演算
が必要となって、小形化及び低消費電力化を困難にして
いた。However, the current code excitation linear predictive encoder 10
Because the internal value that must be represented by the volume of the voice fluctuates greatly, it is very difficult to perform meaningful processing (for example, short-time analysis) with fixed point and without reducing the calculation accuracy. This requires an operation with a large number of bits, which makes it difficult to reduce the size and power consumption.
なお、浮動小数点の表現を用いて演算を行なう符号化
器でも小形化は困難である。Note that it is difficult to reduce the size even with an encoder that performs an operation using floating-point representation.
このような課題は、コード励振線形予測符号化器だけ
でなく、この符号化器に対応するコード励振線形予測復
号化器においても生じている。Such a problem occurs not only in the code excitation linear prediction encoder but also in the code excitation linear prediction decoder corresponding to the encoder.
本発明は、以上の点を考慮してなされたものであり、
入力音声の大きさが変動しても、計算精度を落とさず
に、なおかつ少ないビット数で所望機能を実現する演算
を行なうことができ、小型化及び低消費電力化を実現で
きるコード励振線形予測符号化器及び復号化器を提供し
ようとするものである。The present invention has been made in view of the above points,
A code-excited linear prediction code capable of performing an operation for realizing a desired function with a small number of bits without lowering the calculation accuracy even if the volume of the input voice fluctuates, and realizing miniaturization and low power consumption. And a decoder and a decoder.
[課題を解決するための手段] かかる課題を解決するため、第1の本発明において
は、原音声ベクトルを分析して得た分析パラメータと、
その分析パラメータを用いて複数の励振コードベクトル
を合成処理して得た複数の予測ベクトルのうち原音声ベ
クトルからの誤差が最小となる最適な励振コードベクト
ルのインデックスとをトータルコードにまとめて出力す
るコード励振線形予測符号化器を、以下のようにした。[Means for Solving the Problem] In order to solve the problem, according to a first aspect of the present invention, an analysis parameter obtained by analyzing an original speech vector,
Using the analysis parameters, a plurality of excitation code vectors are synthesized and, among a plurality of prediction vectors, an index of an optimal excitation code vector that minimizes an error from an original speech vector is output as a total code. The code-excited linear prediction encoder was as follows.
すなわち、演算処理によって所定機能(分析等)を実
現する複数の機能部のうち、少なくとも一部を固定小数
点表現が変更可能なものとすると共に、原音声ベクトル
の大きさを平均音声パワーとの相関に基づいて検出する
検出手段、及び、検出された原音声ベクトルの大きさに
応じて各機能部の固定小数点表現を変更させる固定小数
点表現制御手段とを設けた。That is, at least a part of the plurality of functional units for realizing a predetermined function (analysis or the like) by arithmetic processing can be changed in fixed-point representation, and the magnitude of the original speech vector is correlated with the average speech power. And fixed-point expression control means for changing the fixed-point expression of each functional unit according to the magnitude of the detected original speech vector.
この場合において、固定小数点表現制御手段からの制
御信号をもトータルコードに含めて出力させることが好
ましい。In this case, it is preferable that the control signal from the fixed-point expression control means is also included in the total code and output.
第2の本発明は、固定小数点表現制御手段からの制御
信号をもトータルコードに含めて出力させるコード励振
線形予測符号化器に対応するコード励振線形予測復号化
器に関するものである。そして、演算処理によって所定
機能を実現する複数の機能部のうち、少なくとも一部を
固定小数点表現が変更可能なものとすると共に、トータ
ルコードに含まれている制御信号に応じて各機能部の固
定小数点表現を変更させることを特徴とするものであ
る。The second invention relates to a code-excited linear prediction decoder corresponding to a code-excited linear prediction encoder that outputs a control signal from a fixed-point representation control unit in a total code. Then, at least a part of the plurality of functional units that realize the predetermined function by the arithmetic processing can have a fixed-point representation changeable, and each functional unit can be fixed according to a control signal included in the total code. It is characterized in that the decimal point expression is changed.
[作用] 第1の本発明は、演算処理によって所定機能(分析
等)を実現する複数の機能部のうち、少なくとも一部の
機能部の小形化及び低消費電力化を計ったものであり、
そのため、処理ビット数を少なくできるように各機能部
を固定小数点表現が変更可能なものとした。そして、原
音声ベクトルの大きさを検出手段が検出し、固定小数点
表現制御手段が、検出された原音声ベクトルの大きさに
応じて各機能部の固定小数点表現を変更させるようにし
た。[Operation] The first aspect of the present invention is to reduce the size and power consumption of at least some of the plurality of functional units that realize a predetermined function (analysis or the like) by arithmetic processing.
Therefore, in order to reduce the number of processing bits, each of the functional units can be changed in fixed-point representation. Then, the magnitude of the original speech vector is detected by the detection means, and the fixed-point representation control means changes the fixed-point representation of each functional unit according to the magnitude of the detected original speech vector.
この場合において、復号化器の小形化及び低消費電力
化を期して固定小数点表現制御手段からの制御信号をも
トータルコードに含めて出力させることが好ましい。In this case, it is preferable to output a control signal from the fixed-point representation control means in the total code in order to reduce the size and power consumption of the decoder.
第2の本発明は、固定小数点表現制御手段からの制御
信号をも含まれているトータルコードを復号化するコー
ド励振線形予測復号化器に関し、演算処理によって所定
機能を実現する複数の機能部のうち、少なくとも一部を
固定小数点表現が変更可能なものとし、このような機能
部をトータルコードに含まれている制御信号に応じてそ
の固定小数点表現を変更させるようにしたものである。The second invention relates to a code excitation linear prediction decoder for decoding a total code including a control signal from a fixed-point representation control means, and includes a plurality of functional units for realizing a predetermined function by arithmetic processing. Among them, at least a part of the fixed-point expression can be changed, and such a functional unit is configured to change the fixed-point expression according to a control signal included in the total code.
[実施例] 以下、本発明によるコード励振線形予測符号化器の一
実施例を図面を参照しながら詳述する。[Embodiment] Hereinafter, an embodiment of a code excitation linear prediction encoder according to the present invention will be described in detail with reference to the drawings.
第1図はこの実施例の構成を示す機能ブロック図であ
り、第2図との同一及び対応部分には同一符号を付して
示している。また、第3図〜第5図はこのような構成を
採用するに至った考え方の説明図である。FIG. 1 is a functional block diagram showing the configuration of this embodiment, and the same and corresponding parts as in FIG. 2 are denoted by the same reference numerals. FIG. 3 to FIG. 5 are explanatory diagrams of the concept of adopting such a configuration.
実施例の構成及び作用の説明に先立ち、実施例の構成
を採用するに至った考え方を、第3図〜第5図を用いて
説明する。Prior to the description of the configuration and operation of the embodiment, the concept of adopting the configuration of the embodiment will be described with reference to FIGS.
上述したように、符号化器を小型化、低消費電力化し
ようとすると、演算処理によって所望の機能(短時間分
析や長時間分析等)を実現する各機能部が演算処理する
ビット数が可能な限り少ないことが求められる。そこ
で、このような各機能部が処理する信号(ベクトル成
分)の固定小数点の表現方法について考えてみる。一例
として、長時間分析部15が演算処理するベクトルS1につ
いて表現方法を考えてみる。As described above, when trying to reduce the size and power consumption of an encoder, the number of bits to be processed by each functional unit that realizes a desired function (short-time analysis or long-time analysis) by arithmetic processing is possible. It must be as small as possible. Therefore, a fixed-point representation method of a signal (vector component) processed by each functional unit will be considered. As an example, consider a method of expressing a vector S1 operated by the long-time analysis unit 15.
このベクトルS1は、原音声(ベクトル)Sの大きさに
対して第3図に示すように高い相関を有する。すなわ
ち、原音声ベクトルSの各成分のS乗平均である平均音
声パワーに対して、ベクトルS1の成分の最大値及び各成
分の平均値ともに高い相関を有する。なお、第3図では
ベクトルS1の値を、ビット表現を考慮して2を底とする
対数で表している。This vector S1 has a high correlation with the magnitude of the original voice (vector) S as shown in FIG. That is, the maximum value of the component of the vector S1 and the average value of each component have a high correlation with the average audio power that is the S-mean of each component of the original audio vector S. In FIG. 3, the value of the vector S1 is represented by a logarithm having a base of 2 in consideration of the bit representation.
ビット数を考える場合、平均値ではなく最大値が問題
となる。第4図は、第3図の最大値の回帰線L1及び平均
値の回帰線L2の内、最大値の回帰線L1を取出して示した
ものである。When considering the number of bits, not the average value but the maximum value is a problem. FIG. 4 shows the maximum value regression line L1 extracted from the maximum value regression line L1 and the average value regression line L2 in FIG.
ベクトルS1として最低でもmビットの精度が必要なら
ば、原音声Sが小さいときに精度を失わないためには、
ベクトルS1の固定小数点表現は、原音声Sが最も小さい
ときのベクトルS1の最大値(整数化されている)Aから
mビット小さい数までを表現しなければならない。ま
た、オーバーフローを避けるためには、原音声Sが最も
大きいときのベクトルS1の最大値(整数化されている)
Bを表現しなければならない。If at least m-bit precision is required for the vector S1, in order not to lose the precision when the original voice S is small,
The fixed-point representation of the vector S1 must represent from the maximum value (integralized) A of the vector S1 when the original speech S is the smallest to a number smaller by m bits. To avoid overflow, the maximum value of the vector S1 when the original voice S is the largest (integrated)
B must be expressed.
このように考えていくと、固定小数点で精度を確保す
るようにベクトルS1を表現するためには、(B−A)+
mビットが必要となる。これが従来のビット数の決定の
考え方である。Considering this, in order to express the vector S1 so as to secure the precision with a fixed point, (BA) +
m bits are required. This is the conventional concept of determining the number of bits.
ここで、第5図に示すように、原音声Sの大きさ(平
均音声パワー)を幾つかの区間に分けて考えてみる。他
の区間に関係なく、各区間x(x=1〜N)について単
独に必要ビット数を求める場合にも上述と同様な考え方
ができる。すなわち、区間xについては、(Bx−Ax)+
mビットが必要である。Here, as shown in FIG. 5, the size (average audio power) of the original audio S will be divided into several sections. The same concept as described above can be applied to the case where the required number of bits is independently obtained for each section x (x = 1 to N) irrespective of other sections. That is, for the section x, (Bx−Ax) +
m bits are required.
第4図及び第5図の比較から明らかなように、原音声
Sの大きさを幾つかの区間に分けて各区間毎に固定小数
点の表現方法を変えるならば、長時間分析部15が必要と
するビット数は従来より大幅に少なくて済む。勿論、原
音声Sがどの区間に属するものであっても適切に処理で
きるように、各区間で必要なビット数(Bx−Ax)+mの
うちの最大のビット数を処理ビット数とすることを要す
る。As is clear from the comparison between FIG. 4 and FIG. 5, if the loudness of the original voice S is divided into several sections and the fixed-point representation method is changed for each section, the long time analysis unit 15 is required. The number of bits to be used can be significantly smaller than in the past. Of course, the maximum number of bits (Bx−Ax) + m in each section is set as the number of bits to be processed so that the original voice S belongs to any section. It costs.
上述では、長時間分析部15が取り扱うベクトルS1につ
いて検討したが、演算処理を実行する他の各機能部につ
いても同様な考え方をすることができる。In the above description, the vector S1 handled by the long-time analysis unit 15 has been considered. However, the same concept can be applied to other functional units that execute arithmetic processing.
第1図に示す実施例は、このような検討の下になされ
たものである。The embodiment shown in FIG. 1 has been made under such consideration.
この実施例の符号化器10Aにおいても、符号化する基
本的な機能構成は従来と同様である。Also in the encoder 10A of this embodiment, the basic functional configuration for encoding is the same as that of the related art.
すなわち、短時間分析部12が、入力端子11を介して与
えられた原音声ベクトルSを短時間分析して得られた短
時間予測係数αjを量子化器14及び短時間合成フィルタ
13に与えると共に、長時間分析部15が、短時間分析部12
から与えられた音声のフォルマント成分(短時間成分)
が除去されたベクトルS1を長時間分析して得られたピッ
チ予測係数β及びラグ(ピッチ周期)Lを長時間合成フ
ィルタ16及び量子化器14に与え、量子化器14が、短時間
予測係数αj、ピッチ予測係数β、ラグL及び後述する
ように決定された最適励振コードベクトルのインデック
スIを量子化し、トータルコードCとして出力端子112
より出力する構成は、従来の符号化器10と同様である。That is, the short-time analysis unit 12 analyzes the short-time prediction coefficient αj obtained by short-time analysis of the original speech vector S given through the input terminal 11 and the quantizer 14 and the short-time synthesis filter
13 and the long-time analysis unit 15
Formant component (short-time component) of the voice given from
The pitch prediction coefficient β and the lag (pitch period) L obtained by analyzing the vector S1 from which the noise has been removed for a long time are supplied to the long-time synthesis filter 16 and the quantizer 14, and the quantizer 14 αj, the pitch prediction coefficient β, the lag L, and the index I of the optimum excitation code vector determined as described later are quantized, and output to the output terminal 112 as the total code C.
The configuration for outputting more is the same as that of the conventional encoder 10.
また、励振コードテーブル17から出力された各励振コ
ードベクトルeiを長時間合成フィルタ16及び短時間合成
フィルタ13が順次処理して予測ベクトルSWiを形成し、
減算器18が各予測ベクトルSWiの原音声ベクトルSから
の誤差ベクトルeriを得た後、知覚重み付けフィルタ19
が知覚特性を考慮した重み付けを施し、2乗計算部110
が、知覚重み付けされた誤差ベクトルεiの各成分の2
乗を計算し、平均操作部111が、誤差ベクトルεiの各
成分の2乗の和の平均giを計算して励振コードベクトル
eiを評価して最適励振コードベクトルeIのインデックス
Iを得る構成も、従来の符号化器10と同様である。Further, each excitation code vector ei output from the excitation code table 17 is sequentially processed by the long-time synthesis filter 16 and the short-time synthesis filter 13 to form a prediction vector SWi,
After the subtracter 18 obtains the error vector eri of each prediction vector SWi from the original speech vector S, the perceptual weighting filter 19
Performs weighting in consideration of the perceptual characteristic, and calculates a square
Is 2 of each component of the perceptually weighted error vector εi.
The average operation unit 111 calculates the average gi of the sum of the squares of the components of the error vector εi, and calculates the excitation code vector
The configuration for evaluating ei to obtain the index I of the optimal excitation code vector eI is also the same as that of the conventional encoder 10.
しかし、この実施例の符号化器10Aは、平均音声パワ
ー計算部113及び固定小数点制御部114を備える点、演算
処理によって所望の機能を実現する各機能部12、13、15
〜111が固定小数点表現を可変できる点等が、従来の符
号化器10とは異なる。However, the encoder 10A of this embodiment includes an average audio power calculation unit 113 and a fixed point control unit 114, and each of the functional units 12, 13, and 15 that realize desired functions by arithmetic processing.
111111 differs from the conventional encoder 10 in that the fixed-point representation can be changed.
原音声ベクトルSは、平均音声パワー計算部113にも
与えられる。平均音声パワー計算部113は、原音声ベク
トルSの大きさを表すものを得るために設けられたもの
であり、原音声ベクトルSの各成分の2乗平均(平均音
声パワー)を得てそのパワー値R0を固定小数点制御部1
14に与える。The original audio vector S is also provided to the average audio power calculator 113. The average audio power calculation unit 113 is provided to obtain a value representing the magnitude of the original audio vector S. The average audio power calculation unit 113 obtains a root mean square (average audio power) of each component of the original audio vector S, and obtains the power. Value R0 is fixed-point controller 1
Give to 14.
固定小数点制御部114は、このパワー値R0が属する区
間(第5図参照)を認識して認識区間xを表す制御信号
Cxを出力する。この制御信号Cxは、短時間分析部12、短
時間合成フィルタ13、長時間分析部15、長時間合成フィ
ルタ16、減算器18、知覚重み付けフィルタ19、2乗計算
部110及び平均操作部111に与えられる。The fixed-point control unit 114 recognizes a section to which the power value R0 belongs (see FIG. 5) and outputs a control signal representing a recognition section x.
Output Cx. The control signal Cx is sent to the short-time analysis unit 12, the short-time synthesis filter 13, the long-time analysis unit 15, the long-time synthesis filter 16, the subtractor 18, the perceptual weighting filter 19, the square calculation unit 110, and the average operation unit 111. Given.
制御信号Cxが与えられた各機能部は、この制御信号Cx
が指示する区間xに応じた固定小数点表現をもって入力
されてきたベクトルや係数等を表現して処理する。Each of the functional units to which the control signal Cx is applied receives the control signal Cx
Represents and processes the input vectors and coefficients in a fixed-point representation corresponding to the section x indicated by.
なお、この実施例の符号化器10Aでは、後述する復号
化器20の処理を考慮して、制御信号Cxをもトータルコー
ドCに含めるようになされている。In the encoder 10A of this embodiment, the control signal Cx is also included in the total code C in consideration of the processing of the decoder 20 described later.
また、以上の符号化処理は、原音声ベクトルSが変化
する毎に繰り返される。The above encoding process is repeated every time the original audio vector S changes.
従って、上述の実施例によれば、原音声(ベクトル)
Sの大きさに応じて演算処理する各機能部の固定小数点
表現を変更するようにしたので、各機能部の処理ビット
数が小さくて済み、原音声の大きさが変動しても、計算
精度を落とさずに、なおかつ少ないビット数で所望機能
を実現する演算を行なうことができ、小型化及び低消費
電力化を実現できる。Therefore, according to the above embodiment, the original speech (vector)
Since the fixed-point representation of each functional unit that performs arithmetic processing is changed according to the size of S, the number of processing bits of each functional unit can be small, and even if the size of the original voice fluctuates, the calculation accuracy can be improved. It is possible to perform an operation for realizing a desired function with a small number of bits without lowering the power consumption, thereby realizing miniaturization and low power consumption.
次に、本発明によるコード励振線形予測復号化器の一
実施例を第6図に基づいて説明する。Next, an embodiment of a code excitation linear prediction decoder according to the present invention will be described with reference to FIG.
第6図に示す復号化器20は、上述したコード励振線形
予測符号化器10Aに対応したものである。The decoder 20 shown in FIG. 6 corresponds to the code excitation linear prediction encoder 10A described above.
この復号化器20は、入力端子21、逆量子化器22、励振
コードテーブル23、長時間合成フィルタ24、短時間合成
フィルタ25及び出力端子26から構成されている。The decoder 20 includes an input terminal 21, an inverse quantizer 22, an excitation code table 23, a long-time synthesis filter 24, a short-time synthesis filter 25, and an output terminal 26.
符号化器10Aから出力され、当該復号化器20の入力端
子21に与えられたトータルコードCは、逆量子化器22に
よって逆量子化される。この処理によって分離されたイ
ンデックスIは励振コードテーブル23に与えられ、ピッ
チ予測係数β及びラグ(ピッチ周期)Lは長時間合成フ
ィルタ24に与えられ、短時間予測係数αjは短時間合成
フィルタ25に与えられ、制御信号Cxは長時間合成フィル
タ24及び短時間合成フィルタ25に与えられる。The total code C output from the encoder 10A and supplied to the input terminal 21 of the decoder 20 is inversely quantized by the inverse quantizer 22. The index I separated by this processing is provided to the excitation code table 23, the pitch prediction coefficient β and the lag (pitch cycle) L are provided to the long-time synthesis filter 24, and the short-time prediction coefficient αj is provided to the short-time synthesis filter 25. The control signal Cx is provided to the long-time synthesis filter 24 and the short-time synthesis filter 25.
励振コードテーブル23は、符号化器10Aにおける励振
コードテーブル17と同一構成のものであり、与えられた
インデックスIに対応した励振コードベクトルeIを長時
間合成フィルタ24に出力する。The excitation code table 23 has the same configuration as the excitation code table 17 in the encoder 10A, and outputs the excitation code vector eI corresponding to the given index I to the long-time synthesis filter 24.
長時間合成フィルタ24も、符号化器10Aにおける長時
間合成フィルタ16と固定小数点表現を変更できる点を含
め同一構成のものである。長時間合成フィルタ24は、励
振コードベクトルeIに対して、ピッチ予測係数β及びラ
グLを用いて長時間分析部15の逆処理(合成処理)を施
し、処理出力ベクトルSTIを短時間合成フィルタ25に送
出する。この際、処理するベクトル等を制御信号Cxに応
じて固定小数点表現した後処理を実行する。The long-time synthesis filter 24 has the same configuration as the long-time synthesis filter 16 in the encoder 10A, including that the fixed-point representation can be changed. The long-time synthesis filter 24 performs inverse processing (synthesis processing) of the long-time analysis unit 15 on the excitation code vector eI using the pitch prediction coefficient β and the lag L, and converts the processing output vector STI into the short-time synthesis filter 25. To send to. At this time, a post-process is executed by expressing a vector or the like to be processed in a fixed-point representation according to the control signal Cx.
短時間合成フィルタ25は、符号化器10Aにおける短時
間合成フィルタ13と固定小数点表現を変更できる点を含
め同一構成のものである。短時間合成フィルタ25は、制
御信号Cxに応じてベクトルSTIの固定小数点表現を変更
した後、短時間予測係数αjを用いて短時間分析部13の
逆処理(合成処理)を行なって処理出力ベクトルSWIを
得て、これを出力端子26を介して原音声ベクトルSの再
生ベクトルとして出力する。The short-time synthesis filter 25 has the same configuration as the short-time synthesis filter 13 in the encoder 10A, including that the fixed-point representation can be changed. After changing the fixed-point representation of the vector STI in accordance with the control signal Cx, the short-time synthesis filter 25 performs the reverse processing (synthesis processing) of the short-time analysis unit 13 using the short-time prediction coefficient αj to process the output vector SWI is obtained, and this is output as a reproduction vector of the original audio vector S via the output terminal 26.
この実施例の復号化器20によれば、伝送されてきた制
御信号xに応じて長時間合成フィルタ24及び短時間合成
フィルタ25が処理する信号の固定小数点表現を変更する
ようにしたので、各フィルタの処理ビット数が小さくて
済み、原音声の大きさが変動しても、計算精度を落とさ
ずに、なおかつ少ないビット数で所望機能を実現する演
算を行なうことができ、小型化及び低消費電力化を実現
できる。According to the decoder 20 of this embodiment, the fixed-point representation of signals processed by the long-time synthesis filter 24 and the short-time synthesis filter 25 is changed according to the transmitted control signal x. The number of processing bits of the filter can be small, and even if the volume of the original voice fluctuates, it is possible to perform an operation for realizing a desired function with a small number of bits without lowering the calculation accuracy. Electricity can be realized.
なお、上述の実施例の符号化器10Aは制御信号Cxをも
トータルコードCに含めるものであったが、含めないよ
うにしても良く、このようにしても上述の実施例の符号
化器10Aと同様な効果を奏する。この場合、復号化器は
従来と同一のものを適用することになる。Although the encoder 10A of the above-described embodiment also includes the control signal Cx in the total code C, the control signal Cx may not be included, and the encoder 10A of the above-described embodiment may be omitted. It has the same effect as. In this case, the same decoder as the conventional one is applied.
上述の実施例の符号化器10Aにおいては、演算処理す
る全ての各機能部に制御信号Cxを与えるものであった
が、演算処理する各機能部の一部にのみ与えるようにし
ても良い。また、原音声の大きさの区分の仕方を各機能
部で異なるようにしても良い。In the encoder 10A of the above-described embodiment, the control signal Cx is provided to all the functional units that perform the arithmetic processing. However, the control signal Cx may be provided only to a part of the functional units that perform the arithmetic processing. Further, the method of classifying the loudness of the original voice may be different for each functional unit.
また、上述の実施例においては、短時間分析部及び長
時間分析部の双方を有する符号化器に適用したものを示
したが、少なくとも短時間分析部を有する符号化器に適
用することができる。励振コードテーブルが適応形のも
のである符号化器にも適用することができる。Further, in the above-described embodiment, the case where the present invention is applied to the encoder having both the short-time analysis unit and the long-time analysis unit has been described. However, the present invention can be applied to at least the encoder having the short-time analysis unit. . The present invention can also be applied to an encoder in which the excitation code table is of an adaptive type.
[発明の効果] 以上のように、本発明によれば、原信号の大きさによ
って演算処理する機能部の固定小数点表現を変更するよ
うにしたので、入力音声の大きさが変動しても、計算精
度を落とさずに、なおかつ少ないビット数で所望機能を
実現する演算を行なうことができ、小型化及び低消費電
力化を実現できる。[Effects of the Invention] As described above, according to the present invention, the fixed-point representation of the functional unit that performs arithmetic processing is changed according to the magnitude of the original signal. An operation for realizing a desired function can be performed with a small number of bits without deteriorating the calculation accuracy, so that downsizing and low power consumption can be realized.
第1図は第1の本発明によるコード励振線形予測符号化
器の一実施例を示すブロック図、第2図は従来の符号化
器を示すブロック図、第3図〜第5図は第1図の構成を
採用するに至った考え方の説明図、第6図は第2の本発
明によるコード励振線形予測復号化器の一実施例の機能
ブロック図である。 12……短時間分析部、13、25……短時間合成フィルタ、
14……量子化器、15……長時間分析部、16、24……長時
間合成フィルタ、17、23……励振コードテーブル、18…
…減算器、19……知覚重み付けフィルタ、110……2乗
計算部、111……平均操作部、113……平均音声パワー計
算部、114……固定小数点制御部、22……逆量子化器。FIG. 1 is a block diagram showing one embodiment of a code-excited linear prediction encoder according to the first invention, FIG. 2 is a block diagram showing a conventional encoder, and FIGS. FIG. 6 is a functional block diagram of an embodiment of a code-excited linear prediction decoder according to the second invention, which is an illustration of the concept of adopting the configuration shown in FIG. 12 ... short-time analysis unit, 13, 25 ... short-time synthesis filter,
14 Quantizer, 15 Long time analysis unit, 16, 24 Long time synthesis filter, 17, 23 Excitation code table, 18
... Subtractor, 19 ... Perceptual weighting filter, 110 ... Square calculator, 111 ... Average operation unit, 113 ... Average voice power calculator, 114 ... Fixed point controller, 22 ... Dequantizer .
───────────────────────────────────────────────────── フロントページの続き (72)発明者 細田 賢一郎 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平1−54497(JP,A) 特開 昭63−261925(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 H03M 7/30 JOISファイル(JICST)──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Kenichiro Hosoda 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd. (56) References JP-A-1-54497 (JP, A) 63-261925 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G10L 3/00-9/18 H03M 7/30 JOIS file (JICST)
Claims (4)
ータと、その分析パラメータを用いて複数の励振コード
ベクトルを合成処理して得た複数の予測ベクトルのうち
原音声ベクトルからの誤差が最小となる最適な励振コー
ドベクトルのインデックスとをトータルコードにまとめ
て出力するコード励振線形予測符号化器において、 演算処理によって所定機能を実現する複数の機能部のう
ち、少なくとも一部を固定小数点表現が変更可能なもの
とすると共に、 原音声ベクトルの大きさを平均音声パワーとの相関に基
づいて検出する検出手段と、検出された原音声ベクトル
の大きさに応じて表現が変更可能な上記各機能部の固定
小数点表現を変更させる固定小数点表現制御手段とを設
けたことを特徴とするコード励振線形予測符号化器。An analysis parameter obtained by analyzing an original speech vector, and a plurality of prediction vectors obtained by synthesizing a plurality of excitation code vectors using the analysis parameter, the error from the original speech vector is minimized. In a code excitation linear prediction encoder that collectively outputs an index of an optimal excitation code vector and a total code, a fixed-point representation is used for at least a part of a plurality of functional units that realize a predetermined function through arithmetic processing. Detecting means for detecting the magnitude of the original speech vector based on the correlation with the average speech power, and the above-mentioned functions capable of changing the expression according to the magnitude of the detected original speech vector Fixed-point representation control means for changing a fixed-point representation of a section.
声パワーの区間と原音声ベクトルの最大値とを対応させ
たテーブルを有することを特徴とする、請求項1に記載
のコード励振線形予測符号化器。2. The code-excited linear prediction according to claim 1, wherein said detecting means has a table in which a section of the average audio power of the original audio vector is associated with a maximum value of the original audio vector. Encoder.
号をもトータルコードに含めて出力させることを特徴と
する請求項1又は2に記載のコード励振線形予測符号化
器。3. The code-excited linear predictive encoder according to claim 1, wherein a control signal from said fixed-point representation control means is included in a total code and output.
化器から出力されたトータルコードを受信するコード励
振線形予測復号化器において、 演算処理によって所定機能を実現する複数の機能部のう
ち、少なくとも一部を固定小数点表現が変更可能なもの
とすると共に、トータルコードに含まれている上記制御
信号に応じて上記各機能部の固定小数点表現を変更させ
ることを特徴とするコード励振線形予測復号化器。4. A code-excited linear predictive decoder for receiving a total code output from the code-excited linear predictive encoder according to claim 3, wherein said plurality of functional units realize predetermined functions by arithmetic processing. Wherein the fixed-point representation is at least partially changeable and the fixed-point representation of each of the functional units is changed in accordance with the control signal contained in the total code. Decoder.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2225250A JP2898377B2 (en) | 1990-08-29 | 1990-08-29 | Code-excited linear prediction encoder and decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2225250A JP2898377B2 (en) | 1990-08-29 | 1990-08-29 | Code-excited linear prediction encoder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04107600A JPH04107600A (en) | 1992-04-09 |
JP2898377B2 true JP2898377B2 (en) | 1999-05-31 |
Family
ID=16826363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2225250A Expired - Lifetime JP2898377B2 (en) | 1990-08-29 | 1990-08-29 | Code-excited linear prediction encoder and decoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2898377B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19845888A1 (en) * | 1998-10-06 | 2000-05-11 | Bosch Gmbh Robert | Method for coding or decoding speech signal samples as well as encoders or decoders |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63261925A (en) * | 1987-04-20 | 1988-10-28 | Mitsubishi Electric Corp | Decoder for adaptive predicting code signal |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
-
1990
- 1990-08-29 JP JP2225250A patent/JP2898377B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04107600A (en) | 1992-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
JP2887286B2 (en) | Improvements in the method of compressing digitally coded speech | |
JP3346765B2 (en) | Audio decoding method and audio decoding device | |
KR100304682B1 (en) | Fast Excitation Coding for Speech Coders | |
JPH09127991A (en) | Voice coding method, device therefor, voice decoding method, and device therefor | |
US6593872B2 (en) | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method | |
WO2001059757A2 (en) | Method and apparatus for compression of speech encoded parameters | |
JPH09127990A (en) | Voice coding method and device | |
JPH04270400A (en) | Voice encoding system | |
JPH0869299A (en) | Voice coding method, voice decoding method and voice coding/decoding method | |
JPH04270398A (en) | Voice encoding system | |
JP3628268B2 (en) | Acoustic signal encoding method, decoding method and apparatus, program, and recording medium | |
JPH1097295A (en) | Coding method and decoding method of acoustic signal | |
JPH09152896A (en) | Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device | |
JP3248668B2 (en) | Digital filter and acoustic encoding / decoding device | |
de Marca | An LSF quantizer for the North-American half-rate speech coder | |
CA2147394C (en) | Quantization of input vectors with and without rearrangement of vector elements of a candidate vector | |
JP4359949B2 (en) | Signal encoding apparatus and method, and signal decoding apparatus and method | |
JPH11184498A (en) | Voice encoding and decoding method | |
JPH10240299A (en) | Voice encoding and decoding device | |
JP2898377B2 (en) | Code-excited linear prediction encoder and decoder | |
JP2892462B2 (en) | Code-excited linear predictive encoder | |
JPH04190399A (en) | Vselp coding system | |
JP3192051B2 (en) | Audio coding device | |
JP3350340B2 (en) | Voice coding method and voice decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080312 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090312 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100312 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100312 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110312 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110312 Year of fee payment: 12 |