JP3252285B2

JP3252285B2 - 音声帯域信号符号化方法

Info

Publication number: JP3252285B2
Application number: JP10183490A
Authority: JP
Inventors: 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-04-19
Filing date: 1990-04-19
Publication date: 2002-02-04
Anticipated expiration: 2017-02-04
Also published as: JPH041800A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、音声帯域信号、特に音声信号と音声帯域モ
デム信号を低いビットレート、特に８〜4.8kb/s程度で
高品質に符号化するための音声帯域信号符号化方式に関
する。

〔従来の技術〕

音声信号を８〜4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば、M.Schroeder and B.At
al氏による“Code−excited linear prediction:High Q
uality Speech at very low bit rates"（Proc.ICASSP,
pp,937−940,1985年）と題した論文（文献１）等に記載
されているCELP（Code Excited LPC Coding）が知られ
ている。この方法では、送信側では、フレーム毎（例え
ば20ms）に音声信号から音声信号のスペクトル特性を表
すスペクトルパラメータを抽出し、フレームをさらに小
区間サブフレーム（例えば5ms）に分割し、サブフレー
ム毎に過去の音源信号をもとに長時間相関（ピッチ相
関）を表すピッチパラメータを抽出し、ピッチパラメー
タによりサブフレームの音声信号を長期予測し、長期予
測して求めた残差信号に対して、予め定められた種類の
雑音信号からなるコードブックから選択した信号により
合成した信号と、音声信号との誤差電力を最小化するよ
うに一種類の雑音信号を選択するとともに、最適なゲイ
ンを計算する。そして選択された雑音信号の種類を表す
インデクスとゲイン、ならびにスペクトルパラメータと
ピッチパラメータを伝送する。

〔発明が解決しようとする課題〕

上述した文献１の従来方式では、高音質を得るために
は、一般に、雑音信号から構成されるコードブックのビ
ットサイズを10ビット以上に極めて大きくする必要があ
るため、コードブックを探索して最適な雑音信号（コー
ドワード）を求めるために膨大な演算量が必要であると
いう問題点があった。さらに、コードブックが基本的に
雑音信号から構成されるために、コードブックから選択
された音源信号により再生された再生し音声の音質は雑
音感が伴うという問題点があった。

さらに従来方式では、音声帯域のモデム信号などを入
力したときに、コードブックがモデムに最適でないため
に、特性が劣化するという問題点があった。

本発明の目的は、上述した問題点を解決し、比較的少
ない演算量及びメモリ量により、８〜4.8kb/s程度で音
質が良好で、かつ音声帯域のモデム信号に対しても良好
な特性の得られる音声帯域信号符号化方式を提供するこ
とにある。

〔課題を解決するための手段〕

第１の発明は、入力した離散的な音声帯域信号を予め
定められた時間長のフレームに分割し、前記入力信号の
スペクトル包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号をもとに再生した信号が前記入
力信号に近くなるようにピッチパラメータを求めて前記
入力信号に対してピッチ予測を行い残差信号を求め、音
声信号あるいは前記音声信号以外の音声帯域信号をもと
に予め学習して構成した複数種類のコードベクトルが格
納された第１のコードブックから前記残差信号または前
記音声信号との歪みを小さくするコードベクトルを選択
し、既知の統計的特性を有するかあるいは予め学習して
構成したコードベクトルが格納された第２のコードブッ
クから前記差信号との歪みを小さくするコードベクトル
を選択し、前記第１のコードブックから選択されたコー
ドベクトルと前記第２のコードブックから選択されたコ
ードベクトルとを用いて、前記入力信号の音源を表して
出力することを特徴とする。

第２の発明は、入力した離散的な音声帯域信号を予め
定められた時間長のフレームに分割し、前記入力信号の
スペクトル包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号をもとに再生した信号が前記入
力信号に近くなるようにピッチパラメータを求めて前記
入力信号に対してピッチ予測を行い残差信号を求め、音
声信号あるいは前記音声信号以外の音声帯域信号をもと
に予め学習して構成した複数種類のコードベクトルが格
納された第１のコードブックから前記残差信号または前
記音声信号との歪みを小さくするコードベクトルを選択
し、既知の統計的特性を有するかあるいは予め学習して
構成したコードベクトルが格納された第２のコードブッ
クから前記残差信号または前記音声信号との歪みを小さ
くするコードベクトルを選択し、予め構成した第３のコ
ードブックを用いて前記ピッチパラメータあるいは前記
音源信号のゲインの少なくとも一方を量子化して出力
し、前記第１のコードブックから選択されたコードベク
トルと前記第２のコードブックから選択されたコードベ
クトルと前記ゲインとの重み付き線形結合により、前記
入力信号の音源信号を表して出力することを特徴とす
る。

〔作用〕

本発明による音声帯域信号符号化方式の作用を説明す
る。

第１の発明では、フレームを分割したサブフレーム毎
に、下式を最小化するように、入力音声帯域信号を表す
音源信号を求める。

ここでｘ（ｎ）は音声帯域信号、β,mは長期相関にも
とづくピッチ予測（適応コードブック）のピッチパラメ
ータ、すなわちゲイン及び遅延であり、ｖ（ｎ）は過去
の音源信号である。ｈ（ｎ）はスペクトルパラメータに
より構成される合成フィルタのインパルス応答、ｗ
（ｎ）は聴感重み付けフィルタのインパルス応答を示
す。記号＊は畳み込み演算を示す。なお、ｗ（ｎ）の詳
細については前記文献１を参照できる。

また、ｄ（ｎ）はコードブックにより表される音源信
号を示し、下式のように、第１のコードブックから選択
されたコードワードc₁（ｎ）と第２のコードブックから
選択されたコードワードc₂（ｎ）との線形結合で表され
る。

ここでγ₁,γ_２は選択されたコードワードc_1j（ｎ）,
c_2j（ｎ）のゲインを示す。従って、本発明では、２種
類のコードブックに分解して音源信号が表されることに
なるため、各コードブックはコードブック全体のビット
数の1/2でよい。例えばコードブック全体のビット数を1
0ビットとすると、第1,第２のコードブックは５ビット
ずつでよく、コードブック探索の演算量を大幅に低減で
きる。

各コードブックとして前記文献１のような雑音コード
ブックを用い、（２）式のように分割すると、特性的に
は10ビット分のコードブックよりも劣化し全体で７〜８
ビット分の性能しか出せない。

そこで、本発明では、高性能を得るために、第１のコ
ードブックはトレーニングデータを用いて予め学習させ
ることにより構成する。ここで第１のコードブックとし
ては、音声信号に対して学習したコードブックと、音声
以外の音声帯域信号に対して学習したコードブックとを
有する。以下では、入力信号として、音声信号と音声帯
域のモデム信号とを対象とし、音声信号に対して最適に
学習したコードブックと、音声帯域のモデム信号に対し
て最適に学習したコードブックとの２種類を第１のコー
ドブックとして有するものとする。

学習によるコードブックの構成法としては、例えば、
Lindeらによる“An Algorithm for Vector Quantizatio
n Design"と題した論文（IEEE Trans.COM−28,pp.84−9
5,1980年）（文献２）等が知られている。

学習のときの距離尺度としては、通常、２乗距離（ユ
ークリッド距離）が用いられるが、本発明では２乗距離
よりも性能の良好な次式による聴感重み付け距離尺度を
用いる。

ここでt_j（ｎ）はｊ番目のトレーニングデータ、c
₁（ｎ）はクラスタ１のコードワードである。クラスタ
１のセントロイド（代表コードワード）は、クラスタ１
内のトレーニングデータを用いて（４）式あるいは
（５）式を最小化するように求める。

（５）式においてｇは最適ゲインを示す。

一方、第２のコードブックは、第１のコードブックに
よるトレーニングデータ依存性を救済するために、前記
文献１のガウス性雑音信号のような予め統計的特性が確
定した雑音信号あるいは乱数信号からなるコードブック
や、他の特性を有するコードブックを使用する。なお、
雑音コードブックに対して、ある距離尺度のもとで選別
を行うことにより、さらに特性が改善される。詳細はT.
Moriya氏らによる“Transform Coding of Speechusing
a Weighted Vector Quantizer,"と題した論文（IEEE,J.
Sel,Areas,Commun.,pp.425−431,1989年）（文献３）等
を参照することができる。また、第１のコードブックに
より再生した信号と入力信号との誤差信号を用いて第２
のコードブックを学習により構成することもできる。

第２の発明では、第1,第２のコードブックから最適な
コードワードを選択した後に、ピッチパラメータのゲイ
ンと第1,第２のコードブックのゲインγ₁,γ_２の少なく
とも一つを、予め学習により構成したコードブック（第
３のコードブック）を用いて効率的にベクトル量子化す
る。

例えば、第1,第２のコードブックのゲインをベクトル
量子化するとすると、ベクトル量子化において、最適コ
ードワードの探索は、次式を最小化するコードワードを
選択する。

ここでγ′_ｉは各コードワードの示すベクトル量子化
したゲインの値である。またc_i（ｎ）は、第1,第２のコ
ードブックから選択されたコードワードである。（６）
式において、とすると、（６），（７）式から次式を得る。

ここでである。また、（８）式の第１項は定数であるから、コ
ードワードの探索は（８）式の第２項を最大化するもの
を選択すればよい。

また、コードブック探索の演算量を大幅に低減するた
めには、下式に従いコードワードの選択を行ってもよ
い。

ゲインのベクトル量子化用のコードブックは、多量の
ゲインの値からなるトレーニングデータを用いて予め学
習により構成する。コードブックの学習には前記文献２
の方法を用いることができる。ここで学習の際の距離尺
度は通常２乗距離であるが、さらに特性を改善するため
に、次式の距離尺度を用いる。

ここでγ_tiはトレーニング用のゲインデータである。
γ′_i1はゲインコードブックのクラスタ１における代表
コードワードである。

（10）式の距離尺度を用いるときは、クラスタ１にお
けるセントロイドSc_1iは次式を最小化するように求め
る。

一方、学習における演算量を大幅に低減するためには
通常の２乗距離による次式の距離尺度を用いてもよい。

〔実施例〕第１図は、第１の発明による音声帯域符号化方式の一
実施例に適用される音声帯域信号符号化装置を示すブロ
ック図である。

図において、送信側では、入力端子100から音声信号
を入力し、１フレーム分（例えば20ms）の音声信号をバ
ッファメモリ110に格納する。

LPC分析回路130は、フレームの音声信号のスペクトル
特性を表すパラメータとして、LSPパラメータをフレー
ムの音声信号から周知のLPC分析を行い予め定められた
次数Ｌだけ計算する。この具体的な計算法については前
記文献１を参照することができる。次にLSP量子化回路1
40は、LSPパラメータを予め定められた量子化ビット数
で量子化し、得た符号1_kをマルチプレクサ260へ出力す
るとともに、これを復号化してさらに線形予測係数a_i′
（ｉ＝１〜Ｌ）に変換して重み付け回路200,インパルス
応答計算回路170,合成フィルタ281へ出力する。LSPパラ
メータの符号化、LSPパラメータから線形予測係数への
変換の方法についてはSugamura氏らによる“Quantize D
isign in LSP Speech Analysis−Synthesis"と題した論
文（IEEE J.Sel,Areas,Commun.,pp.432−440,1988年）
（文献４）等を参照することができる。

サブフレーム分割回路150は、フレームの入力音声帯
域信号をサブフレームに分割する。ここで例えばフレー
ム長は20ms、サブフレーム長は5msとする。

減算器190は、サブフレームに分割された入力信号か
ら合成フィルタ281の出力を減算して出力する。

重み付け回路200は、減算した信号に対して周知の聴
感重み付けを行う。聴感重み付け関数の詳細は前記文献
１を参照できる。

適応コードブック210は、合成フィルタ281の入力信号
ｖ（ｎ）を遅延回路206を介して入力し、さらにインパ
ルス応答出力回路170から重み付けインパルス応答h
_w（ｎ）、重み付け回路200から重み付け信号を入力し、
長期相関にもとづくピッチ予測を行い、ピッチパラメー
タとして遅延Ｍとゲインβを計算する。以下の説明では
適応コードブック210の予測次数は１とするが、２次以
上の高次とすることもできる。１次の適応コードブック
における遅延M,ゲインβの計算法は、Kleijin“Improve
d speech quality and efficient vector quantization
in SELP"と題した論文（ICASSP、pp.155−158年、1988
年）（文献５）等に記載されている。さらに求めたゲイ
ンβをゲイン量子化器220により予め定められた量子化
ビット数で量子化復号化し、ゲインβ′を求め、これを
用いて次式により予測信号_ｗ（ｎ）を計算し減算器20
5に出力する。また遅延Ｍをマルチプレクサ260へ出力す
る。

上式でｖ（ｎ−Ｍ）は過去の音源信号で、合成フィル
タ281の入力信号である。h_w（ｎ）はインパルス応答計
算回路170で求めた重み付けインパルス応答である。

遅延回路206は、合成フィルタ入力信号ｖ（ｎ）を１
サブフレーム分遅延させて適応コードブック210へ出力
する。

減算器205は、重み付け回路200の出力信号から適応コ
ードブック210の出力を減算し次式の残差信号e_w（ｎ）
を第１のコードブック探索回路230に出力する。

インパルス応答計算回路170は、聴感重み付けした合
成フィルタのインパルス応答h_w（ｎ）を予め定められた
サンプル数Ｌだけ計算する。具体的な計算法は、前記文
献１等を参照できる。

第１のコードブック探索回路230は、音声信号に対し
て学習して構成したコードブック235と音声帯域モデム
信号に対して学習して構成したコードブック236との両
者を探索し、用いて最適なコードワードc_1j（ｎ）を探
索する。ここで作用の項に記したように、コードブック
235,236は、あらかじめトレーニング信号を用いて学習
しておく。

第２図は第１のコードブック探索回路230の構成を示
すブロック図である。コードワードの探索は下式に従
う。

（21）式を最小化するγ_１を求めるためには、（21）
式をγ_１で偏微分として０とおくことにより得た下式を
用いる。

ただしこのとき（21）式はとなる。ここで（25）式の第１項は定数であるので、第
２項を最大化するようにコードブック235,236の各々を
全て探索してコードワードc_j（ｎ）を選択し、（22）式
からゲインγ_１を計算する。

第２図において、相互相関感空計算回路410は、（2
3）式の計算を行い、自己相関関数計算回路420は（24）
式の計算を行い、判別回路430は（25）式の計算を行
い、コードワードc_j（ｎ）を選択し、それを表すインデ
クスを出力する。

また、コードブックの探索に要する演算量を低減する
には、以下の方法を用いることもできる。

ただしここでμ（ｉ）,v_k（ｉ）は、それぞれh_w（ｎ）のｉ次
遅れの自己相関、コードワードc_1k（ｎ）のｉ次遅れの
自己相関を示す。

以上の方法により求めたコードワードを示すインデク
スをマルチプレクサ260に出力する。また、選択された
コードワードc_j（ｎ）を乗算器241に出力する。また、
２種のコードブック235,236のうち、いずれのコードブ
ックを用いるかの判別符号をマルチプレクサ260に出力
する。つまり、最適なコードワードc_j（ｎ）がコードブ
ック235から選択されたときは、コードブック235を示す
符号を、コードブック236から選択されたときはコード
ブック236を示す符号を出力する。

乗算器241は、コードワードc_j（ｎ）にゲインγ_１を
下式により乗じて次式の音源信号ｑ（ｎ）を求め合成フ
ィルタ250へ出力する。

合成フィルタ250は乗算器241の出力ｑ（ｎ）を入力
し、下式に従い重み付け合成信号y_w（ｎ）を求め出力す
る。

減算器255は、e_w（ｎ）からy_w（ｎ）を減算して第２
のコードブック探索回路270へ出力する。

第２のコードブック探索回路270は、第２のコードブ
ック275から最適なコードワードを計算する。第２のコ
ードブック探索回路の構成は、第２図に示した第１のコ
ードブック探索回路の構成と基本的に同一の構成を用い
ることができる。また、コードワードの探索法として
は、第１のコードブックの探索と同一の方法を用いるこ
とができ、第２のコードブックの構成法としては、作用
の項で述べたように、学習コードブックの高効率を保ち
ながらトレーニングデータ依存性を救済するために、乱
数系列からなるコードブックを用いる。乱数系列からな
るコードブックの構成法は前記文献２を参照できる。

また、コードブック探索の演算量の低減化のために、
第２のコードブックとして、重畳型（overlap）乱数コ
ードブックを用いることができる。重畳型乱数コードブ
ックの構成法，コードワード探索法については、前記文
献２等を参照できる。

ゲイン量子化器286は、作用に述べた方法により、予
め学習により前記（12），（13）式を用いて音声信号に
対して最適に作成したゲインコードブック287と、音声
帯域モデム信号に対して最適に作成したコードブック28
8とを用いて、ゲインγ₁,γ_２をベクトル量子化する。

ベクトル量子化の際の最適なコードワードの選択に
は、前記（８）式を用いる。

第３図はゲイン量子化器286の構成を示すブロック図
である。図において、再生回路505は、c₁（ｎ）,c
₂（ｎ）,h_w（ｎ）を入力して前記（９）式，（10）式に
もとづき、s_w1（ｎ）,s_w2（ｎ）を求める。

相互相関関数計算回路500,自己相関関数計算回路510
は、e_w（ｎ）、再生回路505の出力であるs_w1（ｎ）,s_n2
（ｎ）、ゲインコードブック287,288の出力であるコー
ドワードを入力し、前記（８）式の第２項以下の各項を
計算する。最大値判別回路520は、コードブック287,288
を併せて第（８）式の第２項以下の最大値を判別し、そ
のときのコードワードを示すインデクスを出力する。

ゲイン復号回路530は前記インデクスを用いてゲイン
を復号化して出力する。そしてコードブックのインデク
スをマルチプレクサ260に出力する。またゲインの復号
化値γ_１′，γ_２′を乗算器242に出力する。

乗算器242は、第1,第２のコードブックにより選択さ
れたコードワードc₁（ｎ）,c₂（ｎ）に対してそれぞれ
量子化復号化したゲインγ_１′，γ_２′に乗じて合成フ
ィルタ281に出力する。

合成フィルタ281は、乗算器242の出力ｖ（ｎ）を入力
し、下式により合成音声を１フレーム分求め、さらにも
う１フレーム分は０の系列をフィルタに入力して応答信
号系列を求め、１フレーム分の応答信号系列を減算器19
0に出力する。

ただしマルチプレクサ260は、LSP量子化器140,第１のコード
ブック探索回路230,第２のコードブック探索回路270,ゲ
イン量子化器286の出力符号系列を組みあわせて出力す
る。

以上で第１の発明の実施例の説明を終える。

第４図は、第２の発明の一実施例を示すブロック図で
ある。図において、第１図と同一の番号を付した構成要
素は、第１図と同一の動作を行うので説明を省略する。

図において、量子化器225は、前記（16），（17）式
にもとづき予め学習して構成したコードブック226を用
いて、適応コードブックのゲインをベクトル量子化す
る。最適なコードワードの選択には前記（15）式を用い
る。さらに量子化器225は、選択されたコードワードの
インデクスを示す符号をマルチプレクサ260へ出力する
と共に、ゲインを量子化復号化して出力する。

以上で第２の発明の実施例の説明を終える。

以上の説明では、適応コードブックのゲイン、第1,第
２のコードブックのゲインには同時最適化を施さなかっ
たが、適応コードブック，第１のコードブック，第２の
コードブックのゲインについて、同時最適化を行い、さ
らに特性を改善する。この同期最適化は、作用の項で述
べたように、第1,第２のコードブックのコードワードを
求めるときに適用するとさらに特性が改善される。

例えば、適応コードブックの遅延，ゲインβを求めた
後に、第１のコードブックのコードワードc_1j（ｎ），
ゲインγ_１を探索するときに、各コードワード毎に、次
式を最小化するように解いてβとγ_１を同時最適化す
る。

これから、ここで、である。

次に、第２のコードワードを決定するときに、次式を
最小化するように適応コードブックのゲイン、第1,第２
のコードブックのゲインを同時最適化する。

なお、減算量の低減化のために、第１のコードブック
のコードワード探索のときに前記（33）式によるゲイン
最適化を行い、第２のコードブックの探索のときには行
わない構成とすることもできる。

また、さらに演算量を低減するためには、コードブッ
クのコードワードの探索のときにはゲインの最適化を行
わずに、第１のコードブックのコードワードが選択され
たときに、適応コードブックと第１のコードブックのゲ
インの同時最適化を行い、第２のコードブックのコード
ワードが選択されたときには、適応コードブックと第1,
第２のコードブックのゲインを同時に最適化する構成を
用いることもできる。

また、さらに演算量を低減化するためには、第１と第
２のコードブックのコードワードが選択された後に、適
応コードブックのゲインβ_１と、第1,第２のコードブッ
クのゲインγ₁,γ_２の３種を同時に最適化するような構
成とすることもできる。

また、適応コードブックのゲイン、第1,第２のコード
ブックのゲインγ₁,γ_２のベクトル量子化における最適
コードワードの選択には、演算量低減化のためにそれぞ
れ前記（18）式，（11）式を用いることもできる。

また、第１のコードブック探索回路において、サブフ
レーム毎にコードブック235,236のいずれから最適なコ
ードワードが選択されたかを判別して、ゲインのベクト
ル量子化を行うときに、この判別信号を用いて、コード
ブック287,288を予め選択しておき片方のみのゲインコ
ードブックを探索するようにしてもよい。このような構
成とすることにより、ゲインコードブックは両方を探索
する必要がないので、演算量を低減化できる。

また、前記実施例において、第１のコードブックの探
索法は実施例の方法以外にも他の周知な方法を用いるこ
とができる。例えば、前記文献１に記載の方法や、予め
コードブックの各コードワードc_1j（ｎ）の直交変換c₁
（ｋ）を求めて格納しておき、サブフレーム毎に、重み
付けインパルス応答h_w（ｎ）の直交変換H_w（ｋ）と、残
差信号e_w（ｎ）の直交変換E_w（ｋ）を予め定められた点
数だけ求め、前記（13），（14）式の代わりに下式を用
いてもよい。

そして（37），（38）式を逆直交変換して、相互相関
関数G_j,自己相関関数C_jを計算し、前記（25），（22）
式に従いコードワードの探索，ゲインの計算をするよう
な構成としてもよい。このとき、直交変換としては、フ
ーリエ変換、あるいはFFT、コサイン変換などを用いる
ことができる。この方法によれば、前記（13），（14）
式の畳み込み演算を周波数軸上で乗算に帰着できるので
演算量を低減することができる。

また、第２のコードブックの探索法としては、前記実
施例の方法以外にも上記で示した方法や、前記文献５に
記載の方法や、他の周知な良好な方法を用いることがで
きる。

また、第２のコードブックの構成法としては、前記実
施例に記載した方法以外に、例えば予め膨大な乱数系列
をコードブックとして用意して、それらを用いてトレー
ニングデータに対して乱数系列の探索を行い、選択され
る頻度が高いものからコードワードとして登録して第２
のコードブックを構成することもできる。なお、この構
成法は、第１のコードブックの構成にも適用することが
できる。

また、前記実施例では、第1,第２のコードブックのゲ
インをベクトル量子化したが、適応コードブックのゲイ
ンβと、第1,第２のコードブックのゲインγ₁,γ_２を別
々に、あるいはこれらをまとめてベクトル量子化するよ
うな構成をとることもできる。このとき、これらのコー
ドブックを音声信号に対して最適に学習したコードブッ
クと、音声帯域モデム信号に対して最適に学習したコー
ドブックを用意しておく。このときの学習によるベクト
ル量子化器のコードブックの作成は、前記文献２を参照
できる。

また、前記実施例では、適応コードブックの次数は１
としたが、２次以上の高次とすることもできる。また、
次数は１次のままで遅延を整数値ではなく少数値とする
こともできる。これらについての詳細は、例えばMarque
氏らによる“Pitch Prediction with Fractional Delay
s in CELP Coding"と題した論文（EUROSPEECH,pp.509−
513,1989年）（文献６）等を参照できる。以上のように
した方が特性は向上するが、ゲインあるいは遅延の伝送
に必要な情報量が若干増大する。

また、前記実施例では、スペクトルパラメータとして
Ｋパラメータ、LSPパラメータを符号化し、その分析法
としてLPC分析を用いたが、スペクトルパラメータとし
ては他の周知なパラメータ、例えばLPCケプストラム，
ケプストラム，改良ケプストラム，一般化ケプストラ
ム，メルケプストラムなどを用いることもできる。また
各パラメータに最適な分析法を用いることができる。

また、フレームで求めたLPC係数をLSP上や線形予測係
数上でサブフレーム毎に補間し、補間した係数を用いて
適応コードブック、第1,第２のコードブックの探索を行
う構成としてもよい。このような構成とすることによ
り、音質がさらに改善される。

また、LSP係数は周知の方法により、ベクトル量子
化、あるいはベクトル−スカラ量子化することにより、
さらに効率的に符号化することができる。ベクトル−ス
カラ量子化の方法については、例えば前記文献３等を参
照できる。このような構成とするときは、ベクトル量子
化のコードブックとして、音声信号に対して最適に学習
したコードブックと、音声帯域モデム信号に対して最適
に学習したコードブックとを有しておき、これらから最
良なコードワードを選択する構成とすることにより、さ
らに特性を改善できる。

また、演算量を低減するために、送信側では影響信号
の計算を省略することもできる。これによって、送信側
における合成フィルタ281,減算器190は不要となり演算
量低減が可能となるが、音質は若干低下する。

また、演算量を低減するために、重み付け回路200を
サブフレーム分割回路150の前に配置させ、合成フィル
タ281では下式により重み付け合成信号を計算するよう
にしてもよい。

ここでγは聴感重み付けの程度を決める重み付け係数
である。

また、受信側では、量子化雑音を整形することにより
聴覚的に聞き易くするために、ピッチとスペクトル包絡
の少なくとも１つについて動作する適応形ポストフィル
タを付加してもよい。適応型ポストフィルタの構成につ
いては、例えば、Kroon氏らによる“A Class of Analys
is−by−synthesis Predictive Coders for High Quali
ty Speech Coding at Rates between 4.8 and 16kb/s,"
（IEEE JSAC,vol.6,2,353−363,1988）（文献７）等を
参照できる。

なお、デジタル信号処理の分野でよく知られているよ
うに、自己相関関数は周波数軸上でパワスペクトルに、
相互相関関数はクロスパワスペクトルに対応しているの
で、これらから計算することもできる。これらの計算法
については、Oppenheim氏らによる“Digital Signal Pr
ocessing"（Prentice−Hall,1975）と題した刊行物（文
献８）を参照できる。

〔発明の効果〕

以上述べたように、本発明によれば、音源信号を表す
コードブックを２段に分離して、第１のコードブック
は、予め音声信号に対して最適に学習して求めたコード
ブックと、音声信号以外の音声帯域信号、例えばデータ
モデム信号に対して最適に学習して構成したコードブッ
クとを有して、最良のコードワードを両者から選択し、
第２のコードブックは予め定められた統計的特性を有す
るコードブックを用い、さらに前記コードブックのゲイ
ンやピッチ予測による適応コードブックのゲインのう
ち、少なくとも一つを予め多量のトレーニング信号に対
して学習して構成したコードブックを用いてベクトル量
子化することにより、従来方式に比べてより少ない演算
量で、音声信号に対しても音声信号以外の音声帯域信
号、例えばデータモデム信号などに対しても、従来より
良好な特性を得ることができるという効果がある。ま
た、コードブックのゲインを最適化することによりさら
に特性が改善される。

従って本発明によれば、従来方式に比べて、８〜4.8k
b/sのビットレートで、良好な音声帯域信号符号化方式
を得ることができるという大きな効果がある。

【図面の簡単な説明】第１図は第１の発明による音声帯域信号符号化方式の一
実施例が適用される音声帯域信号符号化装置の構成を示
すブロック図、第２図は第１図のコードブック探索回路の構成を示すブ
ロック図、第３図は第１図のゲイン量子化器の構成を示すブロック
図、第４図は第２の発明による音声帯域信号符号化方式の一
実施例が適用される音声帯域信号符号化装置の構成を示
すブロック図である。 110……バッファメモリ 130……LPC分析回路 140……LSP量子化回路 150……サブフレーム分割回路 170……インパルス応答計算回路 190,205,255……減算器 200……重み付け回路 206……遅延回路 210……適応コードブック 220……ゲイン量子化器 225……量子化器 286……ゲイン量子化器 230……第１のコードブック探索回路 235,236……コードブック 250,281……合成フィルタ 241,242……乗算器 270……第２のコードブック探索回路 275……第２のコードブック 287……ゲインコードブック 410,500……相互相関関数計算回路 420,510……自己相関関数計算回路 430,520……判別回路 530……ゲイン復号回路

フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims

(57)【特許請求の範囲】

【請求項１】入力した離散的な音声帯域信号を予め定め
られた時間長のフレームに分割し、前記入力信号のスペクトル包絡を表すスペクトルパラメ
ータを求めて出力し、前記フレームを予め定められた時間長の小区間に分割
し、過去の音源信号をもとに再生信号が前記入力信号に近く
なるようにピッチパラメータを求めて前記入力信号に対
してピッチ予測を行い残差信号を求め、音声信号あるいは前記音声信号以外の音声帯域信号をも
とに予め学習して構成した複数種類のコードベクトルが
格納された第１のコードブックから前記残差信号との歪
みを小さくするコードベクトルを選択し、前記第１のコードブックから選択されたコードベクトル
を用いて第１の音源信号を生成し、この第１の音源信号
を基に合成された合成残差信号と前記残差信号との差信
号を生成し、既知の統計的特性を有するかあるいは予め学習して構成
したコードベクトルが格納された第２のコードブックか
ら前記差信号との歪みを小さくするコードベクトルを選
択し、前記第１のコードブックから選択されたコードベクトル
と前記第２のコードブックから選択されたコードベクト
ルとを用いて、前記入力信号の音源を表して出力することを特徴とする音声帯域信号符号化方法。
【請求項２】入力した離散的な音声帯域信号を予め定め
られた時間長のフレームに分割し、前記入力信号のスペクトル包絡を表すスペクトルパラメ
ータを求めて出力し、前記フレームを予め定められた時間長の小区間に分割
し、過去の音源信号をもとに再生信号が前記入力信号に
近くなるようにピッチパラメータを求めて前記入力信号
に対してピッチ予測を行い残差信号を求め、音声信号あるいは前記音声信号以外の音声帯域信号をも
とに予め学習して構成した複数種類のコードベクトルが
格納された第１のコードブックから前記残差信号または
前記音声信号との歪みを小さくするコードベクトルを選
択し、前記第１のコードブックから選択されたコードベクトル
を用いて第１の音源信号を生成し、この第１の音源信号
を基に合成された合成残差信号と前記残差信号との差信
号を生成し、既知の統計的特性を有するかあるいは予め学習して構成
したコードベクトルが格納された第２のコードブックか
ら前記差信号との歪みを小さくするコードベクトルを選
択し、予め構成した第３のコードブックを用いて前記ピッチパ
ラメータあるいは前記音源信号のゲインの少なくとも一
方を量子化して出力し、前記第１のコードブックから選択されたコードベクトル
と前記第２のコードブックから選択されたコードベクト
ルと前記ゲインとの重み付き線形結合により、前記入力
信号の音源を表して出力することを特徴とする音声帯域信号符号化方法。