JP3178732B2 - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JP3178732B2 JP3178732B2 JP26784091A JP26784091A JP3178732B2 JP 3178732 B2 JP3178732 B2 JP 3178732B2 JP 26784091 A JP26784091 A JP 26784091A JP 26784091 A JP26784091 A JP 26784091A JP 3178732 B2 JP3178732 B2 JP 3178732B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- pulse
- noise
- gain
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
スメール等に利用する音声符号化装置に関するものであ
る。
ビットレートにおける音声符号化装置は、図3に示すよ
うなCELP(Code Excited Linear Prediction Coder
)と呼ばれる音声符号化装置が広く用いられている。
いて説明する。図3において、31は入力音声の聴覚重
み付けを行なう聴覚重み付けフィルタであり、重み付き
入力音声を出力する。32は適応コードブックであり、
過去の駆動音源を蓄えている。33は確率的コードブッ
クであり、複数の雑音音源を予め保持している。34は
適応コードブック32と確率的コードブック33とから
駆動音源信号を生成する駆動音源生成器である。35は
駆動音源を入力として重み付き合成音声を生成する重み
付き合成フィルタである。36は重み付き入力音声に対
する重み付き合成音声の歪を計算し、この歪が最も小さ
くなるような長期予測遅延とゲイン、確率的コードブッ
ク中の代表ベクトルとゲインの量子化符号を出力する歪
最小化器である。
ついて、以下その動作について説明する。まず、聴覚重
み付きフィルタ31で重み付き入力音声v[n]を求め
る。CELP符号化装置は、これに最も近い重み付き合
成音声を生成するような駆動音源e[n]を符号化する
ものである。ここで、駆動音源はe[n]は次式のよう
に、適応コードブック32の出力である長期予測信号a
[n−L]と確率的コードブック33中のベクトルcI
[n]からなる。
難であり、通常、適応コードブック32から長期予測成
分のみをまず歪最小化器36により決定し(適応コード
ブック探索)、過去の駆動信号をどれだけ遡るかを示す
長期予測遅延Lと最適ゲインβを出力する。次に、残り
の歪が最小となるように確率的コードブック33により
歪最小化し(確率的コードブック探索)、選ばれた代表
コードブックの番号Iと最適ゲインγを出力する。
来の音声符号化装置では、4.8kb/s程度以下の低
ビットレートでは、駆動音源信号の生成の性能が下がる
に伴い、その過去の駆動音源信号を蓄えた適応コードブ
ックからの長期予測成分の生成にも性能の劣化が生じ、
特にパルス性のピッチ周期音源を持つ有声音で顕著な音
声品質の劣化が生じるという問題を有していた。
であり、低ビットレートでも、パルス性のピッチ周期音
源を持つ有声音での音声品質の劣化を抑えた優れた音声
符号化装置を提供することを目的とするものである。
スと雑音成分のゲインを制御することにより、高い音声
品質を有する音声符号化装置を提供することである。
成するために、音声符号化装置を、一定区間の入力音声
の聴覚重み付けを行ない、重み付き入力音声を生成する
聴覚重み付けフィルタと、過去の駆動音源を蓄える適応
コードブックと、ピッチ周期間隔で単一インパルスを持
つパルス列で構成されるパルス音源を生成するパルス音
源生成器と、複数の雑音音源を予め格納する確率的コー
ドブックと、前記パルス音源生成器または確率的コード
ブックから生成された音源のいずれかを選択する音源切
り替え器と、前記パルス音源生成器または確率的コード
ブックのいずれかから選択された音源と適応コードブッ
クの出力とから駆動音源を生成する駆動音源生成器と、
前記駆動音源生成器から生成した駆動音源を入力として
音声を合成する重み付き合成フィルタと、前記重み付き
入力音声に対する重み付き合成音声の誤差の二乗和を計
算し、それを最小とする長期予測遅延の符号と、その長
期予測のゲイン、前記計算の結果、パルス音源又は雑音
音源のどちらかの歪み小さい方の音源が選択され、パル
ス音源が選択された場合にはこの選択されたときのパル
ス位置の符号、およびパルス音源の最適ゲイン、また、
雑音音源が選択された場合にはこの選択されたときの確
率的コードブックの符号、および雑音音源の最適ゲイ
ン、を出力する歪最小化器と、により構成したことを要
旨とするものである。これにより、低ビットレートで
も、パルス性のピッチ周期音源を持つ有声音での音声品
質の劣化を抑えることができる。
適応コードブックの代わりに、長期予測信号のパルス成
分を生成する適応コードブックパルス成分格納器と、雑
音成分を生成する適応コードブック雑音成分格納器と、
長期予測のパルス成分および雑音成分のゲインを制御す
るパルス・雑音成分ゲイン制御器とを備え、長期予測信
号のパルスおよび雑音成分のゲインを制御することによ
り高い音声品質を実現するようにしたものである。
器の出力であるパルス音源と確率的コードブックから生
成される雑音音源のいずれか最適な音源を音源切り替え
器により選択することにより、低ビットレートでも、パ
ルス性のピッチ周期音源を持つ有声音でパルス成分を生
成することができ、音声品質の劣化を抑えた符号化が行
なえるという効果を有する。
れたパルス・雑音成分ゲイン制御器により、長期予測信
号のパルスおよび雑音成分のゲインを最適に制御するこ
とにより、高い音声品質を有する音声符号化が行なえる
という効果を有する。
のである。図1において、11は入力音声の聴覚重み付
けを行なう聴覚重み付けフィルタ、12は過去の駆動音
源を蓄える適応コードブック、13はパルス音源を生成
するパルス音源生成器、14は複数の雑音音源を保持し
ている確率的コードブック、15はパルス音源生成器1
3または確率的コードブック14から生成された音源の
いずれかを選択する音源切り替え器、16はパルス音源
生成器13または確率的コードブック14のいずれかか
ら選択された音源と適応コードブック12の出力とから
駆動音源を生成する駆動音源生成器、17は駆動音源か
ら重み付き合成音声を生成する重み付き合成フィルタ、
18は重み付き入力音声と重み付き合成音声との歪を計
算し、その歪が最小となるような長期予測遅延とパルス
位置または確率的コードブック符号およびこれらのゲイ
ンの量子化符号を出力する歪最小化器である。
する。まず、聴覚重み付けフィルタ11で重み付き入力
音声v[n]を求め、以後これに最も近い重み付き合成
音声を生成する駆動音源e[n]を符号化する。ここ
で、駆動音源生成器16で生成される駆動音源e[n]
は、適応コードブック12の出力の長期予測信号a[n
−L]、パルス音源生成器13で生成されたパルス音源
pM[n]または確率的コードブック14から雑音音源
cI[n]からなり、以下の式で表わされる。 e[n]=β・a[n−L]+γp・pM[n] ・・・・(2) または、 e[n]=β・a[n−L]+γN・cI[n] ・・・・(3) ここで、pM[n]は位置Mからピッチ周期間隔で単一
インパルスを持つパルス列、β、γP、γNはそれぞれ
長期予測、パルス、白色雑音成分のゲインである。ここ
で、上記ピッチ周期として、予め一定区間の入力音声ま
たはその残差信号から求めたピッチ周期を使用するか、
または、後に説明する長期予測信号決定後の長期予測遅
延を用いても良い。
の成分を同時に決定することは困難であり、まず、適応
コードブック12の長期予測信号をその聴覚重み付き合
成音声の歪最小化により決定し、過去の駆動信号のどの
部分を用いるかを示す長期予測遅延Lと最適ゲインβを
出力する。次に、長期予測信号決定後の歪に対して、式
(2)および(3)のそれぞれに対応して、パルス音源
または雑音音源により歪最小化を行ない、歪の小さい方
の音源をその符号化区間で音源として選択し、それがパ
ルス音源であればパルス位置Mと最適ゲインγP の量子
化符号、雑音音源であれば選ばれた雑音ベクトルの番号
Iと最適ゲインγN の量子化符号を、その音源選択情報
(パルス音源/雑音音源のいずれが選択されたか)と共
に、出力する。
期予測信号決定後の歪に対して、パルス音源または雑音
音源のいずれか歪の小さい音源を選択することにより、
パルス性のピッチ周期音源を持つ有声音でパルス成分を
生成することができ、低ビットレートでも音声品質の劣
化を抑えた符号化が行なえる効果を有する。
ものである。図2において、21は適応コードブックの
パルス成分を持つ適応コードブックパルス成分格納器、
22は適応コードブックの雑音成分を持つ適応コードブ
ック雑音成分格納器、23は長期予測信号のパルスおよ
び雑音成分のゲインを制御するパルス・雑音成分ゲイン
制御器であり、他は第1の実施例と同じ構成である。す
なわち、24はパルス音源を生成するパルス音源生成
器、25は複数の雑音音源を保持している確率的コード
ブック、26はパルス音源生成器24または確率的コー
ドブック25から生成された音源のいずれかを選択する
音源切り替え器、27はパルス音源生成器24または確
率的コードブック25のいずれかから選択された音源と
パルス・雑音成分ゲイン制御器23の出力とから駆動音
源を生成する駆動音源生成器、28は駆動音源から重み
付き合成音声を生成する重み付き合成フィルタ、29は
重み付き入力音声と重み付き合成音声との歪を計算し、
その歪が最小となるような長期予測遅延とパルス位置ま
たは確率的コードブック符号およびこれらのゲインの量
子化符号を出力する歪最小化器、30は入力音声の聴覚
重み付けを行なう聴覚重み付けフィルタである。
する。第1の実施例と同様に重み付き入力音声に最も近
い重み付き合成音声を生成する駆動音源e[n]を符号
化するため、まず長期予測信号の歪最小化を行なう。そ
の際、第2の実施例では、長期予測信号aS [n]をパ
ルス成分aP [n−L]と雑音成分aN [n−L]の和
で以下の式で表現し、長期予測遅延Lおよびそれぞれの
成分のゲインβP 、β N を決定する。 aS [n]=βP ・aP [n−L]+βN ・aN [n−L] ・・・(4)
インβP 、βN の決定法の一例として、まずβP =βN
として長期予測遅延Lを求め、そのLに対して、以下の
式(5)で示される入力音声との重み付き二乗誤差Eを
最小にするような、最適なパルス成分ゲインβPおよび
雑音成分ゲインβN を決定する。 E=Σ{p[n]−βP ・bP [n]−βN ・bN [n]}2 →Min ・・・(5) p[n]:聴覚重み付き入力音声 bP [n]:適応コードブックパルス成分出力の聴覚重
み付き合成音声 βP : パルス成分ゲイン bN [n]:適応コードブック雑音成分出力の重み付き
合成音声 βN :雑音成分ゲイン
βP 、βN について解くことにより、最適なβP 、βN
が以下のように求められる。
歪最小化後は、第1の実施例と同様に長期予測成分決定
後の歪に対して、パルス音源または雑音音源のいずれか
歪の小さい音源を選択する。また、適応コードブックの
更新は、パルス成分および雑音成分のそれぞれを別々に
行ない、選択された音源がパルス音源であれば、適応コ
ードブックのパルス成分の更新に使用し、雑音音源であ
れば雑音成分の更新に使用する。
応コードブックをパルス成分と雑音成分とに分離して格
納することにより、長期予測信号のパルス成分と雑音成
分のゲインを最適に制御することができ、これにより高
い音声品質を有する音声符号化が行なえるという効果を
有する。
に、長期予測成分決定後の歪に対して、パルス成分また
白色雑音成分のいずれか歪の小さい音源を選択すること
により、パルス性のピッチ周期音源を持つ有声音でパル
ス成分を生成することができ、低ビットレートでも音声
品質の劣化を抑えた符号化が行なえるという効果を有す
る。
パルス成分と雑音成分とに分離して格納することによ
り、長期予測信号のパルス成分と雑音成分のゲインを最
適に制御することができ、これにより高い音声品質を有
する音声符号化が行なえるという効果を有する。
の概略ブロック図
の概略ブロック図
図
Claims (3)
- 【請求項1】 一定区間の入力音声の聴覚重み付けを行
ない、重み付き入力音声を生成する聴覚重み付けフィル
タと、 過去の駆動音源を蓄える適応コードブックと、 ピッチ周期間隔で単一インパルスを持つパルス列で構成
されるパルス音源を生成するパルス音源生成器と、 複数の雑音音源を予め格納する確率的コードブックと、 前記パルス音源生成器または確率的コードブックから生
成された音源のいずれかを選択する音源切り替え器と、 前記パルス音源生成器または確率的コードブックのいず
れかから選択された音源と適応コードブックの出力とか
ら駆動音源を生成する駆動音源生成器と、 前記駆動音源生成器から生成した駆動音源を入力として
音声を合成する重み付き合成フィルタと、 前記重み付き入力音声に対する重み付き合成音声の誤差
の二乗和を計算し、 それを最小とする長期予測遅延の符号と、その長期予測
のゲイン、 前記計算の結果、パルス音源又は雑音音源のどちらかの
歪み小さい方の音源が選択され、 パルス音源が選択された場合にはこの選択されたときの
パルス位置の符号、およびパルス音源の最適ゲイン、 また、雑音音源が選択された場合にはこの選択されたと
きの確率的コードブックの符号、および雑音音源の最適
ゲイン、 を出力する歪最小化器と、 を有する音声符号化装置。 - 【請求項2】 適応コードブックの代わりに、長期予測
信号のパルス成分を格納する適応コードブックパルス成
分格納器と、雑音成分を格納する適応コードブック雑音
生成格納器と、長期予測信号のパルス成分および雑音成
分のゲインを制御するパルス・雑音生成ゲイン制御器と
を有し、長期予測信号のパルス成分と雑音成分のゲイン
を独立に制御できることを特徴とする請求項1記載の音
声符号化装置。 - 【請求項3】 パルス・雑音成分ゲイン制御器が、長期
予測信号のパルス成分と雑音成分のゲインを、聴覚重み
付き入力音声に対する聴覚重み付き合成音声の二乗誤差
を最小にするように決定することを特徴とする請求項2
記載の音声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26784091A JP3178732B2 (ja) | 1991-10-16 | 1991-10-16 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26784091A JP3178732B2 (ja) | 1991-10-16 | 1991-10-16 | 音声符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05108098A JPH05108098A (ja) | 1993-04-30 |
JP3178732B2 true JP3178732B2 (ja) | 2001-06-25 |
Family
ID=17450356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26784091A Expired - Lifetime JP3178732B2 (ja) | 1991-10-16 | 1991-10-16 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3178732B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5864797A (en) * | 1995-05-30 | 1999-01-26 | Sanyo Electric Co., Ltd. | Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors |
EP1752968B1 (en) | 1997-10-22 | 2008-09-10 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for generating dispersed vectors |
JP3404016B2 (ja) | 2000-12-26 | 2003-05-06 | 三菱電機株式会社 | 音声符号化装置及び音声符号化方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
JPH0333900A (ja) * | 1989-06-30 | 1991-02-14 | Fujitsu Ltd | 音声符号化方式 |
-
1991
- 1991-10-16 JP JP26784091A patent/JP3178732B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH05108098A (ja) | 1993-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JPH0353300A (ja) | 音声符号化装置 | |
JPH11327597A (ja) | 音声符号化装置及び音声復号化装置 | |
JPH0612098A (ja) | 音声符号化装置 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3178732B2 (ja) | 音声符号化装置 | |
JP3179291B2 (ja) | 音声符号化装置 | |
JP3329216B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP3303580B2 (ja) | 音声符号化装置 | |
JP3746067B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP2615548B2 (ja) | 高能率音声符号化方式とその装置 | |
JPH10222197A (ja) | 音声合成方法およびコード励振線形予測合成装置 | |
JP3194481B2 (ja) | 音声符号化法 | |
JP3028886B2 (ja) | 音声符号化装置 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP2956068B2 (ja) | 音声符号化復号化方式 | |
JP3845316B2 (ja) | 音声符号化装置及び音声復号装置 | |
JPH11259098A (ja) | 音声符号化/復号化方法 | |
JP4179232B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP3057907B2 (ja) | 音声符号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3103108B2 (ja) | 音声符号化装置 | |
JP3071800B2 (ja) | 適応ポストフィルタ | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JP2001013999A (ja) | 音声符号化方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080413 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090413 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100413 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110413 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120413 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120413 Year of fee payment: 11 |