JP2000122698A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JP2000122698A JP2000122698A JP10296965A JP29696598A JP2000122698A JP 2000122698 A JP2000122698 A JP 2000122698A JP 10296965 A JP10296965 A JP 10296965A JP 29696598 A JP29696598 A JP 29696598A JP 2000122698 A JP2000122698 A JP 2000122698A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- excitation
- adaptive
- pulse
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract description 248
- 230000005284 excitation Effects 0.000 claims description 318
- 230000001629 suppression Effects 0.000 claims description 163
- 238000012545 processing Methods 0.000 claims description 46
- 230000001052 transient effect Effects 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000005236 sound signal Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 10
- 230000002708 enhancing effect Effects 0.000 claims description 6
- 230000000630 rising effect Effects 0.000 abstract description 30
- 238000000034 method Methods 0.000 abstract description 14
- 238000010586 diagram Methods 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 17
- 108010076504 Protein Sorting Signals Proteins 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000541 pulsatile effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【課題】 入力音声の状態に応じて適応符号帳の内部状
態更新に用いる過去の音源信号を加工することで、伝送
情報を増加させずに音声符号化装置の品質向上、特に音
声立ち上がり部分の品質向上を図ることができる音声符
号化装置を得る。 【解決手段】 入力音声信号を一定時間間隔でフレーム
毎に分析し、上記入力音声信号のスペクトル包絡情報を
符号化すると共に、音源信号を符号帳に蓄えられたコー
ドベクトルまたは過去の音声の励振信号をコード化した
適応音源符号帳のコードベクトルによって符号化する音
声符号化装置において、入力音声信号を分析して音声状
態判別信号を出力する音声状態判別手段3、音声状態判
別手段からの音声状態判別信号に基づいて適応音源符号
帳8の内部状態を更新するための適応音源更新信号を加
工して加工した音源信号を用いて適応音源符号帳の更新
を行う加工更新手段(抑制比率算出手段11と音源信号
抑制手段12)を備えた。
態更新に用いる過去の音源信号を加工することで、伝送
情報を増加させずに音声符号化装置の品質向上、特に音
声立ち上がり部分の品質向上を図ることができる音声符
号化装置を得る。 【解決手段】 入力音声信号を一定時間間隔でフレーム
毎に分析し、上記入力音声信号のスペクトル包絡情報を
符号化すると共に、音源信号を符号帳に蓄えられたコー
ドベクトルまたは過去の音声の励振信号をコード化した
適応音源符号帳のコードベクトルによって符号化する音
声符号化装置において、入力音声信号を分析して音声状
態判別信号を出力する音声状態判別手段3、音声状態判
別手段からの音声状態判別信号に基づいて適応音源符号
帳8の内部状態を更新するための適応音源更新信号を加
工して加工した音源信号を用いて適応音源符号帳の更新
を行う加工更新手段(抑制比率算出手段11と音源信号
抑制手段12)を備えた。
Description
【0001】
【発明の属する技術分野】この発明は、主に低ビットレ
ートの符号駆動線形予測符号化(Code Excited Linear
Predictive coding :CELP)方式を用いた音声符号
化装置に関し、特に、適応音源信号を音声状態に応じて
加工することにより、音声品質を向上させる音声符号化
装置に関するものである。
ートの符号駆動線形予測符号化(Code Excited Linear
Predictive coding :CELP)方式を用いた音声符号
化装置に関し、特に、適応音源信号を音声状態に応じて
加工することにより、音声品質を向上させる音声符号化
装置に関するものである。
【0002】
【従来の技術】従来、音声を高能率に符号化する方式と
して、音声信号をある一定の長さのフレーム毎に分析
し、その1フレーム分のスペクトル情報と、そのスペク
トル情報に対応する線形フィルタを駆動する音源信号と
に分離し、それぞれを符号化することが提案されてい
る。この符号化方式の代表例として、符号駆動線形予測
符号化(Code Excited Linear Predictive coding :C
ELP)やベクトル和駆動線形予測符号化(Vector Sum
Excited Linear Predictive coding :VSELP)な
どがよく知られており、4Kbit/s程度で実用的な
音声品質を達成している。それぞれの技術については、
M.R.Schroeder and B.S.Atal 著、“Code−Excited
Linear Prediction(CELP) High−Quality Speech
at Very LowBit Rates”、Proc. ICASSP'85 (19
85.3)、およびI.A.Gerson andM.A.Jasiuk
著、“Vector Sum Excited Linear Prediction(VSE
LP) Speech Coding at 8kbps”、Proc. ICASSP'9
0 (1990.4)に述べられている。
して、音声信号をある一定の長さのフレーム毎に分析
し、その1フレーム分のスペクトル情報と、そのスペク
トル情報に対応する線形フィルタを駆動する音源信号と
に分離し、それぞれを符号化することが提案されてい
る。この符号化方式の代表例として、符号駆動線形予測
符号化(Code Excited Linear Predictive coding :C
ELP)やベクトル和駆動線形予測符号化(Vector Sum
Excited Linear Predictive coding :VSELP)な
どがよく知られており、4Kbit/s程度で実用的な
音声品質を達成している。それぞれの技術については、
M.R.Schroeder and B.S.Atal 著、“Code−Excited
Linear Prediction(CELP) High−Quality Speech
at Very LowBit Rates”、Proc. ICASSP'85 (19
85.3)、およびI.A.Gerson andM.A.Jasiuk
著、“Vector Sum Excited Linear Prediction(VSE
LP) Speech Coding at 8kbps”、Proc. ICASSP'9
0 (1990.4)に述べられている。
【0003】一方、移動体通信における周波数利用効率
の観点から、4Kbit/s以下の低ビットレートの音
声符号化方式の開発が望まれている。しかし、上記のC
ELPやVSELPなどの音声符号化方式を単純に低ビ
ットレート化すると、急激に品質劣化してしまい限界が
ある。これは、低ビットレート化することにより周期性
の再現性が低化するためと、入力音声が急激に変化する
場合において(特に有声音の立ち上がり部分など)、励
振音源としてパルス状の音源信号が必要になるのに対
し、適応音源の立ち上がり遅れによって合成音声信号の
劣化につながるためと考えられている。
の観点から、4Kbit/s以下の低ビットレートの音
声符号化方式の開発が望まれている。しかし、上記のC
ELPやVSELPなどの音声符号化方式を単純に低ビ
ットレート化すると、急激に品質劣化してしまい限界が
ある。これは、低ビットレート化することにより周期性
の再現性が低化するためと、入力音声が急激に変化する
場合において(特に有声音の立ち上がり部分など)、励
振音源としてパルス状の音源信号が必要になるのに対
し、適応音源の立ち上がり遅れによって合成音声信号の
劣化につながるためと考えられている。
【0004】そこで、この音声の立ち上がり部分を改良
するものとして以下に示す方式が提案されている。例え
ば特開平7−334193号公報に開示されている音声
符号化装置は、入力音声信号の変化を監視し、その変化
の度合により符号帳に蓄えられた過去の音源からピッチ
周期に応じて切り出し、それを少ない情報量で修正を加
えることによって、有声音の立上り部分の音声品質を向
上させている。
するものとして以下に示す方式が提案されている。例え
ば特開平7−334193号公報に開示されている音声
符号化装置は、入力音声信号の変化を監視し、その変化
の度合により符号帳に蓄えられた過去の音源からピッチ
周期に応じて切り出し、それを少ない情報量で修正を加
えることによって、有声音の立上り部分の音声品質を向
上させている。
【0005】図17は特開平7−334193号公報に
開示されている従来の音声符号化装置のブロック構成図
である。図17において、101はピッチ周期分析手
段、102はスペクトルパラメータ算出手段、103は
第1のコードブック、104は第2のコードブック、1
05は合成フィルタ、106は聴覚重み付け手段、10
7は誤差最小化手段、108は入力音声信号変化監視手
段、109は音源信号の修正が必要か否かを判定する判
定手段、110は第1のコードブック103に蓄えられ
た音源信号を修正する音源信号修正手段である。
開示されている従来の音声符号化装置のブロック構成図
である。図17において、101はピッチ周期分析手
段、102はスペクトルパラメータ算出手段、103は
第1のコードブック、104は第2のコードブック、1
05は合成フィルタ、106は聴覚重み付け手段、10
7は誤差最小化手段、108は入力音声信号変化監視手
段、109は音源信号の修正が必要か否かを判定する判
定手段、110は第1のコードブック103に蓄えられ
た音源信号を修正する音源信号修正手段である。
【0006】次に動作について説明する。ピッチ周期分
析手段101は、入力音声信号111からピッチ周期1
12を抽出し、入力音声信号変化監視手段108は、入
力音声信号111の変化を監視し、その度合がある閾値
を超えた場合、判定手段109により、第1のコードブ
ック103に蓄えられた過去の音源信号からピッチ周期
112に応じて切り出された音源信号119を読み込
み、修正すべきか否かの判定を行う。修正が必要とされ
た場合には、音源信号119は、音源信号修正手段11
0によってパルス性の形状を持つように修正され、第1
のコードブック103の切り出された元の位置へ再び格
納される。
析手段101は、入力音声信号111からピッチ周期1
12を抽出し、入力音声信号変化監視手段108は、入
力音声信号111の変化を監視し、その度合がある閾値
を超えた場合、判定手段109により、第1のコードブ
ック103に蓄えられた過去の音源信号からピッチ周期
112に応じて切り出された音源信号119を読み込
み、修正すべきか否かの判定を行う。修正が必要とされ
た場合には、音源信号119は、音源信号修正手段11
0によってパルス性の形状を持つように修正され、第1
のコードブック103の切り出された元の位置へ再び格
納される。
【0007】修正された第1のコードブック103の音
源信号120からピッチ周期112に応じて切り出され
た出力音源信号113と第2のコードブック104の出
力音源信号114との線形和により、励振音源信号11
5が生成される。そして、励振信号を合成フィルタ10
5に入力して得た合成音声信号116と入力音声信号1
11との差を取り、聴覚重み付け手段106で重み付け
を行った後、誤差最小化手段107によって誤差を最小
化するように、第1のコードブック103および第2の
コードブック104の出力およびゲインにフィードバッ
ク118をかけ、最適な励振音源信号とそのゲインを決
定し、パルス位置情報およびパルス間隔情報に相当する
ピッチ周期情報とともに伝送路へ送出する。
源信号120からピッチ周期112に応じて切り出され
た出力音源信号113と第2のコードブック104の出
力音源信号114との線形和により、励振音源信号11
5が生成される。そして、励振信号を合成フィルタ10
5に入力して得た合成音声信号116と入力音声信号1
11との差を取り、聴覚重み付け手段106で重み付け
を行った後、誤差最小化手段107によって誤差を最小
化するように、第1のコードブック103および第2の
コードブック104の出力およびゲインにフィードバッ
ク118をかけ、最適な励振音源信号とそのゲインを決
定し、パルス位置情報およびパルス間隔情報に相当する
ピッチ周期情報とともに伝送路へ送出する。
【0008】また、従来の音声符号化装置として、特開
平5−307400号公報に開示されている音声符号化
装置は、適応符号帳および固定符号帳の2つの符号帳を
用い、ピッチ探索・符号帳探索を行って最適な駆動音源
信号を求めることで符号化を行うCELP型の音声符号
化装置において、再生信号のパワーが閾値を越えている
ときには最適駆動音源信号を選択し、閾値を越えていな
いときには零を選択して、適応符号帳を更新する信号を
切り替える制御を行うことにより、音声の立上り等にお
ける品質劣化を無くしている。
平5−307400号公報に開示されている音声符号化
装置は、適応符号帳および固定符号帳の2つの符号帳を
用い、ピッチ探索・符号帳探索を行って最適な駆動音源
信号を求めることで符号化を行うCELP型の音声符号
化装置において、再生信号のパワーが閾値を越えている
ときには最適駆動音源信号を選択し、閾値を越えていな
いときには零を選択して、適応符号帳を更新する信号を
切り替える制御を行うことにより、音声の立上り等にお
ける品質劣化を無くしている。
【0009】図18は特開平5−307400号公報に
開示されている従来の音声符号化装置の構成を示すブロ
ック図である。図18に示す音声符号化装置は、最適駆
動音源信号211から合成フィルタ203で再生信号2
12を生成し、再生信号212のパワーが閾値を越えて
いるときには最適駆動音源信号211を選択し、閾値を
越えていなければ零を選択してフレーム遅延器205を
介して適応符号帳201に与える零置換判定回路204
を備える。なお、202は固定符号帳、206は重み付
け合成フィルタ、207は重み付け合成フィルタ206
から出力される再生信号208と入力信号209との減
算による誤差信号の電力を評価関数として評価する誤差
電力評価部であり、誤差電力を最小とする駆動音源信号
210を最適駆動音源信号として決定するようになって
いる。
開示されている従来の音声符号化装置の構成を示すブロ
ック図である。図18に示す音声符号化装置は、最適駆
動音源信号211から合成フィルタ203で再生信号2
12を生成し、再生信号212のパワーが閾値を越えて
いるときには最適駆動音源信号211を選択し、閾値を
越えていなければ零を選択してフレーム遅延器205を
介して適応符号帳201に与える零置換判定回路204
を備える。なお、202は固定符号帳、206は重み付
け合成フィルタ、207は重み付け合成フィルタ206
から出力される再生信号208と入力信号209との減
算による誤差信号の電力を評価関数として評価する誤差
電力評価部であり、誤差電力を最小とする駆動音源信号
210を最適駆動音源信号として決定するようになって
いる。
【0010】ここで、上記零置換判定回路204は、図
19に示すように、合成フィルタ203からの再生信号
212のパワーをフレーム毎に出力する積和器213
と、この積和器213からの出力信号とパワー閾値Sと
を比較する比較器214と、この比較器214の比較結
果に基づき出力信号216として最適駆動音源信号21
1または“0”を選択する切替器215と、この切替器
215の動作時間を規定するタイマ217とで構成され
ている。
19に示すように、合成フィルタ203からの再生信号
212のパワーをフレーム毎に出力する積和器213
と、この積和器213からの出力信号とパワー閾値Sと
を比較する比較器214と、この比較器214の比較結
果に基づき出力信号216として最適駆動音源信号21
1または“0”を選択する切替器215と、この切替器
215の動作時間を規定するタイマ217とで構成され
ている。
【0011】以下、図18及び図19に従い、この従来
の音声符号化装置の動作を説明する。まず、積和器21
3で再生信号212のパワーを計算する。そして、この
再生信号212のパワーKを閾値Sと比較器214で比
較し、その結果、K > Sの場合は、切替器215を制
御して最適駆動音源信号211をそのまま出力する。反
対に、K < Sの場合には音声の立上り等の状態と判定
し、最適駆動音源信号211を零に置き換えてフレーム
遅延器205より適応符号帳201を更新する。これに
より、適応符号帳201の更新する信号を零に置換する
こととなり、音声の立上り時の音質を改善することがで
きる。なお、音声が定常状態になった後は上記置換動作
は不必要となるので、タイマ217は定常状態に至る時
間を規定し、その後は常に最適駆動音源信号211を選
択するように切り替え器215の動作を制御する。
の音声符号化装置の動作を説明する。まず、積和器21
3で再生信号212のパワーを計算する。そして、この
再生信号212のパワーKを閾値Sと比較器214で比
較し、その結果、K > Sの場合は、切替器215を制
御して最適駆動音源信号211をそのまま出力する。反
対に、K < Sの場合には音声の立上り等の状態と判定
し、最適駆動音源信号211を零に置き換えてフレーム
遅延器205より適応符号帳201を更新する。これに
より、適応符号帳201の更新する信号を零に置換する
こととなり、音声の立上り時の音質を改善することがで
きる。なお、音声が定常状態になった後は上記置換動作
は不必要となるので、タイマ217は定常状態に至る時
間を規定し、その後は常に最適駆動音源信号211を選
択するように切り替え器215の動作を制御する。
【0012】また、特開平8−254998号公報に開
示されている音声符号化装置は、入力音声を有声/無声
/過渡部に分類し、無声/有声/過渡部において適切な
符号帳を使用することで音声過渡部の品質向上を図って
いる。
示されている音声符号化装置は、入力音声を有声/無声
/過渡部に分類し、無声/有声/過渡部において適切な
符号帳を使用することで音声過渡部の品質向上を図って
いる。
【0013】図20に特開平8−254998号公報に
開示されている従来の音声符号化装置のブロック構成図
を示す。図20に示す音声符号化装置は、ある一定区間
の入力音声信号303を分析して線形予測係数304を
抽出する線形予測係数抽出器301と、線形予測係数3
04を量子化して出力する線形予測係数量子化器302
と、入力音声信号303を判定し有声部と無声部と過渡
部とに区分する有声/無声/過渡部判定器317と、そ
の判定結果を入力して過渡部の場合は過渡部音源コード
ブック320、無声部の場合はランダム信号発生器32
1、有声部の場合は有声ダウンサンプリングコードブッ
ク319からダウンサンプルされた信号列を最適音源と
して選択する有声/無声/過渡部切替器318とを備え
ている。
開示されている従来の音声符号化装置のブロック構成図
を示す。図20に示す音声符号化装置は、ある一定区間
の入力音声信号303を分析して線形予測係数304を
抽出する線形予測係数抽出器301と、線形予測係数3
04を量子化して出力する線形予測係数量子化器302
と、入力音声信号303を判定し有声部と無声部と過渡
部とに区分する有声/無声/過渡部判定器317と、そ
の判定結果を入力して過渡部の場合は過渡部音源コード
ブック320、無声部の場合はランダム信号発生器32
1、有声部の場合は有声ダウンサンプリングコードブッ
ク319からダウンサンプルされた信号列を最適音源と
して選択する有声/無声/過渡部切替器318とを備え
ている。
【0014】また、有声/無声/過渡部切替器318に
より選択されたダウンサンプル信号列をアップサンプル
するアップサンプラ326と、アップサンプリングされ
た信号列を入力して高周波成分を除去した低周波成分を
出力するローパスフィルタ325と、フィルタリングさ
れた信号列を入力してピークのみの信号列を生成するピ
ーク抽出器324と、このピークのみの信号の低周波成
分を除去した高周波成分を出力するハイパスフィルタ3
23と、ハイパスフィルタ323でフィルタリングされ
た信号列とローパスフィルタ325の出力とを加算する
加算器322とを備えている。
より選択されたダウンサンプル信号列をアップサンプル
するアップサンプラ326と、アップサンプリングされ
た信号列を入力して高周波成分を除去した低周波成分を
出力するローパスフィルタ325と、フィルタリングさ
れた信号列を入力してピークのみの信号列を生成するピ
ーク抽出器324と、このピークのみの信号の低周波成
分を除去した高周波成分を出力するハイパスフィルタ3
23と、ハイパスフィルタ323でフィルタリングされ
た信号列とローパスフィルタ325の出力とを加算する
加算器322とを備えている。
【0015】さらに、加算器322の出力と有声/無声
/過渡部切替器318により選択されたダウンサンプル
信号列を線形予測係数抽出器301で抽出され線形予測
係数量子化器302で量子化された線形予測係数305
により処理して合成音声を得る線形予測フィルタ306
と、その合成音声を、入力信号との誤差が最小になるよ
うに調整したゲイン量子化器308からの量子化ゲイン
を用いて増幅する増幅器307と、合成音声と入力音声
との誤差を調べ、誤差が最小となるコードベクトルの符
号を復号化部へ伝送するとともに、有声/無声/過渡部
を示すモード情報を復号化部へ伝送する誤差評価器30
9とを備えている。
/過渡部切替器318により選択されたダウンサンプル
信号列を線形予測係数抽出器301で抽出され線形予測
係数量子化器302で量子化された線形予測係数305
により処理して合成音声を得る線形予測フィルタ306
と、その合成音声を、入力信号との誤差が最小になるよ
うに調整したゲイン量子化器308からの量子化ゲイン
を用いて増幅する増幅器307と、合成音声と入力音声
との誤差を調べ、誤差が最小となるコードベクトルの符
号を復号化部へ伝送するとともに、有声/無声/過渡部
を示すモード情報を復号化部へ伝送する誤差評価器30
9とを備えている。
【0016】以下、図20に従いこの従来の音声符号化
装置の動作について説明する。ある一定区間の入力音声
信号303は線形予測係数抽出器301により分析され
線形予測係数304が抽出される。続いて、有声/無声
/過渡部判定器317が、その区間が有声部か、無声部
か、過渡部であるかを判定する。該判定結果は有声/無
声/過渡部切替器318に入力され、過渡部の場合には
過渡部音源コードブック320、無声部の場合にはラン
ダム信号発生器321、有声部の場合には有声ダウンサ
ンプリングコードブック319からダウンサンプルされ
た信号列のいずれかが最適音源として選択される。この
選択されたダウンサンプル信号列は、アップサンプラ3
26に入力されてアップサンプルされる。アップサンプ
リングされた信号列は、ローパスフィルタ325に入力
されて高周波成分が除去され低周波成分が通される。
装置の動作について説明する。ある一定区間の入力音声
信号303は線形予測係数抽出器301により分析され
線形予測係数304が抽出される。続いて、有声/無声
/過渡部判定器317が、その区間が有声部か、無声部
か、過渡部であるかを判定する。該判定結果は有声/無
声/過渡部切替器318に入力され、過渡部の場合には
過渡部音源コードブック320、無声部の場合にはラン
ダム信号発生器321、有声部の場合には有声ダウンサ
ンプリングコードブック319からダウンサンプルされ
た信号列のいずれかが最適音源として選択される。この
選択されたダウンサンプル信号列は、アップサンプラ3
26に入力されてアップサンプルされる。アップサンプ
リングされた信号列は、ローパスフィルタ325に入力
されて高周波成分が除去され低周波成分が通される。
【0017】フィルタリングされた信号列は、次にピー
ク抽出器324に入力されピークのみの信号列が生成さ
れる。このピークのみの信号列は、ハイパスフィルタ3
23に入力されて低周波成分が除去されて高周波成分が
通される。ハイパスフィルタ323でフィルタリングさ
れた信号列は、加算器322によりローパスフィルタ3
25の出力と加算され、線形予測係数抽出器301で抽
出され線形予測係数量子化器302で量子化された線形
予測係数305と共に線形予測フィルタ306で処理さ
れて合成音声となる。この合成音声は、入力信号との誤
差が最小になるように調整した量子化ゲイン(ゲイン量
子化器308で量子化する)を用いて増幅器307によ
り増幅した後に誤差評価器309に入力される。誤差評
価器309は、合成音声と入力音声との誤差を調べ、誤
差が最小となるコードベクトルの符号を復号化部へ伝送
するとともに、有声/無声/過渡部を示すモード情報を
復号化部へ伝送する。
ク抽出器324に入力されピークのみの信号列が生成さ
れる。このピークのみの信号列は、ハイパスフィルタ3
23に入力されて低周波成分が除去されて高周波成分が
通される。ハイパスフィルタ323でフィルタリングさ
れた信号列は、加算器322によりローパスフィルタ3
25の出力と加算され、線形予測係数抽出器301で抽
出され線形予測係数量子化器302で量子化された線形
予測係数305と共に線形予測フィルタ306で処理さ
れて合成音声となる。この合成音声は、入力信号との誤
差が最小になるように調整した量子化ゲイン(ゲイン量
子化器308で量子化する)を用いて増幅器307によ
り増幅した後に誤差評価器309に入力される。誤差評
価器309は、合成音声と入力音声との誤差を調べ、誤
差が最小となるコードベクトルの符号を復号化部へ伝送
するとともに、有声/無声/過渡部を示すモード情報を
復号化部へ伝送する。
【0018】
【発明が解決しようとする課題】以上説明した音声符号
化装置は、従来法に比べて低ビットレート化しても音声
の立ち上がり部分の品質向上が図ることができるが、次
のような問題がある。特開平7−334193号公報に
開示されている方式は、過去の音源信号からピッチ周期
毎に切り出すためにピッチ情報が必要なことと、修正情
報としてのパルス位置情報を伝送しなければならず、伝
送情報量が増加してしまうという問題点がある。
化装置は、従来法に比べて低ビットレート化しても音声
の立ち上がり部分の品質向上が図ることができるが、次
のような問題がある。特開平7−334193号公報に
開示されている方式は、過去の音源信号からピッチ周期
毎に切り出すためにピッチ情報が必要なことと、修正情
報としてのパルス位置情報を伝送しなければならず、伝
送情報量が増加してしまうという問題点がある。
【0019】また、特開平5−307400号公報に開
示されている方式は、例えば音声の立上り部分におい
て、入力音声の過去のフレームの駆動音源信号をすべて
零にして適応音源符号帳を更新するので、有声フレーム
の符号化に無声部の特徴を引きずらない効果はあるが、
この方式では無声フレームに含まれる有声部の特徴を強
調するといった更に大きな効果は望めないので、品質を
保ったまま低ビットレート化するのは困難であるという
問題点がある。また、特開平8−254998号公報に
開示されている方式は、有声/無声/過渡部を決定する
モード情報が必要という問題点がある。
示されている方式は、例えば音声の立上り部分におい
て、入力音声の過去のフレームの駆動音源信号をすべて
零にして適応音源符号帳を更新するので、有声フレーム
の符号化に無声部の特徴を引きずらない効果はあるが、
この方式では無声フレームに含まれる有声部の特徴を強
調するといった更に大きな効果は望めないので、品質を
保ったまま低ビットレート化するのは困難であるという
問題点がある。また、特開平8−254998号公報に
開示されている方式は、有声/無声/過渡部を決定する
モード情報が必要という問題点がある。
【0020】この発明は、かかる課題を解決するために
なされたもので、入力音声の状態に応じて適応符号帳の
内部状態更新に用いる過去の音源信号を加工することに
より、伝送情報を増加させずに、音声符号化装置の品質
向上、特に音声立ち上がり部分の品質向上を図ることが
できる音声符号化装置を得ることを目的としている。
なされたもので、入力音声の状態に応じて適応符号帳の
内部状態更新に用いる過去の音源信号を加工することに
より、伝送情報を増加させずに、音声符号化装置の品質
向上、特に音声立ち上がり部分の品質向上を図ることが
できる音声符号化装置を得ることを目的としている。
【0021】
【課題を解決するための手段】上記の課題を解決するた
めに、この発明に係る音声符号化装置は、入力音声信号
を一定時間間隔でフレーム毎に分析し、上記入力音声信
号のスペクトル包絡情報を符号化すると共に、音源信号
を符号帳に蓄えられたコードベクトルまたは過去の音声
の励振信号をコード化した適応音源符号帳のコードベク
トルによって符号化する音声符号化装置において、入力
音声信号を分析して音声状態判別信号を出力する音声状
態判別手段と、上記音声状態判別手段からの音声状態判
別信号に基づいて上記適応音源符号帳の内部状態を更新
するための適応音源更新信号を加工して加工した音源信
号を用いて上記適応音源符号帳の更新を行う加工更新手
段とを備えたことを特徴とするものである。
めに、この発明に係る音声符号化装置は、入力音声信号
を一定時間間隔でフレーム毎に分析し、上記入力音声信
号のスペクトル包絡情報を符号化すると共に、音源信号
を符号帳に蓄えられたコードベクトルまたは過去の音声
の励振信号をコード化した適応音源符号帳のコードベク
トルによって符号化する音声符号化装置において、入力
音声信号を分析して音声状態判別信号を出力する音声状
態判別手段と、上記音声状態判別手段からの音声状態判
別信号に基づいて上記適応音源符号帳の内部状態を更新
するための適応音源更新信号を加工して加工した音源信
号を用いて上記適応音源符号帳の更新を行う加工更新手
段とを備えたことを特徴とするものである。
【0022】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号中
の全パルス数に対し振幅抑圧するパルス数の比率を上記
音声状態判別信号から算出し抑圧比率として出力する抑
圧比率算出手段と、上記適応音源更新信号を入力し、上
記抑圧比率に従って振幅が小さいパルスから順に振幅抑
圧した音源信号を用いて上記適応音源符号帳の更新を行
う音源信号抑圧手段とを有することを特徴とするもので
ある。
符号帳の内部状態を更新するための適応音源更新信号中
の全パルス数に対し振幅抑圧するパルス数の比率を上記
音声状態判別信号から算出し抑圧比率として出力する抑
圧比率算出手段と、上記適応音源更新信号を入力し、上
記抑圧比率に従って振幅が小さいパルスから順に振幅抑
圧した音源信号を用いて上記適応音源符号帳の更新を行
う音源信号抑圧手段とを有することを特徴とするもので
ある。
【0023】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号中
の全パルス数に対し振幅強調するパルス数の比率を上記
音声状態判別信号から算出し強調比率として出力する強
調比率算出手段と、上記適応音源更新信号を入力し、上
記強調比率に従って振幅が大きいパルスから順に振幅強
調した音源信号を用いて上記適応音源符号帳の更新を行
う音源信号強調手段とを有することを特徴とするもので
ある。
符号帳の内部状態を更新するための適応音源更新信号中
の全パルス数に対し振幅強調するパルス数の比率を上記
音声状態判別信号から算出し強調比率として出力する強
調比率算出手段と、上記適応音源更新信号を入力し、上
記強調比率に従って振幅が大きいパルスから順に振幅強
調した音源信号を用いて上記適応音源符号帳の更新を行
う音源信号強調手段とを有することを特徴とするもので
ある。
【0024】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスと上記音声状態判別信号から抑圧閾値
を算出する抑圧閾値算出手段と、上記適応音源更新信号
を入力し、上記抑圧閾値以下の振幅のパルスを振幅抑圧
した音源信号を用いて上記適応音源符号帳の更新を行う
音源信号抑圧手段とを有することを特徴とするものであ
る。
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスと上記音声状態判別信号から抑圧閾値
を算出する抑圧閾値算出手段と、上記適応音源更新信号
を入力し、上記抑圧閾値以下の振幅のパルスを振幅抑圧
した音源信号を用いて上記適応音源符号帳の更新を行う
音源信号抑圧手段とを有することを特徴とするものであ
る。
【0025】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスと上記音声状態判別信号から強調閾値
を算出する強調閾値算出手段と、上記適応音源更新信号
を入力し、上記強調閾値以上の振幅のパルスを振幅強調
した音源信号を用いて上記適応音源符号帳の更新を行う
音源信号強調手段とを有することを特徴とするものであ
る。
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスと上記音声状態判別信号から強調閾値
を算出する強調閾値算出手段と、上記適応音源更新信号
を入力し、上記強調閾値以上の振幅のパルスを振幅強調
した音源信号を用いて上記適応音源符号帳の更新を行う
音源信号強調手段とを有することを特徴とするものであ
る。
【0026】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスを中心とし、上記最大振幅パルスの近
傍のパルスを選択するための選択幅を上記音声状態判別
信号に従って決定するパルス幅選択手段と、上記適応音
源更新信号を入力し、上記選択幅で選択されたパルス以
外のパルスを振幅抑圧した音源信号を用いて上記適応音
源符号帳の更新を行う音源信号抑圧手段とを有すること
を特徴とするものである。
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスを中心とし、上記最大振幅パルスの近
傍のパルスを選択するための選択幅を上記音声状態判別
信号に従って決定するパルス幅選択手段と、上記適応音
源更新信号を入力し、上記選択幅で選択されたパルス以
外のパルスを振幅抑圧した音源信号を用いて上記適応音
源符号帳の更新を行う音源信号抑圧手段とを有すること
を特徴とするものである。
【0027】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスを中心とし、上記最大振幅パルスの近
傍のパルスを選択するための選択幅を上記音声状態判別
信号に従って決定するパルス幅選択手段と、上記適応音
源更新信号を入力し、上記選択幅で選択されたパルスを
振幅強調した音源信号を用いて上記適応音源符号帳の更
新を行う音源信号強調手段とを有することを特徴とする
ものである。
符号帳の内部状態を更新するための適応音源更新信号中
の最大振幅パルスを中心とし、上記最大振幅パルスの近
傍のパルスを選択するための選択幅を上記音声状態判別
信号に従って決定するパルス幅選択手段と、上記適応音
源更新信号を入力し、上記選択幅で選択されたパルスを
振幅強調した音源信号を用いて上記適応音源符号帳の更
新を行う音源信号強調手段とを有することを特徴とする
ものである。
【0028】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号の
自己相関系列を求める音源信号分析手段と、全パルス数
に対し振幅抑圧するパルス数の比率を、上記音声状態判
別信号および自己相関系列最大値から算出し抑圧比率と
して出力する抑圧比率算出手段と、上記抑圧比率に従っ
て上記適応音源更新信号の自己相関系列の値の小さなパ
ルスから振幅抑圧した音源信号を用いて上記適応音源符
号帳の更新を行う音源信号抑制手段とを有することを特
徴とするものである。
符号帳の内部状態を更新するための適応音源更新信号の
自己相関系列を求める音源信号分析手段と、全パルス数
に対し振幅抑圧するパルス数の比率を、上記音声状態判
別信号および自己相関系列最大値から算出し抑圧比率と
して出力する抑圧比率算出手段と、上記抑圧比率に従っ
て上記適応音源更新信号の自己相関系列の値の小さなパ
ルスから振幅抑圧した音源信号を用いて上記適応音源符
号帳の更新を行う音源信号抑制手段とを有することを特
徴とするものである。
【0029】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号の
自己相関を求める音源信号分析手段と、全パルス数に対
し振幅強調するパルス数の比率を、上記音声状態判別信
号および自己相関係列最大値から算出し強調比率として
出力する強調比率算出手段と、上記強調比率に従って上
記適応音源更新信号の自己相関系列の値の大きなパルス
から振幅強調した音源信号を用いて上記適応音源符号帳
の更新を行う音源信号強調手段とを有することを特徴と
するものである。
符号帳の内部状態を更新するための適応音源更新信号の
自己相関を求める音源信号分析手段と、全パルス数に対
し振幅強調するパルス数の比率を、上記音声状態判別信
号および自己相関係列最大値から算出し強調比率として
出力する強調比率算出手段と、上記強調比率に従って上
記適応音源更新信号の自己相関系列の値の大きなパルス
から振幅強調した音源信号を用いて上記適応音源符号帳
の更新を行う音源信号強調手段とを有することを特徴と
するものである。
【0030】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号の
自己相関系列を求める音源信号分析手段と、上記自己相
関系列最大値と上記音声状態判別信号から抑圧閾値を算
出する抑圧閾値算出手段と、上記適応音源更新信号を入
力し、自己相関系列の値が上記抑圧閾値以下のパルスを
振幅抑圧した音源信号を用いて上記適応音源符号帳の更
新を行う音源信号抑圧手段とを有することを特徴とする
ものである。
符号帳の内部状態を更新するための適応音源更新信号の
自己相関系列を求める音源信号分析手段と、上記自己相
関系列最大値と上記音声状態判別信号から抑圧閾値を算
出する抑圧閾値算出手段と、上記適応音源更新信号を入
力し、自己相関系列の値が上記抑圧閾値以下のパルスを
振幅抑圧した音源信号を用いて上記適応音源符号帳の更
新を行う音源信号抑圧手段とを有することを特徴とする
ものである。
【0031】また、上記加工更新手段は、上記適応音源
符号帳の内部状態を更新するための適応音源更新信号の
自己相関系列を求める音源信号分析手段と、上記自己相
関系列最大値と上記音声状態判別信号から強調閾値を算
出する強調閾値算出手段と、上記適応音源更新信号を入
力し、自己相関系列の値が上記抑圧閾値以上のパルスを
振幅強調した音源信号を用いて上記適応音源符号帳の更
新を行う音源信号強調手段とを有することを特徴とする
ものである。
符号帳の内部状態を更新するための適応音源更新信号の
自己相関系列を求める音源信号分析手段と、上記自己相
関系列最大値と上記音声状態判別信号から強調閾値を算
出する強調閾値算出手段と、上記適応音源更新信号を入
力し、自己相関系列の値が上記抑圧閾値以上のパルスを
振幅強調した音源信号を用いて上記適応音源符号帳の更
新を行う音源信号強調手段とを有することを特徴とする
ものである。
【0032】さらに、上記入力音声状態判定手段は、入
力音声信号の無声/有声/過渡部の状態判別を行い、上
記加工更新手段は、上記入力音声信号の過渡部において
のみ上記適応音源符号帳を更新する音源信号を強調また
は抑圧することを特徴とするものである。
力音声信号の無声/有声/過渡部の状態判別を行い、上
記加工更新手段は、上記入力音声信号の過渡部において
のみ上記適応音源符号帳を更新する音源信号を強調また
は抑圧することを特徴とするものである。
【0033】
【発明の実施の形態】実施の形態1.図1はこの発明の
実施の形態1に係る音声符号化装置の構成を示すブロッ
ク図である。図1において、1は入力音声信号、2は入
力音声信号1を一定時間間隔でフレーム毎に分析して入
力音声信号のスぺクトラム情報を符号化する入力音声分
析手段であり、例えばフレーム長40msで線形予測係
数(Linear Prediction Coefficient:LPC)分析を
行ってLPCを求め、求めたLPCから例えば10次の
線スペクトル対(Linear Spectrum Pair:LSP、以下
LSP係数17と称す)に変換して出力する。
実施の形態1に係る音声符号化装置の構成を示すブロッ
ク図である。図1において、1は入力音声信号、2は入
力音声信号1を一定時間間隔でフレーム毎に分析して入
力音声信号のスぺクトラム情報を符号化する入力音声分
析手段であり、例えばフレーム長40msで線形予測係
数(Linear Prediction Coefficient:LPC)分析を
行ってLPCを求め、求めたLPCから例えば10次の
線スペクトル対(Linear Spectrum Pair:LSP、以下
LSP係数17と称す)に変換して出力する。
【0034】また、3は上記入力音声分析手段2からの
LSP係数17の入力に基づいて入力音声信号1を分析
して音声状態判別信号としてモード信号13を出力する
音声状態判別手段、4は上記音声状態判別手段3からの
モード信号13に基づいて後述する適応音源符号帳8ま
たは第2雑音符号帳10のいずれかの出力を選択する切
り替えスイッチ、5は上記切り替えスイッチ4を介して
出力と後述する第1雑音符号帳9の出力にそれぞれゲイ
ンが乗ぜられた出力を合成した励振音源信号18(適応
音源更新信号14とも称す)を入力してフィルタ処理し
て合成音声信号22を出力する合成フィルタである。
LSP係数17の入力に基づいて入力音声信号1を分析
して音声状態判別信号としてモード信号13を出力する
音声状態判別手段、4は上記音声状態判別手段3からの
モード信号13に基づいて後述する適応音源符号帳8ま
たは第2雑音符号帳10のいずれかの出力を選択する切
り替えスイッチ、5は上記切り替えスイッチ4を介して
出力と後述する第1雑音符号帳9の出力にそれぞれゲイ
ンが乗ぜられた出力を合成した励振音源信号18(適応
音源更新信号14とも称す)を入力してフィルタ処理し
て合成音声信号22を出力する合成フィルタである。
【0035】また、6は上記合成フィルタ5を介した合
成音声信号22と入力音声信号1との誤差信号19に重
みつけを行って重みつけ信号20を出力する聴覚重みつ
け手段、7は聴覚重みつけ手段6からの出力20に基づ
いて上記誤差信号を最小化するように、適応音源符号帳
8または第1と第2雑音符号帳9と10の出力及びゲイ
ンを調整して最適な励振音源信号18を決定するための
誤差最小化手段であり、所定次元(例えば90次元)の
重みつけ信号20の誤差の2乗和が最小となる符号化出
力としてのラグ(遅延)長信号とコード番号を出力す
る。
成音声信号22と入力音声信号1との誤差信号19に重
みつけを行って重みつけ信号20を出力する聴覚重みつ
け手段、7は聴覚重みつけ手段6からの出力20に基づ
いて上記誤差信号を最小化するように、適応音源符号帳
8または第1と第2雑音符号帳9と10の出力及びゲイ
ンを調整して最適な励振音源信号18を決定するための
誤差最小化手段であり、所定次元(例えば90次元)の
重みつけ信号20の誤差の2乗和が最小となる符号化出
力としてのラグ(遅延)長信号とコード番号を出力す
る。
【0036】また、8は過去の最適な励振音源信号をコ
ード化したコードベクトルを蓄えていて、上記誤差最小
化手段7からのラグ長信号を入力してその部分から所定
(例えば90次元)のベクトル長を切り出して出力する
適応音源符号帳、9と10はコード番号に対応する例え
ば90次元のコードベクトルが蓄えられていて、上記誤
差最小化手段7からのコード番号に対応したコードベク
トルを出力する第1と第2雑音符号帳である。
ード化したコードベクトルを蓄えていて、上記誤差最小
化手段7からのラグ長信号を入力してその部分から所定
(例えば90次元)のベクトル長を切り出して出力する
適応音源符号帳、9と10はコード番号に対応する例え
ば90次元のコードベクトルが蓄えられていて、上記誤
差最小化手段7からのコード番号に対応したコードベク
トルを出力する第1と第2雑音符号帳である。
【0037】ここで、上記適応音源符号帳8には、音声
の有声区間に適したコードベクトルが蓄えられ、上記第
1雑音符号帳9には、例えば音声の全区間に適したコー
ドベクトルが、上記第2雑音符号帳10には、例えば音
声の無声区間または雑音区間に適したコードベクトルが
それぞれ蓄えられていて、適応音源符号帳8と第2雑音
符号帳10とを切り替えスイッチ4で切り替えること
で、単一符号帳に比べて高品質な音源ベクトルを生成で
きると共に、符号帳を分割することで演算メモリ量を削
減することができるようになっている。
の有声区間に適したコードベクトルが蓄えられ、上記第
1雑音符号帳9には、例えば音声の全区間に適したコー
ドベクトルが、上記第2雑音符号帳10には、例えば音
声の無声区間または雑音区間に適したコードベクトルが
それぞれ蓄えられていて、適応音源符号帳8と第2雑音
符号帳10とを切り替えスイッチ4で切り替えること
で、単一符号帳に比べて高品質な音源ベクトルを生成で
きると共に、符号帳を分割することで演算メモリ量を削
減することができるようになっている。
【0038】さらに、30と31は上記音声状態判別手
段3からのモード信号13に基づいて上記適応音源符号
帳8の内部状態を更新するための適応音源更新信号14
を加工して加工した音源信号21を用いて上記適応音源
符号帳8の更新を行う加工更新手段を構成する抑圧比率
算出手段と音源信号抑制手段を示し、抑圧比率酸手段1
1は、上記適応音源符号帳8の内部状態を更新するため
の適応音源更新信号14中の全パルス数に対し、振幅抑
圧するパルス数の比率を音声状態判別信号13と入力音
声信号1のパワーから算出し抑圧比率15と抑圧度16
として出力し、音源信号抑圧手段12は、適応音源更新
信号14(最適な励振音源信号18)を入力し、上記抑
圧比率15と抑圧度16に基づいて振幅が小さいパルス
から順に振幅抑圧し、振幅抑圧した音源信号を用いて上
記適応音源符号帳8の更新を行う。
段3からのモード信号13に基づいて上記適応音源符号
帳8の内部状態を更新するための適応音源更新信号14
を加工して加工した音源信号21を用いて上記適応音源
符号帳8の更新を行う加工更新手段を構成する抑圧比率
算出手段と音源信号抑制手段を示し、抑圧比率酸手段1
1は、上記適応音源符号帳8の内部状態を更新するため
の適応音源更新信号14中の全パルス数に対し、振幅抑
圧するパルス数の比率を音声状態判別信号13と入力音
声信号1のパワーから算出し抑圧比率15と抑圧度16
として出力し、音源信号抑圧手段12は、適応音源更新
信号14(最適な励振音源信号18)を入力し、上記抑
圧比率15と抑圧度16に基づいて振幅が小さいパルス
から順に振幅抑圧し、振幅抑圧した音源信号を用いて上
記適応音源符号帳8の更新を行う。
【0039】なお、図1には示されていないが、上記入
力音声分析手段2により分析されたLSP係数17はス
ペクトラム包絡情報として図示しない符号化手段を介し
て符号化されて伝送路に出力され、また、上記誤差最小
化手段7からのラグ長信号とコード番号は伝送路に出力
されるようになっている。
力音声分析手段2により分析されたLSP係数17はス
ペクトラム包絡情報として図示しない符号化手段を介し
て符号化されて伝送路に出力され、また、上記誤差最小
化手段7からのラグ長信号とコード番号は伝送路に出力
されるようになっている。
【0040】以下、図1に基づいて実施の形態1に係る
音声符号化装置の動作原理を説明する。入力音声分析手
段2は、入力音声信号1を例えばフレーム長40msで
LPC分析を行ってLPCを求め、LPCから例えば1
0次の線スペクトル対(LSP:Linear Spectrum Pai
r、以下LSP係数17と略)に変換し出力する。音声
状態判別手段3は、入力音声分析手段2が出力するLS
P係数17と入力音声信号1からLPC予測残差を求
め、その自己相関から現フレームの例えば有声無声判定
を行い、適応音源符号帳8または第2雑音符号帳10を
切り替える切り替えスイッチ4を制御するモード信号1
3を出力する。
音声符号化装置の動作原理を説明する。入力音声分析手
段2は、入力音声信号1を例えばフレーム長40msで
LPC分析を行ってLPCを求め、LPCから例えば1
0次の線スペクトル対(LSP:Linear Spectrum Pai
r、以下LSP係数17と略)に変換し出力する。音声
状態判別手段3は、入力音声分析手段2が出力するLS
P係数17と入力音声信号1からLPC予測残差を求
め、その自己相関から現フレームの例えば有声無声判定
を行い、適応音源符号帳8または第2雑音符号帳10を
切り替える切り替えスイッチ4を制御するモード信号1
3を出力する。
【0041】上記音声状態判別手段3が出力するモード
信号13に基づき、適応音源符号帳8または第2雑音符
号帳10の出力と第1雑音符号帳9の出力にそれぞれゲ
インが乗じられて励振音源が生成され、それを合成フィ
ルタ5に入力して合成音声信号22を得る。合成音声信
号22と入力音声信号1の差をとった後の誤差信号19
を聴覚重み付け手段6にで重み付けを行い、誤差最小化
手段7によって誤差を最小化するように、適応音源符号
帳8または第2雑音符号帳10と第1雑音符号帳9との
出力およびゲインを調節して、最適な励振音源信号18
とそのゲインを決定し、符号化結果を伝送路へ送出す
る。
信号13に基づき、適応音源符号帳8または第2雑音符
号帳10の出力と第1雑音符号帳9の出力にそれぞれゲ
インが乗じられて励振音源が生成され、それを合成フィ
ルタ5に入力して合成音声信号22を得る。合成音声信
号22と入力音声信号1の差をとった後の誤差信号19
を聴覚重み付け手段6にで重み付けを行い、誤差最小化
手段7によって誤差を最小化するように、適応音源符号
帳8または第2雑音符号帳10と第1雑音符号帳9との
出力およびゲインを調節して、最適な励振音源信号18
とそのゲインを決定し、符号化結果を伝送路へ送出す
る。
【0042】抑圧比率算出手段11は、音声状態判別手
段3が出力するモード信号13と、入力音声信号1のパ
ワーから、現フレームの抑圧比率15および抑圧度16
を例えば有声/無声/無音の状態別に決定する。例え
ば、有声または無音の場合には抑圧比率15は0%即ち
抑圧するパルス数を零とし、無声の場合には抑圧比率1
5は90%即ち現フレームの総パルス数の90%のパル
スを抑圧し、また抑圧度16は100%即ち振幅は零に
するように決定する。その後決定された抑圧比率15お
よび抑圧度16を音源信号抑圧手段12に出力する。
段3が出力するモード信号13と、入力音声信号1のパ
ワーから、現フレームの抑圧比率15および抑圧度16
を例えば有声/無声/無音の状態別に決定する。例え
ば、有声または無音の場合には抑圧比率15は0%即ち
抑圧するパルス数を零とし、無声の場合には抑圧比率1
5は90%即ち現フレームの総パルス数の90%のパル
スを抑圧し、また抑圧度16は100%即ち振幅は零に
するように決定する。その後決定された抑圧比率15お
よび抑圧度16を音源信号抑圧手段12に出力する。
【0043】音源信号抑圧手段12は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧比率算
出手段11が出力する抑圧比率15および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。すなわち、所定
(例えば90次元)のベクトル長だけシフトし、加工さ
れた最適な音源信号を挿入して適応音源符号帳8の内部
状態を更新する。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧比率算
出手段11が出力する抑圧比率15および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。すなわち、所定
(例えば90次元)のベクトル長だけシフトし、加工さ
れた最適な音源信号を挿入して適応音源符号帳8の内部
状態を更新する。
【0044】図12は無声フレームで振幅の小さいパル
スを抑圧比率90%、抑圧度100%で抑圧した一例で
あり、図中、(a)はパルスを抑圧する前の適応音源符
号帳更新信号波形(音源信号抑制手段12の入力)、
(b)はパルスを抑圧した後の適応音源符号帳更新信号
波形(音源信号抑制手段12の出力)をそれぞれ示す時
系列データである。なお、左端の0は0番目のパルス、
右端の90は90番目のパルスを示す。
スを抑圧比率90%、抑圧度100%で抑圧した一例で
あり、図中、(a)はパルスを抑圧する前の適応音源符
号帳更新信号波形(音源信号抑制手段12の入力)、
(b)はパルスを抑圧した後の適応音源符号帳更新信号
波形(音源信号抑制手段12の出力)をそれぞれ示す時
系列データである。なお、左端の0は0番目のパルス、
右端の90は90番目のパルスを示す。
【0045】また、図16は適応音源符号帳更新信号を
抑圧する場合としない場合についての合成音声波形の違
いを示す一例である。上段が入力音声信号波形(入力音
声信号1)、中段が適応音源更新信号を抑圧しない場合
の合成音声信号波形(音源信号抑圧手段12の入力)、
下段が適応音源更新信号を抑圧する場合の合成音声信号
波形(音源信号抑圧手段12の出力)であり、抑圧しな
い場合に比べ抑圧する場合には立ち上がり部分が改善さ
れていることが分かる。
抑圧する場合としない場合についての合成音声波形の違
いを示す一例である。上段が入力音声信号波形(入力音
声信号1)、中段が適応音源更新信号を抑圧しない場合
の合成音声信号波形(音源信号抑圧手段12の入力)、
下段が適応音源更新信号を抑圧する場合の合成音声信号
波形(音源信号抑圧手段12の出力)であり、抑圧しな
い場合に比べ抑圧する場合には立ち上がり部分が改善さ
れていることが分かる。
【0046】従って、上記実施の形態1によれば、適応
音源符号帳8を更新する音源信号を抑圧比率および抑圧
度に基づいて振幅抑圧することにより、例えば有音立ち
上がり部分において適応音源を活性化することができる
ので、低ビットレートCELP符号化方式の品質を向上
させることができる。
音源符号帳8を更新する音源信号を抑圧比率および抑圧
度に基づいて振幅抑圧することにより、例えば有音立ち
上がり部分において適応音源を活性化することができる
ので、低ビットレートCELP符号化方式の品質を向上
させることができる。
【0047】実施の形態2.上述した実施の形態1の別
の形態として、パルスを抑圧するのではなく、大きな振
幅パルスを選択的に強調しても構わない。図2はこの発
明の実施の形態2に係る音声符号化装置の構成を示すブ
ロック図である。図2において、図1に示す実施の形態
1と同一部分は同一符号を付してその説明は省略する。
新たな符号として、30と31は加工更新手段として備
えられた強調比率算出手段と音源信号強調手段31であ
り、強調比率算出手段30は、適応音源符号帳8の内部
状態を更新するための適応音源更新信号14中の全パル
ス数に対し振幅強調するパルス数の比率を音声状態判別
信号13から算出し強調比率32及び強調度33を出力
し、音源信号強調手段31は、適応音源更新信号14
(最適な励振音源信号18)を入力し、上記強調比率3
2及び強調度33に従って振幅が大きいパルスから順に
振幅強調した音源信号を用いて上記適応音源符号帳8の
更新を行う。
の形態として、パルスを抑圧するのではなく、大きな振
幅パルスを選択的に強調しても構わない。図2はこの発
明の実施の形態2に係る音声符号化装置の構成を示すブ
ロック図である。図2において、図1に示す実施の形態
1と同一部分は同一符号を付してその説明は省略する。
新たな符号として、30と31は加工更新手段として備
えられた強調比率算出手段と音源信号強調手段31であ
り、強調比率算出手段30は、適応音源符号帳8の内部
状態を更新するための適応音源更新信号14中の全パル
ス数に対し振幅強調するパルス数の比率を音声状態判別
信号13から算出し強調比率32及び強調度33を出力
し、音源信号強調手段31は、適応音源更新信号14
(最適な励振音源信号18)を入力し、上記強調比率3
2及び強調度33に従って振幅が大きいパルスから順に
振幅強調した音源信号を用いて上記適応音源符号帳8の
更新を行う。
【0048】以下、図2に基づいて実施の形態2に係る
音声符号化装置の動作原理を説明する。強調比率算出手
段30は、音声状態判別手段3が出力するモード信号1
3と、入力音声信号1のパワーから、現フレームの強調
比率32および強調度33を例えば有声/無声/無音の
状態別に決定する。例えば、有声または無音の場合には
強調比率32は0%即ち抑圧するパルス数を零とし、無
声の場合には強調比率32は5%即ち現フレームの総パ
ルス数のうち振幅が大きなパルスから順に5%だけを強
調し、またその強調度33は250%即ちパルス振幅を
元の2.5倍にするように決定する。その後決定された
強調比率32および強調度33を音源信号強調手段31
に出力する。
音声符号化装置の動作原理を説明する。強調比率算出手
段30は、音声状態判別手段3が出力するモード信号1
3と、入力音声信号1のパワーから、現フレームの強調
比率32および強調度33を例えば有声/無声/無音の
状態別に決定する。例えば、有声または無音の場合には
強調比率32は0%即ち抑圧するパルス数を零とし、無
声の場合には強調比率32は5%即ち現フレームの総パ
ルス数のうち振幅が大きなパルスから順に5%だけを強
調し、またその強調度33は250%即ちパルス振幅を
元の2.5倍にするように決定する。その後決定された
強調比率32および強調度33を音源信号強調手段31
に出力する。
【0049】図13は、図12に対応するもので、上記
の強調比率32および強調度33にてパルスを強調した
一例であり、(a)が強調前の音源波形(音源信号強調
手段31の入力)、(b)が強調後の音源波形(音源信
号強調手段31の出力)である。
の強調比率32および強調度33にてパルスを強調した
一例であり、(a)が強調前の音源波形(音源信号強調
手段31の入力)、(b)が強調後の音源波形(音源信
号強調手段31の出力)である。
【0050】音源信号強調手段31は、誤差最小化手段
7による誤差の最小化により求められた最適な励振音源
信号18(適応音源更新信号14)を入力し、強調比率
算出手段30が出力する強調比率32および強調度33
に基づいて振幅が大きなパルスから順に強調を行い、適
応音源符号帳8の内部状態を更新する音源信号を生成し
適応音源符号帳8へ出力し、上記音源信号を用いて適応
音源符号帳8の内部状態を更新する。
7による誤差の最小化により求められた最適な励振音源
信号18(適応音源更新信号14)を入力し、強調比率
算出手段30が出力する強調比率32および強調度33
に基づいて振幅が大きなパルスから順に強調を行い、適
応音源符号帳8の内部状態を更新する音源信号を生成し
適応音源符号帳8へ出力し、上記音源信号を用いて適応
音源符号帳8の内部状態を更新する。
【0051】従って、上記実施の形態2によれば、適応
音源符号帳8を更新する音源信号を、強調比率および強
調度に基づいて強調することで、微小振幅パルスの特徴
を生かしたまま、例えば有声立ち上がり部分で適応音源
を活性化することができるので、低ビットレートCEL
P符号化方式の品質を改善することができる。
音源符号帳8を更新する音源信号を、強調比率および強
調度に基づいて強調することで、微小振幅パルスの特徴
を生かしたまま、例えば有声立ち上がり部分で適応音源
を活性化することができるので、低ビットレートCEL
P符号化方式の品質を改善することができる。
【0052】実施の形態3.また、この発明の別の形態
として、音源更新信号中の最大振幅パルスの振幅にある
係数を乗じて閾値を求め、その閾値以下の振幅のパルス
を抑圧することも可能である。図3はこの発明の実施の
形態3に係る音声符号化装置の構成を示すブロック図で
ある。図3において、図1に示す実施の形態1と同一部
分は同一符号を付してその説明は省略する。新たな符号
として、40は音源信号抑制手段12と共に加工更新手
段として備えられた抑圧閾値算出手段40であり、適応
音源符号帳8の内部状態を更新するための適応音源更新
信号14中の最大振幅パルスと音声状態判別信号13か
ら抑圧閾値41及び抑圧度16を算出するようになさ
れ、音源信号抑制手段12は、適応音源更新信号14
(最適な励振音源信号18)を入力し、上記抑圧閾値以
下の振幅のパルスを振幅抑圧した音源信号を用いて上記
適応音源符号帳の更新を行うようになされている。
として、音源更新信号中の最大振幅パルスの振幅にある
係数を乗じて閾値を求め、その閾値以下の振幅のパルス
を抑圧することも可能である。図3はこの発明の実施の
形態3に係る音声符号化装置の構成を示すブロック図で
ある。図3において、図1に示す実施の形態1と同一部
分は同一符号を付してその説明は省略する。新たな符号
として、40は音源信号抑制手段12と共に加工更新手
段として備えられた抑圧閾値算出手段40であり、適応
音源符号帳8の内部状態を更新するための適応音源更新
信号14中の最大振幅パルスと音声状態判別信号13か
ら抑圧閾値41及び抑圧度16を算出するようになさ
れ、音源信号抑制手段12は、適応音源更新信号14
(最適な励振音源信号18)を入力し、上記抑圧閾値以
下の振幅のパルスを振幅抑圧した音源信号を用いて上記
適応音源符号帳の更新を行うようになされている。
【0053】以下、図3に基づいて実施の形態3に係る
音声符号化装置の動作原理を説明する。抑圧閾値算出手
段40は、適応音源更新信号14、入力音声信号1およ
びモード信号13を入力し、入力音声信号パワーとモー
ド信号13から例えば有声/無声/無音別に抑圧係数を
設定し、上記得られた適応音源更新信号14の振幅値に
抑圧係数を乗じて抑圧閾値41を算出する。抑圧係数は
例えば無声の場合には0.8とし、抑圧度16は100
%即ち零に抑圧する。また、有声および無音の場合には
抑圧係数を0.0として抑圧を行なわない。状態別に抑
圧係数を決定した後上記振幅値に抑圧係数を乗じて抑圧
閾値41を算出し、抑圧度16と共に音源信号抑圧手段
12に出力する。
音声符号化装置の動作原理を説明する。抑圧閾値算出手
段40は、適応音源更新信号14、入力音声信号1およ
びモード信号13を入力し、入力音声信号パワーとモー
ド信号13から例えば有声/無声/無音別に抑圧係数を
設定し、上記得られた適応音源更新信号14の振幅値に
抑圧係数を乗じて抑圧閾値41を算出する。抑圧係数は
例えば無声の場合には0.8とし、抑圧度16は100
%即ち零に抑圧する。また、有声および無音の場合には
抑圧係数を0.0として抑圧を行なわない。状態別に抑
圧係数を決定した後上記振幅値に抑圧係数を乗じて抑圧
閾値41を算出し、抑圧度16と共に音源信号抑圧手段
12に出力する。
【0054】音源信号抑圧手段12は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧閾値算
出手段40が出力する抑圧閾値41および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。図14は、図1
2及び図13に対応するもので、上記抑圧閾値および抑
圧度にて抑圧閾値以下の振幅のパルスを抑圧した一例で
あり、(a)が抑圧前の音源波形(音源信号抑制手段1
2の入力)、(b)が抑圧後の音源波形(音源信号抑制
手段12の出力)である。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧閾値算
出手段40が出力する抑圧閾値41および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。図14は、図1
2及び図13に対応するもので、上記抑圧閾値および抑
圧度にて抑圧閾値以下の振幅のパルスを抑圧した一例で
あり、(a)が抑圧前の音源波形(音源信号抑制手段1
2の入力)、(b)が抑圧後の音源波形(音源信号抑制
手段12の出力)である。
【0055】従って、上記実施の形態3によれば、最大
振幅パルスの振幅から求められる閾値以下の振幅のパル
スを抑圧することで、例えば有声立ち上がり部分で主成
分パルスの特徴を強調するように適応音源を活性化する
ことができるので、低レートCELP符号化方式の品質
を改善することができる。
振幅パルスの振幅から求められる閾値以下の振幅のパル
スを抑圧することで、例えば有声立ち上がり部分で主成
分パルスの特徴を強調するように適応音源を活性化する
ことができるので、低レートCELP符号化方式の品質
を改善することができる。
【0056】実施の形態4.また、実施の形態3の別の
形態として、音源更新信号中の最大振幅パルスの振幅に
ある係数を乗じて閾値を求め、その閾値以上の振幅のパ
ルスを強調することも可能である。図4はこの発明の実
施の形態4に係る音声符号化装置の構成を示すブロック
図である。図4において、図2に示す実施の形態2と同
一部分は同一符号を付してその説明は省略する。新たな
符号として、50は図2に示す強調比率算出手段30の
代わりに設けた強調閾値算出手段50であり、適応音源
符号帳8の内部状態を更新するための適応音源更新信号
14中の最大振幅パルスと音声状態判別信号13から強
調閾値51及び強調度33を算出するようになされ、音
源信号強調手段31は適応音源更新信号14を入力し、
上記強調閾値以上の振幅のパルスを振幅強調した音源信
号を用いて上記適応音源符号帳8の更新を行うようにな
されている。
形態として、音源更新信号中の最大振幅パルスの振幅に
ある係数を乗じて閾値を求め、その閾値以上の振幅のパ
ルスを強調することも可能である。図4はこの発明の実
施の形態4に係る音声符号化装置の構成を示すブロック
図である。図4において、図2に示す実施の形態2と同
一部分は同一符号を付してその説明は省略する。新たな
符号として、50は図2に示す強調比率算出手段30の
代わりに設けた強調閾値算出手段50であり、適応音源
符号帳8の内部状態を更新するための適応音源更新信号
14中の最大振幅パルスと音声状態判別信号13から強
調閾値51及び強調度33を算出するようになされ、音
源信号強調手段31は適応音源更新信号14を入力し、
上記強調閾値以上の振幅のパルスを振幅強調した音源信
号を用いて上記適応音源符号帳8の更新を行うようにな
されている。
【0057】以下、図4に基づいて実施の形態4に係る
音声符号化装置の動作原理を説明する。強調閾値算出手
段50は、適応音源更新信号14、入力音声信号1およ
びモード信号13を入力し、入力音声信号パワーとモー
ド信号13から例えば有声/無声/無音別に強調係数を
設定し、上記得られた適応音源更新信号14の振幅値に
強調係数を乗じて強調閾値51を算出する。強調係数は
例えば無声の場合には0.9とし強調度33は150%
即ち元の振幅の1.5倍に強調する。また、有声および
無音の場合には強調係数を0.0として強調を行なわな
い。状態別に強調係数を決定した後上記振幅値に強調係
数を乗じて強調閾値51を算出し、強調度33と共に音
源信号強調手段31に出力する。
音声符号化装置の動作原理を説明する。強調閾値算出手
段50は、適応音源更新信号14、入力音声信号1およ
びモード信号13を入力し、入力音声信号パワーとモー
ド信号13から例えば有声/無声/無音別に強調係数を
設定し、上記得られた適応音源更新信号14の振幅値に
強調係数を乗じて強調閾値51を算出する。強調係数は
例えば無声の場合には0.9とし強調度33は150%
即ち元の振幅の1.5倍に強調する。また、有声および
無音の場合には強調係数を0.0として強調を行なわな
い。状態別に強調係数を決定した後上記振幅値に強調係
数を乗じて強調閾値51を算出し、強調度33と共に音
源信号強調手段31に出力する。
【0058】音源信号強調手段31は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、強調閾値算
出手段50が出力する強調閾値51および強調度33に
基づいて振幅が小さいパルスから順に振幅強調を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、強調閾値算
出手段50が出力する強調閾値51および強調度33に
基づいて振幅が小さいパルスから順に振幅強調を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。
【0059】従って、上記実施の形態4によれば、最大
振幅パルスの振幅を基準に閾値以上の振幅のパルスを強
調することで、例えば有声立ち上がり部分で主成分パル
スの特徴を強調するように適応音源を活性化することが
できるので、低レートCELP符号化方式の品質を改善
することができる。
振幅パルスの振幅を基準に閾値以上の振幅のパルスを強
調することで、例えば有声立ち上がり部分で主成分パル
スの特徴を強調するように適応音源を活性化することが
できるので、低レートCELP符号化方式の品質を改善
することができる。
【0060】実施の形態5.また、この発明の別形態と
して、適応音源更新信号の最大振幅パルスを中心として
対称になるようにしてある範囲のパルスを選択し、その
選択した部分以外のパルスを抑圧することも可能であ
る。図5はこの発明の実施の形態5に係る音声符号化装
置の構成を示すブロック図である。図5において、図1
に示す実施の形態1と同一部分は同一符号を付して示し
その説明は省略する。新たな符号として、60は抑圧比
率算出手段11の代わりに設けたパルス幅選択手段60
であり、適応音源符号帳8の内部状態を更新するための
適応音源更新信号14中の最大振幅パルスを中心とし、
上記最大振幅パルスの近傍のパルスを選択するための選
択幅を音声状態判別信号13に従って決定するようにな
され、音源信号抑圧手段12は、適応音源更新信号14
を入力し、上記選択幅で選択されたパルス以外のパルス
を振幅抑圧した音源信号を用いて上記適応音源符号帳8
の更新を行うようになされている。
して、適応音源更新信号の最大振幅パルスを中心として
対称になるようにしてある範囲のパルスを選択し、その
選択した部分以外のパルスを抑圧することも可能であ
る。図5はこの発明の実施の形態5に係る音声符号化装
置の構成を示すブロック図である。図5において、図1
に示す実施の形態1と同一部分は同一符号を付して示し
その説明は省略する。新たな符号として、60は抑圧比
率算出手段11の代わりに設けたパルス幅選択手段60
であり、適応音源符号帳8の内部状態を更新するための
適応音源更新信号14中の最大振幅パルスを中心とし、
上記最大振幅パルスの近傍のパルスを選択するための選
択幅を音声状態判別信号13に従って決定するようにな
され、音源信号抑圧手段12は、適応音源更新信号14
を入力し、上記選択幅で選択されたパルス以外のパルス
を振幅抑圧した音源信号を用いて上記適応音源符号帳8
の更新を行うようになされている。
【0061】以下、図5に基づいて実施の形態5に係る
音声符号化装置の動作原理を説明する。パルス幅選択手
段60は、入力音声信号1、モード信号13、適応音源
更新信号14を入力し、例えば有声/無声/無音別のパ
ルス幅61を決定する。例えば、無声の場合にはパルス
幅(パルスの本数)を14個とし、抑圧度16は100
%として零に抑圧することとする。有声または無音の場
合にはパルス幅を設定せず抑圧を行なわない。状態別に
パルス幅61を選択した後、音源信号抑圧手段12へパ
ルス幅61および抑圧度16を出力する。
音声符号化装置の動作原理を説明する。パルス幅選択手
段60は、入力音声信号1、モード信号13、適応音源
更新信号14を入力し、例えば有声/無声/無音別のパ
ルス幅61を決定する。例えば、無声の場合にはパルス
幅(パルスの本数)を14個とし、抑圧度16は100
%として零に抑圧することとする。有声または無音の場
合にはパルス幅を設定せず抑圧を行なわない。状態別に
パルス幅61を選択した後、音源信号抑圧手段12へパ
ルス幅61および抑圧度16を出力する。
【0062】音源信号抑圧手段12は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、パルス幅選
択手段60が出力するパルス幅61および抑圧度16に
基づいて、最大振幅パルスを中心にして、パルス幅61
が指定する範囲以外のパルスの振幅抑圧を行い、適応音
源符号帳8の内部状態を更新する音源信号を生成し適応
音源符号帳8へ出力し、上記音源信号を用いて適応音源
符号帳8の内部状態を更新する。図15は、図12〜図
14に対応するもので、上記パルス幅および抑圧度にて
パルスを抑圧した一例であり、(a)が抑圧前の音源波
形(音源信号抑圧手段12の入力)、(b)が抑圧後の
音源波形(音源信号抑圧手段12の出力)である。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、パルス幅選
択手段60が出力するパルス幅61および抑圧度16に
基づいて、最大振幅パルスを中心にして、パルス幅61
が指定する範囲以外のパルスの振幅抑圧を行い、適応音
源符号帳8の内部状態を更新する音源信号を生成し適応
音源符号帳8へ出力し、上記音源信号を用いて適応音源
符号帳8の内部状態を更新する。図15は、図12〜図
14に対応するもので、上記パルス幅および抑圧度にて
パルスを抑圧した一例であり、(a)が抑圧前の音源波
形(音源信号抑圧手段12の入力)、(b)が抑圧後の
音源波形(音源信号抑圧手段12の出力)である。
【0063】従って、上記実施の形態5によれば、最大
振幅パルスを中心としてその近傍のパルスを残してその
他のパルスを抑圧することで、例えば有声立ち上がり部
分で主成分パルスの特徴を強調するように適応音源を活
性化することができるので、低レートCELP符号化方
式の品質を更に改善することができる。
振幅パルスを中心としてその近傍のパルスを残してその
他のパルスを抑圧することで、例えば有声立ち上がり部
分で主成分パルスの特徴を強調するように適応音源を活
性化することができるので、低レートCELP符号化方
式の品質を更に改善することができる。
【0064】実施の形態6.実施の形態5の別の形態と
して、適応音源更新信号の最大振幅パルスを中心として
対照になるようにある範囲のパルスを選択し、それらを
強調することも可能である。図6はこの発明の実施の形
態6に係る音声符号化装置のの構成を示すブロック図で
ある。各構成要素については図4および図5と同様であ
るので説明は省略する。
して、適応音源更新信号の最大振幅パルスを中心として
対照になるようにある範囲のパルスを選択し、それらを
強調することも可能である。図6はこの発明の実施の形
態6に係る音声符号化装置のの構成を示すブロック図で
ある。各構成要素については図4および図5と同様であ
るので説明は省略する。
【0065】以下、図6に基づいて実施の形態6に係る
音声符号化装置の動作原理を説明する。パルス幅選択手
段60は、入力音声信号1、モード信号13、適応音源
更新信号14を入力し、例えば有声/無声/無音別のパ
ルス幅を決定する。例えば、無声の場合にはパルス幅
(パルスの本数)を14個とし、強調度は150%とし
て元の振幅の1.5倍に強調することとする。有声また
は無音の場合にはパルス幅を設定せず強調を行なわな
い。状態別にパルス幅を選択した後、音源信号抑圧手段
へパルス幅61および強調度33を出力する。
音声符号化装置の動作原理を説明する。パルス幅選択手
段60は、入力音声信号1、モード信号13、適応音源
更新信号14を入力し、例えば有声/無声/無音別のパ
ルス幅を決定する。例えば、無声の場合にはパルス幅
(パルスの本数)を14個とし、強調度は150%とし
て元の振幅の1.5倍に強調することとする。有声また
は無音の場合にはパルス幅を設定せず強調を行なわな
い。状態別にパルス幅を選択した後、音源信号抑圧手段
へパルス幅61および強調度33を出力する。
【0066】音源信号強調手段31は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、パルス幅選
択手段60が出力するパルス幅61および強調度33に
基づいて、最大振幅パルスを中心にして、パルス幅61
が指定する範囲のパルスの振幅強調を行い、適応音源符
号帳8の内部状態を更新する音源信号を生成し適応音源
符号帳8へ出力し、上記音源信号を用いて適応音源符号
帳8の内部状態を更新する。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、パルス幅選
択手段60が出力するパルス幅61および強調度33に
基づいて、最大振幅パルスを中心にして、パルス幅61
が指定する範囲のパルスの振幅強調を行い、適応音源符
号帳8の内部状態を更新する音源信号を生成し適応音源
符号帳8へ出力し、上記音源信号を用いて適応音源符号
帳8の内部状態を更新する。
【0067】従って、上記実施の形態6によれば、最大
振幅パルスを中心としてその近傍のパルスを強調するこ
とで、例えば有声立ち上がり部分で主成分パルスの特徴
を強調するように適応音源を活性化することができるの
で、低レートCELP符号化方式の品質を更に改善する
ことができる。
振幅パルスを中心としてその近傍のパルスを強調するこ
とで、例えば有声立ち上がり部分で主成分パルスの特徴
を強調するように適応音源を活性化することができるの
で、低レートCELP符号化方式の品質を更に改善する
ことができる。
【0068】実施の形態7.実施の形態1の別の形態と
して、例えば適応音源更新信号の自己相関系列を求め、
その自己相関系列の値の小さなパルスから順にパルスを
抑圧することも可能である。図7はこの発明の実施の形
態7に係る音声符号化装置の構成を示すブロック図であ
る。図7において、図1に示す実施の形態1と同一部分
は同一符号を付してその説明は省略する。新たな符号と
して、70は適応音源符号帳8の内部状態を更新するた
めの適応音源更新信号14の自己相関系列を求める音源
信号分析手段であり、抑圧比率算出手段11は、全パル
ス数に対し振幅抑圧するパルス数の比率を、音声状態判
別信号13および自己相関系列71の最大値から算出し
抑圧比率として出力し、音源信号抑制手段12は、上記
抑圧比率に従って上記適応音源更新信号の自己相関系列
の値の小さなパルスから振幅抑圧した音源信号を用いて
上記適応音源符号帳の更新を行うようになされている。
して、例えば適応音源更新信号の自己相関系列を求め、
その自己相関系列の値の小さなパルスから順にパルスを
抑圧することも可能である。図7はこの発明の実施の形
態7に係る音声符号化装置の構成を示すブロック図であ
る。図7において、図1に示す実施の形態1と同一部分
は同一符号を付してその説明は省略する。新たな符号と
して、70は適応音源符号帳8の内部状態を更新するた
めの適応音源更新信号14の自己相関系列を求める音源
信号分析手段であり、抑圧比率算出手段11は、全パル
ス数に対し振幅抑圧するパルス数の比率を、音声状態判
別信号13および自己相関系列71の最大値から算出し
抑圧比率として出力し、音源信号抑制手段12は、上記
抑圧比率に従って上記適応音源更新信号の自己相関系列
の値の小さなパルスから振幅抑圧した音源信号を用いて
上記適応音源符号帳の更新を行うようになされている。
【0069】以下、図7に基づいて実施の形態7に係る
音声符号化装置の動作原理を説明する。音源信号分析手
段70は、適応音源更新信号14の例えば正規化自己相
関系列を求めて抑圧比率算出手段11に出力する。抑圧
比率算出手段11は、音声状態判別手段3が出力するモ
ード信号13と、入力音声信号1のパワーおよび音源信
号分析手段が出力する正規化自己相関系列71を入力
し、現フレームの抑圧比率15および抑圧度16を例え
ば有声/無声/無音の状態別に決定する。例えば、有声
または無音の場合には抑圧比率15は0%即ち抑圧する
パルス数を零とし、無声の場合には抑圧比率15は90
%即ち現フレームの総パルス数の90%のパルスを抑圧
し、また抑圧度16は100%即ち振幅は零にするよう
に決定し、決定された抑圧比率15および抑圧度16を
音源信号抑圧手段12に出力する。
音声符号化装置の動作原理を説明する。音源信号分析手
段70は、適応音源更新信号14の例えば正規化自己相
関系列を求めて抑圧比率算出手段11に出力する。抑圧
比率算出手段11は、音声状態判別手段3が出力するモ
ード信号13と、入力音声信号1のパワーおよび音源信
号分析手段が出力する正規化自己相関系列71を入力
し、現フレームの抑圧比率15および抑圧度16を例え
ば有声/無声/無音の状態別に決定する。例えば、有声
または無音の場合には抑圧比率15は0%即ち抑圧する
パルス数を零とし、無声の場合には抑圧比率15は90
%即ち現フレームの総パルス数の90%のパルスを抑圧
し、また抑圧度16は100%即ち振幅は零にするよう
に決定し、決定された抑圧比率15および抑圧度16を
音源信号抑圧手段12に出力する。
【0070】音源信号抑圧手段12は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧比率算
出手段11が出力する抑圧比率15および抑圧度16に
基づいて正規化自己相関係数が小さいパルスから順に振
幅抑圧を行い、適応音源符号帳8の内部状態を更新する
音源信号を生成し適応音源符号帳8へ出力し、上記音源
信号を用いて適応音源符号帳8の内部状態を更新する。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧比率算
出手段11が出力する抑圧比率15および抑圧度16に
基づいて正規化自己相関係数が小さいパルスから順に振
幅抑圧を行い、適応音源符号帳8の内部状態を更新する
音源信号を生成し適応音源符号帳8へ出力し、上記音源
信号を用いて適応音源符号帳8の内部状態を更新する。
【0071】従って、上記実施の形態7によれば、適応
音源更新信号の自己相関系列を求め、その自己相関系列
の値が小さいパルスから順にパルスを抑圧することによ
り、例えば有声立ち上がり部分において適応音源の周期
性を強調することができるので、低レートCELP符号
化方式の品質を改善することができる。
音源更新信号の自己相関系列を求め、その自己相関系列
の値が小さいパルスから順にパルスを抑圧することによ
り、例えば有声立ち上がり部分において適応音源の周期
性を強調することができるので、低レートCELP符号
化方式の品質を改善することができる。
【0072】実施の形態8.実施の形態7の別の形態と
して、例えば適応音源更新信号の自己相関系列を求め、
その自己相関系列の値の大きなパルスから順にパルス振
幅を強調することも可能である。図8はこの発明の実施
の形態8に係る音声符号化装置の構成を示すブロック図
である。構成要素については図2および図7と同様であ
るので説明は省略する。
して、例えば適応音源更新信号の自己相関系列を求め、
その自己相関系列の値の大きなパルスから順にパルス振
幅を強調することも可能である。図8はこの発明の実施
の形態8に係る音声符号化装置の構成を示すブロック図
である。構成要素については図2および図7と同様であ
るので説明は省略する。
【0073】以下、図8に基づいて実施の形態8に係る
音声符号化装置の動作原理を説明する。音源信号分析手
段70は、適応音源更新信号14の例えば正規化自己相
関系列を求めて強調比率算出手段11に出力する。強調
比率算出手段30は、音声状態判別手段3が出力するモ
ード信号13と、入力音声信号1のパワーおよび音源信
号分析手段70が出力する正規化自己相関系列71を入
力し、現フレームの強調比率32および強調度33を例
えば有声/無声/無音の状態別に決定する。例えば、有
声または無音の場合には強調比率32は0%即ち抑圧す
るパルス数を零とし、無声の場合には強調比率32は5
%即ち現フレームの総パルス数のうち振幅が大きなパル
スから順に5%だけを強調し、またその強調度33は2
50%即ちパルス振幅を元の2.5倍にするように決定
する。その後決定された強調比率32および強調度33
を音源信号強調手段31に出力する。
音声符号化装置の動作原理を説明する。音源信号分析手
段70は、適応音源更新信号14の例えば正規化自己相
関系列を求めて強調比率算出手段11に出力する。強調
比率算出手段30は、音声状態判別手段3が出力するモ
ード信号13と、入力音声信号1のパワーおよび音源信
号分析手段70が出力する正規化自己相関系列71を入
力し、現フレームの強調比率32および強調度33を例
えば有声/無声/無音の状態別に決定する。例えば、有
声または無音の場合には強調比率32は0%即ち抑圧す
るパルス数を零とし、無声の場合には強調比率32は5
%即ち現フレームの総パルス数のうち振幅が大きなパル
スから順に5%だけを強調し、またその強調度33は2
50%即ちパルス振幅を元の2.5倍にするように決定
する。その後決定された強調比率32および強調度33
を音源信号強調手段31に出力する。
【0074】音源信号強調手段31は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18を入力し、強調比率算出手段30が出力する強調
比率32および強調度33に基づいて振幅が大きなパル
スから順に強調を行い、適応音源符号帳8の内部状態を
更新する音源信号を生成し適応音源符号帳8へ出力し、
上記音源信号を用いて適応音源符号帳8の内部状態を更
新する。
7による誤差最小化により求められた最適な励振音源信
号18を入力し、強調比率算出手段30が出力する強調
比率32および強調度33に基づいて振幅が大きなパル
スから順に強調を行い、適応音源符号帳8の内部状態を
更新する音源信号を生成し適応音源符号帳8へ出力し、
上記音源信号を用いて適応音源符号帳8の内部状態を更
新する。
【0075】従って、上記実施の形態8によれば、適応
音源更新信号の自己相関系列を求め、その自己相関系列
の値が最大となるパルスから順にパルスを強調すること
により、例えば微小振幅パルスの特徴を生かしたまま、
有声立ち上がり部分において適応音源の周期性を強調す
ることができるので、低レートCELP符号化方式の品
質を改善することができる。
音源更新信号の自己相関系列を求め、その自己相関系列
の値が最大となるパルスから順にパルスを強調すること
により、例えば微小振幅パルスの特徴を生かしたまま、
有声立ち上がり部分において適応音源の周期性を強調す
ることができるので、低レートCELP符号化方式の品
質を改善することができる。
【0076】実施の形態9.実施の形態3の別の形態と
して、例えば適応音源更新信号中の最大振幅をとるパル
スの振幅の代わりに、適応音源更新信号の自己相関系列
最大値を基準に閾値を定め、自己相関系列の値が上記閾
値以下のパルスを抑圧することも可能である。図9はこ
の発明の実施の形態9に係る音声符号化装置の構成を示
すブロック図である。構成要素については図3および図
7と同様であるので説明は省略する。
して、例えば適応音源更新信号中の最大振幅をとるパル
スの振幅の代わりに、適応音源更新信号の自己相関系列
最大値を基準に閾値を定め、自己相関系列の値が上記閾
値以下のパルスを抑圧することも可能である。図9はこ
の発明の実施の形態9に係る音声符号化装置の構成を示
すブロック図である。構成要素については図3および図
7と同様であるので説明は省略する。
【0077】以下、図9に基づいて実施の形態9に係る
音声符号化装置の動作原理を説明する。音源信号分析手
段70は、適応音源更新信号14の例えば正規化自己相
関系列を求めて抑圧閾値算出手段40に出力する。抑圧
閾値算出手段40は、音声状態判別手段3が出力するモ
ード信号13と、入力音声信号1のパワーおよび音源信
号分析手段70が出力する正規化自己相関系列71を入
力し、例えば有声/無声/無音別に抑圧係数を設定し、
上記得られた振幅値に抑圧係数を乗じて抑圧閾値41を
算出する。抑圧係数は例えば無声の場合には0.8と
し、抑圧度16は100%即ち零に抑圧する。また、有
声および無音の場合には抑圧係数を0.0として抑圧を
行なわない。状態別に抑圧係数を決定した後上記振幅値
に抑圧係数を乗じて抑圧閾値41を算出し、抑圧度16
と共に音源信号抑圧手段12に出力する。
音声符号化装置の動作原理を説明する。音源信号分析手
段70は、適応音源更新信号14の例えば正規化自己相
関系列を求めて抑圧閾値算出手段40に出力する。抑圧
閾値算出手段40は、音声状態判別手段3が出力するモ
ード信号13と、入力音声信号1のパワーおよび音源信
号分析手段70が出力する正規化自己相関系列71を入
力し、例えば有声/無声/無音別に抑圧係数を設定し、
上記得られた振幅値に抑圧係数を乗じて抑圧閾値41を
算出する。抑圧係数は例えば無声の場合には0.8と
し、抑圧度16は100%即ち零に抑圧する。また、有
声および無音の場合には抑圧係数を0.0として抑圧を
行なわない。状態別に抑圧係数を決定した後上記振幅値
に抑圧係数を乗じて抑圧閾値41を算出し、抑圧度16
と共に音源信号抑圧手段12に出力する。
【0078】音源信号抑圧手段12は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧閾値算
出手段40が出力する抑圧閾値41および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧閾値算
出手段40が出力する抑圧閾値41および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。
【0079】従って、上記実施の形態9によれば、適応
音源更新信号の自己相関系列最大値を基準にして、自己
相関系列の値が閾値以下をとるパルスを抑圧することに
より、例えば有声立ち上がり部分において適応音源の周
期性を強調することができるので、低レートCELP符
号化方式の品質を改善することができる。
音源更新信号の自己相関系列最大値を基準にして、自己
相関系列の値が閾値以下をとるパルスを抑圧することに
より、例えば有声立ち上がり部分において適応音源の周
期性を強調することができるので、低レートCELP符
号化方式の品質を改善することができる。
【0080】実施の形態10.実施の形態9の別の形態
として、例えば適応音源更新信号中の最大振幅をとるパ
ルスの振幅の代わりに、適応音源更新信号の自己相関系
列最大値を基準に閾値を定め、自己相関系列の値が上記
閾値以上をとるパルスを強調することも可能である。図
10はこの発明の実施の形態10に係る音声符号化装置
の構成を示すブロック図である。構成要素については図
4および図8と同様であるので説明は省略する。
として、例えば適応音源更新信号中の最大振幅をとるパ
ルスの振幅の代わりに、適応音源更新信号の自己相関系
列最大値を基準に閾値を定め、自己相関系列の値が上記
閾値以上をとるパルスを強調することも可能である。図
10はこの発明の実施の形態10に係る音声符号化装置
の構成を示すブロック図である。構成要素については図
4および図8と同様であるので説明は省略する。
【0081】以下、図10に基づいて実施の形態10に
係る音声符号化装置の動作原理を説明する。音源信号分
析手段70は、適応音源更新信号14の例えば正規化自
己相関系列を求めて強調閾値算出手段50に出力する。
強調閾値算出手段50は、音声状態判別手段3が出力す
るモード信号13と、入力音声信号1のパワーおよび音
源信号分析手段70が出力する正規化自己相関系列71
を入力し、例えば有声/無声/無音別に強調係数を設定
し、上記得られた振幅値に強調係数を乗じて強調閾値5
1を算出する。強調係数は例えば無声の場合には0.9
とし強調度33は150%即ち元の振幅の1.5倍に強
調する。また、有声および無音の場合には強調係数を
0.0として強調を行なわない。状態別に強調係数を決
定した後上記振幅値に強調係数を乗じて強調閾値51を
算出し、強調度33と共に音源信号強調手段31に出力
する。
係る音声符号化装置の動作原理を説明する。音源信号分
析手段70は、適応音源更新信号14の例えば正規化自
己相関系列を求めて強調閾値算出手段50に出力する。
強調閾値算出手段50は、音声状態判別手段3が出力す
るモード信号13と、入力音声信号1のパワーおよび音
源信号分析手段70が出力する正規化自己相関系列71
を入力し、例えば有声/無声/無音別に強調係数を設定
し、上記得られた振幅値に強調係数を乗じて強調閾値5
1を算出する。強調係数は例えば無声の場合には0.9
とし強調度33は150%即ち元の振幅の1.5倍に強
調する。また、有声および無音の場合には強調係数を
0.0として強調を行なわない。状態別に強調係数を決
定した後上記振幅値に強調係数を乗じて強調閾値51を
算出し、強調度33と共に音源信号強調手段31に出力
する。
【0082】音源信号強調手段31は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18を入力し、強調閾値算出手段50が出力する強調
閾値51および強調度33に基づいて振幅が小さいパル
スから順に振幅強調を行い、適応音源符号帳8の内部状
態を更新する音源信号を生成し適応音源符号帳8へ出力
し、上記音源信号を用いて適応音源符号帳8の内部状態
を更新する。
7による誤差最小化により求められた最適な励振音源信
号18を入力し、強調閾値算出手段50が出力する強調
閾値51および強調度33に基づいて振幅が小さいパル
スから順に振幅強調を行い、適応音源符号帳8の内部状
態を更新する音源信号を生成し適応音源符号帳8へ出力
し、上記音源信号を用いて適応音源符号帳8の内部状態
を更新する。
【0083】従って、上記実施の形態10によれば、適
応音源更新信号の自己相関系列最大値を基準にして、自
己相関系列の値が閾値以上をとるパルスを強調すること
により、例えば有声立ち上がり部分において適応音源の
周期性を強調することができるので、低レートCELP
符号化方式の品質を改善することができる。
応音源更新信号の自己相関系列最大値を基準にして、自
己相関系列の値が閾値以上をとるパルスを強調すること
により、例えば有声立ち上がり部分において適応音源の
周期性を強調することができるので、低レートCELP
符号化方式の品質を改善することができる。
【0084】実施の形態11.実施の形態1または実施
の形態7の別の形態として、例えばフレーム毎に分析し
た音声状態判別結果と、サブフレーム単位で更に詳細に
音声状態判別した結果から、図1または図7中のフレー
ム毎の判定で求められた抑圧比率15および抑圧度16
に修正を加えることも可能である。
の形態7の別の形態として、例えばフレーム毎に分析し
た音声状態判別結果と、サブフレーム単位で更に詳細に
音声状態判別した結果から、図1または図7中のフレー
ム毎の判定で求められた抑圧比率15および抑圧度16
に修正を加えることも可能である。
【0085】例えば、量子化後のLSPよりケプストラ
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて抑圧比率15
に修正係数を加える。例えば、フレーム判定が無声でサ
ブフレーム判定が有声の場合、抑圧比率15を80%か
ら90%に修正する。こうすることにより音源信号をよ
りパルス状にすることができる。サブフレーム判定が無
声の場合には抑圧比率15は80%のままとする。
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて抑圧比率15
に修正係数を加える。例えば、フレーム判定が無声でサ
ブフレーム判定が有声の場合、抑圧比率15を80%か
ら90%に修正する。こうすることにより音源信号をよ
りパルス状にすることができる。サブフレーム判定が無
声の場合には抑圧比率15は80%のままとする。
【0086】従って、実施の形態11によれば、フレー
ム/サブフレームの2段階判定で抑圧比率および抑圧度
を修正することにより、音源信号抑圧のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
ム/サブフレームの2段階判定で抑圧比率および抑圧度
を修正することにより、音源信号抑圧のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
【0087】実施の形態12.実施の形態2または実施
の形態8の別の形態として、例えばフレーム毎に分析し
た音声状態判別結果と、サブフレーム単位で更に詳細に
音声状態判別した結果から、図2または図8中のフレー
ム毎の判定で求められた強調比率32および強調度33
に修正を加えることも可能である。
の形態8の別の形態として、例えばフレーム毎に分析し
た音声状態判別結果と、サブフレーム単位で更に詳細に
音声状態判別した結果から、図2または図8中のフレー
ム毎の判定で求められた強調比率32および強調度33
に修正を加えることも可能である。
【0088】例えば、量子化後のLSPよりケプストラ
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて強調度33に
修正係数を加える。例えば、フレーム判定が無声でサブ
フレーム判定が有声の場合、強調度33を250%から
300%に修正する。こうすることにより音源信号をよ
りパルス状にすることができる。サブフレーム判定が無
声の場合には強調度33は250%のままとする。
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて強調度33に
修正係数を加える。例えば、フレーム判定が無声でサブ
フレーム判定が有声の場合、強調度33を250%から
300%に修正する。こうすることにより音源信号をよ
りパルス状にすることができる。サブフレーム判定が無
声の場合には強調度33は250%のままとする。
【0089】従って、実施の形態12によれば、フレー
ム/サブフレームの2段階判定で強調比率および強調度
を修正することにより、音源信号強調のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
ム/サブフレームの2段階判定で強調比率および強調度
を修正することにより、音源信号強調のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
【0090】実施の形態13.実施の形態3または実施
の形態9の別の形態として、例えばフレーム毎に分析し
た音声状態判別結果と、サブフレーム単位で更に詳細に
音声状態判別した結果から、図3または図9中のフレー
ム毎の判定で求められた抑圧閾値41および抑圧度16
に修正を加えることも可能である。
の形態9の別の形態として、例えばフレーム毎に分析し
た音声状態判別結果と、サブフレーム単位で更に詳細に
音声状態判別した結果から、図3または図9中のフレー
ム毎の判定で求められた抑圧閾値41および抑圧度16
に修正を加えることも可能である。
【0091】例えば、量子化後のLSPよりケプストラ
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて抑圧閾値を求
めるための抑圧係数に修正を加える。例えば、フレーム
判定が無声でサブフレーム判定が有声の場合、抑圧係数
を0。8から0。9に修正する。こうすることにより音
源信号をよりパルス状にすることができる。サブフレー
ム判定が無声の場合には抑圧係数は現状のままとする。
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて抑圧閾値を求
めるための抑圧係数に修正を加える。例えば、フレーム
判定が無声でサブフレーム判定が有声の場合、抑圧係数
を0。8から0。9に修正する。こうすることにより音
源信号をよりパルス状にすることができる。サブフレー
ム判定が無声の場合には抑圧係数は現状のままとする。
【0092】従って、実施の形態13によれば、フレー
ム/サブフレームの2段階判定で抑圧閾値および抑圧度
を修正することにより、音源信号抑圧のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
ム/サブフレームの2段階判定で抑圧閾値および抑圧度
を修正することにより、音源信号抑圧のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
【0093】実施の形態14.実施の形態4または実施
の形態10の別の形態として、例えばフレーム毎に分析
した音声状態判別結果と、サブフレーム単位で更に詳細
に音声状態判別した結果から、図4または図10中のフ
レーム毎の判定で求められた強調閾値51および強調度
33に修正を加えることも可能である。
の形態10の別の形態として、例えばフレーム毎に分析
した音声状態判別結果と、サブフレーム単位で更に詳細
に音声状態判別した結果から、図4または図10中のフ
レーム毎の判定で求められた強調閾値51および強調度
33に修正を加えることも可能である。
【0094】例えば、量子化後のLSPよりケプストラ
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて強調度33に
修正を加える。例えば、フレーム判定が無声でサブフレ
ーム判定が有声の場合、強調度33を150%から20
0%に修正する。こうすることにより音源信号をよりパ
ルス状にすることができる。サブフレーム判定が無声の
場合には強調度33は現状のままとする。
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいて強調度33に
修正を加える。例えば、フレーム判定が無声でサブフレ
ーム判定が有声の場合、強調度33を150%から20
0%に修正する。こうすることにより音源信号をよりパ
ルス状にすることができる。サブフレーム判定が無声の
場合には強調度33は現状のままとする。
【0095】従って、実施の形態14によれば、フレー
ム/サブフレームの2段階判定で強調閾値および強調度
を修正することにより、音源信号強調のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
ム/サブフレームの2段階判定で強調閾値および強調度
を修正することにより、音源信号強調のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
【0096】実施の形態15.実施の形態5の別の形態
として、例えばフレーム毎に分析した音声状態判別結果
と、サブフレーム単位で更に詳細に音声状態判別した結
果から、図5中のフレーム毎の判定で求められたパルス
幅61および抑圧度16に修正を加えることも可能であ
る。
として、例えばフレーム毎に分析した音声状態判別結果
と、サブフレーム単位で更に詳細に音声状態判別した結
果から、図5中のフレーム毎の判定で求められたパルス
幅61および抑圧度16に修正を加えることも可能であ
る。
【0097】例えば、量子化後のLSPよりケプストラ
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいてパルス幅61
に修正を加える。例えば、フレーム判定が無声でサブフ
レーム判定が有声の場合、パルス幅61を14個から8
個に修正する。こうすることにより音源信号をよりパル
ス状にすることができる。サブフレーム判定が無声の場
合にはパルス幅61は現状のままとする。
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいてパルス幅61
に修正を加える。例えば、フレーム判定が無声でサブフ
レーム判定が有声の場合、パルス幅61を14個から8
個に修正する。こうすることにより音源信号をよりパル
ス状にすることができる。サブフレーム判定が無声の場
合にはパルス幅61は現状のままとする。
【0098】従って、実施の形態15によれば、フレー
ム/サブフレームの2段階判定でパルス幅および抑圧度
を修正することにより、音源信号抑圧のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
ム/サブフレームの2段階判定でパルス幅および抑圧度
を修正することにより、音源信号抑圧のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
【0099】実施の形態16.実施の形態6の別の形態
として、例えばフレーム毎に分析した音声状態判別結果
と、サブフレーム単位で更に詳細に音声状態判別した結
果から、図6中のフレーム毎の判定で求められたパルス
幅61および強調度33に修正を加えることも可能であ
る。
として、例えばフレーム毎に分析した音声状態判別結果
と、サブフレーム単位で更に詳細に音声状態判別した結
果から、図6中のフレーム毎の判定で求められたパルス
幅61および強調度33に修正を加えることも可能であ
る。
【0100】例えば、量子化後のLSPよりケプストラ
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいてパルス幅61
に修正を加える。例えば、フレーム判定が無声でサブフ
レーム判定が有声の場合、パルス幅61を14個から8
個に修正する。こうすることにより音源信号をよりパル
ス状にすることができる。サブフレーム判定が無声の場
合にはパルス幅61は現状のままとする。
ムを求めてその低次ケプストラムからサブフレーム毎に
有声無声判別を行い、その結果に基づいてパルス幅61
に修正を加える。例えば、フレーム判定が無声でサブフ
レーム判定が有声の場合、パルス幅61を14個から8
個に修正する。こうすることにより音源信号をよりパル
ス状にすることができる。サブフレーム判定が無声の場
合にはパルス幅61は現状のままとする。
【0101】従って、実施の形態16によれば、フレー
ム/サブフレームの2段階判定でパルス幅および強調度
を修正することにより、音源信号強調のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
ム/サブフレームの2段階判定でパルス幅および強調度
を修正することにより、音源信号強調のより細かな制御
を行うことができるので、低レートCELP符号化方式
の品質を更に改善することができる。
【0102】実施の形態17.入力音声信号の例えば過
渡部のみにおいて、適応音源更新信号中の微小振幅パル
スを抑圧してもよい。図11はこの発明の実施の形態1
7に係る音声符号化装置の構成を示すブロック図であ
る。図11において、図1に示す実施の形態1と同一部
分は同一符号を付してその説明は省略する。新たな符号
として、80は雑音符号帳である。
渡部のみにおいて、適応音源更新信号中の微小振幅パル
スを抑圧してもよい。図11はこの発明の実施の形態1
7に係る音声符号化装置の構成を示すブロック図であ
る。図11において、図1に示す実施の形態1と同一部
分は同一符号を付してその説明は省略する。新たな符号
として、80は雑音符号帳である。
【0103】以下、図11に基づいて実施の形態17に
係る音声符号化装置の動作原理を説明する。音声状態判
別手段3は、入力音声信号1とLSP係数17から入力
音声信号1中の過渡部フレームを検出し、過渡部フレー
ムを示すモード信号13を抑圧比率算出手段11へ出力
する。
係る音声符号化装置の動作原理を説明する。音声状態判
別手段3は、入力音声信号1とLSP係数17から入力
音声信号1中の過渡部フレームを検出し、過渡部フレー
ムを示すモード信号13を抑圧比率算出手段11へ出力
する。
【0104】抑圧比率算出手段11は、過渡部とそれ以
外の部分の状態別に抑圧比率15と抑圧度16を決定す
る。例えば過渡部の場合には抑圧比率15は90%即ち
現フレームの総パルス数の90%のパルスを抑圧し、ま
た抑圧度16は100%即ち振幅は零にするように決定
する。それ以外の場合には抑圧比率15は0%即ち抑圧
するパルス数を零とする。その後決定された抑圧比率1
5および抑圧度16を音源信号抑圧手段12に出力す
る。
外の部分の状態別に抑圧比率15と抑圧度16を決定す
る。例えば過渡部の場合には抑圧比率15は90%即ち
現フレームの総パルス数の90%のパルスを抑圧し、ま
た抑圧度16は100%即ち振幅は零にするように決定
する。それ以外の場合には抑圧比率15は0%即ち抑圧
するパルス数を零とする。その後決定された抑圧比率1
5および抑圧度16を音源信号抑圧手段12に出力す
る。
【0105】音源信号抑圧手段12は、誤差最小化手段
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧比率算
出手段11が出力する抑圧比率15および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。
7による誤差最小化により求められた最適な励振音源信
号18(適応音源更新信号14)を入力し、抑圧比率算
出手段11が出力する抑圧比率15および抑圧度16に
基づいて振幅が小さいパルスから順に振幅抑圧を行い、
適応音源符号帳8の内部状態を更新する音源信号を生成
し適応音源符号帳8へ出力し、上記音源信号を用いて適
応音源符号帳8の内部状態を更新する。
【0106】従って、実施の形態17によれば、例えば
無声から有声に渡る部分の音声過渡部で適応音源更新信
号中の微小振幅パルスの抑圧を行うことで、有声立上り
部分における適応音源を活性化することができるので、
低レートCELP符号化方式の品質を更に改善すること
ができる。
無声から有声に渡る部分の音声過渡部で適応音源更新信
号中の微小振幅パルスの抑圧を行うことで、有声立上り
部分における適応音源を活性化することができるので、
低レートCELP符号化方式の品質を更に改善すること
ができる。
【0107】実施の形態18.実施の形態17の別の形
態として、入力音声信号の例えば過渡部のみにおいて、
適応音源更新信号中の大きな振幅パルスを強調してもよ
い。
態として、入力音声信号の例えば過渡部のみにおいて、
適応音源更新信号中の大きな振幅パルスを強調してもよ
い。
【0108】例えば無声から有声に渡る部分の音声過渡
部で適応音源更新信号中の大きな振幅パルスの強調を行
うことで、有声立上り部分における適応音源を活性化す
ることができるので、低レートCELP符号化方式の品
質を更に改善することができる。
部で適応音源更新信号中の大きな振幅パルスの強調を行
うことで、有声立上り部分における適応音源を活性化す
ることができるので、低レートCELP符号化方式の品
質を更に改善することができる。
【0109】実施の形態19.音源信号加工方式とし
て、例えば、上記発明の実施の形態1と実施の形態4の
抑圧方式と強調方式を複合し、適応音源更新信号の閾値
以上のパルスを振幅強調した後、さらに別の比率の数の
パルスを抑圧するといったことも可能である。
て、例えば、上記発明の実施の形態1と実施の形態4の
抑圧方式と強調方式を複合し、適応音源更新信号の閾値
以上のパルスを振幅強調した後、さらに別の比率の数の
パルスを抑圧するといったことも可能である。
【0110】パルスの振幅強調を行った後にさらに別の
比率の数のパルスを抑圧することにより、振幅強調の効
果に加え、微少振幅のパルス抑圧による相乗効果により
更に低レートCELP符号化方式の品質を改善すること
ができる。
比率の数のパルスを抑圧することにより、振幅強調の効
果に加え、微少振幅のパルス抑圧による相乗効果により
更に低レートCELP符号化方式の品質を改善すること
ができる。
【0111】
【発明の効果】以上のように、この発明によれば、入力
音声信号を一定時間間隔でフレーム毎に分析し、上記入
力音声信号のスペクトル包絡情報を符号化すると共に、
音源信号を符号帳に蓄えられたコードベクトルまたは過
去の音声の励振信号をコード化した適応音源符号帳のコ
ードベクトルによって符号化する音声符号化装置におい
て、入力音声信号を分析して音声状態判別信号を出力す
る音声状態判別手段と、上記音声状態判別手段からの音
声状態判別信号に基づいて上記適応音源符号帳の内部状
態を更新するための適応音源更新信号を加工して加工し
た音源信号を用いて上記適応音源符号帳の更新を行う加
工更新手段とを備えたので、入力音声の状態に応じて適
応符号帳の内部状態更新に用いる過去の音源信号を加工
することにより、伝送情報を増加させずに、音声符号化
装置の品質向上、特に音声立ち上がり部分の品質向上を
図ることができる。
音声信号を一定時間間隔でフレーム毎に分析し、上記入
力音声信号のスペクトル包絡情報を符号化すると共に、
音源信号を符号帳に蓄えられたコードベクトルまたは過
去の音声の励振信号をコード化した適応音源符号帳のコ
ードベクトルによって符号化する音声符号化装置におい
て、入力音声信号を分析して音声状態判別信号を出力す
る音声状態判別手段と、上記音声状態判別手段からの音
声状態判別信号に基づいて上記適応音源符号帳の内部状
態を更新するための適応音源更新信号を加工して加工し
た音源信号を用いて上記適応音源符号帳の更新を行う加
工更新手段とを備えたので、入力音声の状態に応じて適
応符号帳の内部状態更新に用いる過去の音源信号を加工
することにより、伝送情報を増加させずに、音声符号化
装置の品質向上、特に音声立ち上がり部分の品質向上を
図ることができる。
【0112】また、加工更新手段として、適応音源符号
帳を更新する音源信号から微少パルスを抑圧するように
抑圧比率算出手段および音源信号抑圧手段を設けたの
で、例えば有声立ち上がり部分において適応音源を活性
化することができ、低ビットレートCELP符号化方式
の品質を向上させることができる。
帳を更新する音源信号から微少パルスを抑圧するように
抑圧比率算出手段および音源信号抑圧手段を設けたの
で、例えば有声立ち上がり部分において適応音源を活性
化することができ、低ビットレートCELP符号化方式
の品質を向上させることができる。
【0113】また、加工更新手段として、適応音源符号
帳を更新する音源信号から大振幅パルスを強調するよう
に強調比率算出手段および音源信号強調手段を設けたの
で、微少振幅パルスの特徴を生かしたまま、例えば有声
立ち上がり部分で適応音源を活性化することができ、低
ビットレートCELP符号化方式の品質を改善すること
ができる。
帳を更新する音源信号から大振幅パルスを強調するよう
に強調比率算出手段および音源信号強調手段を設けたの
で、微少振幅パルスの特徴を生かしたまま、例えば有声
立ち上がり部分で適応音源を活性化することができ、低
ビットレートCELP符号化方式の品質を改善すること
ができる。
【0114】また、加工更新手段として、適応音源符号
帳を更新する音源信号から微少パルスを抑圧するように
抑圧閾値算出手段および音源信号抑圧手段を設けたの
で、例えば有声立ち上がり部分において適応音源を活性
化することができ、低ビットレートCELP符号化方式
の品質を向上させることができる。
帳を更新する音源信号から微少パルスを抑圧するように
抑圧閾値算出手段および音源信号抑圧手段を設けたの
で、例えば有声立ち上がり部分において適応音源を活性
化することができ、低ビットレートCELP符号化方式
の品質を向上させることができる。
【0115】また、加工更新手段として、適応音源符号
帳を更新する音源信号から大振幅パルスを強調するよう
に強調閾値算出手段および音源信号強調手段を設けたの
で、微少振幅パルスの特徴を生かしたまま、例えば有声
立ち上がり部分で適応音源を活性化することができ、低
ビットレートCELP符号化方式の品質を改善すること
ができる。
帳を更新する音源信号から大振幅パルスを強調するよう
に強調閾値算出手段および音源信号強調手段を設けたの
で、微少振幅パルスの特徴を生かしたまま、例えば有声
立ち上がり部分で適応音源を活性化することができ、低
ビットレートCELP符号化方式の品質を改善すること
ができる。
【0116】また、加工更新手段として、適応音源符号
帳を更新する音源信号中の最大振幅パルスを中心として
その近傍のパルスを残してその他の部分のパルスを抑圧
するようにパルス幅選択手段と音源信号抑圧手段を設け
たので、例えば有声立ち上がり部分で主成分パルスの特
徴を強調するように適応音源を活性化することができ、
低レートCELP符号化方式の品質を更に改善すること
ができる。
帳を更新する音源信号中の最大振幅パルスを中心として
その近傍のパルスを残してその他の部分のパルスを抑圧
するようにパルス幅選択手段と音源信号抑圧手段を設け
たので、例えば有声立ち上がり部分で主成分パルスの特
徴を強調するように適応音源を活性化することができ、
低レートCELP符号化方式の品質を更に改善すること
ができる。
【0117】また、加工更新手段として、適応音源符号
帳を更新する音源信号中の最大振幅パルスを中心として
その近傍のパルスを強調するようにパルス幅選択手段と
音源信号抑圧手段を設けたので、例えば有声立ち上がり
部分で主成分パルスの特徴を強調するように適応音源を
活性化することができるので、低レートCELP符号化
方式の品質を更に改善することができる。
帳を更新する音源信号中の最大振幅パルスを中心として
その近傍のパルスを強調するようにパルス幅選択手段と
音源信号抑圧手段を設けたので、例えば有声立ち上がり
部分で主成分パルスの特徴を強調するように適応音源を
活性化することができるので、低レートCELP符号化
方式の品質を更に改善することができる。
【0118】また、加工更新手段として、適応音源符号
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、その自己相関系列の値が小さなパルス
から順にパルスを抑圧することにより、例えば有声立ち
上がり部分において適応音源の周期性を強調することが
できるので、低レートCELP符号化方式の品質を改善
することができる。
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、その自己相関系列の値が小さなパルス
から順にパルスを抑圧することにより、例えば有声立ち
上がり部分において適応音源の周期性を強調することが
できるので、低レートCELP符号化方式の品質を改善
することができる。
【0119】また、加工更新手段として、適応音源符号
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、その自己相関系列の値が大きなパルス
から順にパルスを強調することにより、例えば有声立ち
上がり部分において適応音源の周期性を強調することが
できるので、低レートCELP符号化方式の品質を改善
することができる。
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、その自己相関系列の値が大きなパルス
から順にパルスを強調することにより、例えば有声立ち
上がり部分において適応音源の周期性を強調することが
できるので、低レートCELP符号化方式の品質を改善
することができる。
【0120】また、加工更新手段として、適応音源符号
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、自己相関系列最大値を基準にして、自
己相関系列の値が抑圧閾値以下のパルスを抑圧すること
により、例えば有声立ち上がり部分において適応音源の
周期性を強調することができるので、低レートCELP
符号化方式の品質を改善することができる。
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、自己相関系列最大値を基準にして、自
己相関系列の値が抑圧閾値以下のパルスを抑圧すること
により、例えば有声立ち上がり部分において適応音源の
周期性を強調することができるので、低レートCELP
符号化方式の品質を改善することができる。
【0121】また、加工更新手段として、適応音源符号
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、自己相関系列最大値を基準にして、自
己相関系列の値が強調閾値以上のパルスを強調すること
により、例えば有声立ち上がり部分において適応音源の
周期性を強調することができるので、低レートCELP
符号化方式の品質を改善することができる。
帳を更新する音源信号の自己相関系列を求める音源信号
分析手段を設け、自己相関系列最大値を基準にして、自
己相関系列の値が強調閾値以上のパルスを強調すること
により、例えば有声立ち上がり部分において適応音源の
周期性を強調することができるので、低レートCELP
符号化方式の品質を改善することができる。
【0122】さらに、パルスの振幅強調を行った後にさ
らに別の比率の数のパルスを抑圧することにより、振幅
強調の効果に加え、微少振幅のパルス抑圧による相乗効
果により更に低レートCELP符号化方式の品質を改善
することができる。
らに別の比率の数のパルスを抑圧することにより、振幅
強調の効果に加え、微少振幅のパルス抑圧による相乗効
果により更に低レートCELP符号化方式の品質を改善
することができる。
【図1】 この発明の実施の形態1の構成を示すブロッ
ク図である。
ク図である。
【図2】 この発明の実施の形態2の構成を示すブロッ
ク図である。
ク図である。
【図3】 この発明の実施の形態3の構成を示すブロッ
ク図である。
ク図である。
【図4】 この発明の実施の形態4の構成を示すブロッ
ク図である。
ク図である。
【図5】 この発明の実施の形態5の構成を示すブロッ
ク図である。
ク図である。
【図6】 この発明の実施の形態6の構成を示すブロッ
ク図である。
ク図である。
【図7】 この発明の実施の形態7の構成を示すブロッ
ク図である。
ク図である。
【図8】 この発明の実施の形態8の構成を示すブロッ
ク図である。
ク図である。
【図9】 この発明の実施の形態9の構成を示すブロッ
ク図である。
ク図である。
【図10】 この発明の実施の形態10の構成を示すブ
ロック図である。
ロック図である。
【図11】 この発明の実施の形態17の構成を示すブ
ロック図である。
ロック図である。
【図12】 微小パルス抑圧前と抑圧後の適応音源更新
信号波形を示す図である。
信号波形を示す図である。
【図13】 大振幅パルス強調前と強調後の適応音源更
新信号波形を示す図である。
新信号波形を示す図である。
【図14】 微小パルス抑圧前と抑圧後の適応音源更新
信号波形を示す図である。
信号波形を示す図である。
【図15】 パルス選択幅以外の部分のパルスの抑圧前
と抑圧後の適応音源更新信号波形を示す図である。
と抑圧後の適応音源更新信号波形を示す図である。
【図16】 適応音源符号張更新信号を抑圧する場合と
しない場合についての合成音声波形の違いを示す図であ
る。
しない場合についての合成音声波形の違いを示す図であ
る。
【図17】 従来の音声符号化装置の構成を示すブロッ
ク図である。
ク図である。
【図18】 従来の音声符号化装置の構成を示すブロッ
ク図である。
ク図である。
【図19】 従来の音声符号化装置の一部分の構成を示
すブロック図である。
すブロック図である。
【図20】 従来の音声符号化装置の構成を示すブロッ
ク図である。
ク図である。
1 入力音声信号、2 入力音声分析手段、3 音声状
態判別手段、4 切り替えスイッチ、5 合成フィル
タ、6 聴覚重みつけ手段、7 誤差最小化手段、8
適応音源符号帳、9 第1雑音符号帳、10 第2雑音
符号帳、11 抑圧比率算出手段、12 音源信号抑圧
手段、13 モード信号、14 適応音源更新信号、1
5 抑圧比率、16 抑圧度、17 LSP係数、18
最適な励振音源信号、19 誤差信号、20 聴覚重
みつけされた誤差信号、21 パルス抑圧された適応音
源更新信号、22 合成音声信号、30 強調比率算出
手段、31 音源信号強調手段、32 強調比率、33
強調度、34 パルス強調された適応音源更新信号、
40 抑圧閾値算出手段、41 抑圧閾値、50 強調
閾値算出手段、51 強調閾値、60 パルス幅選択手
段、61 パルス幅、70 音源信号分析手段、80
雑音符号帳。
態判別手段、4 切り替えスイッチ、5 合成フィル
タ、6 聴覚重みつけ手段、7 誤差最小化手段、8
適応音源符号帳、9 第1雑音符号帳、10 第2雑音
符号帳、11 抑圧比率算出手段、12 音源信号抑圧
手段、13 モード信号、14 適応音源更新信号、1
5 抑圧比率、16 抑圧度、17 LSP係数、18
最適な励振音源信号、19 誤差信号、20 聴覚重
みつけされた誤差信号、21 パルス抑圧された適応音
源更新信号、22 合成音声信号、30 強調比率算出
手段、31 音源信号強調手段、32 強調比率、33
強調度、34 パルス強調された適応音源更新信号、
40 抑圧閾値算出手段、41 抑圧閾値、50 強調
閾値算出手段、51 強調閾値、60 パルス幅選択手
段、61 パルス幅、70 音源信号分析手段、80
雑音符号帳。
Claims (12)
- 【請求項1】 入力音声信号を一定時間間隔でフレーム
毎に分析し、上記入力音声信号のスペクトル包絡情報を
符号化すると共に、音源信号を符号帳に蓄えられたコー
ドベクトルまたは過去の音声の励振信号をコード化した
適応音源符号帳のコードベクトルによって符号化する音
声符号化装置において、 入力音声信号を分析して音声状態判別信号を出力する音
声状態判別手段と、 上記音声状態判別手段からの音声状態判別信号に基づい
て上記適応音源符号帳の内部状態を更新するための適応
音源更新信号を加工して加工した音源信号を用いて上記
適応音源符号帳の更新を行う加工更新手段とを備えたこ
とを特徴とする音声符号化装置。 - 【請求項2】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号中の全パルス数に
対し振幅抑圧するパルス数の比率を上記音声状態判別信
号から算出し抑圧比率として出力する抑圧比率算出手段
と、上記適応音源更新信号を入力し、上記抑圧比率に従
って振幅が小さいパルスから順に振幅抑圧した音源信号
を用いて上記適応音源符号帳の更新を行う音源信号抑圧
手段とを有することを特徴とする音声符号化装置。 - 【請求項3】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号中の全パルス数に
対し振幅強調するパルス数の比率を上記音声状態判別信
号から算出し強調比率として出力する強調比率算出手段
と、上記適応音源更新信号を入力し、上記強調比率に従
って振幅が大きいパルスから順に振幅強調した音源信号
を用いて上記適応音源符号帳の更新を行う音源信号強調
手段とを有することを特徴とする音声符号化装置。 - 【請求項4】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号中の最大振幅パル
スと上記音声状態判別信号から抑圧閾値を算出する抑圧
閾値算出手段と、上記適応音源更新信号を入力し、上記
抑圧閾値以下の振幅のパルスを振幅抑圧した音源信号を
用いて上記適応音源符号帳の更新を行う音源信号抑圧手
段とを有することを特徴とする音声符号化装置。 - 【請求項5】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号中の最大振幅パル
スと上記音声状態判別信号から強調閾値を算出する強調
閾値算出手段と、上記適応音源更新信号を入力し、上記
強調閾値以上の振幅のパルスを振幅強調した音源信号を
用いて上記適応音源符号帳の更新を行う音源信号強調手
段とを有することを特徴とする音声符号化装置。 - 【請求項6】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号中の最大振幅パル
スを中心とし、上記最大振幅パルスの近傍のパルスを選
択するための選択幅を上記音声状態判別信号に従って決
定するパルス幅選択手段と、上記適応音源更新信号を入
力し、上記選択幅で選択されたパルス以外のパルスを振
幅抑圧した音源信号を用いて上記適応音源符号帳の更新
を行う音源信号抑圧手段とを有することを特徴とする音
声符号化装置。 - 【請求項7】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号中の最大振幅パル
スを中心とし、上記最大振幅パルスの近傍のパルスを選
択するための選択幅を上記音声状態判別信号に従って決
定するパルス幅選択手段と、上記適応音源更新信号を入
力し、上記選択幅で選択されたパルスを振幅強調した音
源信号を用いて上記適応音源符号帳の更新を行う音源信
号強調手段とを有することを特徴とする音声符号化装
置。 - 【請求項8】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号の自己相関系列を
求める音源信号分析手段と、全パルス数に対し振幅抑圧
するパルス数の比率を、上記音声状態判別信号および自
己相関系列最大値から算出し抑圧比率として出力する抑
圧比率算出手段と、上記抑圧比率に従って上記適応音源
更新信号の自己相関系列の値の小さなパルスから振幅抑
圧した音源信号を用いて上記適応音源符号帳の更新を行
う音源信号抑制手段とを有することを特徴とする音声符
号化装置。 - 【請求項9】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号の自己相関を求め
る音源信号分析手段と、全パルス数に対し振幅強調する
パルス数の比率を、上記音声状態判別信号および自己相
関係列最大値から算出し強調比率として出力する強調比
率算出手段と、上記強調比率に従って上記適応音源更新
信号の自己相関系列の値の大きなパルスから振幅強調し
た音源信号を用いて上記適応音源符号帳の更新を行う音
源信号強調手段とを有することを特徴とする音声符号化
装置。 - 【請求項10】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号の自己相関系列を
求める音源信号分析手段と、上記自己相関系列最大値と
上記音声状態判別信号から抑圧閾値を算出する抑圧閾値
算出手段と、上記適応音源更新信号を入力し、自己相関
系列の値が上記抑圧閾値以下のパルスを振幅抑圧した音
源信号を用いて上記適応音源符号帳の更新を行う音源信
号抑圧手段とを有することを特徴とする音声符号化装
置。 - 【請求項11】 請求項1記載の音声符号化装置におい
て、上記加工更新手段は、上記適応音源符号帳の内部状
態を更新するための適応音源更新信号の自己相関系列を
求める音源信号分析手段と、上記自己相関系列最大値と
上記音声状態判別信号から強調閾値を算出する強調閾値
算出手段と、上記適応音源更新信号を入力し、自己相関
系列の値が上記抑圧閾値以上のパルスを振幅強調した音
源信号を用いて上記適応音源符号帳の更新を行う音源信
号強調手段とを有することを特徴とする音声符号化装
置。 - 【請求項12】 請求項1ないし11のいずれかに記載
の音声符号化装置において、上記入力音声状態判定手段
は、入力音声信号の無声/有声/過渡部の状態判別を行
い、上記加工更新手段は、上記入力音声信号の過渡部に
おいてのみ上記適応音源符号帳を更新する音源信号を強
調または抑圧することを特徴とする音声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10296965A JP2000122698A (ja) | 1998-10-19 | 1998-10-19 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10296965A JP2000122698A (ja) | 1998-10-19 | 1998-10-19 | 音声符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000122698A true JP2000122698A (ja) | 2000-04-28 |
Family
ID=17840501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10296965A Abandoned JP2000122698A (ja) | 1998-10-19 | 1998-10-19 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000122698A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000077774A1 (fr) * | 1999-06-15 | 2000-12-21 | Matsushita Electric Industrial Co., Ltd. | Codeur de signaux de bruit et codeur de signaux vocaux |
JP3462464B2 (ja) | 2000-10-20 | 2003-11-05 | 株式会社東芝 | 音声符号化方法、音声復号化方法及び電子装置 |
JP2017194716A (ja) * | 2011-02-18 | 2017-10-26 | 株式会社Nttドコモ | 音声符号化装置、及び音声符号化方法 |
JP2020533619A (ja) * | 2017-08-17 | 2020-11-19 | セレンス オペレーティング カンパニー | 有音音声検出の複雑性低減およびピッチ推定 |
-
1998
- 1998-10-19 JP JP10296965A patent/JP2000122698A/ja not_active Abandoned
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000077774A1 (fr) * | 1999-06-15 | 2000-12-21 | Matsushita Electric Industrial Co., Ltd. | Codeur de signaux de bruit et codeur de signaux vocaux |
JP3462464B2 (ja) | 2000-10-20 | 2003-11-05 | 株式会社東芝 | 音声符号化方法、音声復号化方法及び電子装置 |
US6842732B2 (en) | 2000-10-20 | 2005-01-11 | Kabushiki Kaisha Toshiba | Speech encoding and decoding method and electronic apparatus for synthesizing speech signals using excitation signals |
JP2017194716A (ja) * | 2011-02-18 | 2017-10-26 | 株式会社Nttドコモ | 音声符号化装置、及び音声符号化方法 |
JP2020533619A (ja) * | 2017-08-17 | 2020-11-19 | セレンス オペレーティング カンパニー | 有音音声検出の複雑性低減およびピッチ推定 |
US11176957B2 (en) | 2017-08-17 | 2021-11-16 | Cerence Operating Company | Low complexity detection of voiced speech and pitch estimation |
JP7052008B2 (ja) | 2017-08-17 | 2022-04-11 | セレンス オペレーティング カンパニー | 有声音声検出の複雑性低減およびピッチ推定 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005513539A (ja) | 音声信号の効率的コーディングのための信号修正方法 | |
WO2001052241A1 (en) | Multi-mode voice encoding device and decoding device | |
JP2002258896A (ja) | 音声符号化方法および音声符号化装置 | |
JPH1097296A (ja) | 音声符号化方法および装置、音声復号化方法および装置 | |
Jelinek et al. | Wideband speech coding advances in VMR-WB standard | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3558031B2 (ja) | 音声復号化装置 | |
CN107710324B (zh) | 音频编码器和用于对音频信号进行编码的方法 | |
JP4679513B2 (ja) | 階層符号化装置および階層符号化方法 | |
JP3426871B2 (ja) | 音声信号のスペクトル形状調整方法および装置 | |
JP2000122698A (ja) | 音声符号化装置 | |
US7486719B2 (en) | Transcoder and code conversion method | |
JP2001051699A (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
EP1564723B1 (en) | Transcoder and coder conversion method | |
JP2005326868A (ja) | 音声復号化方法及び音声復号化装置 | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JP3232701B2 (ja) | 音声符号化方法 | |
KR100312336B1 (ko) | 다차 lpc 계수를 적용한 포만트 후필터링을 통한 음성보코더의 음질 향상방법 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3578933B2 (ja) | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 | |
JP2004151423A (ja) | 帯域拡張装置及び方法 | |
JP3468862B2 (ja) | 音声符号化装置 | |
JP3232728B2 (ja) | 音声符号化方法 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JP2992998B2 (ja) | 音声符号化復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080902 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20081010 |