JPH04264597A - 音声符号化装置および音声復号装置 - Google Patents
音声符号化装置および音声復号装置Info
- Publication number
- JPH04264597A JPH04264597A JP3026085A JP2608591A JPH04264597A JP H04264597 A JPH04264597 A JP H04264597A JP 3026085 A JP3026085 A JP 3026085A JP 2608591 A JP2608591 A JP 2608591A JP H04264597 A JPH04264597 A JP H04264597A
- Authority
- JP
- Japan
- Prior art keywords
- component
- periodic
- periodic component
- signal
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000000737 periodic effect Effects 0.000 claims abstract description 95
- 230000005236 sound signal Effects 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims 1
- 238000001308 synthesis method Methods 0.000 claims 1
- 230000006866 deterioration Effects 0.000 abstract description 3
- 239000002131 composite material Substances 0.000 abstract description 2
- 230000003044 adaptive effect Effects 0.000 description 24
- 239000013598 vector Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
- G10L2019/0014—Selection criteria for distances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、音声信号の情報圧縮伝
送を行うための音声符号化装置および音声復号装置に関
し、特に、CELP型の音声符号化装置および音声復号
装置に関する。近年、企業内通信システム、ディジタル
伝送システム、音声蓄積システム等において、情報の高
能率な圧縮を行う音声符号化方式が要望されている。特
に、ディジタル移動無線通信システム等においては、伝
送路エラーに強い音声符号化システムが求められている
。これらのシステムにおいて、音声品質を保ちつつ情報
圧縮を実現するものとして、CELP型の音声符号化装
置および音声復号装置における技術の進展が期待されて
いる。
送を行うための音声符号化装置および音声復号装置に関
し、特に、CELP型の音声符号化装置および音声復号
装置に関する。近年、企業内通信システム、ディジタル
伝送システム、音声蓄積システム等において、情報の高
能率な圧縮を行う音声符号化方式が要望されている。特
に、ディジタル移動無線通信システム等においては、伝
送路エラーに強い音声符号化システムが求められている
。これらのシステムにおいて、音声品質を保ちつつ情報
圧縮を実現するものとして、CELP型の音声符号化装
置および音声復号装置における技術の進展が期待されて
いる。
【0002】
【従来の技術】図4は、従来のCELP型音声符号化装
置の一般的な構成を示すものである。図4において、1
1は適応(アダプティブ)符号帳、12はストカスティ
ック符号帳、13は加算器、14は重み付け合成フィル
タ、15は減算器、16は誤差電力評価回路、18はフ
レーム遅延回路、そして、21および22は乗算器であ
る。
置の一般的な構成を示すものである。図4において、1
1は適応(アダプティブ)符号帳、12はストカスティ
ック符号帳、13は加算器、14は重み付け合成フィル
タ、15は減算器、16は誤差電力評価回路、18はフ
レーム遅延回路、そして、21および22は乗算器であ
る。
【0003】図4に示されるように、CELP型音声符
号化装置は、アダプティブおよびストカスティックの2
つの符号帳11および12を有しており、アダプティブ
符号帳11が出力するピッチベクトルP、および、スト
カスティック符号帳12が出力するコードベクトルCに
対して、乗算器21および22において、それぞれのゲ
イン(ピッチゲインbおよびコードゲインg)を乗じて
、加算器13にて両者を加算することにより、駆動音源
信号(bP+gC)を発生する。ここで、アダプティブ
符号帳11が出力するピッチベクトルは、音声信号のピ
ッチ周期性に依存する成分を発生するものであり、他方
、ストカスティック符号帳21のコードベクトルは、非
周期的な(ランダムな)音源ベクトルを出力するもので
あって、複数のランダムパターンからなるコードベクト
ルのうちの1つを選択して出力する。上記の駆動音源信
号(bP+gC)は重み付け合成フィルタ14に供給さ
れ、例えば、線型予測等による、短期的予測処理がなさ
れて、再生信号(bAP+gAC)が生成される。この
再生信号は、減算器15において、聴覚重み付け処理が
なされた入力信号A′Xに対する誤差Eが求められる。 この誤差Eは、誤差電力評価回路16に供給される。誤
差電力評価回路16は、上記のアダプティブ符号帳11
の出力P、ストカスティック符号帳12の出力C、およ
び、乗算器21および22におけるゲインbおよびgを
各フレーム毎に走査することにより、誤差Eを最小にす
る駆動音源信号(bP+gC)を最適駆動音源信号(b
0 P0 +g0 C0 )として決定する。
号化装置は、アダプティブおよびストカスティックの2
つの符号帳11および12を有しており、アダプティブ
符号帳11が出力するピッチベクトルP、および、スト
カスティック符号帳12が出力するコードベクトルCに
対して、乗算器21および22において、それぞれのゲ
イン(ピッチゲインbおよびコードゲインg)を乗じて
、加算器13にて両者を加算することにより、駆動音源
信号(bP+gC)を発生する。ここで、アダプティブ
符号帳11が出力するピッチベクトルは、音声信号のピ
ッチ周期性に依存する成分を発生するものであり、他方
、ストカスティック符号帳21のコードベクトルは、非
周期的な(ランダムな)音源ベクトルを出力するもので
あって、複数のランダムパターンからなるコードベクト
ルのうちの1つを選択して出力する。上記の駆動音源信
号(bP+gC)は重み付け合成フィルタ14に供給さ
れ、例えば、線型予測等による、短期的予測処理がなさ
れて、再生信号(bAP+gAC)が生成される。この
再生信号は、減算器15において、聴覚重み付け処理が
なされた入力信号A′Xに対する誤差Eが求められる。 この誤差Eは、誤差電力評価回路16に供給される。誤
差電力評価回路16は、上記のアダプティブ符号帳11
の出力P、ストカスティック符号帳12の出力C、およ
び、乗算器21および22におけるゲインbおよびgを
各フレーム毎に走査することにより、誤差Eを最小にす
る駆動音源信号(bP+gC)を最適駆動音源信号(b
0 P0 +g0 C0 )として決定する。
【0004】図4に示されるように、上記のアダプティ
ブ符号帳11には、前のフレームにおいて求められた最
適駆動音源信号(b0 P0 +g0 C0 )が供給
(フィードバック)される。アダプティブ符号帳11は
、該アダプティブ符号帳11に入力されるビット列のう
ちあるピッチ周期成分を強調したものに対応するパター
ンを、上記ピッチベクトルとして出力する。こうして、
図4の構成の適応符号帳11、乗算器21、加算器13
、および、フレーム遅延回路18からなるループによっ
て、駆動音源信号内の、音声信号のピッチ周期性に依存
する成分(周期的成分)が生成されている。
ブ符号帳11には、前のフレームにおいて求められた最
適駆動音源信号(b0 P0 +g0 C0 )が供給
(フィードバック)される。アダプティブ符号帳11は
、該アダプティブ符号帳11に入力されるビット列のう
ちあるピッチ周期成分を強調したものに対応するパター
ンを、上記ピッチベクトルとして出力する。こうして、
図4の構成の適応符号帳11、乗算器21、加算器13
、および、フレーム遅延回路18からなるループによっ
て、駆動音源信号内の、音声信号のピッチ周期性に依存
する成分(周期的成分)が生成されている。
【0005】上記のように、図4の構成の適応符号帳1
1、乗算器21、加算器13、および、フレーム遅延回
路18からなるループにおいては、駆動音源信号内の、
音声信号のピッチ周期性に依存する成分(周期的成分)
が生成されるので、音声信号の母音のみの部分の再生品
質という観点からは、本来、このループには、真に周期
性のある成分b0 P0 のみがフィードバックされる
ことが望ましい。しかしながら、もし、アダプティブ符
号帳11に非周期的成分g0 C0 が入力されないと
、上記のループには、一度取り込まれた周期的成分は永
遠に保持されることになり、アダプティブ符号帳11が
、時間と共に変化する音声信号の性質に追随できなくな
る。特に、初期状態では、アダプティブ符号帳11の入
力はオールゼロであるので、非周期的成分g0 C0
が入力されないとアダプティブ符号帳11の出力はゼロ
のままとなってしまう。したがって、アダプティブ符号
帳11が、時間と共に変化する音声信号の性質に追随し
て適応的に動作するためには、一般には、上記のような
非周期的成分g0 C0 をもまた、フィードバックす
ることが必要である。
1、乗算器21、加算器13、および、フレーム遅延回
路18からなるループにおいては、駆動音源信号内の、
音声信号のピッチ周期性に依存する成分(周期的成分)
が生成されるので、音声信号の母音のみの部分の再生品
質という観点からは、本来、このループには、真に周期
性のある成分b0 P0 のみがフィードバックされる
ことが望ましい。しかしながら、もし、アダプティブ符
号帳11に非周期的成分g0 C0 が入力されないと
、上記のループには、一度取り込まれた周期的成分は永
遠に保持されることになり、アダプティブ符号帳11が
、時間と共に変化する音声信号の性質に追随できなくな
る。特に、初期状態では、アダプティブ符号帳11の入
力はオールゼロであるので、非周期的成分g0 C0
が入力されないとアダプティブ符号帳11の出力はゼロ
のままとなってしまう。したがって、アダプティブ符号
帳11が、時間と共に変化する音声信号の性質に追随し
て適応的に動作するためには、一般には、上記のような
非周期的成分g0 C0 をもまた、フィードバックす
ることが必要である。
【0006】図5は、図4の構成における信号波形を示
す図である。図5において、19は、入力信号Xに対し
て聴覚重み付け処理A′を行う聴覚重み付けフィルタで
ある。
す図である。図5において、19は、入力信号Xに対し
て聴覚重み付け処理A′を行う聴覚重み付けフィルタで
ある。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
ような従来のCELP型音声符号化装置においては、ア
ダプティブ符号帳11への入力として、常に、最適駆動
音源信号(b0 P0 +g0 C0 )が供給(フィ
ードバック)されるため、音声信号のうちピッチ周期性
の強い有声音の再生の際には、上記の非周期的成分が、
音質を劣化させる無用且つ有害な成分として作用すると
いう問題がある。
ような従来のCELP型音声符号化装置においては、ア
ダプティブ符号帳11への入力として、常に、最適駆動
音源信号(b0 P0 +g0 C0 )が供給(フィ
ードバック)されるため、音声信号のうちピッチ周期性
の強い有声音の再生の際には、上記の非周期的成分が、
音質を劣化させる無用且つ有害な成分として作用すると
いう問題がある。
【0008】本発明は.音源の周期的成分および非周期
的成分の合成信号を、該音源の周期的成分の発生部分に
フィードバックして、該音源の周期的成分を発生させる
構成を含むCELP型の音声符号化装置および音声復号
装置を含んでなるシステムにおいて、ピッチ周期性の強
い有声音の再生の際に、音質の劣化を防止することを目
的とする。
的成分の合成信号を、該音源の周期的成分の発生部分に
フィードバックして、該音源の周期的成分を発生させる
構成を含むCELP型の音声符号化装置および音声復号
装置を含んでなるシステムにおいて、ピッチ周期性の強
い有声音の再生の際に、音質の劣化を防止することを目
的とする。
【0009】
【課題を解決するための手段】図1は、本発明による音
声符号化装置の基本構成を示すものである。図1におい
て、1は周期的成分発生手段、2は非周期的成分発生手
段、3は合成手段、4は短期的予測フィルタ手段、5は
誤差検出手段、6は誤差評価手段、そして、7は帰還成
分補正手段である。
声符号化装置の基本構成を示すものである。図1におい
て、1は周期的成分発生手段、2は非周期的成分発生手
段、3は合成手段、4は短期的予測フィルタ手段、5は
誤差検出手段、6は誤差評価手段、そして、7は帰還成
分補正手段である。
【0010】周期的成分発生手段1は、自身の入力信号
に追随して音源信号の周期的成分を発生する。非周期的
成分発生手段2は、音源信号の非周期的成分を発生する
。合成手段3は、上記の音源信号の周期的成分および非
周期的成分を合成する。短期的予測フィルタ手段4は、
短期的予測に基づいて、前記合成された信号から、入力
音声信号を近似する再生信号を発生する。
に追随して音源信号の周期的成分を発生する。非周期的
成分発生手段2は、音源信号の非周期的成分を発生する
。合成手段3は、上記の音源信号の周期的成分および非
周期的成分を合成する。短期的予測フィルタ手段4は、
短期的予測に基づいて、前記合成された信号から、入力
音声信号を近似する再生信号を発生する。
【0011】誤差検出手段5は、上記の再生信号の入力
音声信号に対する誤差を検出する。誤差評価手段6は、
上記の周期的成分発生手段1および非周期的成分発生手
段2を制御且つ走査して、前記入力音声信号を最も良く
近似する再生信号を実現するような最適の音源信号の周
期的成分および非周期的成分を、それぞれ発生させる。
音声信号に対する誤差を検出する。誤差評価手段6は、
上記の周期的成分発生手段1および非周期的成分発生手
段2を制御且つ走査して、前記入力音声信号を最も良く
近似する再生信号を実現するような最適の音源信号の周
期的成分および非周期的成分を、それぞれ発生させる。
【0012】帰還成分補正手段7は、上記の最適の音源
信号の周期的成分および非周期的成分を入力して、該最
適の音源信号の周期的成分および非周期的成分の相対的
な大きさに基づいて、該周期的成分が相対的に大きいと
きには、より一層非周期的成分を抑圧して、前記最適の
音源信号の周期的成分と共に前記周期的成分発生手段1
への入力信号として供給する。
信号の周期的成分および非周期的成分を入力して、該最
適の音源信号の周期的成分および非周期的成分の相対的
な大きさに基づいて、該周期的成分が相対的に大きいと
きには、より一層非周期的成分を抑圧して、前記最適の
音源信号の周期的成分と共に前記周期的成分発生手段1
への入力信号として供給する。
【0013】上記の帰還成分補正手段7は、例えば、前
記最適の音源信号における周期的成分および非周期的成
分それぞれのパワーの比に応じて前記非周期的成分を抑
圧するようにすることができる。また、上記の周期的成
分発生手段1は、前記誤差評価手段6の制御の基に、前
記入力信号における所定のピッチ周期の成分を強調して
出力するものとすることができる。
記最適の音源信号における周期的成分および非周期的成
分それぞれのパワーの比に応じて前記非周期的成分を抑
圧するようにすることができる。また、上記の周期的成
分発生手段1は、前記誤差評価手段6の制御の基に、前
記入力信号における所定のピッチ周期の成分を強調して
出力するものとすることができる。
【0014】図1の音声符号化装置に対応して復号側に
設けられる音声復号装置は、図1の構成から誤差検出手
段5および誤差評価手段6を除いた構成により実現でき
る。尚、ここで、上記の音声符号化装置においては、上
記の最適の音源信号の周期的成分および非周期的成分を
、周期的成分発生手段1および非周期的成分発生手段2
において発生させるように周期的成分発生手段1および
非周期的成分発生手段2を制御するパラメータ、および
、入力音声信号を最も良く近似する再生信号を実現する
ような短期的予測フィルタ手段4のフィルタ係数を、音
声信号の符号化された情報として復号側へ伝送し、復号
側においては、これらのパラメータおよびフィルタ係数
を受信して、上記の音声復号装置内の対応する周期的成
分発生手段1、非周期的成分発生手段2、短期的予測フ
ィルタ手段4、および、帰還成分補正手段7を、これら
のパラメータおよびフィルタ係数に従って動作させるこ
とにより、上記の音声符号化装置において入力音声信号
を最も良く近似する再生信号が再生される。
設けられる音声復号装置は、図1の構成から誤差検出手
段5および誤差評価手段6を除いた構成により実現でき
る。尚、ここで、上記の音声符号化装置においては、上
記の最適の音源信号の周期的成分および非周期的成分を
、周期的成分発生手段1および非周期的成分発生手段2
において発生させるように周期的成分発生手段1および
非周期的成分発生手段2を制御するパラメータ、および
、入力音声信号を最も良く近似する再生信号を実現する
ような短期的予測フィルタ手段4のフィルタ係数を、音
声信号の符号化された情報として復号側へ伝送し、復号
側においては、これらのパラメータおよびフィルタ係数
を受信して、上記の音声復号装置内の対応する周期的成
分発生手段1、非周期的成分発生手段2、短期的予測フ
ィルタ手段4、および、帰還成分補正手段7を、これら
のパラメータおよびフィルタ係数に従って動作させるこ
とにより、上記の音声符号化装置において入力音声信号
を最も良く近似する再生信号が再生される。
【0015】
【作用】図1に示されるように、帰還成分補正手段7に
よって、入力音声信号の周期性が大きいときには、周期
的成分発生手段1にフィードバックされる最適駆動音源
信号のうち、非周期的成分はより抑圧され、入力音声信
号の周期性が小さいときには、従来通りの最適駆動音源
信号により近い信号が周期的成分発生手段1にフィード
バックされる。
よって、入力音声信号の周期性が大きいときには、周期
的成分発生手段1にフィードバックされる最適駆動音源
信号のうち、非周期的成分はより抑圧され、入力音声信
号の周期性が小さいときには、従来通りの最適駆動音源
信号により近い信号が周期的成分発生手段1にフィード
バックされる。
【0016】したがって、入力音声信号の周期性が大き
いときに非周期的成分が周期的成分発生手段1にフィー
ドバックされることによる音質の低下が防止される。
いときに非周期的成分が周期的成分発生手段1にフィー
ドバックされることによる音質の低下が防止される。
【0017】
【実施例】以下添付図面を用いて本発明の実施例を詳細
に説明する。図2は、本発明の実施例における音声符号
化装置の構成を示す図である。図2において、符号17
で示され、フレーム遅延回路18の前段に設けられた帰
還量補正回路以外は、図4の従来の構成と同様である。 図2の帰還量補正回路17は、図1の帰還成分補正手段
7に対応するものである。帰還量補正回路17は、前フ
レームにおいて決定された最適な駆動音源信号(b0
P0 +g0C0 )を定める各パラメータb0 ,P
0 ,g0 ,およびC0 を入力して、以下の式(1
)および(2)、または、式(1)および(3)によっ
て定められる演算を行うことにより、フレーム遅延回路
18を介してアダプティブ符号帳11に供給する帰還信
号を(b0 P0 +g0 ′C0 )として求める。
に説明する。図2は、本発明の実施例における音声符号
化装置の構成を示す図である。図2において、符号17
で示され、フレーム遅延回路18の前段に設けられた帰
還量補正回路以外は、図4の従来の構成と同様である。 図2の帰還量補正回路17は、図1の帰還成分補正手段
7に対応するものである。帰還量補正回路17は、前フ
レームにおいて決定された最適な駆動音源信号(b0
P0 +g0C0 )を定める各パラメータb0 ,P
0 ,g0 ,およびC0 を入力して、以下の式(1
)および(2)、または、式(1)および(3)によっ
て定められる演算を行うことにより、フレーム遅延回路
18を介してアダプティブ符号帳11に供給する帰還信
号を(b0 P0 +g0 ′C0 )として求める。
【0018】
g0 ′=kc ・g0
(1) kc =(|g0 C0
|2 /(|b0 P0 |2 +|g0 C0 |2
))1/2
0≦kc ≦1 (2)
kc =(|g0 AC0 |2 /(|b0 A
P0 |2 +|g0 AC0 |2 ))1/2
0≦kc ≦1
(3)ここで、Aは、重み付け合成フ
ィルタ14におけるフィルタ係数である。
(1) kc =(|g0 C0
|2 /(|b0 P0 |2 +|g0 C0 |2
))1/2
0≦kc ≦1 (2)
kc =(|g0 AC0 |2 /(|b0 A
P0 |2 +|g0 AC0 |2 ))1/2
0≦kc ≦1
(3)ここで、Aは、重み付け合成フ
ィルタ14におけるフィルタ係数である。
【0019】上記(1)および(2)式からわかるよう
に、図2の帰還量補正回路17においては、前フレーム
において決定された最適な駆動音源信号(b0 P0
+g0 C0 )の周期的成分および非周期的成分それ
ぞれのエネルギーをベクトルの内積演算によって算出し
、この内、非周期的成分の割合を、上記の係数kc と
して求め、この係数kc を、該非周期的成分に更に乗
じたものg0 ′C0 を、元の周期的成分b0 P0
と合成して、フレーム遅延回路18を介してアダプテ
ィブ符号帳11に供給している。この係数kc は、必
ず1以下であり、また、前フレームにおいて決定された
最適な駆動音源信号(b0 P0 +g0 C0 )に
おいて、非周期的成分のエネルギーの占める割合が小さ
ければ、小さい程、小さくなるので、入力音声信号が、
有声音等のピッチ周期性の強いものであるときには、ア
ダプティブ符号帳11に供給される帰還信号における非
周期的成分が更に抑圧される。したがって、有声音等の
ピッチ周期性の強い音声信号に対する雑音成分が抑圧さ
れることになり、このような音声信号の符号化音声品質
が向上する。
に、図2の帰還量補正回路17においては、前フレーム
において決定された最適な駆動音源信号(b0 P0
+g0 C0 )の周期的成分および非周期的成分それ
ぞれのエネルギーをベクトルの内積演算によって算出し
、この内、非周期的成分の割合を、上記の係数kc と
して求め、この係数kc を、該非周期的成分に更に乗
じたものg0 ′C0 を、元の周期的成分b0 P0
と合成して、フレーム遅延回路18を介してアダプテ
ィブ符号帳11に供給している。この係数kc は、必
ず1以下であり、また、前フレームにおいて決定された
最適な駆動音源信号(b0 P0 +g0 C0 )に
おいて、非周期的成分のエネルギーの占める割合が小さ
ければ、小さい程、小さくなるので、入力音声信号が、
有声音等のピッチ周期性の強いものであるときには、ア
ダプティブ符号帳11に供給される帰還信号における非
周期的成分が更に抑圧される。したがって、有声音等の
ピッチ周期性の強い音声信号に対する雑音成分が抑圧さ
れることになり、このような音声信号の符号化音声品質
が向上する。
【0020】また、前フレームにおいて決定された最適
な駆動音源信号(b0 P0 +g0 C0 )におい
て、周期的成分のエネルギーの占める割合が小さく、ア
ダプティブ符号帳11が入力信号のピッチ周期に追従で
きていないと考えられるとき、あるいは、周期的成分が
占める割合が小さい入力音声信号(無声音等)の場合に
は、上記の係数kc の値は大きくなり、したがって、
上記の最適な駆動音源信号(b0P0 +g0 C0
)における非周期的成分は、あまり抑圧されることなく
、アダプティブ符号帳11に供給される。これにより、
アダプティブ符号帳11の出力が、入力信号に追従でき
るようになる。
な駆動音源信号(b0 P0 +g0 C0 )におい
て、周期的成分のエネルギーの占める割合が小さく、ア
ダプティブ符号帳11が入力信号のピッチ周期に追従で
きていないと考えられるとき、あるいは、周期的成分が
占める割合が小さい入力音声信号(無声音等)の場合に
は、上記の係数kc の値は大きくなり、したがって、
上記の最適な駆動音源信号(b0P0 +g0 C0
)における非周期的成分は、あまり抑圧されることなく
、アダプティブ符号帳11に供給される。これにより、
アダプティブ符号帳11の出力が、入力信号に追従でき
るようになる。
【0021】図2の帰還量補正回路17が上記の(1)
および(3)式による演算を行う場合においても、その
定性的性質は、上記の(1)および(2)式による演算
を行う場合と同様である。図3は、図2の帰還量補正回
路17において、上記の(1)および(2)式によって
、係数kc およびg0 ′の演算を行う場合の構成例
を示すものである。図3において、71および72は乗
算器(増幅器)、73および74は乗算器(二乗回路)
、75は加算器、76は除算器、77は平方根演算回路
、そして、78は乗算器である。
および(3)式による演算を行う場合においても、その
定性的性質は、上記の(1)および(2)式による演算
を行う場合と同様である。図3は、図2の帰還量補正回
路17において、上記の(1)および(2)式によって
、係数kc およびg0 ′の演算を行う場合の構成例
を示すものである。図3において、71および72は乗
算器(増幅器)、73および74は乗算器(二乗回路)
、75は加算器、76は除算器、77は平方根演算回路
、そして、78は乗算器である。
【0022】
【発明の効果】以上説明したように、本発明によれば、
CELP型の音声符号化において、有声音等の周期性の
強い信号の入力時には、駆動音源信号のピッチ周期的成
分を発生するアダプティブ符号帳に対して供給する信号
における非周期的な雑音成分が抑圧されるので、周期性
の強い音声信号に対して符号化音声品質を改善すること
ができる。
CELP型の音声符号化において、有声音等の周期性の
強い信号の入力時には、駆動音源信号のピッチ周期的成
分を発生するアダプティブ符号帳に対して供給する信号
における非周期的な雑音成分が抑圧されるので、周期性
の強い音声信号に対して符号化音声品質を改善すること
ができる。
【図1】本発明による音声符号化装置の基本構成を示す
図である。
図である。
【図2】本発明の実施例における音声符号化装置の構成
を示す図である。
を示す図である。
【図3】図2の帰還量補正回路の構成の1例を示す図で
ある。
ある。
【図4】従来の音声符号化装置の構成を示す図である。
【図5】図4の構成における信号波形を示す図である。
1…周期的成分発生手段
2…非周期的成分発生手段
3…合成手段
4…短期的予測フィルタ手段
5…誤差検出手段
6…誤差評価手段
7…帰還成分補正手段
11…適応(アダプティブ)符号帳
12…ストカスティック符号帳
13…加算器
14…重み付け合成フィルタ
15…減算器
16…誤差電力評価回路
17…帰還量補正回路
17′…帰還量補正回路17内の係数演算部18…フレ
ーム遅延回路 19…聴覚重み付けフィルタ 21,22…乗算器
ーム遅延回路 19…聴覚重み付けフィルタ 21,22…乗算器
Claims (5)
- 【請求項1】 自らへの入力信号に追随して音源信号
の周期的成分を発生する周期的成分発生手段(1)と、
音源信号の非周期的成分を発生する非周期的成分発生手
段(2)と、前記音源信号の周期的成分および非周期的
成分を合成する合成手段(3)と、短期的予測に基づい
て、前記合成された信号から、入力音声信号を近似する
再生信号を発生する短期的予測フィルタ手段(4)と、
前記再生信号の入力音声信号に対する誤差を検出する誤
差検出手段(5)と、前記周期的成分発生手段(1)お
よび非周期的成分発生手段(2)を制御且つ走査して、
前記入力音声信号を最も良く近似する再生信号を実現す
るような最適の音源信号の周期的成分および非周期的成
分を、それぞれ発生させる誤差評価手段(6)と、前記
最適の音源信号の周期的成分および非周期的成分を入力
して、該最適の音源信号の周期的成分および非周期的成
分の相対的な大きさに基づいて、該周期的成分が相対的
に大きいときには、より一層非周期的成分を抑圧して、
前記最適の音源信号の周期的成分と共に前記周期的成分
発生手段(1)への入力信号として供給する帰還成分補
正手段(7)とを有してなることを特徴とする音声符号
化装置。 - 【請求項2】 前記帰還成分補正手段(7)は、前記
最適の音源信号における周期的成分および非周期的成分
それぞれのパワーの比に応じて前記非周期的成分を抑圧
するものである請求項1記載の音声符号化装置。 - 【請求項3】 前記周期的成分発生手段(1)は、前
記誤差評価手段(6)の制御の下に、前記入力信号にお
ける所定のピッチ周期の成分を強調して出力するもので
ある請求項1記載の音声符号化装置。 - 【請求項4】 符号化側から伝送された音声符号化情
報を復号する音声復号装置において、前記音声符号化情
報に従って、自身の入力信号に追随して音源信号の周期
的成分を発生する周期的成分発生手段(1)と、前記音
声符号化情報に従って、音源信号の非周期的成分を発生
する非周期的成分発生手段(2)と、前記音源信号の周
期的成分および非周期的成分を合成する合成手段(3)
と、前記音声符号化情報に従って、前記合成された信号
から、短期的予測に基づいて入力音声信号を近似する再
生信号を発生する短期的予測フィルタ手段(4)と、前
記音声符号化情報として符号化側から伝送された、最適
の音源信号の周期的成分および非周期的成分を入力して
、該最適の音源信号の周期的成分および非周期的成分の
相対的な大きさに基づいて、該周期的成分が相対的に大
きいときには、より一層非周期的成分を抑圧して、前記
最適の音源信号の周期的成分と共に前記周期的成分発生
手段(1)への入力信号として供給する帰還成分補正手
段(7)とを有してなることを特徴とする音声復号装置
。 - 【請求項5】 前記帰還成分補正手段(7)は、前記
最適の音源信号における周期的成分および非周期的成分
それぞれのパワーの比に応じて前記非周期的成分を抑圧
するものである請求項4記載の音声復号装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3026085A JPH04264597A (ja) | 1991-02-20 | 1991-02-20 | 音声符号化装置および音声復号装置 |
CA002061457A CA2061457C (en) | 1991-02-20 | 1992-02-19 | Speech signal coding system wherein non-periodic component feedback to periodic excitation signal source is adaptively reduced |
EP19920102832 EP0500095A3 (en) | 1991-02-20 | 1992-02-20 | Speech coding system wherein non-periodic component feedback to periodic signal excitation source is adaptively reduced |
US08/188,124 US5828811A (en) | 1991-02-20 | 1994-01-28 | Speech signal coding system wherein non-periodic component feedback to periodic excitation signal source is adaptively reduced |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3026085A JPH04264597A (ja) | 1991-02-20 | 1991-02-20 | 音声符号化装置および音声復号装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04264597A true JPH04264597A (ja) | 1992-09-21 |
Family
ID=12183785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3026085A Withdrawn JPH04264597A (ja) | 1991-02-20 | 1991-02-20 | 音声符号化装置および音声復号装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5828811A (ja) |
EP (1) | EP0500095A3 (ja) |
JP (1) | JPH04264597A (ja) |
CA (1) | CA2061457C (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8160874B2 (en) | 2005-12-27 | 2012-04-17 | Panasonic Corporation | Speech frame loss compensation using non-cyclic-pulse-suppressed version of previous frame excitation as synthesis filter source |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
JP3303580B2 (ja) * | 1995-02-23 | 2002-07-22 | 日本電気株式会社 | 音声符号化装置 |
EP1071079B1 (en) * | 1996-11-07 | 2002-06-26 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
EP1039442B1 (en) * | 1999-03-25 | 2006-03-01 | Yamaha Corporation | Method and apparatus for compressing and generating waveform |
GB2398980B (en) * | 2003-02-27 | 2005-09-14 | Motorola Inc | Speech communication unit and method for synthesising speech therein |
EP2128855A1 (en) * | 2007-03-02 | 2009-12-02 | Panasonic Corporation | Voice encoding device and voice encoding method |
CN101983402B (zh) * | 2008-09-16 | 2012-06-27 | 松下电器产业株式会社 | 声音分析装置、方法、系统、合成装置、及校正规则信息生成装置、方法 |
US9020812B2 (en) * | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1180126B (it) * | 1984-11-13 | 1987-09-23 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante tecniche di quantizzazione vettoriale |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
DE3871369D1 (de) * | 1988-03-08 | 1992-06-25 | Ibm | Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate. |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5307460A (en) * | 1992-02-14 | 1994-04-26 | Hughes Aircraft Company | Method and apparatus for determining the excitation signal in VSELP coders |
-
1991
- 1991-02-20 JP JP3026085A patent/JPH04264597A/ja not_active Withdrawn
-
1992
- 1992-02-19 CA CA002061457A patent/CA2061457C/en not_active Expired - Fee Related
- 1992-02-20 EP EP19920102832 patent/EP0500095A3/en not_active Ceased
-
1994
- 1994-01-28 US US08/188,124 patent/US5828811A/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8160874B2 (en) | 2005-12-27 | 2012-04-17 | Panasonic Corporation | Speech frame loss compensation using non-cyclic-pulse-suppressed version of previous frame excitation as synthesis filter source |
JP5142727B2 (ja) * | 2005-12-27 | 2013-02-13 | パナソニック株式会社 | 音声復号装置および音声復号方法 |
Also Published As
Publication number | Publication date |
---|---|
CA2061457C (en) | 1996-08-27 |
EP0500095A2 (en) | 1992-08-26 |
EP0500095A3 (en) | 1992-10-07 |
CA2061457A1 (en) | 1992-08-21 |
US5828811A (en) | 1998-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8209190B2 (en) | Method and apparatus for generating an enhancement layer within an audio coding system | |
US7636055B2 (en) | Signal decoding apparatus and signal decoding method | |
US6466904B1 (en) | Method and apparatus using harmonic modeling in an improved speech decoder | |
EP1327241B1 (en) | Perceptually improved enhancement of encoded acoustic signals | |
JP4296752B2 (ja) | 符号化方法及び装置、復号方法及び装置、並びにプログラム | |
JP2007316658A (ja) | ステレオ音響信号の処理方法と装置 | |
US5826221A (en) | Vocal tract prediction coefficient coding and decoding circuitry capable of adaptively selecting quantized values and interpolation values | |
JPH04264597A (ja) | 音声符号化装置および音声復号装置 | |
US5717724A (en) | Voice encoding and voice decoding apparatus | |
US7848932B2 (en) | Stereo encoding apparatus, stereo decoding apparatus, and their methods | |
JP4963965B2 (ja) | スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法 | |
USRE43570E1 (en) | Method and apparatus for improved weighting filters in a CELP encoder | |
JP2002221994A (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
JP3206497B2 (ja) | インデックスによる信号生成型適応符号帳 | |
JPH1083200A (ja) | 符号化,復号化方法及び符号化,復号化装置 | |
CA2521445C (en) | Code conversion method and apparatus | |
JP3095340B2 (ja) | 音声復号化装置 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP4295372B2 (ja) | 音声符号化装置 | |
KR100718487B1 (ko) | 디지털 음성 코더들에서의 고조파 잡음 가중 | |
JP2002149198A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3099852B2 (ja) | 励振信号の利得量子化方法 | |
JP4297078B2 (ja) | 復号方法及び装置 | |
JP2638522B2 (ja) | 音声符号化装置 | |
JP3293654B2 (ja) | 音声伝送方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 19980514 |