JPH08263099A - 符号化装置 - Google Patents
符号化装置Info
- Publication number
- JPH08263099A JPH08263099A JP7063660A JP6366095A JPH08263099A JP H08263099 A JPH08263099 A JP H08263099A JP 7063660 A JP7063660 A JP 7063660A JP 6366095 A JP6366095 A JP 6366095A JP H08263099 A JPH08263099 A JP H08263099A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- vector
- similarity
- encoding
- adaptive codebook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000013598 vector Substances 0.000 claims abstract description 90
- 230000003044 adaptive effect Effects 0.000 claims abstract description 67
- 238000004364 calculation method Methods 0.000 claims abstract description 27
- 238000000034 method Methods 0.000 claims description 123
- 230000015572 biosynthetic process Effects 0.000 claims description 32
- 238000003786 synthesis reaction Methods 0.000 claims description 32
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 238000010187 selection method Methods 0.000 description 7
- 239000002131 composite material Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【目的】 平均レートが小さく、目標品質を達成できる
符号化方式の選択を少ない計算量で実現できる符号化装
置を提供する。 【構成】 駆動信号をベクトルとして格納した適応符号
帳104と、この適応符号帳104に格納されたベクト
ルを参照して合成信号を得る合成フィルタ105と、こ
の合成フィルタ105により得られる合成信号と目標信
号との類似度を求める類似度計算部106と、この類似
度計算部106により求められた類似度によって、予め
用意されている符号化ビットレートの異なる複数の符号
化方式の中から一つの符号化方式を決定する符号化方式
部107からなる符号化方式選択部101を有する。
符号化方式の選択を少ない計算量で実現できる符号化装
置を提供する。 【構成】 駆動信号をベクトルとして格納した適応符号
帳104と、この適応符号帳104に格納されたベクト
ルを参照して合成信号を得る合成フィルタ105と、こ
の合成フィルタ105により得られる合成信号と目標信
号との類似度を求める類似度計算部106と、この類似
度計算部106により求められた類似度によって、予め
用意されている符号化ビットレートの異なる複数の符号
化方式の中から一つの符号化方式を決定する符号化方式
部107からなる符号化方式選択部101を有する。
Description
【0001】
【産業上の利用分野】本発明は、音声信号などを高能率
に符号化する符号化装置に係り、特に可変レート符号化
に適した符号化装置に関する。
に符号化する符号化装置に係り、特に可変レート符号化
に適した符号化装置に関する。
【0002】
【従来の技術】音声信号の高能率・低ビットレート符号
化は、自動車電話などの移動体通信や企業内通信におい
て、電波の有効利用や通信コスト削減のための重要な技
術である。近年、米国において符号分割多重アクセス
(CDMA)方式による可変レート通信システムが実用
化されることになり、可変レートの特性を活かした多チ
ャンネル化および高品質なサービスへの期待が高まって
いる。また、可変レート音声符号化は、蓄積的応用の見
地からも音声の性質に従い効率的なビット配分が行える
ことから、蓄積媒体の有効利用を可能にする方式といえ
る。このような背景の下、可変レート音声符号化の研究
・開発が活発に行われている。
化は、自動車電話などの移動体通信や企業内通信におい
て、電波の有効利用や通信コスト削減のための重要な技
術である。近年、米国において符号分割多重アクセス
(CDMA)方式による可変レート通信システムが実用
化されることになり、可変レートの特性を活かした多チ
ャンネル化および高品質なサービスへの期待が高まって
いる。また、可変レート音声符号化は、蓄積的応用の見
地からも音声の性質に従い効率的なビット配分が行える
ことから、蓄積媒体の有効利用を可能にする方式といえ
る。このような背景の下、可変レート音声符号化の研究
・開発が活発に行われている。
【0003】固定レートでは、8kbps以下のビット
レートで品質の優れた音声合成が可能な音声符号化方式
として、CELP(Code Excited LinearPrediction )
方式が知られているが、可変レートの分野においてもC
ELP方式が主流になっている。この場合、予め決めら
れている複数種類、例えば4種類程度の符号化ビットレ
ートのうち、固定のフレーム長毎に1つのビットレート
を選択し、そのビットレートに最適化されたCELP方
式により符号化を行う。また、符号化ビットレートが1
kbps程度と低い場合には、駆動信号にランダム雑音
系列を用いるボコーダ方式を適用することもあり、ビッ
トレート毎に符号化方式が異なることが一般的である。
可変レート符号化では、目標品質を達成しつつ、いかに
平均ビットレートを小さくできるかで可変レート符号化
方式の優劣が決定するため、各フレーム毎の符号化方式
の選択法が重要になってくる。この要求に対し、従来技
術として以下の二通りが提案されている。
レートで品質の優れた音声合成が可能な音声符号化方式
として、CELP(Code Excited LinearPrediction )
方式が知られているが、可変レートの分野においてもC
ELP方式が主流になっている。この場合、予め決めら
れている複数種類、例えば4種類程度の符号化ビットレ
ートのうち、固定のフレーム長毎に1つのビットレート
を選択し、そのビットレートに最適化されたCELP方
式により符号化を行う。また、符号化ビットレートが1
kbps程度と低い場合には、駆動信号にランダム雑音
系列を用いるボコーダ方式を適用することもあり、ビッ
トレート毎に符号化方式が異なることが一般的である。
可変レート符号化では、目標品質を達成しつつ、いかに
平均ビットレートを小さくできるかで可変レート符号化
方式の優劣が決定するため、各フレーム毎の符号化方式
の選択法が重要になってくる。この要求に対し、従来技
術として以下の二通りが提案されている。
【0004】第1の方法は、図11の符号化装置に示し
たように、端子2001からの入力信号を符号化器選択
部2002に導いて特徴抽出部2003で特徴量を抽出
し、特徴量の大きさや前フレームとの変化量を判定部2
004で判定して、その判定結果により符号化方式の異
なる複数の符号化器2005〜2007から一つの符号
化器を選択し、マルチプレクサ2008を介して出力端
子2009から出力するというものである。この方法の
例として、例えばA.Dejaco氏らによるQCELP方式
(文献1:“QCELP:The North American CDMA Digital
Cellular Variable Rate Speech Coding Standard ”,P
roc. of the IEEE Workshop on Speech Coding for Tel
ecommunications,PP5-6,Oct.1993)では、フレームパワ
ーを特徴量として抽出し、それに基づいて符号化器を選
択する方法を採っており、またE.Paksoy氏らによるVR
PS方式(文献:2“Variable Rate Speech Coding wi
th Phonetic Segmentation”,Proc.ICASSP 93,PPII-1
55-158,April 1993)では、低周波音声エネルギーや零ク
ロス比等を含む7つの特徴量の加重和値を基に符号化器
を選択する方法を採っている。
たように、端子2001からの入力信号を符号化器選択
部2002に導いて特徴抽出部2003で特徴量を抽出
し、特徴量の大きさや前フレームとの変化量を判定部2
004で判定して、その判定結果により符号化方式の異
なる複数の符号化器2005〜2007から一つの符号
化器を選択し、マルチプレクサ2008を介して出力端
子2009から出力するというものである。この方法の
例として、例えばA.Dejaco氏らによるQCELP方式
(文献1:“QCELP:The North American CDMA Digital
Cellular Variable Rate Speech Coding Standard ”,P
roc. of the IEEE Workshop on Speech Coding for Tel
ecommunications,PP5-6,Oct.1993)では、フレームパワ
ーを特徴量として抽出し、それに基づいて符号化器を選
択する方法を採っており、またE.Paksoy氏らによるVR
PS方式(文献:2“Variable Rate Speech Coding wi
th Phonetic Segmentation”,Proc.ICASSP 93,PPII-1
55-158,April 1993)では、低周波音声エネルギーや零ク
ロス比等を含む7つの特徴量の加重和値を基に符号化器
を選択する方法を採っている。
【0005】しかし、このような符号化方式選択法は、
比較的少ない計算量で実現できるメリットがあるが、復
号音声が例えばSNR等で規定される目標品質を達成す
るとは限らず、品質低下が生じることがある。また、入
力信号に背景雑音が付加されてしまう条件下では、特徴
量の抽出を良好に行うことができず、選択結果が妥当で
なくなる場合があり、結果として合成音の品質低下を招
いてしまう。
比較的少ない計算量で実現できるメリットがあるが、復
号音声が例えばSNR等で規定される目標品質を達成す
るとは限らず、品質低下が生じることがある。また、入
力信号に背景雑音が付加されてしまう条件下では、特徴
量の抽出を良好に行うことができず、選択結果が妥当で
なくなる場合があり、結果として合成音の品質低下を招
いてしまう。
【0006】第2の方法は、図12の符号化装置に示し
たように、用意してある全ての符号化器2005〜20
07で入力信号の符号化を行い、復号信号を生成して、
入力信号から復号信号を減算して得られる誤差信号とビ
ットレートから算出されるコスト関数をコスト関数算出
部3002で求め、これを最小とする符号化器を選択部
3003で選択する方法である。この方法の代表例とし
て、S.V.Vasegi氏のFS−CELP(Finite State-CEL
P)方式(文献3:“Finite State CELP for variable r
ate speech coding ”,IEE Proc.-I,vol.138,No.6,PP6
03-610,Dec.1991 )がある。
たように、用意してある全ての符号化器2005〜20
07で入力信号の符号化を行い、復号信号を生成して、
入力信号から復号信号を減算して得られる誤差信号とビ
ットレートから算出されるコスト関数をコスト関数算出
部3002で求め、これを最小とする符号化器を選択部
3003で選択する方法である。この方法の代表例とし
て、S.V.Vasegi氏のFS−CELP(Finite State-CEL
P)方式(文献3:“Finite State CELP for variable r
ate speech coding ”,IEE Proc.-I,vol.138,No.6,PP6
03-610,Dec.1991 )がある。
【0007】しかし、この符号化器選択法では、常に目
標品質が達成できるよう符号化器が選択されるメリット
があるが、予め準備されている全ての符号化器を実行し
なければならず、計算量が膨大になるという問題があ
る。
標品質が達成できるよう符号化器が選択されるメリット
があるが、予め準備されている全ての符号化器を実行し
なければならず、計算量が膨大になるという問題があ
る。
【0008】また、上記第1の方法と第2の方法のハイ
ブリッド的な手法がL.Cellario氏らによって
報告されている(文献4:“Variable Rate Speech Cod
ingfor UMTS”,Proc.of the IEEE Workshop on Speech
Coding forTelecommunications,PP1-2,Oct.1993)。図
13に、このハイブリッド法による符号化装置のブロッ
ク図を示す。この方法では、最初に入力音声を分析して
得られる特徴量を用いて符号化器を限定し、次に限定さ
れた符号化器でそれぞれ符号化を行い、コスト関数を最
小とする符号化器を最終的に選択する。この方法では、
第1の方法と第2の方法の中間的な解が得られるもの
の、複数の符号化器を実行しなければならず、計算量が
非常に大きくなるという問題点は依然として残ってい
た。
ブリッド的な手法がL.Cellario氏らによって
報告されている(文献4:“Variable Rate Speech Cod
ingfor UMTS”,Proc.of the IEEE Workshop on Speech
Coding forTelecommunications,PP1-2,Oct.1993)。図
13に、このハイブリッド法による符号化装置のブロッ
ク図を示す。この方法では、最初に入力音声を分析して
得られる特徴量を用いて符号化器を限定し、次に限定さ
れた符号化器でそれぞれ符号化を行い、コスト関数を最
小とする符号化器を最終的に選択する。この方法では、
第1の方法と第2の方法の中間的な解が得られるもの
の、複数の符号化器を実行しなければならず、計算量が
非常に大きくなるという問題点は依然として残ってい
た。
【0009】
【発明が解決しようとする課題】上述したように、従来
の符号化器選択法のうち入力信号を分析して特徴量を抽
出し、その特徴量に応じて符号化器を選択する方法で
は、復号音声が目標品質に達するとは限らず品質低下が
生じることがあり、また入力信号に背景雑音等が付加さ
れている場合、特徴量の抽出を良好にできず、適当な符
号化器を選択できなくなり、合成音の品質低下を招いて
しまうという問題があった。また、用意してある全ての
符号化器で符号化を実行し、コスト関数が最小となる符
号化器を選択するもう一つの方法や、これら二つの方法
を組み合わせたハイブリッド法では、計算量が膨大なも
のになるという問題があった。本発明の目的は、平均レ
ートが小さく、目標品質を達成できる符号化方式の選択
を少ない計算量で実現できる符号化装置を提供すること
にある。
の符号化器選択法のうち入力信号を分析して特徴量を抽
出し、その特徴量に応じて符号化器を選択する方法で
は、復号音声が目標品質に達するとは限らず品質低下が
生じることがあり、また入力信号に背景雑音等が付加さ
れている場合、特徴量の抽出を良好にできず、適当な符
号化器を選択できなくなり、合成音の品質低下を招いて
しまうという問題があった。また、用意してある全ての
符号化器で符号化を実行し、コスト関数が最小となる符
号化器を選択するもう一つの方法や、これら二つの方法
を組み合わせたハイブリッド法では、計算量が膨大なも
のになるという問題があった。本発明の目的は、平均レ
ートが小さく、目標品質を達成できる符号化方式の選択
を少ない計算量で実現できる符号化装置を提供すること
にある。
【0010】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は駆動信号をベクトルとして格納した適応符
号帳から得られるベクトルを参照ベクトルとして目標信
号との類似度を合成音レベルで求め、その類似度の大き
さによって予め用意されている符号化ビットレートの異
なる複数の符号化方式の中から一つを選択するようにし
たことを骨子としている。
め、本発明は駆動信号をベクトルとして格納した適応符
号帳から得られるベクトルを参照ベクトルとして目標信
号との類似度を合成音レベルで求め、その類似度の大き
さによって予め用意されている符号化ビットレートの異
なる複数の符号化方式の中から一つを選択するようにし
たことを骨子としている。
【0011】すなわち、本発明に係る符号化装置は、駆
動信号をベクトルとして格納した適応符号帳と、この適
応符号帳に格納されたベクトルを参照して合成信号を得
る合成フィルタと、この合成フィルタにより得られる合
成信号と目標信号との類似度を求める類似度計算手段
と、この類似度計算手段により求められた類似度に基づ
いて、予め用意されている符号化ビットレートの異なる
複数の符号化方式の中から一つの符号化方式を決定する
符号化方式決定手段とを有することを基本的な特徴とす
る。
動信号をベクトルとして格納した適応符号帳と、この適
応符号帳に格納されたベクトルを参照して合成信号を得
る合成フィルタと、この合成フィルタにより得られる合
成信号と目標信号との類似度を求める類似度計算手段
と、この類似度計算手段により求められた類似度に基づ
いて、予め用意されている符号化ビットレートの異なる
複数の符号化方式の中から一つの符号化方式を決定する
符号化方式決定手段とを有することを基本的な特徴とす
る。
【0012】本発明の一つの態様では、目標信号のピッ
チを分析してピッチ情報を得るピッチ分析手段をさらに
設け、このピッチ情報に基づいて適応符号帳に格納され
たベクトルから参照するベクトルを決定するようにした
ことを特徴とする。
チを分析してピッチ情報を得るピッチ分析手段をさらに
設け、このピッチ情報に基づいて適応符号帳に格納され
たベクトルから参照するベクトルを決定するようにした
ことを特徴とする。
【0013】本発明の他の態様では、前記の類似度が最
大となるベクトルを適応符号帳に格納された全てのベク
トルの中から探索する探索手段をさらに設け、探索され
たベクトルに対応して求められた類似度に基づいて符号
化方式を決定するようにしたことを特徴とする。
大となるベクトルを適応符号帳に格納された全てのベク
トルの中から探索する探索手段をさらに設け、探索され
たベクトルに対応して求められた類似度に基づいて符号
化方式を決定するようにしたことを特徴とする。
【0014】本発明のさらに別の態様では、前フレーム
で得られたピッチ情報を記憶した記憶手段をさら設け、
この記憶手段に記憶された前フレームのピッチ情報に基
づいて、適応符号帳に格納されたベクトルから参照する
ベクトルを決定するようにしたことを特徴とする。
で得られたピッチ情報を記憶した記憶手段をさら設け、
この記憶手段に記憶された前フレームのピッチ情報に基
づいて、適応符号帳に格納されたベクトルから参照する
ベクトルを決定するようにしたことを特徴とする。
【0015】
【作用】このように本発明では、適応符号帳から参照す
るベクトルを合成フィルタに通して合成信号を生成し、
この合成信号と目標信号との類似度を計算して、この類
似度に基づいて符号化方式を決定する。一般に、適応符
号帳はCELP方式の符号化装置の構成要素の一つであ
り、ピッチ周期で繰り返される目標信号の冗長度を効率
良く表現できるという特徴があるため、目標信号が周期
性の大きな信号のときは、適応符号帳に格納された駆動
信号のベクトルで目標信号を精度良く表すことができ
る。このため、目標信号が周期性の大きな信号の場合、
合成フィルタの駆動信号に割り当てるビット数を少なく
しても容易に目標品質を達成することができ、つまると
ころ符号化ビットレートを低くすることができる。逆
に、目標信号が周期性の小さな信号のときは、適応符号
帳だけでは精度良く表すことができないため、符号化ビ
ットレートを高くしなければ目標品質を達成することが
できない。
るベクトルを合成フィルタに通して合成信号を生成し、
この合成信号と目標信号との類似度を計算して、この類
似度に基づいて符号化方式を決定する。一般に、適応符
号帳はCELP方式の符号化装置の構成要素の一つであ
り、ピッチ周期で繰り返される目標信号の冗長度を効率
良く表現できるという特徴があるため、目標信号が周期
性の大きな信号のときは、適応符号帳に格納された駆動
信号のベクトルで目標信号を精度良く表すことができ
る。このため、目標信号が周期性の大きな信号の場合、
合成フィルタの駆動信号に割り当てるビット数を少なく
しても容易に目標品質を達成することができ、つまると
ころ符号化ビットレートを低くすることができる。逆
に、目標信号が周期性の小さな信号のときは、適応符号
帳だけでは精度良く表すことができないため、符号化ビ
ットレートを高くしなければ目標品質を達成することが
できない。
【0016】従って、本発明のように適応符号帳から得
られる参照ベクトルと目標ベクトルとの合成音レベルで
の類似度を求め、この類似度が大きいときは低ビットレ
ートの符号化方式を選択し、類似度が小さい時は高ビッ
トレートの符号化方式を選択するようにすることによ
り、平均ビットレートが低く、しかも目標品質を達成で
きる適切な符号化方式の選択が可能となる。
られる参照ベクトルと目標ベクトルとの合成音レベルで
の類似度を求め、この類似度が大きいときは低ビットレ
ートの符号化方式を選択し、類似度が小さい時は高ビッ
トレートの符号化方式を選択するようにすることによ
り、平均ビットレートが低く、しかも目標品質を達成で
きる適切な符号化方式の選択が可能となる。
【0017】すなわち、目標信号を分析して特徴量を抽
出し、その大きさや変化量によって符号化方式を選択す
る方法では、目標品質に達しないフレームが多く発生し
てしまうという問題があったが、本発明では符号化装置
の一構成要素である適応符号帳を用い、合成音レベルで
の類似度に基づいて符号化方式を選択するため、ほとん
ど全てのフレームで目標品質に達することができる。
出し、その大きさや変化量によって符号化方式を選択す
る方法では、目標品質に達しないフレームが多く発生し
てしまうという問題があったが、本発明では符号化装置
の一構成要素である適応符号帳を用い、合成音レベルで
の類似度に基づいて符号化方式を選択するため、ほとん
ど全てのフレームで目標品質に達することができる。
【0018】一方、予め用意されている複数の符号化器
の全てを用いて符号化を行い、コスト関数が最小となる
符号化器を選択する方法では、計算量が膨大になるとい
う問題があったのに対し、本発明では合成フィルタに入
力する参照ベクトルを決定するための計算量が比較的大
きくなるケースでも適応符号帳の探索だけでよく、符号
化方式選択のための計算量は格段に小さい。また、目標
信号のピッチ分析により参照ベクトルを決定して符号化
方式を選択すると、必要な計算量は適応符号帳の探索よ
りさらに少ない計算量で済む。さらに、前フレームのピ
ッチ情報により参照ベクトルを決定して符号化方式を選
択すると、計算量の増加はほとんどなくなる。このよう
に本発明によれば、少ない計算量で平均レートを小さく
し、かつ目標品質を達成する符号化方式を選択すること
ができる。
の全てを用いて符号化を行い、コスト関数が最小となる
符号化器を選択する方法では、計算量が膨大になるとい
う問題があったのに対し、本発明では合成フィルタに入
力する参照ベクトルを決定するための計算量が比較的大
きくなるケースでも適応符号帳の探索だけでよく、符号
化方式選択のための計算量は格段に小さい。また、目標
信号のピッチ分析により参照ベクトルを決定して符号化
方式を選択すると、必要な計算量は適応符号帳の探索よ
りさらに少ない計算量で済む。さらに、前フレームのピ
ッチ情報により参照ベクトルを決定して符号化方式を選
択すると、計算量の増加はほとんどなくなる。このよう
に本発明によれば、少ない計算量で平均レートを小さく
し、かつ目標品質を達成する符号化方式を選択すること
ができる。
【0019】
【実施例】以下、図面を参照しながら本発明の実施例を
説明する。(第1の実施例)図1は、本発明の第1の実
施例に係る符号化方式選択部101の構成を示すブロッ
ク図である。この符号化方式選択部101は、入力端子
102より入力される目標信号r(n)に基づいて選択
すべき符号化方式を決定し、符号化方式選択情報Iを出
力端子103から出力するものであり、適応符号帳10
4、合成フィルタ105、類似度計算部106および符
号化方式決定部107により構成されている。
説明する。(第1の実施例)図1は、本発明の第1の実
施例に係る符号化方式選択部101の構成を示すブロッ
ク図である。この符号化方式選択部101は、入力端子
102より入力される目標信号r(n)に基づいて選択
すべき符号化方式を決定し、符号化方式選択情報Iを出
力端子103から出力するものであり、適応符号帳10
4、合成フィルタ105、類似度計算部106および符
号化方式決定部107により構成されている。
【0020】次に、本実施例における符号化方式選択手
順について説明する。ただし、本実施例では説明を簡略
化するため選択対象の符号化方式は2つとする。符号化
方式選択情報Iの値は「1」もしくは「2」をとり、I
=「1」のときはビットレートの低い符号化方式、I=
「2」のときはビットレートの高い符号化方式を選択す
るものとする。
順について説明する。ただし、本実施例では説明を簡略
化するため選択対象の符号化方式は2つとする。符号化
方式選択情報Iの値は「1」もしくは「2」をとり、I
=「1」のときはビットレートの低い符号化方式、I=
「2」のときはビットレートの高い符号化方式を選択す
るものとする。
【0021】まず、入力端子102を通して目標信号r
(n)が入力される。次に、適応符号帳104よりベク
トルp(n)が参照され、このベクトルp(n)から合
成フィルタ105を介して合成信号q(n)が生成され
る。一例として、合成フィルタ105はz変換領域で次
式(1)のように表すことができる。
(n)が入力される。次に、適応符号帳104よりベク
トルp(n)が参照され、このベクトルp(n)から合
成フィルタ105を介して合成信号q(n)が生成され
る。一例として、合成フィルタ105はz変換領域で次
式(1)のように表すことができる。
【0022】
【数1】
【0023】ここで、{αi }10 i=1 はLPC(線形予
測分析)係数を表し、γは0を越え1.0以下の定数を
とる。よって、合成信号q(n)と参照ベクトルp
(n)の関係を時間領域で表すと、次式(2)のように
なる。
測分析)係数を表し、γは0を越え1.0以下の定数を
とる。よって、合成信号q(n)と参照ベクトルp
(n)の関係を時間領域で表すと、次式(2)のように
なる。
【0024】
【数2】
【0025】次に、類似度計算部106で目標信号r
(n)と合成信号q(n)との類似度を計算する。すな
わち、類似度計算部106では以下に示すように、合成
信号q(n)に最適ゲインgを乗じたときの信号と目標
信号r(n)とのSNR値を類似度uとして出力する。
まず、次式(3)のように合成信号q(n)に最適ゲイ
ンgを乗じた信号と目標信号r(n)との2乗誤差値E
を定義する。
(n)と合成信号q(n)との類似度を計算する。すな
わち、類似度計算部106では以下に示すように、合成
信号q(n)に最適ゲインgを乗じたときの信号と目標
信号r(n)とのSNR値を類似度uとして出力する。
まず、次式(3)のように合成信号q(n)に最適ゲイ
ンgを乗じた信号と目標信号r(n)との2乗誤差値E
を定義する。
【0026】
【数3】 Eを最小とするときのgが最適ゲインとなるので、Eを
gで偏微分してgで解く。その結果、最適ゲインgは次
式(4)のようになる。
gで偏微分してgで解く。その結果、最適ゲインgは次
式(4)のようになる。
【0027】
【数4】 この最適ゲインgを用いたときの目標信号とのSNR値
Sは、次式(5)のようになる。
Sは、次式(5)のようになる。
【0028】
【数5】 次に、符号化方式決定部107では、SNR値Sを用い
てどの符号化方式を用いるべきか判定する。判定法は、
閾値Aを用いて、
てどの符号化方式を用いるべきか判定する。判定法は、
閾値Aを用いて、
【0029】
【数6】 のように実行され、符号化方式選択情報Iが出力され
る。
る。
【0030】以上の処理の流れをまとめると、図2のよ
うになる。まず、最初にステップS11で適応符号帳1
04から参照ベクトルp(n)を取り出し、次いでステ
ップS12でp(n)を合成フィルタ105に通して、
合成ベクトルq(n)を作成する。次に、ステップS1
3で合成ベクトルq(n)に与える最適ゲインgを求
め、さらにr(n)とg・q(n)のSNR値Sを求
め、最後にステップS14でSNR値Sと閾値Aとの比
較により符号化方式選択情報Iを決定し、出力端子10
3より出力する。
うになる。まず、最初にステップS11で適応符号帳1
04から参照ベクトルp(n)を取り出し、次いでステ
ップS12でp(n)を合成フィルタ105に通して、
合成ベクトルq(n)を作成する。次に、ステップS1
3で合成ベクトルq(n)に与える最適ゲインgを求
め、さらにr(n)とg・q(n)のSNR値Sを求
め、最後にステップS14でSNR値Sと閾値Aとの比
較により符号化方式選択情報Iを決定し、出力端子10
3より出力する。
【0031】(第2の実施例)図3は、本発明の第2の
実施例に係る符号化方式選択部201の構成を示すブロ
ック図である。図1と同一機能を有する部分に同一符号
を付して説明すると、この符号化方式選択部201は目
標信号r(n)をピッチ分析部202で分析してピッチ
Tを求め、このピッチTを用いて適応符号帳104から
参照するベクトルp(n)を決定する点が第1の実施例
と異なる。よって、ここでは新たに設けられたピッチ分
析部208について説明する。
実施例に係る符号化方式選択部201の構成を示すブロ
ック図である。図1と同一機能を有する部分に同一符号
を付して説明すると、この符号化方式選択部201は目
標信号r(n)をピッチ分析部202で分析してピッチ
Tを求め、このピッチTを用いて適応符号帳104から
参照するベクトルp(n)を決定する点が第1の実施例
と異なる。よって、ここでは新たに設けられたピッチ分
析部208について説明する。
【0032】ピッチ分析部208では、時間Tサンプル
だけ過去の信号r(n−T)を用いて目標信号r(n)
を予測し、その予測誤差信号のパワーEが最小となると
きのTをピッチ周期として出力する。すなわち、予測残
差信号パワーEは
だけ過去の信号r(n−T)を用いて目標信号r(n)
を予測し、その予測誤差信号のパワーEが最小となると
きのTをピッチ周期として出力する。すなわち、予測残
差信号パワーEは
【0033】
【数7】 と表される。ここで、gはピッチゲイン、Nはピッチ分
析長をそれぞれ表す。安定したピッチ周期を得るため
に、ピッチ分析長は例えばN=256程度が適当であ
る。式(1)をgで偏微分し、その値が0になるときに
予測誤差信号パワーEが最小値をとる。これを解くと
析長をそれぞれ表す。安定したピッチ周期を得るため
に、ピッチ分析長は例えばN=256程度が適当であ
る。式(1)をgで偏微分し、その値が0になるときに
予測誤差信号パワーEが最小値をとる。これを解くと
【0034】
【数8】 となり、式(8)を最小にするTがピッチ周期を表すこ
とになる。式(8)の右辺第1項は定数となるので、実
際は右辺第2項が最大となるピッチ周期Tを探索するこ
とになる。このようにして求めたピッチ周期Tを出力
し、この値を用いて適応符号帳204から参照ベクトル
p(n)を取り出す。
とになる。式(8)の右辺第1項は定数となるので、実
際は右辺第2項が最大となるピッチ周期Tを探索するこ
とになる。このようにして求めたピッチ周期Tを出力
し、この値を用いて適応符号帳204から参照ベクトル
p(n)を取り出す。
【0035】以上の処理の流れをまとめると、図4のよ
うになる。まず、最初にステップS21においてピッチ
分析部202で目標信号r(n)を分析してピッチ周期
Tを求める。次に、ステップS22でピッチ周期Tを用
いて適応符号帳104から参照するベクトルp(n)を
取り出す。この後のステップS23,S24,S25の
処理は、それぞれ図2におけるステップS12,S1
3,S14の処理と同じなので説明は省略する。
うになる。まず、最初にステップS21においてピッチ
分析部202で目標信号r(n)を分析してピッチ周期
Tを求める。次に、ステップS22でピッチ周期Tを用
いて適応符号帳104から参照するベクトルp(n)を
取り出す。この後のステップS23,S24,S25の
処理は、それぞれ図2におけるステップS12,S1
3,S14の処理と同じなので説明は省略する。
【0036】なお、本実施例においては目標信号r
(n)を用いてピッチ周期Tを求めると説明したが、目
標信号r(n)が聴感重み付けフィルタで重み付けされ
ている場合には、入力音声信号u(n)を用いた方が良
好なピッチ分析が可能である。また、入力音声信号u
(n)をLPC予測フィルタに通して得られる予測残差
信号v(n)を用いると、音声信号の包絡情報が除去さ
れるため、さらに良好なピッチ分析ができる。よって、
本実施例において目標信号r(n)の代わりに入力音声
信号u(n)または予測残差信号v(n)を用いてもよ
い。また、本実施例ではピッチ分析部202に1次のピ
ッチ予測フィルタを用いた場合について説明したが、よ
り次数の高い予測フィルタを用いても構わない。
(n)を用いてピッチ周期Tを求めると説明したが、目
標信号r(n)が聴感重み付けフィルタで重み付けされ
ている場合には、入力音声信号u(n)を用いた方が良
好なピッチ分析が可能である。また、入力音声信号u
(n)をLPC予測フィルタに通して得られる予測残差
信号v(n)を用いると、音声信号の包絡情報が除去さ
れるため、さらに良好なピッチ分析ができる。よって、
本実施例において目標信号r(n)の代わりに入力音声
信号u(n)または予測残差信号v(n)を用いてもよ
い。また、本実施例ではピッチ分析部202に1次のピ
ッチ予測フィルタを用いた場合について説明したが、よ
り次数の高い予測フィルタを用いても構わない。
【0037】(第3の実施例)図5は、本発明の第3の
実施例に係る符号化方式選択部301の構成を示すブロ
ック図である。図1と同一機能を有する部分に同一符号
を付して説明すると、この符号化方式選択部301は、
適応符号帳104内の全てのベクトルを参照ベクトル候
補として、合成フィルタ105でそれぞれの参照ベクト
ルについて合成ベクトルを求め、目標ベクトルr(n)
と最も類似している合成ベクトルを探索部302で探索
する点が第1の実施例と異なっている。よって、ここで
は新たに設けられた探索部302について説明する。
実施例に係る符号化方式選択部301の構成を示すブロ
ック図である。図1と同一機能を有する部分に同一符号
を付して説明すると、この符号化方式選択部301は、
適応符号帳104内の全てのベクトルを参照ベクトル候
補として、合成フィルタ105でそれぞれの参照ベクト
ルについて合成ベクトルを求め、目標ベクトルr(n)
と最も類似している合成ベクトルを探索部302で探索
する点が第1の実施例と異なっている。よって、ここで
は新たに設けられた探索部302について説明する。
【0038】探索部302は、適応符号帳104に格納
された全てのベクトルを参照ベクトルとして探索して類
似度計算部106にSNR値Sを計算させ、SNR値S
が最大となったときのSを用いて符号化決定部107で
符号化方式を決定し、符号化方式選択情報Iを出力す
る。
された全てのベクトルを参照ベクトルとして探索して類
似度計算部106にSNR値Sを計算させ、SNR値S
が最大となったときのSを用いて符号化決定部107で
符号化方式を決定し、符号化方式選択情報Iを出力す
る。
【0039】但し、一般的には探索のためにSNR値ま
で求める必要は必ずしもなく、例えば式(3)で規定さ
れる2乗誤差値Eを最小にする参照ベクトルを探索すれ
ばよい。その場合、実際には2乗誤差値Eを最小にする
参照ベクトルが見つかった後にSNR値を計算し、それ
を符号化決定部107に出力することになる。
で求める必要は必ずしもなく、例えば式(3)で規定さ
れる2乗誤差値Eを最小にする参照ベクトルを探索すれ
ばよい。その場合、実際には2乗誤差値Eを最小にする
参照ベクトルが見つかった後にSNR値を計算し、それ
を符号化決定部107に出力することになる。
【0040】以上の処理の流れをまとめると、図6のよ
うになる。ここで、Lは適応符号帳104内に格納され
たベクトルの個数を表す。さらに式(3)に式(4)で
表される最適ゲインgを代入して展開すると、
うになる。ここで、Lは適応符号帳104内に格納され
たベクトルの個数を表す。さらに式(3)に式(4)で
表される最適ゲインgを代入して展開すると、
【0041】
【数9】 となり、2乗誤差値Eが最小値をとるには、式(9)の
右辺第1項である
右辺第1項である
【0042】
【数10】 を寄与度として求め、この寄与度Dが最大となる参照ベ
クトルを探索することになる。
クトルを探索することになる。
【0043】最初に、ステップS30において変数i=
1,iopt=1,Dmax =0と設定する。次に、ステ
ップS31およびステップS32を経て、合成ベクトル
qi(n)を求める。なお、ステップS31,S32は
図2のステップS11,S12と同じなので説明を省略
する。次に、ステップS33で目標ベクトルr(n)と
合成ベクトルqi (n)から式(10)に従って寄与度
Dを求め、さらにステップS34で寄与度Dと最大寄与
度Dmax の大きさを比較する。ここで、寄与度Dが最大
寄与度Dmax より大きければステップS35でDmax の
値をDと同じ値に更新し、その時のiの値をioptに
格納してステップS36へ進む。寄与度DがDmax より
小さければ直接ステップS36へ進み、ステップS36
でiの値を1だけ増加させ、さらにステップS37でi
の値と適応符号帳104に含まれるベクトルの個数Lと
の比較を行う。ここでもしiがLより小さければ、ステ
ップS31へ戻って、上述した処理の流れを繰り返し行
うことになり、iがLより大きければループを抜けてス
テップS38に進む。ステップS38では、目標ベクト
ルr(n)とg・qiopt(n)とのSNR値Sを求め、
ステップS39でこのSNR値Sを基に符号化方式選択
情報Iを出力する。ステップS38およびステップS3
9の処理の詳細については、図2のステップS13およ
びステップS14と同じなので、説明を省略する。
1,iopt=1,Dmax =0と設定する。次に、ステ
ップS31およびステップS32を経て、合成ベクトル
qi(n)を求める。なお、ステップS31,S32は
図2のステップS11,S12と同じなので説明を省略
する。次に、ステップS33で目標ベクトルr(n)と
合成ベクトルqi (n)から式(10)に従って寄与度
Dを求め、さらにステップS34で寄与度Dと最大寄与
度Dmax の大きさを比較する。ここで、寄与度Dが最大
寄与度Dmax より大きければステップS35でDmax の
値をDと同じ値に更新し、その時のiの値をioptに
格納してステップS36へ進む。寄与度DがDmax より
小さければ直接ステップS36へ進み、ステップS36
でiの値を1だけ増加させ、さらにステップS37でi
の値と適応符号帳104に含まれるベクトルの個数Lと
の比較を行う。ここでもしiがLより小さければ、ステ
ップS31へ戻って、上述した処理の流れを繰り返し行
うことになり、iがLより大きければループを抜けてス
テップS38に進む。ステップS38では、目標ベクト
ルr(n)とg・qiopt(n)とのSNR値Sを求め、
ステップS39でこのSNR値Sを基に符号化方式選択
情報Iを出力する。ステップS38およびステップS3
9の処理の詳細については、図2のステップS13およ
びステップS14と同じなので、説明を省略する。
【0044】本実施例によれば、適応符号帳104に格
納された全ベクトルから最大SNR値となる参照ベクト
ルを求めることができるので、第2の実施例と異なり、
特に大きな背景雑音が存在する入力音声に対してピッチ
分析で得られるピッチの正確性や精度の影響を受けるこ
となく、実際の適応符号帳104の効率を正確に評価で
き表すことができるという利点がある。
納された全ベクトルから最大SNR値となる参照ベクト
ルを求めることができるので、第2の実施例と異なり、
特に大きな背景雑音が存在する入力音声に対してピッチ
分析で得られるピッチの正確性や精度の影響を受けるこ
となく、実際の適応符号帳104の効率を正確に評価で
き表すことができるという利点がある。
【0045】なお、上記実施例では適応符号帳104の
全ベクトルから参照ベクトルを求めるようにしたが、あ
る程度限定された数の参照ベクトルを候補として探索す
るようにしてもよい。
全ベクトルから参照ベクトルを求めるようにしたが、あ
る程度限定された数の参照ベクトルを候補として探索す
るようにしてもよい。
【0046】(第4の実施例)図7は、本発明の第4の
実施例に係る符号化方式選択部401の構成を示すブロ
ック図である。図1と同一機能を有する部分に同一符号
を付して説明すると、この符号化方式選択部401は前
フレームの符号化で求められたピッチ情報を現フレーム
でも用い、この前フレームのピッチ情報を基に適応符号
帳104から参照するベクトルp(n)を決定する点が
第1の実施例と異なる。すなわち、本実施例ではバッフ
ァ402が新たに設けられ、このバッファ402に前フ
レームで求められたピッチ情報が格納されている。この
ピッチ情報は、前フレームの符号化の際の適応符号帳1
04の探索結果、つまり前フレームで符号化を行った際
に適応符号帳104の探索により決定されたピッチを表
わす。
実施例に係る符号化方式選択部401の構成を示すブロ
ック図である。図1と同一機能を有する部分に同一符号
を付して説明すると、この符号化方式選択部401は前
フレームの符号化で求められたピッチ情報を現フレーム
でも用い、この前フレームのピッチ情報を基に適応符号
帳104から参照するベクトルp(n)を決定する点が
第1の実施例と異なる。すなわち、本実施例ではバッフ
ァ402が新たに設けられ、このバッファ402に前フ
レームで求められたピッチ情報が格納されている。この
ピッチ情報は、前フレームの符号化の際の適応符号帳1
04の探索結果、つまり前フレームで符号化を行った際
に適応符号帳104の探索により決定されたピッチを表
わす。
【0047】そして、バッファ402に格納されたピッ
チ情報に従って、適応符号帳104から参照ベクトルp
(n)が取り出され、この参照ベクトルp(n)に基づ
いて合成フィルタ105、類似度計算部106および符
号化方式決定部107を経て符号化方式選択情報Iが出
力される。合成フィルタ105、類似度計算部106お
よび符号化方式決定部107の処理は第1の実施例と同
様であるので、ここでは説明を省略する。
チ情報に従って、適応符号帳104から参照ベクトルp
(n)が取り出され、この参照ベクトルp(n)に基づ
いて合成フィルタ105、類似度計算部106および符
号化方式決定部107を経て符号化方式選択情報Iが出
力される。合成フィルタ105、類似度計算部106お
よび符号化方式決定部107の処理は第1の実施例と同
様であるので、ここでは説明を省略する。
【0048】以上の処理の流れをまとめると、図8のよ
うになる。まず、ステップS41でバッファ402に格
納されているピッチ周期Tを用いて、適応符号帳104
から参照ベクトルp(n)を選択して取り出す。この後
のステップS42,S43,S44の処理はそれぞれ図
2におけるステップS12,S13,S14の処理と同
様である。
うになる。まず、ステップS41でバッファ402に格
納されているピッチ周期Tを用いて、適応符号帳104
から参照ベクトルp(n)を選択して取り出す。この後
のステップS42,S43,S44の処理はそれぞれ図
2におけるステップS12,S13,S14の処理と同
様である。
【0049】このように、本実施例は前フレームのピッ
チ情報を利用して参照ベクトルを決定するため、第2の
実施例におけるピッチ分析、第3の実施例における適応
符号帳104の探索といった、参照ベクトルを決定する
ための計算を特別に必要とせず、さらに少ない計算量で
符号化方式選択情報Iを得ることができるという利点が
ある。
チ情報を利用して参照ベクトルを決定するため、第2の
実施例におけるピッチ分析、第3の実施例における適応
符号帳104の探索といった、参照ベクトルを決定する
ための計算を特別に必要とせず、さらに少ない計算量で
符号化方式選択情報Iを得ることができるという利点が
ある。
【0050】(第5の実施例)次に、第5の実施例とし
て上述した符号化方式選択部を音声符号化装置に適用し
た実施例を説明する。図9は、本実施例に係る音声符号
化装置の構成を示すブロック図であり、符号化方式選択
部902は第1〜第4の実施例で説明した符号化方式選
択部101,201,301,401のいずれかの構成
をとるものとする。符号化器903〜905は、符号化
方式、言い換えれば符号化ビットレートのそれぞれ異な
る符号化器であって、符号化方式選択部902によって
いずれか一つが選択される。
て上述した符号化方式選択部を音声符号化装置に適用し
た実施例を説明する。図9は、本実施例に係る音声符号
化装置の構成を示すブロック図であり、符号化方式選択
部902は第1〜第4の実施例で説明した符号化方式選
択部101,201,301,401のいずれかの構成
をとるものとする。符号化器903〜905は、符号化
方式、言い換えれば符号化ビットレートのそれぞれ異な
る符号化器であって、符号化方式選択部902によって
いずれか一つが選択される。
【0051】以下、動作を説明すると、まず入力端子9
01から目標信号が入力される。この目標信号は場合に
よっては聴感重み付けフィルタを通し、かつ前フレーム
の影響が減じられた信号であってもよいが、この図では
簡単のためその処理に関する部分を除いている。この目
標信号は符号化方式選択部902に入力され、符号化方
式選択情報Iが出力される。この符号化方式選択情報I
に基づいて符号化器903〜905の中の一つが選択さ
れ、その選択された符号化器に目標信号が入力されて符
号化が行われる。符号化の終了後、符号化結果として求
められた符号化パラメータと、符号化方式選択情報Iが
マルチプレクサ906に入力され、ビットストリームに
変換された後、出力端子907から出力される。
01から目標信号が入力される。この目標信号は場合に
よっては聴感重み付けフィルタを通し、かつ前フレーム
の影響が減じられた信号であってもよいが、この図では
簡単のためその処理に関する部分を除いている。この目
標信号は符号化方式選択部902に入力され、符号化方
式選択情報Iが出力される。この符号化方式選択情報I
に基づいて符号化器903〜905の中の一つが選択さ
れ、その選択された符号化器に目標信号が入力されて符
号化が行われる。符号化の終了後、符号化結果として求
められた符号化パラメータと、符号化方式選択情報Iが
マルチプレクサ906に入力され、ビットストリームに
変換された後、出力端子907から出力される。
【0052】(第6の実施例)本実施例では、さらに具
体的な音声符号化装置の実施例として、高ビットレート
符号化器にCELP方式符号化器、低ビットレート符号
化器に適応符号帳を利用する乱数駆動型LPCボコーダ
(以後、LPCボコーダと呼ぶ)をそれぞれ用いた場合
について説明する。
体的な音声符号化装置の実施例として、高ビットレート
符号化器にCELP方式符号化器、低ビットレート符号
化器に適応符号帳を利用する乱数駆動型LPCボコーダ
(以後、LPCボコーダと呼ぶ)をそれぞれ用いた場合
について説明する。
【0053】図10は、本実施例に係る音声符号化装置
のブロック図である。CELP方式では、出力信号とし
てデコーダに伝送する符号化パラメータは、(1) 適応符
号帳1107の適応ベクトルインデックス、(2) 雑音ベ
クトル符号帳1108の雑音ベクトルインデックス、
(3) ピッチゲイン符号帳1109のピッチゲインインデ
ックス、(4) 雑音ゲイン符号帳1110の雑音ゲインイ
ンデックス、(5) LPC量子化部1114で量子化した
結果得られるLPCインデックスがある。
のブロック図である。CELP方式では、出力信号とし
てデコーダに伝送する符号化パラメータは、(1) 適応符
号帳1107の適応ベクトルインデックス、(2) 雑音ベ
クトル符号帳1108の雑音ベクトルインデックス、
(3) ピッチゲイン符号帳1109のピッチゲインインデ
ックス、(4) 雑音ゲイン符号帳1110の雑音ゲインイ
ンデックス、(5) LPC量子化部1114で量子化した
結果得られるLPCインデックスがある。
【0054】LPCボコーダで出力信号としてデコーダ
に伝送するパラメータには、(1) ゲイン符号帳1128
のゲインインデックス、(2) LPC量子化部1122で
量子化した結果得られるLPCインデックス、(3) 適応
符号帳1107の適応ベクトルインデックス、(4) ピッ
チゲイン符号帳1109のピッチゲインインデックスが
ある。
に伝送するパラメータには、(1) ゲイン符号帳1128
のゲインインデックス、(2) LPC量子化部1122で
量子化した結果得られるLPCインデックス、(3) 適応
符号帳1107の適応ベクトルインデックス、(4) ピッ
チゲイン符号帳1109のピッチゲインインデックスが
ある。
【0055】ここで、LPCボコーダは駆動信号として
乱数を用いるため、駆動信号の情報をデコーダに伝送す
る必要がなく、符号化ビットレートを非常に小さくする
ことができる。また、一般にLPCボコーダではLPC
量子化部1122およびゲイン符号帳1128を低いビ
ットレートで用意しておく場合が多く、そのため全体的
なビットレートを低く抑えられる。
乱数を用いるため、駆動信号の情報をデコーダに伝送す
る必要がなく、符号化ビットレートを非常に小さくする
ことができる。また、一般にLPCボコーダではLPC
量子化部1122およびゲイン符号帳1128を低いビ
ットレートで用意しておく場合が多く、そのため全体的
なビットレートを低く抑えられる。
【0056】以下、本実施例の音声符号化装置の動作を
説明する。入力端子1101より入力される音声信号に
ついてLPC分析部1102でLPC分析が行われ、線
形予測係数(以後、LPC係数と呼ぶ)が求められる。
このLPC係数により特性が規定された合成フィルタ1
103に、適応符号帳1107から得られる適応ベクト
ルが入力され、合成信号が求められる。この合成信号と
入力音声信号との類似度が類似度計算部1104で計算
され、その結果を基に符号化方式決定部1105で符号
化方式が決定される。
説明する。入力端子1101より入力される音声信号に
ついてLPC分析部1102でLPC分析が行われ、線
形予測係数(以後、LPC係数と呼ぶ)が求められる。
このLPC係数により特性が規定された合成フィルタ1
103に、適応符号帳1107から得られる適応ベクト
ルが入力され、合成信号が求められる。この合成信号と
入力音声信号との類似度が類似度計算部1104で計算
され、その結果を基に符号化方式決定部1105で符号
化方式が決定される。
【0057】そして、符号化方式決定部1105から出
力される符号化方式選択情報に応じて、セレクタ110
6で高ビットレート用符号化器であるCELP、もしく
は低ビットレート用符号化器であるLPCボコーダのい
ずれかが選択される。
力される符号化方式選択情報に応じて、セレクタ110
6で高ビットレート用符号化器であるCELP、もしく
は低ビットレート用符号化器であるLPCボコーダのい
ずれかが選択される。
【0058】ここで、セレクタ1106でCELP方式
の符号化器が選択された場合について説明する。なお、
CELP方式の符号化器は、図10中の破線より上側に
示されている。
の符号化器が選択された場合について説明する。なお、
CELP方式の符号化器は、図10中の破線より上側に
示されている。
【0059】適応符号帳1107から得られる適応ベク
トルと、雑音符号帳1108から得られる雑音ベクトル
に、ピッチゲイン符号帳1109から得られるピッチゲ
インおよび雑音ゲイン符号帳1110から得られる雑音
ゲインが乗算器1111,1112でそれぞれ乗じられ
る。これらのピッチゲインおよび雑音ゲインがそれぞれ
乗じられた後の適応ベクトルおよび雑音ベクトルが加算
器1113で加算され、合成フィルタ1115の駆動信
号が生成される。
トルと、雑音符号帳1108から得られる雑音ベクトル
に、ピッチゲイン符号帳1109から得られるピッチゲ
インおよび雑音ゲイン符号帳1110から得られる雑音
ゲインが乗算器1111,1112でそれぞれ乗じられ
る。これらのピッチゲインおよび雑音ゲインがそれぞれ
乗じられた後の適応ベクトルおよび雑音ベクトルが加算
器1113で加算され、合成フィルタ1115の駆動信
号が生成される。
【0060】一方、LPC分析部1102によって求め
られたLPC係数をLPC量子化部1114で量子化し
て得られるLPC係数を基に合成フィルタ1115の特
性が規定され、この合成フィルタ1115に加算器11
13から出力される駆動信号が入力されることにより、
合成信号が生成される。この合成信号を入力音声信号か
ら前フレームの影響を減じた信号を目標信号として、目
標信号から合成信号が減算器1117で減じられ、誤差
信号が求められる。
られたLPC係数をLPC量子化部1114で量子化し
て得られるLPC係数を基に合成フィルタ1115の特
性が規定され、この合成フィルタ1115に加算器11
13から出力される駆動信号が入力されることにより、
合成信号が生成される。この合成信号を入力音声信号か
ら前フレームの影響を減じた信号を目標信号として、目
標信号から合成信号が減算器1117で減じられ、誤差
信号が求められる。
【0061】この誤差信号は、聴感重み付けフィルタ1
118で重み付けされた後、その電力が誤差計算部11
19で求められ、この誤差信号電力が最小となる適応ベ
クトル、雑音ベクトル、ピッチゲインおよび雑音ゲイン
の組み合わせが適応符号帳1107、雑音符号帳110
8、ピッチゲイン符号帳1109および雑音ゲイン符号
帳111から探索される。そして、この探索の結果求め
られた誤差電力が最小となるときの適応ベクトル、雑音
ベクトル、ピッチゲインおよび雑音ゲインをそれぞれ表
わす適応ベクトルインデックス、雑音ベクトルインデッ
クス、ピッチゲインインデックスおよび雑音ゲインイン
デックスと、LPC係数を表わすLPCインデックスが
符号化パラメータとして図示しない伝送媒体または蓄積
媒体に出力され、図示しない音声復号化装置に伝送され
る。
118で重み付けされた後、その電力が誤差計算部11
19で求められ、この誤差信号電力が最小となる適応ベ
クトル、雑音ベクトル、ピッチゲインおよび雑音ゲイン
の組み合わせが適応符号帳1107、雑音符号帳110
8、ピッチゲイン符号帳1109および雑音ゲイン符号
帳111から探索される。そして、この探索の結果求め
られた誤差電力が最小となるときの適応ベクトル、雑音
ベクトル、ピッチゲインおよび雑音ゲインをそれぞれ表
わす適応ベクトルインデックス、雑音ベクトルインデッ
クス、ピッチゲインインデックスおよび雑音ゲインイン
デックスと、LPC係数を表わすLPCインデックスが
符号化パラメータとして図示しない伝送媒体または蓄積
媒体に出力され、図示しない音声復号化装置に伝送され
る。
【0062】次に、セレクタ1106でLPCボコーダ
が選ばれた場合について説明する。なお、LPCボコー
ダは図10中の破線より下側に示されている。LPCボ
コーダでは、まず適応符号帳1107のインデックスお
よびピッチゲイン符号帳1109のピッチゲインを探索
して決定する。
が選ばれた場合について説明する。なお、LPCボコー
ダは図10中の破線より下側に示されている。LPCボ
コーダでは、まず適応符号帳1107のインデックスお
よびピッチゲイン符号帳1109のピッチゲインを探索
して決定する。
【0063】次に、乱数発生部112で平均値C、分散
値Ιとなる乱数ベクトルが発生され、この乱数ベクトル
に乗算器1129でゲインが乗じられ、さらに加算器1
130で乗算器1111からのピッチゲインが乗じられ
た後の適応ベクトルと加算されることにより、合成フィ
ルタ1123の駆動信号が生成される。次に、LPC量
子化部1122でLPC係数が量子化され、量子化後の
LPC係数を基に合成フィルタ1123の特性が規定さ
れ、この合成フィルタ1123に乗算器1129から出
力される駆動信号が入力されることにより合成信号が生
成される。この合成信号が目標信号から減算器1124
で減じられ、誤差信号が求められる。
値Ιとなる乱数ベクトルが発生され、この乱数ベクトル
に乗算器1129でゲインが乗じられ、さらに加算器1
130で乗算器1111からのピッチゲインが乗じられ
た後の適応ベクトルと加算されることにより、合成フィ
ルタ1123の駆動信号が生成される。次に、LPC量
子化部1122でLPC係数が量子化され、量子化後の
LPC係数を基に合成フィルタ1123の特性が規定さ
れ、この合成フィルタ1123に乗算器1129から出
力される駆動信号が入力されることにより合成信号が生
成される。この合成信号が目標信号から減算器1124
で減じられ、誤差信号が求められる。
【0064】この誤差信号は聴感重み付けフィルタ11
25で重み付けされた後、その電力が誤差計算部112
6で求られ、この誤差信号電力が最小となるゲインが探
索部1127によってゲイン符号帳1128から求めら
れる。この場合、ゲインは探索せずに解析的に求めるこ
とができる。そして、この誤差信号電力が最小となるゲ
インを表わすゲインインデックスとLPC係数を表わす
LPCインデックスが符号化パラメータとして図示しな
い伝送媒体または蓄積媒体に出力され、図示しない音声
復号化装置に伝送される。
25で重み付けされた後、その電力が誤差計算部112
6で求られ、この誤差信号電力が最小となるゲインが探
索部1127によってゲイン符号帳1128から求めら
れる。この場合、ゲインは探索せずに解析的に求めるこ
とができる。そして、この誤差信号電力が最小となるゲ
インを表わすゲインインデックスとLPC係数を表わす
LPCインデックスが符号化パラメータとして図示しな
い伝送媒体または蓄積媒体に出力され、図示しない音声
復号化装置に伝送される。
【0065】また、第5の実施例で説明したように、符
号化方式決定部1105で得られた符号化方式選択情報
Iは図示しないマルチプレクサによって符号化パラメー
タと共にビットストリームに変換され、伝送媒体または
蓄積媒体に出力される。
号化方式決定部1105で得られた符号化方式選択情報
Iは図示しないマルチプレクサによって符号化パラメー
タと共にビットストリームに変換され、伝送媒体または
蓄積媒体に出力される。
【0066】本実施例においては、CELP方式による
符号化器の構成要素である適応符号帳1107および合
成フィルタ1103を符号化器(符号化方式)の選択に
利用しているため、先の第1〜第4の実施例で説明した
ような構成の符号化方式選択部を用いることによって、
適切な符号化方式の選択が可能である。
符号化器の構成要素である適応符号帳1107および合
成フィルタ1103を符号化器(符号化方式)の選択に
利用しているため、先の第1〜第4の実施例で説明した
ような構成の符号化方式選択部を用いることによって、
適切な符号化方式の選択が可能である。
【0067】すなわち、この場合の目標信号である入力
音声信号が周期性の大きな信号のときは、適応符号帳1
107に格納された駆動信号のベクトルで目標信号を精
度良く表すことができるため、目標信号が周期性の大き
な信号の場合、合成フィルタの駆動信号に割り当てるビ
ット数を少なくしても容易に目標品質を達成することが
でき、符号化ビットレートの低いLPCボコーダを用い
ることができる。逆に、目標信号が周期性の小さな信号
のときは、適応符号帳1107だけでは精度良く表すこ
とができないため、その場合には符号化ビットレートの
高いCELP方式の符号化器を用いることによって目標
品質を達成することができる。
音声信号が周期性の大きな信号のときは、適応符号帳1
107に格納された駆動信号のベクトルで目標信号を精
度良く表すことができるため、目標信号が周期性の大き
な信号の場合、合成フィルタの駆動信号に割り当てるビ
ット数を少なくしても容易に目標品質を達成することが
でき、符号化ビットレートの低いLPCボコーダを用い
ることができる。逆に、目標信号が周期性の小さな信号
のときは、適応符号帳1107だけでは精度良く表すこ
とができないため、その場合には符号化ビットレートの
高いCELP方式の符号化器を用いることによって目標
品質を達成することができる。
【0068】そして、本実施例では第1〜第4の実施例
で説明したように、適応符号帳1107から得られる参
照ベクトルを合成フィルタ1103を通して得られた合
成信号と目標信号である入力音声信号との類似度を類似
度計算部1104で求め、この類似度が大きいときは低
ビットレート符号化器を選択し、類似度が小さい時は高
ビットレート符号化器を選択するようにすることによ
り、平均ビットレートを低くしつつ、目標品質を容易に
達成することができる。
で説明したように、適応符号帳1107から得られる参
照ベクトルを合成フィルタ1103を通して得られた合
成信号と目標信号である入力音声信号との類似度を類似
度計算部1104で求め、この類似度が大きいときは低
ビットレート符号化器を選択し、類似度が小さい時は高
ビットレート符号化器を選択するようにすることによ
り、平均ビットレートを低くしつつ、目標品質を容易に
達成することができる。
【0069】一方、音声復号化装置の構成は図示してい
ないが、図10の音声符号化装置に対応してCELP方
式およびLPCボコーダ方式の復号化器が設けられ、音
声符号化装置からの符号化方式選択情報によって、これ
らの復号化器のいずれかが選択され、その復号化器によ
り音声符号化装置からの符号化パラメータに従って元の
音声信号が復号される。
ないが、図10の音声符号化装置に対応してCELP方
式およびLPCボコーダ方式の復号化器が設けられ、音
声符号化装置からの符号化方式選択情報によって、これ
らの復号化器のいずれかが選択され、その復号化器によ
り音声符号化装置からの符号化パラメータに従って元の
音声信号が復号される。
【0070】
【発明の効果】以上説明したように、本発明によれば適
応符号帳が目標信号をどの程度精度良く表すことができ
るかによって、複数個用意されている符号化方式の中の
1つを選択することを基本としているため、選択に必要
な計算量を抑えつつ、平均レートが低くかつ目標品質を
達成できる符号化方式の選択を可能とした符号化装置を
提供することができる。
応符号帳が目標信号をどの程度精度良く表すことができ
るかによって、複数個用意されている符号化方式の中の
1つを選択することを基本としているため、選択に必要
な計算量を抑えつつ、平均レートが低くかつ目標品質を
達成できる符号化方式の選択を可能とした符号化装置を
提供することができる。
【図1】本発明の第1の実施例の構成を示すブロック図
【図2】同実施例の処理手順を説明するためのフローチ
ャート
ャート
【図3】本発明の第2の実施例の構成を示すブロック図
【図4】同実施例の処理手順を説明するためのフローチ
ャート
ャート
【図5】本発明の第3の実施例の構成を示すブロック図
【図6】同実施例の処理手順を説明するためのフローチ
ャート
ャート
【図7】本発明の第4の実施例の構成を示すブロック図
【図8】同実施例の処理手順を説明するためのフローチ
ャート
ャート
【図9】本発明の第5の実施例に係る音声符号化装置の
概略構成を示すブロック図
概略構成を示すブロック図
【図10】本発明の第6の実施例に係る音声符号化装置
の構成を示すブロック図
の構成を示すブロック図
【図11】従来の第1の符号化方式選択法を説明するた
めのブロック図
めのブロック図
【図12】従来の第2の符号化方式選択法を説明するた
めのブロック図
めのブロック図
【図13】従来の第3の符号化方式選択法を説明するた
めのブロック図
めのブロック図
101,201,301,401,902…符号化方式
選択部 102,202,302,402,901,1101…
入力端子 103,203,303,403,907…出力端子 104,1107…適応符号帳、 105,1115,1123…合成フィルタ 106,1104…類似度計算部 107,1105…符号化方式決定部 202…ピッチ分析部 302,1102,1127…探索部 402…バッファ 903,904,905…符号化器 906…マルチプレクサ 1102…LPC分析部 1106…セレクタ 1108…雑音符号帳 1109…ピッチゲイン符号帳 1110…雑音符号帳 1111,1112,1129…乗算器 1113,1116,11171,1124…加算器 1114,1122…LPC量子化部 1118,1125…聴感重み付けフィルタ 1119,1126…誤差計算部 1120,1127…探索部 1121…乱数発生部 1128…ゲイン符号帳
選択部 102,202,302,402,901,1101…
入力端子 103,203,303,403,907…出力端子 104,1107…適応符号帳、 105,1115,1123…合成フィルタ 106,1104…類似度計算部 107,1105…符号化方式決定部 202…ピッチ分析部 302,1102,1127…探索部 402…バッファ 903,904,905…符号化器 906…マルチプレクサ 1102…LPC分析部 1106…セレクタ 1108…雑音符号帳 1109…ピッチゲイン符号帳 1110…雑音符号帳 1111,1112,1129…乗算器 1113,1116,11171,1124…加算器 1114,1122…LPC量子化部 1118,1125…聴感重み付けフィルタ 1119,1126…誤差計算部 1120,1127…探索部 1121…乱数発生部 1128…ゲイン符号帳
Claims (4)
- 【請求項1】駆動信号をベクトルとして格納した適応符
号帳と、 この適応符号帳に格納されたベクトルを参照して合成信
号を得る合成フィルタと、 この合成フィルタにより得られる合成信号と目標信号と
の類似度を求める類似度計算手段と、 この類似度計算手段により求められた類似度に基づい
て、予め用意されている符号化ビットレートの異なる複
数の符号化方式の中から一つの符号化方式を決定する符
号化方式決定手段とを有することを特徴とする符号化装
置。 - 【請求項2】駆動信号をベクトルとして格納した適応符
号帳と、 目標信号のピッチを分析してピッチ情報を求めるピッチ
分析手段と、 このピッチ分析手段で求められたピッチ情報に基づいて
前記適応符号帳に格納されたベクトルから決定されるベ
クトルを参照して合成信号を得る合成フィルタと、 この合成フィルタにより得られる合成信号と前記目標信
号との類似度を求める類似度計算手段と、 この類似度計算手段により求められた類似度に基づい
て、予め用意されている符号化ビットレートの異なる複
数の符号化方式の中から一つの符号化方式を決定する符
号化方式決定手段とを有することを特徴とする符号化装
置。 - 【請求項3】駆動信号をベクトルとして格納した適応符
号帳と、 この適応符号帳に格納されたベクトルを参照して合成信
号を得る合成フィルタと、 この合成フィルタにより得られる合成信号と目標信号と
の類似度を求める類似度計算手段と、 この類似度計算手段により求められる類似度が最大とな
るベクトルを前記適応符号帳に格納された全てのベクト
ルの中から探索する探索手段と、 この探索手段により探索されたベクトルに対応して前記
類似度計算手段により求められた類似度に基づいて、予
め用意されている符号化ビットレートの異なる複数の符
号化方式の中から一つの符号化方式を決定する符号化方
式決定手段とを有することを特徴とする符号化装置。 - 【請求項4】駆動信号をベクトルとして格納した適応符
号帳と、 前フレームで得られたピッチ情報を記憶した記憶手段
と、 この記憶手段に記憶されたピッチ情報に基づいて前記適
応符号帳に格納されたベクトルから決定されるベクトル
を参照して現フレームの合成信号を得る合成フィルタ
と、 この合成フィルタにより得られる合成信号と現フレーム
の目標信号との類似度を求める類似度計算手段と、 この類似度計算手段により求められた類似度に基づい
て、予め用意されている符号化ビットレートの異なる複
数の符号化方式の中から一つの符号化方式を決定する符
号化方式決定手段とを有することを特徴とする符号化装
置。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7063660A JPH08263099A (ja) | 1995-03-23 | 1995-03-23 | 符号化装置 |
CN95119106A CN1115781C (zh) | 1995-03-23 | 1995-09-29 | 编码器 |
DE69519421T DE69519421T2 (de) | 1995-03-23 | 1995-09-29 | Kodiergerät |
US08/537,276 US5878387A (en) | 1995-03-23 | 1995-09-29 | Coding apparatus having adaptive coding at different bit rates and pitch emphasis |
EP00109508A EP1028411B1 (en) | 1995-03-23 | 1995-09-29 | Coding apparatus |
CA002159557A CA2159557C (en) | 1995-03-23 | 1995-09-29 | Coding apparatus having adaptive coding at different bit rates and pitch emphasis |
KR1019950033928A KR100209454B1 (ko) | 1995-03-23 | 1995-09-29 | 부호화 장치 |
DE69531464T DE69531464T2 (de) | 1995-03-23 | 1995-09-29 | Kodiergerät |
EP95306943A EP0734014B1 (en) | 1995-03-23 | 1995-09-29 | Coding apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7063660A JPH08263099A (ja) | 1995-03-23 | 1995-03-23 | 符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08263099A true JPH08263099A (ja) | 1996-10-11 |
Family
ID=13235729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7063660A Pending JPH08263099A (ja) | 1995-03-23 | 1995-03-23 | 符号化装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5878387A (ja) |
EP (2) | EP0734014B1 (ja) |
JP (1) | JPH08263099A (ja) |
KR (1) | KR100209454B1 (ja) |
CN (1) | CN1115781C (ja) |
CA (1) | CA2159557C (ja) |
DE (2) | DE69531464T2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002536693A (ja) * | 1999-02-08 | 2002-10-29 | クゥアルコム・インコーポレイテッド | 可変率音声符号化に基づいた音声合成装置 |
JP2003515178A (ja) * | 1999-10-28 | 2003-04-22 | クゥアルコム・インコーポレイテッド | フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ |
WO2003056546A1 (en) * | 2001-12-25 | 2003-07-10 | Ntt Docomo, Inc. | Signal coding apparatus, signal coding method, and program |
KR100394146B1 (ko) * | 2000-12-28 | 2003-08-09 | 디지털시스 주식회사 | 인터넷 프로토콜상에서의 이중 다해상도 적응 압축음성신호 전송 방법 |
US7933417B2 (en) | 2000-12-22 | 2011-04-26 | Sony Corporation | Encoding device and decoding device |
JP2015102611A (ja) * | 2013-11-22 | 2015-06-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6075768A (en) * | 1995-11-09 | 2000-06-13 | At&T Corporation | Fair bandwidth sharing for video traffic sources using distributed feedback control |
DE69834093T2 (de) * | 1997-04-07 | 2006-12-14 | Koninklijke Philips Electronics N.V. | Sprachübertragungssystem mit veränderlicher bitrate |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
US6418147B1 (en) * | 1998-01-21 | 2002-07-09 | Globalstar Lp | Multiple vocoder mobile satellite telephone system |
EP0961264B1 (fr) * | 1998-05-26 | 2004-12-15 | Koninklijke Philips Electronics N.V. | Appareil d'émission/réception pour sélectionner un codeur de source et procédés mis en oeuvre dans un tel appareil |
WO2000011649A1 (en) * | 1998-08-24 | 2000-03-02 | Conexant Systems, Inc. | Speech encoder using a classifier for smoothing noise coding |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US6411927B1 (en) * | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
JP2000244384A (ja) * | 1999-02-18 | 2000-09-08 | Mitsubishi Electric Corp | 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法 |
EP1240760A2 (en) * | 1999-12-23 | 2002-09-18 | Broadcom Corporation | System and method for providing compatibility between different transceivers in a multi-pair communication system |
US6382331B1 (en) * | 2000-04-17 | 2002-05-07 | Noble Drilling Services, Inc. | Method of and system for optimizing rate of penetration based upon control variable correlation |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US7460722B2 (en) * | 2002-01-11 | 2008-12-02 | Canon Kabushiki Kaisha | Encoding of digital data with determination of sample path |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
US20060217970A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for noise reduction |
US20060217972A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal |
US20060217988A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for adaptive level control |
US20060217983A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for injecting comfort noise in a communications system |
US20060215683A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for voice quality enhancement |
US20070005347A1 (en) * | 2005-06-30 | 2007-01-04 | Kotzin Michael D | Method and apparatus for data frame construction |
US7818264B2 (en) * | 2006-06-19 | 2010-10-19 | Visa U.S.A. Inc. | Track data encryption |
JP5164970B2 (ja) * | 2007-03-02 | 2013-03-21 | パナソニック株式会社 | 音声復号装置および音声復号方法 |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
JP6960766B2 (ja) * | 2017-05-15 | 2021-11-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 雑音抑圧装置、雑音抑圧方法及びプログラム |
EP3576088A1 (en) * | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
JPH0783315B2 (ja) * | 1988-09-26 | 1995-09-06 | 富士通株式会社 | 可変レート音声信号符号化方式 |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
CA2051304C (en) * | 1990-09-18 | 1996-03-05 | Tomohiko Taniguchi | Speech coding and decoding system |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
JPH06138896A (ja) * | 1991-05-31 | 1994-05-20 | Motorola Inc | 音声フレームを符号化するための装置および方法 |
US5173941A (en) * | 1991-05-31 | 1992-12-22 | Motorola, Inc. | Reduced codebook search arrangement for CELP vocoders |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
US5265190A (en) * | 1991-05-31 | 1993-11-23 | Motorola, Inc. | CELP vocoder with efficient adaptive codebook search |
US5179594A (en) * | 1991-06-12 | 1993-01-12 | Motorola, Inc. | Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook |
EP1239456A1 (en) * | 1991-06-11 | 2002-09-11 | QUALCOMM Incorporated | Variable rate vocoder |
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
US5440336A (en) * | 1993-07-23 | 1995-08-08 | Electronic Data Systems Corporation | System and method for storing and forwarding audio and/or visual information on demand |
-
1995
- 1995-03-23 JP JP7063660A patent/JPH08263099A/ja active Pending
- 1995-09-29 US US08/537,276 patent/US5878387A/en not_active Expired - Lifetime
- 1995-09-29 DE DE69531464T patent/DE69531464T2/de not_active Expired - Lifetime
- 1995-09-29 EP EP95306943A patent/EP0734014B1/en not_active Expired - Lifetime
- 1995-09-29 CN CN95119106A patent/CN1115781C/zh not_active Expired - Lifetime
- 1995-09-29 KR KR1019950033928A patent/KR100209454B1/ko not_active Expired - Lifetime
- 1995-09-29 CA CA002159557A patent/CA2159557C/en not_active Expired - Lifetime
- 1995-09-29 EP EP00109508A patent/EP1028411B1/en not_active Expired - Lifetime
- 1995-09-29 DE DE69519421T patent/DE69519421T2/de not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002536693A (ja) * | 1999-02-08 | 2002-10-29 | クゥアルコム・インコーポレイテッド | 可変率音声符号化に基づいた音声合成装置 |
JP2003515178A (ja) * | 1999-10-28 | 2003-04-22 | クゥアルコム・インコーポレイテッド | フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ |
US7933417B2 (en) | 2000-12-22 | 2011-04-26 | Sony Corporation | Encoding device and decoding device |
KR100394146B1 (ko) * | 2000-12-28 | 2003-08-09 | 디지털시스 주식회사 | 인터넷 프로토콜상에서의 이중 다해상도 적응 압축음성신호 전송 방법 |
WO2003056546A1 (en) * | 2001-12-25 | 2003-07-10 | Ntt Docomo, Inc. | Signal coding apparatus, signal coding method, and program |
US7505900B2 (en) | 2001-12-25 | 2009-03-17 | Ntt Docomo, Inc. | Signal encoding apparatus, signal encoding method, and program |
JP2015102611A (ja) * | 2013-11-22 | 2015-06-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
Also Published As
Publication number | Publication date |
---|---|
DE69519421D1 (de) | 2000-12-21 |
EP1028411A3 (en) | 2000-11-29 |
EP1028411B1 (en) | 2003-08-06 |
US5878387A (en) | 1999-03-02 |
EP0734014A1 (en) | 1996-09-25 |
DE69519421T2 (de) | 2001-06-13 |
CN1140362A (zh) | 1997-01-15 |
EP0734014B1 (en) | 2000-11-15 |
CN1115781C (zh) | 2003-07-23 |
DE69531464T2 (de) | 2004-07-01 |
EP1028411A2 (en) | 2000-08-16 |
DE69531464D1 (de) | 2003-09-11 |
KR100209454B1 (ko) | 1999-07-15 |
KR960036343A (ko) | 1996-10-28 |
CA2159557A1 (en) | 1996-09-24 |
CA2159557C (en) | 2000-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH08263099A (ja) | 符号化装置 | |
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
US6202046B1 (en) | Background noise/speech classification method | |
EP1619664B1 (en) | Speech coding apparatus, speech decoding apparatus and methods thereof | |
US5819213A (en) | Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
JP2004526213A (ja) | 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム | |
US5659659A (en) | Speech compressor using trellis encoding and linear prediction | |
US7634402B2 (en) | Apparatus for coding of variable bitrate wideband speech and audio signals, and a method thereof | |
US5926785A (en) | Speech encoding method and apparatus including a codebook storing a plurality of code vectors for encoding a speech signal | |
JPH08272395A (ja) | 音声符号化装置 | |
KR20030076725A (ko) | 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법 | |
JP4550176B2 (ja) | 音声符号化方法 | |
JP3435310B2 (ja) | 音声符号化方法および装置 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JPH0830299A (ja) | 音声符号化装置 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JPH08179800A (ja) | 音声符号化装置 | |
JP2002169595A (ja) | 固定音源符号帳及び音声符号化/復号化装置 | |
JPH09120300A (ja) | ベクトル量子化装置 | |
JPH08101700A (ja) | ベクトル量子化装置 | |
JPH07199994A (ja) | 音声符号化方式 | |
Chui et al. | A hybrid input/output spectrum adaptation scheme for LD-CELP coding of speech |