JP3496618B2 - 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 - Google Patents
複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法Info
- Publication number
- JP3496618B2 JP3496618B2 JP2000074515A JP2000074515A JP3496618B2 JP 3496618 B2 JP3496618 B2 JP 3496618B2 JP 2000074515 A JP2000074515 A JP 2000074515A JP 2000074515 A JP2000074515 A JP 2000074515A JP 3496618 B2 JP3496618 B2 JP 3496618B2
- Authority
- JP
- Japan
- Prior art keywords
- power
- amount
- representing
- voice
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 32
- 230000003595 spectral effect Effects 0.000 claims description 21
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 7
- 238000009499 grossing Methods 0.000 description 25
- 238000001514 detection method Methods 0.000 description 17
- 238000013139 quantization Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000000354 decomposition reaction Methods 0.000 description 10
- 230000005284 excitation Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- UWHCKJMYHZGTIT-UHFFFAOYSA-N tetraethylene glycol Chemical compound OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000012966 insertion method Methods 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
タル情報を符号化・復号する装置に関し、特に無音声部
の符号化・復号に関するものである。
装置は、音声がない区間(無音声部)を、音声部の符号化
に比べて非常に低いビットレートで符号化することによ
り、伝送する平均ビットレートを低減することを目的と
して用いられている。例えば、「IEEE Communications
Magazine, 頁64-73、Sep 1997」(文献1)に記載され
ている装置がある。
レーム(10msec)毎に音声部であるか無音声部であるか
を判別し、音声部である場合は、通常の音声符号化方式
(ITU-T勧告G.729)により入力信号を符号化・復号す
る。無音声部の場合、符号化装置では入力信号の特徴パ
ラメータを間欠的に符号化し、復号装置に伝送する。復
号装置では、全てのフレームではなく間欠的に受信した
特徴パラメータの繰り返し及び平滑化により全フレーム
の特徴パラメータを計算し、これらを用いて信号を復号
する。
献1に記述されているように、フレーム毎に入力信号か
ら計算する信号パワー、低周波数領域に対応する信号パ
ワー、零交差数、及びスペクトル包絡特性を表すフィル
タ係数を用いる方法がある。これらの変量と各々の無音
声部における平均値との差分に基づき、閾値処理により
判別を行なう。
ば、「ITU-T勧告G.729、COM15-152 July 1995」(文
献2)に記述されているCELP (Code Excited Linear
Prediction Coding)方式がある。 CELP方式に関して
は、他に「Code-Excited Linear Prediction : Hig
h Quality Speech at Very Low Bit Rates (IE
EE Proc. ICASSP-85、 pp.937- 940、1985)」(文献
3)に記載されている。従来装置の符号化処理では、入力
信号を予め定めたフレーム毎に線形予測分析して、音声
信号のスペクトル包絡特性を表す線形予測(LP)係数を算
出し、そのスペクトル包絡特性に対応するLP合成フィル
タを駆動して励振信号を算出し、各々符号化する。励振
信号の符号化は、フレームを更にサブフレームに分割し
てサブフレーム毎に行う。ここで、励振信号は、入力信
号のピッチ周期を表す周期成分とその残差成分及びそれ
らのゲインにより構成される。入力信号のピッチ周期を
表す周期成分は、適応コードブックと呼ばれる過去の励
振信号を保持するコードブックに格納された適応コード
ベクトルとして表され、前記残差成分は、複数のパルス
からなるマルチパルス信号として表される。また、復号
処理では、復号した前記ピッチ周期成分と前記残差信号
から得た励振信号を、復号した前記フィルタ係数で構成
する合成フィルタに入力して音声信号を復号する。
ば、文献1に記述されているように、入力信号の特徴パ
ラメータとして信号パワーを表す二乗平均平方根(Root
Mean Square;RMS)とスペクトル特性を表すフィル
タ係数を符号化する方法がある。復号は、乱数信号と乱
数的に生成したパルス性信号との線形和を前記RMSで調
整し、これを前記フィルタ係数を用いて構成した合成フ
ィルタに入力することにより行なう。前記特徴パラメー
タは、無音声部で信号の性質が変化したフレームでのみ
伝送し、それ以外のフレームでは何も伝送しない。この
何も伝送しないフレームでは、過去の伝送された特徴パ
ラメータを繰り返し使用する。但し、波形上での不連続
が生じないように、RMSには平滑化処理を施す。
る。図4は従来の符号化・復号装置を説明するブロック
図である。
子51は、入力信号を一定フレーム単位、例えば10msec単
位で入力する。音声検出回路53は、入力端子51からの入
力信号を用いて前記フレームに含まれる信号が音声部か
無音声部かの判定を前述のように行ない、検出結果(VA
D_flag)を切り替え回路52と56及び無音声部符号化回路
54に渡す。切り替え回路52は、入力端子51から渡された
フレーム単位の入力信号を、音声検出回路53から渡され
るVAD_flagが音声部を示す場合は音声部符号化回路55に
渡す。また、VAD_flagが無音声部を示す場合は無音声部
符号化回路54に渡す。
らの入力信号、即ち、入力信号の音声部をフレーム毎に
前述のように符号化し、得た量子化符号列を切り替え回
路56に渡す。無音声部符号化回路54は、切り替え回路52
からの入力信号、即ち、入力信号の無音声部をフレーム
毎に前述のように符号化し、得た量子化符号列を切り替
え回路56に渡す。また、無音声部符号化回路54は、無音
声部において前記量子化符号列を伝送するか否かの判定
を前記特徴パラメータであるRMSとスペクトル特性を表
すフィルタ係数の時間変化に基づき行ない、その判定情
報(TX_flag)をビット列生成回路57に渡す。
の各フレームで計算したRMSを過去数フレームに渡り平
均化した値と最近伝送したRMSとの差分が予め定めた閾
値と比較する。スペクトル特性を表すフィルタ係数に関
しても同様に差分と閾値を比較し、いずれかの差分がそ
の閾値を超える場合は前記量子化符号列を伝送する。い
ずれもその閾値を越えない場合は何も伝送しない。
されるVAD_flagで入力信号が音声部とされた場合は音声
部符号化回路55から渡された量子化符号列を、VAD_flag
で、入力信号が無音声部とされた場合は無音声符号化回
路54から渡された量子化符号列をビット列生成回路57に
渡す。ビット列生成回路57は、無音声部音声検出回路53
から渡されるTX_flagと切り替え回路56から渡される量
子化符号列とからビット列を生成し、出力端子64から出
力する。
ト列分解回路58は、入力端子65から入力したビット列を
TX_flagと量子化符号列に分解し、前記VAD_flagと前記
量子化符号列を切り替え回路59に渡し、前記TX_flagを
無音声部復号回路60と切り替え回路62に渡す。切り替え
回路59は、ビット列分解回路59から渡された量子化符号
列を、ビット列分解回路58から渡されたTX_flagで入力
信号が音声部とされた場合は音声部復号回路61に渡し、
無音声部とされた場合は無音声部復号回路60に渡す。
から渡されたTX_flagと切り替え回路59から渡された量
子化符号列を用いて無音声部の信号を復号し、切り替え
回路62に渡す。切り替え回路62はビット列分解回路58か
ら渡されたTX_flagに従い、音声部復号回路61あるいは
無音声部復号回路60から渡された復号信号を出力端子63
から出力する。
もっとも使用されているのが、携帯電話システムであ
り、これらの装置は基地局及び通信端末に備えられてい
る。
音声部符号化回路54を説明するブロック図である。入力
端子10は、入力信号をフレーム単位で入力し、LP分析回
路11とパワー計算回路15に渡す。LP分析回路11は、入力
端子10から渡された入力信号を一定区間蓄積し、予め定
めた単位(フレーム)毎に線形予測(LP)分析する。また、
LP分析で得た線形予測(LP)係数をLPC-LSP変換回路12に
渡す。LPC-LSP変換回路12は、LP分析回路11から渡され
たLP係数を線スペクトル対(LSP)に変換し、LSP平滑化回
路13に渡す。LSP平滑化回路13は、LPC-LSP平滑化回路13
から渡されたLSPを平滑化し、変化検出回路24とLSP量子
化回路17に渡す。平滑化は、現フレームと過去の複数フ
レームにおいてLPC-LSP変換回路12で計算されたLSPの平
均値を用いることができるが、この平滑化を行なわず現
フレームの値を直接用いることもできる。LSP量子化回
路17は、LSP平滑化回路13から渡された平滑化LSPを量子
化し、その量子化符号をビット列生成回路19に渡す。量
子化に関しては、文献2に記載されているベクトル量子
化が適用できる。
れた入力信号を一定区間蓄積し、フレーム毎に入力信号
のRMSを計算する。パワー平滑化回路16は、パワー計算
回路15から渡されたRMSを平滑化し、パワー量子化回路1
8に渡す。平滑化は、LSPと同様に、現フレームと過去の
複数フレームにおいてパワー計算回路15で計算されたパ
ワーの平均値を用いることができるが、この平滑化を行
なわず現フレームの値を直接用いることもできる。パワ
ー量子化回路18は、パワー平滑化回路16から渡された平
滑化パワーあるいは平滑化RMSを量子化し、その量子化
符号をビット列生成回路19に渡す。量子化は、μ-law量
子化等のスカラー量子化が適用できる。
パワー量子化回路18から各々渡される量子化符号からビ
ット列を生成し、切り替え回路23に渡す。入力端子14は
VAD_flagを入力し変化検出回路24に渡す。変化検出回路
24は、入力端子14から渡されたVAD_flagが無音声部を示
す場合は、LSP平滑化回路13とパワー平滑化回路16から
各々平滑化値を受け取り、平滑化値の量子化符号を伝送
するか否かを検出する。
予め定めた値より大きい場合には量子化符号を伝送する
と判定を行なう。また、変化検出回路24は、判定結果を
TX_flagとして出力端子21と切り替え回路23に渡す。切
り替え回路23は、変化検出回路14の判定結果が伝送する
ことを示す場合は、ビット列生成回路19から渡される量
子化符号を無音情報(SID)として出力端子22に渡し、そ
うでない場合は何も出力しない。出力端子22は切り替え
回路23から渡された量子化符号を出力する。
無音声復号回路60を説明するブロック図である。入力端
子30はSIDを入力し、切り替え回路49に渡す。入力端子3
1はTX_flagを入力し、切り替え回路49とLSP平滑化回路3
5とパワー平滑化回路39に渡す。切り替え回路49は入力
端子31から渡されたTX_flagが伝送することを示す場合
は入力端子30から入力したSIDをビット列分解回路33に
渡す。TX_flagが無伝送をを示す場合は何も出力しな
い。ビット列分解回路33は、切り替え回路49から渡され
たSIDからLSPの量子化符号をLSP復号回路34に渡し、RMS
の量子化符号をパワー復号回路38に渡す。
渡されたLSPの量子化符号からLSPを復号し、LSP平滑化
回路35に渡す。LSP平滑化回路35は、入力端子31から渡
されたTX_flagに従い、LSP復号回路34から渡されたLSP
を平滑化し、LSP補間回路36に渡す。但し、入力端子31
から渡されたTX_flagが量子化符号を伝送しないことを
示す場合は、前フレームでLSP復号回路34から渡されたL
SPを用いて平滑化を行なう。LSP-LPC変換回路37はLSP補
間回路36から渡された平滑化LSPをLP係数に変換し、合
成フィルタ回路47に渡す。
ら渡されたパワーの量子化符号からパワーを復号し、平
滑化回路39に渡す。平滑化回路39は、入力端子31から渡
されたTX_flagに従い、パワー復号回路38から渡された
パワーを平滑化し、ゲイン計算回路40に渡す。但し、入
力端子50から入力されたDTX判定符号で量子化符号列が
伝送されないことが示された場合は、前フレームのRMS
を用いて平滑化を行なう。ゲイン計算回路40はパワー平
滑化回路39から渡された平滑化パワーからパルス信号と
乱数信号に積算するパルスゲインと乱数ゲインを計算
し、各々ゲイン回路44と45に渡す。
数を生成するための乱数系列を生成し、マルチパルス生
成回路43と乱数生成回路42に渡す。マルチパルス生成回
路43は、フレームを更に分割したサブフレーム(例えば5
msec長)毎に、乱数系列発生回路41から渡された乱数系
列に基づき各々生成した位置と振幅を有するパルス信号
を生成し、ゲイン回路44に渡す。ゲイン回路44は、マル
チパルス生成回路43から渡されたパルス信号に、ゲイン
計算回路40から渡されたパルスゲインを積算し、加算回
路46に渡す。
ら渡された乱数系列に基づき乱数信号を生成し、ゲイン
回路45に渡す。ゲイン回路45は乱数生成回路42から渡さ
れた乱数信号に、ゲイン計算回路40から渡された乱数ゲ
インを積算し、加算回路46に渡す。
ら渡されたゲイン積算済のパルス信号と乱数生成回路42
から渡されたゲイン積算済の乱数信号を加算することに
より合成フィルタの励振信号を生成し、合成フィルタ回
路47に渡す。パルスゲインと乱数ゲインは、例えば、文
献1に記載された様に、励振信号のRMSが前記平滑化RMS
と同一になるように計算できる。合成フィルタ回路47
は、加算回路46から渡される励振信号を、LSP-LPC変換
回路37から渡されるLP係数で構成するフィルタに入力す
ることにより、信号を復号し、出力端子48から出力す
る。
符号化・復号装置において、更新が不必要な伝送パラメ
ータを伝送することである。その結果、平均伝送ビット
レートが高くなる。その理由は、特徴パラメータである
RMSとLSPの両方を、いずれか一方の時間変化が検出され
た場合に伝送するためである。
声部の平均伝送ビットレートを削減することにより、従
来の音声通信システムに比べてより低い平均伝送ビット
レートのシステムを実現することにある。
化装置は、各フレームにおいて入力信号が音声部である
か無音声部であるかの判別をする手段(図1の53)と、そ
の判定結果に従い前記入力信号の特徴パラメータから信
号を復号する方法を切り替える手段(図1の52と56)と、
前記無音声部で前記特徴パラメータのいずれに関する符
号を伝送するかあるいは何も伝送しないかを各フレーム
で切り替える手段(図1の70)を有することを特徴とする
号化装置に加えて、前記特徴パラメータとして前記入力
信号に対応するスペクトル包絡を表す量とパワーを表す
量の少なくとも一つを符号化する手段(図2の17と18)を
有することを特徴とする。
第2の符号化装置に加えて、前記特徴パラメータのいず
れを伝送するかの判定を前記各特徴パラメータの時間変
化量に基づき行なう手段(図2の25)を有することを特徴
とする。
第2の符号化装置に加えて、前記スペクトル包絡を表す
量の時間変化量が予め定めた条件を満たす場合は前記ス
ペクトル包絡を表す量と前記パワーを表す量の両者を伝
送する手段(図2の17、18、19及び20)、前記パワーを表
す量の時間変化量が予め定めた条件を満たす場合は前記
パワーを表す量のみを伝送する手段(図2の18と20)を有
することを特徴とする。
ムにおいて復号信号が音声部であるか無音声部であるか
の判別結果を受信する手段(図1の58)と、その判別結果
に従い前記復号信号の特徴パラメータから信号を復号す
る方法を切り替える手段(図1の59と62)と、前記無音声
部では前記特徴パラメータのいずれかに関する符号を用
いて復号するかあるいは過去に受信した符号を用いて復
号するかを各フレームで切り替える手段(図1の71)を有
することを特徴とする。
装置に加えて、前記特徴パラメータとして前記入力信号
に対応するスペクトル包絡を表す量とパワーを表す量の
少なくとも一つを復号する手段(図3の34と38)を有する
ことを特徴とする。
2の復号装置に加えて、前記スペクトル包絡を表す量と
前記パワーを表す量の両者を受信し、復号する手段(図3
の32、33、34及び38)と、前記パワーを表す量のみを受
信し、復号する手段(図3の32と38)を有することを特徴
とする。
第2、第3あるいは第4の符号化装置と第5、第6あるいは
第7の復号装置を有することを特徴とする。
たと判定された特徴パラメータのみを伝送する。これに
より、不必要な特徴パラメータの伝送を避けることがで
き、その結果、平均伝送ビットレートを低減できる。
基づく符号化・復号装置の実施例を説明する。
るブロック図である。図4に示す従来の符号化・復号装
置と異なるのは、無音声部符号化回路54と無音声部復号
回路60が各々無音声部符号化回路70と無音声部復号回路
71になった点のみである。従って、他回路に関する説明
は省略する。
の入力信号をフレーム毎に符号化し、得た量子化符号列
を切り替え回路56に渡す。また、無音声部においてどの
特徴パラメータに対応する量子化符号列を伝送するか、
あるいは伝送しないかの判定情報(TX_flag)をビット
列生成回路57に渡す。音声部復号回路71は、ビット列分
解回路58から渡されたTX_flagと切り替え回路59から渡
された量子化符号列を用いて無音声部の信号を復号し、
切り替え回路62に渡す。
化回路70を説明する。図5に示す従来の無音声部符号化
回路54と異なるのは、変化検出回路24と切り替え回路23
が各々変化検出回路25と切り替え回路20になった点のみ
である。従って、他回路に関する説明を省略する。
での各フレームで計算したRMSを過去数フレームに渡り
平均化した値と最近伝送したRMSとの差分が予め定めた
閾値と比較する。LSPに関しても同様に差分とその閾値
とを比較する。LSPの変化がその閾値を越える場合はLSP
とRMSの量子化符号列を伝送するという判定結果(TX_fla
g;HR-SID)を切り替え回路20と出力端子21に渡す。ま
た、RMSの変化のみがその閾値を越える場合はRMSの量子
化符号を伝送するという判定結果(LR-SID)を渡す。い
ずれもその閾値を越えない場合は何も伝送しないという
判定結果を渡す。音声でスペクトル特性を表すLSPが変
化する場合はRMSも変化する可能性が高いことと、RMSの
情報量がLSPに比べて少ないことを考慮すると頻度の少
ないと考えられるLSPのみ伝送する場合を外すことによ
り、上記3通りを採用しているが、LSPのみを伝送する場
合を含めた4通りにすることも可能である。
変化検出回路25から渡されたTX_flagがLSPとRMSの両方
の量子化符号が伝送されたことを示す場合はビット列生
成回路19から渡されたSID (HR-SID)を渡し、RMSのみの
量子化符号が伝送されたことを示す場合は入力端子から
渡されたSID(LR-SID)を渡す。そうでない場合は出力
端子22に何も渡さない。
号回路71を説明する。図6に示す従来の無音声部復号回
路60と異なるには、切り替え回路49が切り替え回路32に
変わった点とパワー復号回路38が切り替え回路32から量
子化符号を直接渡される場合がある点のみである。従っ
て、他回路に関する説明を省略する。
たTX_flagがLSPとRMSの両方の量子化符号が伝送された
ことを示す場合(HR-SID)は入力端子30から渡されたSID
をビット列分解回路33に渡し、RMSのみの量子化符号が
伝送されたことを示す場合(LR-SID)は入力端子から渡
されたSIDをパワー復号回路に渡す。そうでない場合は
何も出力しない。
現した実施形態を示す図である。同図には、音声符号化
復号化装置A,Bが通信回線を介して接続された様子を
示している。
であるので、音声符号化装置Aについてのみ説明する。
音声符号化復号化装置装置Aは、音声信号を入力するた
めのマイクロフォン(MIC)と、音声符号化復号化装
置装置Bからの符号列を復号し、再生音声を出力するス
ピーカと、音声符号化復号化装置の本体であるCPU
と、CPUを音声符号化復号化装置本体として動作させ
るためのプログラムを格納した記録媒体とから構成され
る。記録媒体からプログラムをダウンロードすることに
より、既に説明した各実施形態と同様の動作を、CPU
は実行する。なお、記録媒体に格納されているプログラ
ムの構成は、既述の実施形態の説明から、当業者には明
かであるので、重複した説明は省略する。
号装置において、平均伝送ビットレートを低減できるこ
とである。その理由は、変化したと判定された特徴パラ
メータのみを伝送するためである。
例を説明するブロック図である。
成例を説明するブロック図である。
例を説明するブロック図である。
ロック図である。
ブロック図である。
ロック図である。
態を示す図である。
Claims (17)
- 【請求項1】各フレームにおいて入力信号が音声部であ
るか無音声部であるかの判別に従い前記入力信号に対応
するスペクトル包絡を表す量とパワーを表す量を少なく
とも含む特徴パラメータを符号化する方法を切り替える
音声符号化装置において、 前記無音声部で、前記パワーを表す量に関する符号を伝
送するか、または、前記パワーを表す量に関する符号と
前記スペクトル包絡を表す量に関する符号を伝送する
か、あるいは、何も伝送しないかを各フレームで切り替
えることを特徴とする音声符号化装置。 - 【請求項2】前記無音声部で、前記パワーを表す量に関
する符号を伝送するか、または、前記パワーを表す量に
関する符号と前記スペクトル包絡を表す量に関する符号
を伝送するか、あるいは、何も伝送しないかの判定を、
前記各特徴パラメータの時間変化量に基づき行なうこと
を特徴とする請求項1に記載の音声符号化装置。 - 【請求項3】前記スペクトル包絡を表す量の時間変化量
が予め定めた条件を満たす場合は前記スペクトル包絡を
表す量と前記パワーを表す量の両者を伝送し、前記パワ
ーを表す量の時間変化量が予め定めた条件を満たす場合
は前記パワーを表す量のみを伝送することを特徴とする
請求項1に記載の音声符号化装置。 - 【請求項4】各フレームにおいて復号信号が音声部であ
るか無音声部であるかの判別に従い前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量を少なく
とも含む特徴パラメータから前記復号信号を復号化する
方法を切り替える音声復号装置において、 前記無音声部で、前記パワーを表す量に関する符号を用
いて復号化するか、または、前記パワーを表す量に関す
る符号と前記スペクトル包絡を表す量に関する符号を用
いて復号化するか、あるいは、過去に受信した符号を用
いて復号化するかを各フレームで切り替えることを特徴
とする音声復号装置。 - 【請求項5】請求項1から3のいずれか一項に記載の音
声符号化装置と請求項4に記載の音声復号装置を有する
音声符号化・復号装置。 - 【請求項6】各フレームにおいて入力信号が音声部であ
るか無音声部であるかの判別に従い前記入力信号に対応
するスペクトル包絡を表す量とパワーを表す量を少なく
とも含む特徴パラメータを符号化する方法を切り替える
音声符号化方法において、 前記無音声部で、前記パワーを表す量に関する符号を伝
送するか、または、前記パワーを表す量に関する符号と
前記スペクトル包絡を表す量に関する符号を伝送する
か、あるいは、何も伝送しないかを各フレームで切り替
えるステップを含むことを特徴とする音声符号化方法。 - 【請求項7】前記無音声部で、前記パワーを表す量に関
する符号を伝送するか、または、前記パワーを表す量に
関する符号と前記スペクトル包絡を表す量に関する符号
を伝送するか、あるいは、何も伝送しないかの判定を、
前記各特徴パラメータの時間変化量に基づき行なうこと
を特徴とする請求項6に記載の音声符号化方法。 - 【請求項8】前記スペクトル包絡を表す量の時間変化量
が予め定めた条件を満たす場合は前記スペクトル包絡を
表す量と前記パワーを表す量の両者を伝送するステップ
と、 前記パワーを表す量の時間変化量が予め定めた条件を満
たす場合は前記パワーを表す量のみを伝送するステップ
を含むことを特徴とする請求項6に記載の音声符号化方
法。 - 【請求項9】各フレームにおいて復号信号が音声部であ
るか無音声部であるかの判別に従い前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量を少なく
とも含む特徴パラメータ から前記復号信号を復号化する
方法を切り替える音声復号方法において、 前記無音声部で、前記パワーを表す量に関する符号を用
いて復号化するか、または、前記パワーを表す量に関す
る符号と前記スペクトル包絡を表す量に関する符号を用
いて復号化するか、あるいは、過去に受信した符号を用
いて復号化するかを各フレームで切り替えるステップを
含むことを特徴とする音声復号方法。 - 【請求項10】請求項6から8のいずれか一項に記載の
音声符号化方法と請求項9に記載の音声復号方法を有す
る音声符号化・復号方法。 - 【請求項11】各フレームにおいて入力信号が音声部で
あるか無音声部であるかの判別に従い前記入力信号に対
応するスペクトル包絡を表す量とパワーを表す量を少な
くとも含む特徴パラメータを符号化する方法を切り替え
る音声符号化方法において、 前記無音声部で、前記パワーを表す量に関する符号を伝
送するか、または、前記パワーを表す量に関する符号と
前記スペクトル包絡を表す量に関する符号を伝送する
か、あるいは、何も伝送しないかを各フレームで切り替
えるステップを含むことを特徴とする記録媒体。 - 【請求項12】前記無音声部で、前記パワーを表す量に
関する符号を伝送するか、または、前記パワーを表す量
に関する符号と前記スペクトル包絡を表す量に関する符
号を伝送するか、あるいは、何も伝送しないかの判定
を、前記各特徴パラメータの時間変化量に基づき行なう
ことを特徴とする請求項11に記載の記録媒体。 - 【請求項13】前記スペクトル包絡を表す量の時間変化
量が予め定めた条件を満たす場合は前記スペクトル包絡
を表す量と前記パワーを表す量の両者を伝送するステッ
プと、 前記パワーを表す量の時間変化量が予め定めた条件を満
たす場合は前記パワーを表す量のみを伝送するステップ
を含むことを特徴とする請求項11に記載の記録媒体。 - 【請求項14】各フレームにおいて復号信号が音声部で
あるか無音声部であるかの判別に従い前記復号信号に対
応するスペクトル包絡を表す量とパワーを表す量を少な
くとも含む特徴パラメータから前記復号信号を復号化す
る方法を切り替える音声復号方法において、 前記無音声部で、前記パワーを表す量に関する符号を用
いて復号化するか、または、前記パワーを表す量に関す
る符号と前記スペクトル包絡を表す量に関する符号を用
いて復号化するか、あるいは、過去に受信した符号を用
いて復号化するかを各フレームで切り替えるステップを
含むことを特徴とする記録媒体。 - 【請求項15】請求項11から13のいずれか一項記載
の記録媒体と請求項14に記載の記録媒体に記録された
両方のプログラムを含むことを特徴とする記録媒体。 - 【請求項16】請求項1から5のいずれかに記載の音声
符号化装置、音声復号装置、あるいは音声符号化・復号
装置を備えたことを特徴とする基地局装置。 - 【請求項17】請求項1から5のいずれかに記載の音声
符号化装置、音声復号装置、あるいは音声符号化・復号
装置を備えたことを特徴とする通信端末装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000074515A JP3496618B2 (ja) | 2000-03-16 | 2000-03-16 | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000074515A JP3496618B2 (ja) | 2000-03-16 | 2000-03-16 | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003319786A Division JP2004078235A (ja) | 2003-09-11 | 2003-09-11 | 複数レートで動作する無音声符号化を含む音声符号化・復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001265390A JP2001265390A (ja) | 2001-09-28 |
JP3496618B2 true JP3496618B2 (ja) | 2004-02-16 |
Family
ID=18592548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000074515A Expired - Fee Related JP3496618B2 (ja) | 2000-03-16 | 2000-03-16 | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3496618B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4793539B2 (ja) | 2005-03-29 | 2011-10-12 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びにその記憶媒体 |
JP4978364B2 (ja) * | 2007-08-07 | 2012-07-18 | トヨタ自動車株式会社 | データ送受信装置 |
KR101451844B1 (ko) | 2013-03-27 | 2014-10-16 | 주식회사 시그테크 | 음성활동감지방법 및 그 방법을 채택한 통신장치 |
KR101396873B1 (ko) | 2013-04-03 | 2014-05-19 | 주식회사 크린컴 | 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치 |
-
2000
- 2000-03-16 JP JP2000074515A patent/JP3496618B2/ja not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
Masahiro Serizawa, et al,A Silence Compression Algorithm for Multi−Rate/Dual−Bandwidth MPEG−4 CELP Standard,Proc.2000 IEEE International Conference on Acoustics,Speech, and Signal Process, ICASSP’00,2000年 6月,p.1173−1176 |
Masarhiro Serizawa, et al,A Silence Compression Algorithm for Multi−Rate Dual−Bandwidth MPEG−4 CELP Standard,Trans.IEICE on Information and Systems,2003年 3月,Vol.E86−D, No3,p.412−417 |
松尾直樹,他,音声パケット通信における無音区間再生法,昭和63年電子情報通信学会秋季全国大会講演論文集,1988年 8月15日,B−252,p.B−2−130 |
由比藤光宏,他,音声パケット通信におけるホス雑音挿入方式の一検討,1990年電子情報通信学会春季全国大会講演論文集,1990年 3月 5日,B−563,p.3−141 |
Also Published As
Publication number | Publication date |
---|---|
JP2001265390A (ja) | 2001-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5343098B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
KR100574031B1 (ko) | 음성합성방법및장치그리고음성대역확장방법및장치 | |
US7426465B2 (en) | Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality | |
JP3259759B2 (ja) | 音声信号伝送方法及び音声符号復号化システム | |
EP1096476B1 (en) | Speech signal decoding | |
JPH1097295A (ja) | 音響信号符号化方法及び復号化方法 | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
KR100796836B1 (ko) | 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체 | |
JP2003249957A (ja) | パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP3451998B2 (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
US7584096B2 (en) | Method and apparatus for encoding speech | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
US7295974B1 (en) | Encoding in speech compression | |
EP1035538B1 (en) | Multimode quantizing of the prediction residual in a speech coder | |
JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JP2004078235A (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置 | |
JP3475958B2 (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JPH034300A (ja) | 音声符号化復号化方式 | |
JPH01293399A (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JPH01293400A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置 | |
JPH0343800A (ja) | 音声信号符号化復合化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20031028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3496618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071128 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081128 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081128 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091128 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091128 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101128 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131128 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |