[go: up one dir, main page]

JPH04249300A - 音声符復号化方法及びその装置 - Google Patents

音声符復号化方法及びその装置

Info

Publication number
JPH04249300A
JPH04249300A JP3035149A JP3514991A JPH04249300A JP H04249300 A JPH04249300 A JP H04249300A JP 3035149 A JP3035149 A JP 3035149A JP 3514991 A JP3514991 A JP 3514991A JP H04249300 A JPH04249300 A JP H04249300A
Authority
JP
Japan
Prior art keywords
information
term prediction
signal
residual signal
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3035149A
Other languages
English (en)
Inventor
Seiji Sasaki
誠司 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kokusai Denki Electric Inc
Original Assignee
Kokusai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Electric Co Ltd filed Critical Kokusai Electric Co Ltd
Priority to JP3035149A priority Critical patent/JPH04249300A/ja
Publication of JPH04249300A publication Critical patent/JPH04249300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、アナログ音声信号を高
能率に符号化して伝送路に送出し、受信側でそれを復号
してアナログ音声信号を復号再生する音声符復号化方法
及びその装置に関するものである。
【0002】
【従来の技術】図3は長期予測を用いた従来の等間隔パ
ルス駆動型音声符復号化器のブロック図あり、(A)は
音声符号化装置、(B)は音声復号装置である。この方
法は符号化速度13Kbps(ビット/秒)で、汎欧州
ディジタル自動車電話(GSM)システムに採用されて
いる音声符復号化方法である。以下、符号化速度を64
Kbpsから13Kbpsに圧縮する方法について説明
する。
【0003】図3(A)において、8kHzサンプリン
グで8ビット量子化された入力音声信号(64Kbps
)は、短期予測分析器11により1フレーム毎(160
サンプル:20msec)に短期予測分析(線形予測分
析ともいう)が施される。即ち入力音声信号からスペク
トル包絡情報Paを抽出して出力するとともに、スペク
トル包絡成分を取り除いた信号である短期予測残差信号
a(160サンプル)を生成して出力する。次に、短期
予測残差信号aは、長期予測分析器12により4つのサ
ブフレーム(40サンプル)に分割されサブフレーム毎
にピッチ情報Pbを抽出して出力するとともに、更にピ
ッチ成分を取り除いた信号である長期予測残差信号b(
40サンプル)を生成して出力する。この長期予測残差
信号b(40サンプル)はLPF(低域ろ波器)13に
より1/3に帯域制限され信号cが得られる。信号cは
3つのグリッドを有するスイッチSにより1/3にダウ
ンサンプリングされるが、このときグリッド選択器14
により電力が最大となるグリッドの信号列(13サンプ
ル)が選択され、それらが等間隔パルス情報Pcとなっ
て出力される。以上のPa,Pb及びPcは符号化器1
5により符号化及び多重化されたディジタル列として受
信側に対して送出される。このときの各パラメータに対
する1フレームあたりのビット割り当ては、表1のよう
になる。但し、等間隔パルス情報Pcとしては、その1
3サンプル中の最大値と、それにより正規化された13
サンプル及び位置情報(グリッド番号)とにより構成さ
れる。1フレームは20msecであるので符号化速度
は13Kbpsとなる。
【表1】
【0004】図3(B)では、受信したディジタル列は
分離回路21により、等間隔パルス情報Pd,ピッチ情
報Pe,スペクトル包絡情報Pfを分離した後、長期予
測残差信号再生器22により等間隔パルス情報Pdから
長期予測残差信号dを再生する。ここでは、送られてき
た等間隔パルスを元のグリッド位置に再配置し、等間隔
パルスが存在しないサンプル点には0を挿入する。次に
、長期予測合成器23により長期予測残差信号dにピッ
チ情報Peを付加し、短期予測残差信号eを再生する。 次に、短期予測合成器24により短期予測残差信号eに
スペクトル包絡情報Pfを付加して再生音声信号を出力
する。
【0005】
【発明が解決しようとする課題】上記の従来の方式の問
題点を図4を用いて説明する。図4(A)は、長期予測
残差信号bのスペクトルであり、これを図4(B)の理
想LPFによりフィルタリングすれば、図4(C)のよ
うな信号が得られ、これを1/3のダウンサンプリング
しても折り返し歪みは発生しない。しかし、従来の方式
でのフィルタリングは、時間領域で理想LPFのインパ
ルス応答と長期予測残差信号列との畳み込みを行うこと
により実現しており、無限長であるはずのインパルス応
答を11サンプルのみで打ち切っているため、図4(D
)のようなスペクトルとなり、これによりフィルタリン
グされた信号は、図4(E)のようになる。これを1/
3にダウンサンプリングすれば、図4(F)に示すよう
にな折り返し歪み(斜線部分)が生じる。これが再生音
に影響し、1人の発声した音声があたかも2人が発声し
ているように聞こえる現象が起きる。また、折り返し歪
みが大きくなるため、これ以上長期予測残差信号のサン
プルを間引くことが出来ず、符号化速度をこれより低く
するのは困難である。
【0006】以上をまとめると従来の方式の欠点は、次
のようになる。 (1)  LPFの不完全さによる折り返し歪みが発生
し再生音の品質が劣化する。 (2)  低ビットレート化が困難である。
【0007】本発明の目的は、従来方式の欠点となって
いる折り返し歪みによる品質への悪影響を軽減し、さら
に低い符号化速度での音声符復号化方法及びその装置を
提供することである。
【0008】
【課題を解決するための手段】図1は本発明の実施例を
示す音声符復号化装置のブロック図であり、(A)は音
声符号化装置、(B)は音声復号装置である。
【0009】図1(A)において、8kHzサンプリン
グで8ビット量子化された入力音声信号(64Kbps
)は短期予測分析器31により1フレーム毎(160サ
ンプル:20msec)に短期予測分析が施される。 即ち入力音声信号からスペクトル包絡情報Pgを抽出し
て出力するとともに、スペクトル包絡成分を取り除いた
信号である短期予測残差信号g(160サンプル)を生
成して出力する。次に、この短期予測残差信号gは、長
期予測分析器32により4つのサブフレーム(40サン
プル)に分割され、サブフレーム毎にピッチ情報Phを
抽出して出力するとともに、さらにピッチ成分を取り除
いた信号である長期予測残差信号h(40サンプル)を
生成して出力する。この長期予測残差信号h(40サン
プル)は離散コサイン変換(DCT)器33により周波
数領域に変換されDCT係数iを出力する。DCTの変
換式については後述する。次にDCT係数i(40サン
プル)は、間引き器34により間引かれ7サンプルによ
り代表される。図2は間引き方法の説明図である。図2
(A)は長期予測残差信号をDCT変換した結果である
。これを同図(B)のように、まず、1.33[kHz
]以上の係数を間引く。これは従来の方式の場合のLP
Fにより1/3に帯域制限するのと同じ作用をするが、
周波数領域で成分を消去しているので1.33[kHz
]以上の成分が残らず、折り返し歪みが軽減される。 また、さらに符号化速度を低くするために、同図におい
て実線,点線のうち電力の大きいほうを選択し7サンプ
ルを選出する。これらがDCT係数情報Piとなる。上
記のPg,Ph及びPiは、符号化器35により符号化
及び多重化されたディジタル系列として受信側に対して
送出される。このときの各パラメータに対する1フレー
ムあたりのビット割り当ては、表2のようになる。但し
、DCT係数情報Piとしては、その7サンプル中の最
大値とそれにより正規化された7サンプル及び位置情報
(グリッド番号)とにより構成される。
【表2】   1フレームは20msecであるので、符号化速度
は9.2Kbpsとなり、低ビットレート化を実現する
ことができる。
【0010】図1(B)では受信したディジタル系列は
分離回路41により、DCT係数情報Pj,ピッチ情報
Pk及びスペクトル包絡情報Pmとに分離した後、DC
T係数補間器42によりDCT係数jを再生する。ここ
では、図2(C)に示すように、送られてきたDCT係
数(7サンプル)を元の周波数位置に再配置し、DCT
係数が存在しないサンプル点に0を挿入するか、または
、補間処理により得られた値を挿入する。補間方法の1
例として、直線補間を用いた場合を図2(D)に示す。 ここでは等間隔に間引かれた成分のみ直線補間し、その
他の間引かれた成分に0を挿入して40サンプルとして
いる。次に、逆DCT変換(IDCT)器43により時
間領域に変換し長期予測残差信号kを再生する。次に、
長期予測合成器44により長期予測残差信号kにピッチ
情報Pkを付加し短期予測残差信号mを再生する。 次に、短期予測合成器45により短期予測残差信号mに
スペクトル包絡情報Pmを付加して再生音声信号を出力
する。
【0011】DCT及びIDCTの変換式は、入力信号
をX(n)とするとそれぞれ次のようになる。(1) 
 DCTの場合、求めるDCT係数Xc(k)は、但し
、Nはブロック当たりのサンプル数g(k)=1(k=
0) g(k)=√2(k=1,2…,N−1)(2)  I
DCTの場合、復元される信号X(n)は、
【0012
【発明の効果】以上詳細に説明したように、本発明を実
施することにより、周波数領域でDCT係数を間引いて
いるため折り返し歪みが発生せず、従来の方法に比べ再
生音声の品質は向上する。また、僅かな品質劣化を伴う
が、9.2Kbpsまで符号化速度を下げることも可能
となる等極めて大きい効果がある。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図
【図2】本発
明の間引き方法の説明図
【図3】従来の音声符復号化装置のブロック図
【図4】
折り返し歪み発生の説明図
【符号の説明】
11  短期予測分析器 12  長期予測分析器 13  LPF 14  グリッド選択器 15  符号化器 21  分離回路 22  長期予測残差再生器 23  長期予測合成器 24  短期予測合成器 31  短期予測分析器 32  長期予測分析器 33  離散コサイン変換(DCT)器34  間引き
器 35  符号化器 41  分離回路 42  DCT係数補間器 43  逆離散コサイン変換(IDCT)器44  長
期予測合成器 45  短期予測合成器

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】  入力音声信号を短期予測分析によりス
    ペクトル包絡情報を抽出するとともに該スペクトル包絡
    情報を取り除いた短期予測残差信号を生成し、長期予測
    分析により該短期予測残差信号からピッチ情報を抽出す
    るとともに該ピッチ情報を取り除いた長期予測残差信号
    を生成し、それを離散コサイン変換により周波数領域に
    変換して周波数成分であるDCT係数を出力し、該DC
    T係数を高域から全体の2/3の成分を消去するととも
    に残りの1/3のDCT係数を等間隔に間引いてDCT
    係数情報を出力し、該DCT係数情報,前記ピッチ情報
    及び前記スペクトル包絡情報とをディジタル列信号の形
    態に符号化した後多重化して伝送路に送出し、該伝送路
    を介して受信した前記ディジタル列信号を分離して前記
    DCT係数情報,前記ピッチ情報及び前記スペクトル包
    絡情報を取り出し、該DCT係数情報を再生処理してD
    CT係数を元の周波数に再配置したのち間引かれた成分
    の代わりに全て0を挿入するか又は補間により得られた
    値を挿入することにより全ての周波数成分を再生した後
    、逆コサイン変換により時間領域に変換して長期予測残
    差信号を再生し、長期予測合成により該長期予測残差信
    号に前記ピッチ情報を付加して短期予測残差信号を再生
    し、次に短期予測合成により該短期予測残差信号に前記
    スペクトル包絡情報を付加することにより音声信号を復
    号再生するようにした音声符復号化方法。
  2. 【請求項2】  入力音声信号をスペクトル包絡情報と
    該音声信号からスペクトル包絡成分を取り除いた短期予
    測残差信号に分割出力する短期予測分析器と、前記短期
    予測残差信号をピッチ情報とピッチ成分を取り除いた長
    期予測残差信号に分割出力する長期予測分析器と、前記
    長期予測残差信号を周波数領域に変換してDCT係数を
    出力する離散コサイン変換器と、該DCT係数を高域か
    ら全体の2/3の成分を消去するとともに残りの1/3
    のDCT係数を等間隔に間引いてDCT係数情報を取り
    出す間引き器と、前記スペクトル包絡情報,ピッチ情報
    およびDCT係数情報とをディジタル列信号の形態に符
    号化したのち多重化して伝送路に送出する符号化器とを
    備えた音声符号化装置。
  3. 【請求項3】  DCT係数情報,ピッチ情報及びスペ
    クトル包絡情報とを含んでディジタル列信号の形態に符
    号化され多重化された信号を受信し、該ディジタル列信
    号を分離して前記DCT係数情報,前記ピッチ情報及び
    前記スペクトル包絡情報を取り出す分離器と、該DCT
    係数情報を元の周波数に再配置して間引かれた周波数成
    分の代わりに0を挿入するか又は補間により得られた値
    を挿入することにより全ての周波数成分のDCT係数を
    再生するDCT係数補間器と、該DCT係数を逆コサイ
    ン変換して時間領域に変換し長期予測残差信号を再生す
    る逆コサイン変換器と、該長期予測残差信号に前記ピッ
    チ情報を付加し短期予測残差信号を再生する長期予測合
    成器と、該短期予測残差信号に前記スペクトル包絡情報
    を付加して音声信号を復号再生する短期予測合成器とを
    備えた音声復号装置。
JP3035149A 1991-02-05 1991-02-05 音声符復号化方法及びその装置 Pending JPH04249300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3035149A JPH04249300A (ja) 1991-02-05 1991-02-05 音声符復号化方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3035149A JPH04249300A (ja) 1991-02-05 1991-02-05 音声符復号化方法及びその装置

Publications (1)

Publication Number Publication Date
JPH04249300A true JPH04249300A (ja) 1992-09-04

Family

ID=12433847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3035149A Pending JPH04249300A (ja) 1991-02-05 1991-02-05 音声符復号化方法及びその装置

Country Status (1)

Country Link
JP (1) JPH04249300A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002050814A1 (fr) * 2000-12-07 2002-06-27 Kabushiki Kaisha Kenwood Systeme et procede d'interpolation de signaux
JP2003510644A (ja) * 1999-09-22 2003-03-18 マイクロソフト コーポレイション スーパーフレーム構造のlpcハーモニックボコーダ
JP2008083363A (ja) * 2006-09-27 2008-04-10 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2008102520A (ja) * 2006-10-18 2008-05-01 Polycom Inc オーディオ信号の2重変換符号化

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003510644A (ja) * 1999-09-22 2003-03-18 マイクロソフト コーポレイション スーパーフレーム構造のlpcハーモニックボコーダ
WO2002050814A1 (fr) * 2000-12-07 2002-06-27 Kabushiki Kaisha Kenwood Systeme et procede d'interpolation de signaux
JP2008083363A (ja) * 2006-09-27 2008-04-10 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
JP2008102520A (ja) * 2006-10-18 2008-05-01 Polycom Inc オーディオ信号の2重変換符号化

Similar Documents

Publication Publication Date Title
JP5048697B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体
JP4567238B2 (ja) 符号化方法、復号化方法、符号化器、及び復号化器
JP3336617B2 (ja) 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体
JP3926726B2 (ja) 符号化装置および復号化装置
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
US6415251B1 (en) Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JPH10282999A (ja) オーディオ信号を符号化する方法及び装置、並びに符号化されたオーディオ信号を復号する方法及び装置
JP2976860B2 (ja) 再生装置
CA2399253C (en) Speech decoder and method of decoding speech involving frequency expansion
JP4308229B2 (ja) 符号化装置および復号化装置
KR100352351B1 (ko) 정보부호화방법및장치와정보복호화방법및장치
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
KR100750115B1 (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
JPH04249300A (ja) 音声符復号化方法及びその装置
JP2002538503A (ja) ディジタルオーディオデータの逆方向デコーディング方法
JP3593201B2 (ja) オーディオ復号装置
JPH05303399A (ja) 音声時間軸圧縮伸長装置
JP2001083995A (ja) サブバンド符号化・復号方法
JP3778739B2 (ja) オーディオ信号再生装置およびオーディオ信号再生方法
KR920009960B1 (ko) 잔여신호 여기식 선형예측 부호화 합성장치
JP2000244325A (ja) Mpegオーディオの復号化方法
JP2001094432A (ja) サブバンド符号化・復号方法
JPS58204632A (ja) 音声符号化方法とその装置
JPH01233498A (ja) 音声符号化装置