JPH05143099A - 音声符号化・復号化装置 - Google Patents
音声符号化・復号化装置Info
- Publication number
- JPH05143099A JPH05143099A JP3310493A JP31049391A JPH05143099A JP H05143099 A JPH05143099 A JP H05143099A JP 3310493 A JP3310493 A JP 3310493A JP 31049391 A JP31049391 A JP 31049391A JP H05143099 A JPH05143099 A JP H05143099A
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- pitch
- decoding
- basic waveform
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
長期予測を用いピッチ誤りが起らないようにする。 【構成】 第1に、アナログからディジタル音声信号を
得るA/D変換部1と、以前の符号を復号化して得られ
る合成波形が格納されている合成波形格納部2と、ディ
ジタル音声信号に対してピッチ分析と長期予測分析を行
ない長期予測係数と1ピッチの基本波形とを求める音響
分析部3と、音響分析部3で得られる1ピッチの基本波
形を符号化する基本波形符号化部4と、音響分析部3と
基本波形符号化部4での符号に基づき合成音を作成し合
成波形格納部2に格納する音声合成部5とを設ける。第
2は、1ピッチの基本波形を復号化する基本波形復号化
部7と、ディジタル音声信号を復号化する音声波形復号
化部7と、音声波形復号化部7の出力したディジタル音
声信号をアナログ音声信号に変換するA/D変換部8と
を設ける。
Description
ための音声コーデックや、各種機器の音声出力のための
音声合成器に使用される音声符号化・復号化装置に関す
るものである。
加入者の増加に対応するために、より低ビットレートの
音声符号化法が求められており、各研究機関で研究開発
が行われている。そして、現在ではビットレート8kb
psまでが標準化されており、各研究機関は、4.8kbps
程度の低ビットレートに向って研究開発を行っている。
しかし、十分な性能を持つ音声符号化・復号化装置はま
だ得られていない。
通りの方法に分けることができる。まず、第1の方法
は、CELPに代表されるように、ある分析区間におけ
る音声をLPC系パラメータと駆動音源によって符号化
し、ピッチ成分は長期予測フィルターによって作り出す
という方法である。この方法は6.7kbps〜16kbpsの中ビ
ットレートにおいては現在最も効率の良い方法である。
しかし、4kbps以下ではかなりの音質低下が見られ、低
ビットレートを実現するのは難しい。
波数を持った有声音であることを利用し、ピッチ分析を
行ってピッチと1ピッチ波形のみを伝送するという方法
である。この方法は6kbps以下の符号化においてはかな
り有効で、低ビットレートを実現する最も有力な方法と
言える。しかし、ピッチ検出には誤りが必ず発生する。
また、ピッチ検出に要する計算量はかなり多く、リアル
タイムでのピッチ検出は難しいと言える。
レートの実現は難しいとされてきた。
の音声符号化・復号化技術では、低ビットレートを実現
するのが困難であった。それは、長期予測では十分な音
質は得られず、また、ピッチ同期ではピッチ検出が困難
であったからである。
長所をあわせ、ピッチ同期の符号化に長期予測を用いて
ピッチ誤りが起らないようにすることによって、低ビッ
トレートを実現することを目的とする。
に、本発明の第1の発明は、アナログ音声信号からディ
ジタル音声信号を得るA/D変換部と、以前の符号を復
号化して得られる合成波形が格納されている合成波形格
納部と、ある区間のディジタル音声信号に対してピッチ
分析と長期予測分析を行なって長期予測係数と1ピッチ
の基本波形とを求める音響分析部と、音響分析部で得ら
れる1ピッチの基本波形を符号化する基本波形符号化部
と、音響分析部と基本波形符号化部で得られる符号に基
づいて合成音を作成して合成波形格納部に格納する音声
合成部とを設けるように構成される。
基本波形を復号化する基本波形復号化部と、ある区間の
ディジタル音声信号を復号化する音声波形復号化部と、
音声波形復号化部の出力したディジタル音声信号をアナ
ログ音声信号に変換するD/A変換部とを設けるように
構成される。
形を符号化することによって低ビットレートを実現する
ことができ、長期予測を使用するためにピッチ誤りを防
ぐことができる。従って、低ビットレートの音声符号化
を効率良く行うことができる。
しながら説明する。
成波形格納部、3は音響分析部、4は基本波形符号化
部、5は音声合成部、6は基本波形復号化部、7は音声
波形復号化部、8はD/A変換部、10は符号器、11
は復号器である。
号化・復号化装置の動作を説明する。
いて説明する。マイク(図示せず)から入力した入力音
声をA/D変換部1でディジタル信号に変換する。次に
音響分析部3において、一定時間の音声信号をRAMメ
モリー(図示せず)に取込み、この分析区間と合成波形
格納部2に格納されている合成波形との相関の分析と、
分析区間のピッチ分析とを同時に行い、相関のある合成
波形の部分区間の位置と1ピッチの基本波形とを求め
る。このパラメータと基本波形の抽出方法については、
後に詳細に説明する。
音響分析部3において得られた基本波形を符号化する。
具体的な方法としては、位相を合せて波形のままVQす
る方法や、周波数領域に変換してから符号化する方法等
が挙げられる。
形符号化部4において得られた符号に基づいて1ピッチ
の基本波形を復号化し、音響分析部3において抽出した
長期予測係数と上記基本波形とを用いて復号化を行い、
得られた合成波形を合成波形格納部2に格納する。この
音声合成部5の機能は、復号器11における基本波形復
号化部6と音声波形復号化部7の機能を合せたものであ
るので、その詳細は復号器11の説明の際に述べる。
と基本波形の抽出方法について、詳細に説明する。本発
明の合成の式を(数1)に示す。
qはピッチ周期、βは長期予測係数、pは長期予測のピ
ッチ、Xnq+i,Xnq+i-pはいずれも合成波形、Yiは復
号化された1ピッチの基本波形である。
が原波形に最も近くなるようにp、q、β、Yiを求め
る。
下の(数3)のようになる。
内のピッチ周期の数である。そこで、このEが最小の時
は、β、Yiで微分したものがいずれも0になることを
利用する。まず、βで微分すると(数4)が得られる。
用いて、式を簡略化してβについて解くと、(数7)が
得られる。
8)が得られる。
を求め、その値を用いて各Ykを求める。これを、全て
のp、qについて行い、誤差Eを評価して最も誤差の少
ないp、qを選ぶ。
な計算量を必要とする。この計算量を削減する方法とし
ては、Vpの値でpおよびqの候補を絞り込んで探索す
る方法や、qをVpの最大の時のpの値にする方法等が
挙げられる。
いて説明する。まず、基本波形復号化部6において、1
ピッチの基本波形を合成する。そして、音声波形復号化
部7において、基本波形復号化部6において合成された
1ピッチの基本波形と、長期予測係数とを用いて合成式
(数1)に基づいて1分析区間の音声波形を合成する。
そして、D/A変換部8でアナログ信号に変換して出力
する。
の効果を検証するために、音声符号化・復号化の予備シ
ミュレーション実験を行った。評価用音声は男性1名が
発声した「爆音が銀世界の高原に広がる」で、サンプリ
ングレート8kHz、12bit-PCMで符号化したもので
ある。また、シミュレーションでは基本波形の符号化・
復号化やβのスカラ符号化を行わず、そのままを用い
た。p、qはいずれも7ビットで符号化した。その結
果、セグメンタルS/N比で13.75dBが得られ、
ピッチ誤りも起らなかった。また、1ピッチ波形は14
〜20dBで符号化できることを考慮すると、S/N比
9〜12dBで符号化ができる。したがって、上記目的
を達成することが可能となる。
符号化に長期予測を用いてピッチ誤りが起らないように
したので、ピッチ誤りを起こさずに低ビットレートで音
声を符号化および復号化することができる。
装置のブロック結線図。
Claims (2)
- 【請求項1】 アナログ音声信号からディジタル音声信
号を得るA/D変換部と、以前の符号を復号化して得ら
れる合成波形が格納されている合成波形格納部と、ある
区間のディジタル音声信号に対してピッチ分析と長期予
測分析を行なって長期予測係数と1ピッチの基本波形と
を求める音響分析部と、前記音響分析部で得られる1ピ
ッチの基本波形を符号化する基本波形符号化部と、前記
音響分析部と前記基本波形符号化部で得られる符号に基
づいて合成音を作成して前記合成波形格納部に格納する
音声合成部とを有する音声符号化装置。 - 【請求項2】 1ピッチの基本波形を復号化する基本波
形復号化部と、ある区間のディジタル音声信号を復号化
する音声波形復号化部と、前記音声波形復号化部の出力
したディジタル音声信号をアナログ音声信号に変換する
D/A変換部とを有する音声復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31049391A JP3328945B2 (ja) | 1991-11-26 | 1991-11-26 | 音声符号化装置、音声符号化方法及び音声復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31049391A JP3328945B2 (ja) | 1991-11-26 | 1991-11-26 | 音声符号化装置、音声符号化方法及び音声復号化方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002030538A Division JP3428594B2 (ja) | 2002-02-07 | 2002-02-07 | 音声符号化装置、音声復号化装置、音声符号化方法及び音声復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05143099A true JPH05143099A (ja) | 1993-06-11 |
JP3328945B2 JP3328945B2 (ja) | 2002-09-30 |
Family
ID=18005893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP31049391A Expired - Lifetime JP3328945B2 (ja) | 1991-11-26 | 1991-11-26 | 音声符号化装置、音声符号化方法及び音声復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3328945B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6553343B1 (en) | 1995-12-04 | 2003-04-22 | Kabushiki Kaisha Toshiba | Speech synthesis method |
JP2004348120A (ja) * | 2003-04-30 | 2004-12-09 | Matsushita Electric Ind Co Ltd | 音声符号化装置、音声復号化装置及びこれらの方法 |
JP4842472B2 (ja) * | 1999-07-19 | 2011-12-21 | クゥアルコム・インコーポレイテッド | フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置 |
-
1991
- 1991-11-26 JP JP31049391A patent/JP3328945B2/ja not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6553343B1 (en) | 1995-12-04 | 2003-04-22 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US7184958B2 (en) | 1995-12-04 | 2007-02-27 | Kabushiki Kaisha Toshiba | Speech synthesis method |
JP4842472B2 (ja) * | 1999-07-19 | 2011-12-21 | クゥアルコム・インコーポレイテッド | フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置 |
JP2004348120A (ja) * | 2003-04-30 | 2004-12-09 | Matsushita Electric Ind Co Ltd | 音声符号化装置、音声復号化装置及びこれらの方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3328945B2 (ja) | 2002-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7496505B2 (en) | Variable rate speech coding | |
JP4824167B2 (ja) | 周期的スピーチコーディング | |
US6260009B1 (en) | CELP-based to CELP-based vocoder packet translation | |
JP4270866B2 (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
US6138092A (en) | CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency | |
US6094629A (en) | Speech coding system and method including spectral quantizer | |
JP3446764B2 (ja) | 音声合成システム及び音声合成サーバ | |
WO2004068893A2 (en) | Method and apparatus for noise suppression within a distributed speech recognition system | |
Jagtap et al. | Speech coding techniques | |
JP3328945B2 (ja) | 音声符号化装置、音声符号化方法及び音声復号化方法 | |
JP3428594B2 (ja) | 音声符号化装置、音声復号化装置、音声符号化方法及び音声復号化方法 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
Shoham | Low complexity speech coding at 1.2 to 2.4 kbps based on waveform interpolation | |
EP1212750A1 (en) | Multimode vselp speech coder | |
JPH09297597A (ja) | 高能率音声伝送方法及び高能率音声伝送装置 | |
Toosy et al. | Design and implementation of an LD-CELP codec | |
Skog et al. | Voice over IP application on TMS320C6701 EVM DSP Board | |
JPH053600B2 (ja) | ||
JP2000200097A (ja) | 音声符号化装置、音声復号化装置及び音声符号化復号化装置 | |
KR19980035867A (ko) | 음성 데이터 부호화/복호화장치 및 그 방법 | |
HK1117937A (en) | Variable rate speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070719 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080719 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090719 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090719 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100719 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110719 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110719 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120719 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120719 Year of fee payment: 10 |