[go: up one dir, main page]

JPH05143099A - 音声符号化・復号化装置 - Google Patents

音声符号化・復号化装置

Info

Publication number
JPH05143099A
JPH05143099A JP3310493A JP31049391A JPH05143099A JP H05143099 A JPH05143099 A JP H05143099A JP 3310493 A JP3310493 A JP 3310493A JP 31049391 A JP31049391 A JP 31049391A JP H05143099 A JPH05143099 A JP H05143099A
Authority
JP
Japan
Prior art keywords
waveform
pitch
decoding
basic waveform
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3310493A
Other languages
English (en)
Other versions
JP3328945B2 (ja
Inventor
Toshiyuki Morii
利幸 森井
Taisuke Watanabe
泰助 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP31049391A priority Critical patent/JP3328945B2/ja
Publication of JPH05143099A publication Critical patent/JPH05143099A/ja
Application granted granted Critical
Publication of JP3328945B2 publication Critical patent/JP3328945B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【目的】 音声合成器において、ピッチ同期の符号化に
長期予測を用いピッチ誤りが起らないようにする。 【構成】 第1に、アナログからディジタル音声信号を
得るA/D変換部1と、以前の符号を復号化して得られ
る合成波形が格納されている合成波形格納部2と、ディ
ジタル音声信号に対してピッチ分析と長期予測分析を行
ない長期予測係数と1ピッチの基本波形とを求める音響
分析部3と、音響分析部3で得られる1ピッチの基本波
形を符号化する基本波形符号化部4と、音響分析部3と
基本波形符号化部4での符号に基づき合成音を作成し合
成波形格納部2に格納する音声合成部5とを設ける。第
2は、1ピッチの基本波形を復号化する基本波形復号化
部7と、ディジタル音声信号を復号化する音声波形復号
化部7と、音声波形復号化部7の出力したディジタル音
声信号をアナログ音声信号に変換するA/D変換部8と
を設ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル移動通信の
ための音声コーデックや、各種機器の音声出力のための
音声合成器に使用される音声符号化・復号化装置に関す
るものである。
【0002】
【従来の技術】ディジタル移動通信の分野においては、
加入者の増加に対応するために、より低ビットレートの
音声符号化法が求められており、各研究機関で研究開発
が行われている。そして、現在ではビットレート8kb
psまでが標準化されており、各研究機関は、4.8kbps
程度の低ビットレートに向って研究開発を行っている。
しかし、十分な性能を持つ音声符号化・復号化装置はま
だ得られていない。
【0003】低ビットレートを実現する技術は、次の2
通りの方法に分けることができる。まず、第1の方法
は、CELPに代表されるように、ある分析区間におけ
る音声をLPC系パラメータと駆動音源によって符号化
し、ピッチ成分は長期予測フィルターによって作り出す
という方法である。この方法は6.7kbps〜16kbpsの中ビ
ットレートにおいては現在最も効率の良い方法である。
しかし、4kbps以下ではかなりの音質低下が見られ、低
ビットレートを実現するのは難しい。
【0004】第2の方法は、人の音声の大部分が基本周
波数を持った有声音であることを利用し、ピッチ分析を
行ってピッチと1ピッチ波形のみを伝送するという方法
である。この方法は6kbps以下の符号化においてはかな
り有効で、低ビットレートを実現する最も有力な方法と
言える。しかし、ピッチ検出には誤りが必ず発生する。
また、ピッチ検出に要する計算量はかなり多く、リアル
タイムでのピッチ検出は難しいと言える。
【0005】したがって、上記の理由により、低ビット
レートの実現は難しいとされてきた。
【0006】
【発明が解決しようとする課題】上述したように、従来
の音声符号化・復号化技術では、低ビットレートを実現
するのが困難であった。それは、長期予測では十分な音
質は得られず、また、ピッチ同期ではピッチ検出が困難
であったからである。
【0007】本発明は、上記課題に鑑み、2つの方法の
長所をあわせ、ピッチ同期の符号化に長期予測を用いて
ピッチ誤りが起らないようにすることによって、低ビッ
トレートを実現することを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に、本発明の第1の発明は、アナログ音声信号からディ
ジタル音声信号を得るA/D変換部と、以前の符号を復
号化して得られる合成波形が格納されている合成波形格
納部と、ある区間のディジタル音声信号に対してピッチ
分析と長期予測分析を行なって長期予測係数と1ピッチ
の基本波形とを求める音響分析部と、音響分析部で得ら
れる1ピッチの基本波形を符号化する基本波形符号化部
と、音響分析部と基本波形符号化部で得られる符号に基
づいて合成音を作成して合成波形格納部に格納する音声
合成部とを設けるように構成される。
【0009】また、本発明の第2の発明は、1ピッチの
基本波形を復号化する基本波形復号化部と、ある区間の
ディジタル音声信号を復号化する音声波形復号化部と、
音声波形復号化部の出力したディジタル音声信号をアナ
ログ音声信号に変換するD/A変換部とを設けるように
構成される。
【0010】
【作用】本発明の上記構成によって、1ピッチの基本波
形を符号化することによって低ビットレートを実現する
ことができ、長期予測を使用するためにピッチ誤りを防
ぐことができる。従って、低ビットレートの音声符号化
を効率良く行うことができる。
【0011】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。
【0012】図1において、1はA/D変換部、2は合
成波形格納部、3は音響分析部、4は基本波形符号化
部、5は音声合成部、6は基本波形復号化部、7は音声
波形復号化部、8はD/A変換部、10は符号器、11
は復号器である。
【0013】次に、本発明の第1の実施例による音声符
号化・復号化装置の動作を説明する。
【0014】まず、符号器10の機能について図1を用
いて説明する。マイク(図示せず)から入力した入力音
声をA/D変換部1でディジタル信号に変換する。次に
音響分析部3において、一定時間の音声信号をRAMメ
モリー(図示せず)に取込み、この分析区間と合成波形
格納部2に格納されている合成波形との相関の分析と、
分析区間のピッチ分析とを同時に行い、相関のある合成
波形の部分区間の位置と1ピッチの基本波形とを求め
る。このパラメータと基本波形の抽出方法については、
後に詳細に説明する。
【0015】さらに、基本波形符号化部4においては、
音響分析部3において得られた基本波形を符号化する。
具体的な方法としては、位相を合せて波形のままVQす
る方法や、周波数領域に変換してから符号化する方法等
が挙げられる。
【0016】ここで、音声合成部5においては、基本波
形符号化部4において得られた符号に基づいて1ピッチ
の基本波形を復号化し、音響分析部3において抽出した
長期予測係数と上記基本波形とを用いて復号化を行い、
得られた合成波形を合成波形格納部2に格納する。この
音声合成部5の機能は、復号器11における基本波形復
号化部6と音声波形復号化部7の機能を合せたものであ
るので、その詳細は復号器11の説明の際に述べる。
【0017】ここで、音響分析部3におけるパラメータ
と基本波形の抽出方法について、詳細に説明する。本発
明の合成の式を(数1)に示す。
【0018】
【数1】
【0019】この(数1)で、nはピッチ区間の番号、
qはピッチ周期、βは長期予測係数、pは長期予測のピ
ッチ、Xnq+i,Xnq+i-pはいずれも合成波形、Yiは復
号化された1ピッチの基本波形である。
【0020】そこで、この合成式により合成される波形
が原波形に最も近くなるようにp、q、β、Yiを求め
る。
【0021】今、p、qが与えられていると、原波形
【0022】
【数2】
【0023】と(数1)の合成波形との誤差パワーは以
下の(数3)のようになる。
【0024】
【数3】
【0025】ここで、Eは誤差パワー、Mは1分析区間
内のピッチ周期の数である。そこで、このEが最小の時
は、β、Yiで微分したものがいずれも0になることを
利用する。まず、βで微分すると(数4)が得られる。
【0026】
【数4】
【0027】そこで、下記の(数5)および(数6)を
用いて、式を簡略化してβについて解くと、(数7)が
得られる。
【0028】
【数5】
【0029】
【数6】
【0030】
【数7】
【0031】一方、(数3)をYkで微分すると(数
8)が得られる。
【0032】
【数8】
【0033】そこで、(数8)を(数7)に代入してβ
を求め、その値を用いて各Ykを求める。これを、全て
のp、qについて行い、誤差Eを評価して最も誤差の少
ないp、qを選ぶ。
【0034】ただし、このp、qを全探索すると、多大
な計算量を必要とする。この計算量を削減する方法とし
ては、Vpの値でpおよびqの候補を絞り込んで探索す
る方法や、qをVpの最大の時のpの値にする方法等が
挙げられる。
【0035】次に、復号器11の機能について図1を用
いて説明する。まず、基本波形復号化部6において、1
ピッチの基本波形を合成する。そして、音声波形復号化
部7において、基本波形復号化部6において合成された
1ピッチの基本波形と、長期予測係数とを用いて合成式
(数1)に基づいて1分析区間の音声波形を合成する。
そして、D/A変換部8でアナログ信号に変換して出力
する。
【0036】本発明の音声符号化・復号化装置の符号化
の効果を検証するために、音声符号化・復号化の予備シ
ミュレーション実験を行った。評価用音声は男性1名が
発声した「爆音が銀世界の高原に広がる」で、サンプリ
ングレート8kHz、12bit-PCMで符号化したもので
ある。また、シミュレーションでは基本波形の符号化・
復号化やβのスカラ符号化を行わず、そのままを用い
た。p、qはいずれも7ビットで符号化した。その結
果、セグメンタルS/N比で13.75dBが得られ、
ピッチ誤りも起らなかった。また、1ピッチ波形は14
〜20dBで符号化できることを考慮すると、S/N比
9〜12dBで符号化ができる。したがって、上記目的
を達成することが可能となる。
【0037】
【発明の効果】以上のように、本発明は、ピッチ同期の
符号化に長期予測を用いてピッチ誤りが起らないように
したので、ピッチ誤りを起こさずに低ビットレートで音
声を符号化および復号化することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声符号化・復号化
装置のブロック結線図。
【符号の説明】
1 A/D変換部 2 合成波形格納部 3 音響分析部 4 基本波形符号化部 5 音声合成部 6 基本波形復号化部 7 音声波形復号化部 8 D/A変換部 9 伝送路 10 符号器 11 復号器

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 アナログ音声信号からディジタル音声信
    号を得るA/D変換部と、以前の符号を復号化して得ら
    れる合成波形が格納されている合成波形格納部と、ある
    区間のディジタル音声信号に対してピッチ分析と長期予
    測分析を行なって長期予測係数と1ピッチの基本波形と
    を求める音響分析部と、前記音響分析部で得られる1ピ
    ッチの基本波形を符号化する基本波形符号化部と、前記
    音響分析部と前記基本波形符号化部で得られる符号に基
    づいて合成音を作成して前記合成波形格納部に格納する
    音声合成部とを有する音声符号化装置。
  2. 【請求項2】 1ピッチの基本波形を復号化する基本波
    形復号化部と、ある区間のディジタル音声信号を復号化
    する音声波形復号化部と、前記音声波形復号化部の出力
    したディジタル音声信号をアナログ音声信号に変換する
    D/A変換部とを有する音声復号化装置。
JP31049391A 1991-11-26 1991-11-26 音声符号化装置、音声符号化方法及び音声復号化方法 Expired - Lifetime JP3328945B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31049391A JP3328945B2 (ja) 1991-11-26 1991-11-26 音声符号化装置、音声符号化方法及び音声復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31049391A JP3328945B2 (ja) 1991-11-26 1991-11-26 音声符号化装置、音声符号化方法及び音声復号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002030538A Division JP3428594B2 (ja) 2002-02-07 2002-02-07 音声符号化装置、音声復号化装置、音声符号化方法及び音声復号化方法

Publications (2)

Publication Number Publication Date
JPH05143099A true JPH05143099A (ja) 1993-06-11
JP3328945B2 JP3328945B2 (ja) 2002-09-30

Family

ID=18005893

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31049391A Expired - Lifetime JP3328945B2 (ja) 1991-11-26 1991-11-26 音声符号化装置、音声符号化方法及び音声復号化方法

Country Status (1)

Country Link
JP (1) JP3328945B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6553343B1 (en) 1995-12-04 2003-04-22 Kabushiki Kaisha Toshiba Speech synthesis method
JP2004348120A (ja) * 2003-04-30 2004-12-09 Matsushita Electric Ind Co Ltd 音声符号化装置、音声復号化装置及びこれらの方法
JP4842472B2 (ja) * 1999-07-19 2011-12-21 クゥアルコム・インコーポレイテッド フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6553343B1 (en) 1995-12-04 2003-04-22 Kabushiki Kaisha Toshiba Speech synthesis method
US7184958B2 (en) 1995-12-04 2007-02-27 Kabushiki Kaisha Toshiba Speech synthesis method
JP4842472B2 (ja) * 1999-07-19 2011-12-21 クゥアルコム・インコーポレイテッド フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
JP2004348120A (ja) * 2003-04-30 2004-12-09 Matsushita Electric Ind Co Ltd 音声符号化装置、音声復号化装置及びこれらの方法

Also Published As

Publication number Publication date
JP3328945B2 (ja) 2002-09-30

Similar Documents

Publication Publication Date Title
US7496505B2 (en) Variable rate speech coding
JP4824167B2 (ja) 周期的スピーチコーディング
US6260009B1 (en) CELP-based to CELP-based vocoder packet translation
JP4270866B2 (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
US6094629A (en) Speech coding system and method including spectral quantizer
JP3446764B2 (ja) 音声合成システム及び音声合成サーバ
WO2004068893A2 (en) Method and apparatus for noise suppression within a distributed speech recognition system
Jagtap et al. Speech coding techniques
JP3328945B2 (ja) 音声符号化装置、音声符号化方法及び音声復号化方法
JP3428594B2 (ja) 音声符号化装置、音声復号化装置、音声符号化方法及び音声復号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
Shoham Low complexity speech coding at 1.2 to 2.4 kbps based on waveform interpolation
EP1212750A1 (en) Multimode vselp speech coder
JPH09297597A (ja) 高能率音声伝送方法及び高能率音声伝送装置
Toosy et al. Design and implementation of an LD-CELP codec
Skog et al. Voice over IP application on TMS320C6701 EVM DSP Board
JPH053600B2 (ja)
JP2000200097A (ja) 音声符号化装置、音声復号化装置及び音声符号化復号化装置
KR19980035867A (ko) 음성 데이터 부호화/복호화장치 및 그 방법
HK1117937A (en) Variable rate speech coding

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070719

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080719

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090719

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090719

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100719

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110719

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110719

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120719

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120719

Year of fee payment: 10