JP2615664B2 - 音声符号化方式 - Google Patents
音声符号化方式Info
- Publication number
- JP2615664B2 JP2615664B2 JP62233855A JP23385587A JP2615664B2 JP 2615664 B2 JP2615664 B2 JP 2615664B2 JP 62233855 A JP62233855 A JP 62233855A JP 23385587 A JP23385587 A JP 23385587A JP 2615664 B2 JP2615664 B2 JP 2615664B2
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- evaluation function
- pulses
- impulse response
- predetermined number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 27
- 238000011156 evaluation Methods 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- DEFLNOSTNCSZRB-IDTAVKCVSA-N 9-[(2r,3r,4r,5r)-3,4-dimethoxy-5-(methoxymethyl)oxolan-2-yl]-n-methoxypurin-6-amine Chemical compound CO[C@@H]1[C@H](OC)[C@@H](COC)O[C@H]1N1C2=NC=NC(NOC)=C2N=C1 DEFLNOSTNCSZRB-IDTAVKCVSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声を低いビットレートで符号化する音声
符号化方式に関する。
符号化方式に関する。
10kbps前後の伝送ビットレートで、音声を効率的に符
号化する方法の一つに、音声を20ミリ秒程度の短い区間
に区切って、駆動音源列を探索し、駆動音源列を使って
再生された信号と入力音声との誤差が最小になるように
する方法が知られている。合成による分析手法(アナリ
シス−バイ−シンセシス法)を用いたアメリカのベル研
究所のビー・エス・アタール(B.S.Atal)によって提案
された方法(文献1)は注目に値し、その方法では、駆
動音源列は、前記方法によって、符号化器側で、短区間
毎に、いくつかのパルスの極性と大きさと、位置によっ
て表わされる。この方法の詳細は1982年のICASSP論文集
のpp.614〜617の、「A new model of LPC excitafion f
or producing natural−sounding speech of Low bit r
ates」という論文に書かれており、本願では省略する。
従来の方法の欠点は、アナリシス−バイ−シンセシス法
を用いているため、パルス列を求めるのに、ぼう大な演
算量を要するということである。
号化する方法の一つに、音声を20ミリ秒程度の短い区間
に区切って、駆動音源列を探索し、駆動音源列を使って
再生された信号と入力音声との誤差が最小になるように
する方法が知られている。合成による分析手法(アナリ
シス−バイ−シンセシス法)を用いたアメリカのベル研
究所のビー・エス・アタール(B.S.Atal)によって提案
された方法(文献1)は注目に値し、その方法では、駆
動音源列は、前記方法によって、符号化器側で、短区間
毎に、いくつかのパルスの極性と大きさと、位置によっ
て表わされる。この方法の詳細は1982年のICASSP論文集
のpp.614〜617の、「A new model of LPC excitafion f
or producing natural−sounding speech of Low bit r
ates」という論文に書かれており、本願では省略する。
従来の方法の欠点は、アナリシス−バイ−シンセシス法
を用いているため、パルス列を求めるのに、ぼう大な演
算量を要するということである。
一方、パルス列を求めるのに相関関数を用いるとい
う、別の方法(文献2)が提案されており、この方法
は、計算量を減らすように考えられており、荒関、小
沢、小野、落合によりIEEE Global Telecommunications
Conferenceにおいて、1983年12月発表された「Mnlti−
pulse Excifed Speech Codecr Bcsed on Maximum Cross
−Correlation Search Algorithn」という論文に書かれ
ている。相関を用いた様様な方法は、小沢、小野、荒関
によって提案されている(「A Stady on Pulse Search
Algorithms for Multi pulse Excited Speech Coder Re
alizction」IEEE Journal on Selecfed Areas in Commu
nications,vol.SAC−4 No.1,1986年1月)8〜16kbpsの
伝送ビットレートで優れた音質の再成方法をこれらの方
法によって得ることができる。
う、別の方法(文献2)が提案されており、この方法
は、計算量を減らすように考えられており、荒関、小
沢、小野、落合によりIEEE Global Telecommunications
Conferenceにおいて、1983年12月発表された「Mnlti−
pulse Excifed Speech Codecr Bcsed on Maximum Cross
−Correlation Search Algorithn」という論文に書かれ
ている。相関を用いた様様な方法は、小沢、小野、荒関
によって提案されている(「A Stady on Pulse Search
Algorithms for Multi pulse Excited Speech Coder Re
alizction」IEEE Journal on Selecfed Areas in Commu
nications,vol.SAC−4 No.1,1986年1月)8〜16kbpsの
伝送ビットレートで優れた音質の再成方法をこれらの方
法によって得ることができる。
従来の相関を用いる方法について、簡単に説明する。
切り出された20ミリ秒程度の音声区間(以後フレームと
云う)に、K個のパルス列からなる駆動音源列は、次式
のように表わせる。
切り出された20ミリ秒程度の音声区間(以後フレームと
云う)に、K個のパルス列からなる駆動音源列は、次式
のように表わせる。
ここに、δ(・)はクロネッカーのデルタ、Nはフレー
ム長、gkは位置mkにおけるパルスの振幅を表わす。
ム長、gkは位置mkにおけるパルスの振幅を表わす。
あるフレームの音声の共分散から、合成フィルタの係
数である線形予測係数(LPCパラメータ)を求める。
数である線形予測係数(LPCパラメータ)を求める。
合成フィルタの伝達関数は、Z変換表現で、次式のよ
うに表わせる。
うに表わせる。
ここでaiは合成フィルタの係数で、Pはフィルタの次数
である。h(n)を合成フィルタのインパルス応答とす
ると、駆動音源パルス列V(n)を合成フィルタに入力
して得られる、フィルタの出力である再生信号Y(n)
は、次式で表わせる。
である。h(n)を合成フィルタのインパルス応答とす
ると、駆動音源パルス列V(n)を合成フィルタに入力
して得られる、フィルタの出力である再生信号Y(n)
は、次式で表わせる。
ここで、*はたたみ込み積分を表わす。
入力信号X(n)と再生信号Y(n)の1フレームの
重み付け平均2乗誤差パワーEは、 と表わされ、ここで、W(n)は重み付け関数である。
重み付け関数W(n)は再生音声の聴感上の重み付け歪
を減少させるために導入された。音響的マスク効果によ
って、音声エネルギーの大きい帯域のノイズは聞こえに
くいという傾向がある。重み付け関数は、この音響的性
質に基いて決められる。重み付け関数W(n)の伝導特
性はZ変換表現で次式のように表わせる。
重み付け平均2乗誤差パワーEは、 と表わされ、ここで、W(n)は重み付け関数である。
重み付け関数W(n)は再生音声の聴感上の重み付け歪
を減少させるために導入された。音響的マスク効果によ
って、音声エネルギーの大きい帯域のノイズは聞こえに
くいという傾向がある。重み付け関数は、この音響的性
質に基いて決められる。重み付け関数W(n)の伝導特
性はZ変換表現で次式のように表わせる。
ここで、rは正の定数で0≦r≦1である。
式(4)は、次式のように書きかえることができる。
ここで、Xw(n)とhw(n)はそれぞれX(n)とh
(n)の重み付け信号である。
(n)の重み付け信号である。
既に、k−1個のパルスが求められていると仮定する
と、k番目のパルスの位置mkは、誤差パワーEのk番目
のパルスの振幅gkに対する偏微分を零とおくことによ
り、1≦mk≦Nの範囲で求めることができる。
と、k番目のパルスの位置mkは、誤差パワーEのk番目
のパルスの振幅gkに対する偏微分を零とおくことによ
り、1≦mk≦Nの範囲で求めることができる。
上式から、最適なパルス位置mkは、gkの絶対値が最大と
なる位置である。フレームの端の条件を適切に扱えば、
上式は、次式のように簡単化できる。
なる位置である。フレームの端の条件を適切に扱えば、
上式は、次式のように簡単化できる。
ここで で、重み付き音声入力Xw(n)と重み付きインパルス応
答hw(n)の相互相関、 は、重み付きインパルス応答hw(n)の自己相関であ
る。
答hw(n)の相互相関、 は、重み付きインパルス応答hw(n)の自己相関であ
る。
実際のパルス探索は、評価関数R(n)を用いて行な
われる。まず、1段目の処理(k=1)では、R(n)
は相互相関Rhx(n)と同じである。R(n)の絶対値
の最大の位置を探索し、最適なパルス位置が決められ
る。パルス振幅は式(8)に得られた位置m1を代入して
決める。R(n)は積gkRhh(n)をR(n)から引い
た値に修正される。kを1増して、次のパルス探索を、
最大の相互相関探索法に基づいて、予め決めた数のパル
スが求まるまで繰り返す。k番目の段を開始する時にお
けるR(n)の値 は、次式のように表わせる。
われる。まず、1段目の処理(k=1)では、R(n)
は相互相関Rhx(n)と同じである。R(n)の絶対値
の最大の位置を探索し、最適なパルス位置が決められ
る。パルス振幅は式(8)に得られた位置m1を代入して
決める。R(n)は積gkRhh(n)をR(n)から引い
た値に修正される。kを1増して、次のパルス探索を、
最大の相互相関探索法に基づいて、予め決めた数のパル
スが求まるまで繰り返す。k番目の段を開始する時にお
けるR(n)の値 は、次式のように表わせる。
〔発明が解決しようとする問題点〕 パルス探索で、k番目のパルスが求まった時に、それ
までに既に求まっているk−1個のパルスと振幅の調整
をする方法2、k番目のパルスに最も近い2個のパルス
と振幅を調整する方法2−2、k番目のパルスに最も近
い1個のパルスと振幅を調整する方法2−1、振幅を調
整しない方法1が提案されている(従来技術3)。方法
1,2−1,2−2,2の順に再生音響が良くなっていくが、パ
ルス探索の演算量は、方法2−1,2−2,2は、方法1のそ
れぞれ約2倍,3倍,K/2倍と多くなり実用的でない。
までに既に求まっているk−1個のパルスと振幅の調整
をする方法2、k番目のパルスに最も近い2個のパルス
と振幅を調整する方法2−2、k番目のパルスに最も近
い1個のパルスと振幅を調整する方法2−1、振幅を調
整しない方法1が提案されている(従来技術3)。方法
1,2−1,2−2,2の順に再生音響が良くなっていくが、パ
ルス探索の演算量は、方法2−1,2−2,2は、方法1のそ
れぞれ約2倍,3倍,K/2倍と多くなり実用的でない。
本発明の目的は、音声を10kbps前後のビットレートに
符号化するマルチパルス符号化において、少ない演算量
で優れた音質を得ることのできる符号化法及び符号化器
を提供することである。
符号化するマルチパルス符号化において、少ない演算量
で優れた音質を得ることのできる符号化法及び符号化器
を提供することである。
本発明の音声符号化方式は、入力信号を線形予測分析
し、該線形予測フィルタのインパルス応答を求め、入力
信号とインパルス応答の相互相関を求め、該相互相関を
評価関数とし、評価関数の絶対値の最大の位置に第一の
パルスを立て、評価関数から、パルスを立てた位置にイ
ンパルス応答の自己相関をパルスの大きさに正規化して
引いたものを新たな評価関数とし、該評価関数から、同
様にして、予め定めた個数のパルスをもとめ、前記線形
予測フィルタの係数と予め定めた個数のパルスの位置と
大きさを伝送する音声符号化器において、予め定めた個
数のパルスを求めた後、パルスの立った位置の中で評価
関数の絶対値の最大の位置のパルスの大きさを修正し、
評価関数から、パルスの大きさを修正した位置にインパ
ルス応答の自己相関をパルスの修正分の大きさに正規化
して引いたものを新たな評価関数とし、該評価関数か
ら、同様にして、予め定めた回数だけパルスの大きさの
修正を繰り返す事を特徴とする。
し、該線形予測フィルタのインパルス応答を求め、入力
信号とインパルス応答の相互相関を求め、該相互相関を
評価関数とし、評価関数の絶対値の最大の位置に第一の
パルスを立て、評価関数から、パルスを立てた位置にイ
ンパルス応答の自己相関をパルスの大きさに正規化して
引いたものを新たな評価関数とし、該評価関数から、同
様にして、予め定めた個数のパルスをもとめ、前記線形
予測フィルタの係数と予め定めた個数のパルスの位置と
大きさを伝送する音声符号化器において、予め定めた個
数のパルスを求めた後、パルスの立った位置の中で評価
関数の絶対値の最大の位置のパルスの大きさを修正し、
評価関数から、パルスの大きさを修正した位置にインパ
ルス応答の自己相関をパルスの修正分の大きさに正規化
して引いたものを新たな評価関数とし、該評価関数か
ら、同様にして、予め定めた回数だけパルスの大きさの
修正を繰り返す事を特徴とする。
以下、本発明の一実施例について図面を参照して説明
する。
する。
第1図はマルチパルス駆動音声符号化方式のブロック
図である。入力音声信号は、Nサンプルずつのフレーム
に分割され、フレーム毎に処理される。あるフレームの
入力信号をX(n),n=1,2,…,Nとすると、CODERでは
そのフレームの音声を合成する合成フィルタの係数と、
その駆動音源となるパルス列を求め、それらが伝送さ
れ、DECODERでは、それらをもとに、再生音声を合成す
る。
図である。入力音声信号は、Nサンプルずつのフレーム
に分割され、フレーム毎に処理される。あるフレームの
入力信号をX(n),n=1,2,…,Nとすると、CODERでは
そのフレームの音声を合成する合成フィルタの係数と、
その駆動音源となるパルス列を求め、それらが伝送さ
れ、DECODERでは、それらをもとに、再生音声を合成す
る。
CODERでは、まず、入力音声X(n)を線形予測分析
部13で線形予測分析し、合成フィルタの係数ai,i=1,2,
…,Pを求める。
部13で線形予測分析し、合成フィルタの係数ai,i=1,2,
…,Pを求める。
重み付けインパルス応答部14では合成フィルタのイン
パルス応答h(n)の重み付け信号hw(n)のZ変換表
現Hw(Z)は、式(2)、式(5)から、下式の様に表
わせる。
パルス応答h(n)の重み付け信号hw(n)のZ変換表
現Hw(Z)は、式(2)、式(5)から、下式の様に表
わせる。
自己相関部16では、重み付けインパルス応答hw(n)
の自己相関Rhh(n)を式(10)に従って求める。
の自己相関Rhh(n)を式(10)に従って求める。
影響信号合成フィルタ11では、前フレームの影響を除
去する為に、合成フィルタの内部データは前フレームの
最後の値を初期値として保持した状態で、合成フィルタ
の係数は線形予測分析部13で求めた、今のフレームの値
ai,i=1,2,…,Pを用いて、入力信号を零として1フレー
ム分の影響信号Xs(n)を合成する。Xs(n)は と表わせる。ここにXs(1−P),Xs(2−P),…,X
(0)は前フレームの合成フィルタの内部データで、前
フレームの合成フィルタの出力Y(N−P+1),Y(N
−P+2)…,Y(N)にそれぞれ等しい。
去する為に、合成フィルタの内部データは前フレームの
最後の値を初期値として保持した状態で、合成フィルタ
の係数は線形予測分析部13で求めた、今のフレームの値
ai,i=1,2,…,Pを用いて、入力信号を零として1フレー
ム分の影響信号Xs(n)を合成する。Xs(n)は と表わせる。ここにXs(1−P),Xs(2−P),…,X
(0)は前フレームの合成フィルタの内部データで、前
フレームの合成フィルタの出力Y(N−P+1),Y(N
−P+2)…,Y(N)にそれぞれ等しい。
入力信号X(n)から影響信号Xs(n)を引いた信号
を、重み付けフィルター部12で、重み付ける。重み付け
信号Xw(n)は次式で求められる。
を、重み付けフィルター部12で、重み付ける。重み付け
信号Xw(n)は次式で求められる。
ここでa0=−1。
相互相関部15では、重み付け信号Xw(n)と重み付け
インパルス応答hw(n)の相互相関Rhx(n)を式
(9)に従って求める。
インパルス応答hw(n)の相互相関Rhx(n)を式
(9)に従って求める。
パルス探索部17では相互相関Rhx(n)と自己相関Rhh
(n)から、パルスの位置mkと振幅gkを求め定めた個数
K個求める。
(n)から、パルスの位置mkと振幅gkを求め定めた個数
K個求める。
符号化部18では、線形予測係数ai、パルス位置mk、パ
ルス振幅gkを量子化、多重化して伝送する。
ルス振幅gkを量子化、多重化して伝送する。
パルス位置及びパルス振幅が求まった後に、影響信号
合成部11で、次フレームの音響信号を合成する為に、今
のフレームの合成を行なう。
合成部11で、次フレームの音響信号を合成する為に、今
のフレームの合成を行なう。
合成出力Y(n)は、式(2)で表わされる伝達関数
H(z)の合成フィルタを式(1)で表わされるパルス
列V(n)で駆動することにより求められる。合成フィ
ルタの内部データは前フレームの最後の値を初期値とし
て保持した状態で始める。合成出力Y(n)は と表わせる。ここでY(1−P),Y(2−P),…,Y
(0)は、前フレームの合成フィルタの内部データで、
前フレームの合成フィルタの出力Y(N−P+1),Y
(N−P+2),…Y(N)にそれぞれ等しい。
H(z)の合成フィルタを式(1)で表わされるパルス
列V(n)で駆動することにより求められる。合成フィ
ルタの内部データは前フレームの最後の値を初期値とし
て保持した状態で始める。合成出力Y(n)は と表わせる。ここでY(1−P),Y(2−P),…,Y
(0)は、前フレームの合成フィルタの内部データで、
前フレームの合成フィルタの出力Y(N−P+1),Y
(N−P+2),…Y(N)にそれぞれ等しい。
第2図にパルス探索と、パルス振幅修正法のフローチ
ャートを示す。
ャートを示す。
まず、評価関数R(n)の初期値として、相互相関Rh
x(n)を与える(ステップ20)。次に駆動音源パルス
列V(n)の初期値として零を与える(ステップ21)。
さらに、何番目のパルスかを示すインデックスkに、初
期値として零を与える(ステップ22)。
x(n)を与える(ステップ20)。次に駆動音源パルス
列V(n)の初期値として零を与える(ステップ21)。
さらに、何番目のパルスかを示すインデックスkに、初
期値として零を与える(ステップ22)。
評価関数R(n)の絶対値が最大となる位置n=lを
1≦n≦Nの範囲で探し(ステップ23)、また位置lに
立てるパルスの大きさΔを、位置lの評価関数の値V
(l)が零になるように求める(ステップ24)。
1≦n≦Nの範囲で探し(ステップ23)、また位置lに
立てるパルスの大きさΔを、位置lの評価関数の値V
(l)が零になるように求める(ステップ24)。
Δ=R(l)/Rhh(o) (16) ステップ25で、位置lに、既にパルスが立っているか
どうかをV(l)の値で調べる。V(l)=0で、パル
スが立っていない時は新たなパルスが求まったことにな
るので、ステップ26でkを+1して、ステップ27でk番
目のパルス位置mkをlとし、ステップ28でパルス位置l
に大きさΔのパルスを立ててV(l)=Δとする。ステ
ップ25で、位置lに、既にパルスが立っている場合、す
なわちV(l)≠0の時は、29で位置lのパルスの大き
さV(l)にΔを加えたものを新たなV(l)とする。
どうかをV(l)の値で調べる。V(l)=0で、パル
スが立っていない時は新たなパルスが求まったことにな
るので、ステップ26でkを+1して、ステップ27でk番
目のパルス位置mkをlとし、ステップ28でパルス位置l
に大きさΔのパルスを立ててV(l)=Δとする。ステ
ップ25で、位置lに、既にパルスが立っている場合、す
なわちV(l)≠0の時は、29で位置lのパルスの大き
さV(l)にΔを加えたものを新たなV(l)とする。
ステップ30で、位置lに大きさΔのパルスを立てたこ
とによる効果を評価関数R(n)から、下式のように引
く。
とによる効果を評価関数R(n)から、下式のように引
く。
R(n)=R(n)−Δ・Rhh(|n−l|) n=1、
2、…,N (17) ステップ31で、パルスが予め定めた個数K個になっかど
うかを調べ、K個に満たない場合は23〜31を繰り返す。
2、…,N (17) ステップ31で、パルスが予め定めた個数K個になっかど
うかを調べ、K個に満たない場合は23〜31を繰り返す。
上記ステップ23〜31のパルス探索ループは、既にパル
スが立っている位置に、またパルスが立つステップ29の
パスを通ることもあるため、予め定めた求めたいパルス
の個数K回以上回ることがある。この様にして、K個の
パルスが求まったら、ステップ32〜37のパルス振幅修正
を行なう。
スが立っている位置に、またパルスが立つステップ29の
パスを通ることもあるため、予め定めた求めたいパルス
の個数K回以上回ることがある。この様にして、K個の
パルスが求まったら、ステップ32〜37のパルス振幅修正
を行なう。
ステップ32で、パルス振幅修正回数を示すカウンタj
に初期値零を与える。
に初期値零を与える。
ステップ33で、パルスの立っている位置m1からmkの中
で、評価関数R(mk)の絶対値の最大の位置mk=lを探
す。
で、評価関数R(mk)の絶対値の最大の位置mk=lを探
す。
ステップ34で、位置lのパルスの大きさを、位置lの
評価関数R(l)の値が零になるように、修正する値Δ
を式(16)で求める。
評価関数R(l)の値が零になるように、修正する値Δ
を式(16)で求める。
ステップ35で、位置lのパルスの大きさV(l)にΔ
を加えたものを新たなV(l)として、パルス振幅修正
を行なう。
を加えたものを新たなV(l)として、パルス振幅修正
を行なう。
ステップ36で、位置lのパルス振幅を大きさΔだけ修
正したことによる効果を評価関数R(mk)から、下式の
ように引く。
正したことによる効果を評価関数R(mk)から、下式の
ように引く。
R(mk)=R(mk)−Δ・Rhh(|mk−l|)mk=m1,
m2,…,mk (18) ステップ37で、jを+1とする。
m2,…,mk (18) ステップ37で、jを+1とする。
ステップ38で、パルス振幅修正回数が予め定めた回数
Jになったかどうかを調べ、J回に満たない時は上記ス
テップ33〜38を繰り返す。
Jになったかどうかを調べ、J回に満たない時は上記ス
テップ33〜38を繰り返す。
この様にして、J回パルス振幅を修正したら、ステッ
プ39で、位置mkのV(mk)を位置mkのパルス振幅gkとす
る。
プ39で、位置mkのV(mk)を位置mkのパルス振幅gkとす
る。
本発明におけるパルス振幅の修正ステップ32〜38は、
ステップ33の評価関数の絶対値の最大の位置の探索も、
ステップ36の評価関数の値の更新も、パルスの立ってい
る位置m1からmkのみの各K個所で良い。ステップ20〜31
のパルス探索では、ステップ23の評価関数の絶対値の最
大の位置の探索も、ステップ30の評価関数の更新もn=
1からNの各個所行なう必要がある。パルス数Kとルー
プ回数Jは同程度の値で、パルス数Kは、1フレームの
サンプル数Nに比べかなり小さいから、パルス振幅修正
に要する演算量は、パルス探索の演算量に対して無視で
きる程度の演算量ですむ。しかも、パルス位置の評価関
数の値は、ほぼ零にできる為、再生される音声の音質も
向上させることができる。
ステップ33の評価関数の絶対値の最大の位置の探索も、
ステップ36の評価関数の値の更新も、パルスの立ってい
る位置m1からmkのみの各K個所で良い。ステップ20〜31
のパルス探索では、ステップ23の評価関数の絶対値の最
大の位置の探索も、ステップ30の評価関数の更新もn=
1からNの各個所行なう必要がある。パルス数Kとルー
プ回数Jは同程度の値で、パルス数Kは、1フレームの
サンプル数Nに比べかなり小さいから、パルス振幅修正
に要する演算量は、パルス探索の演算量に対して無視で
きる程度の演算量ですむ。しかも、パルス位置の評価関
数の値は、ほぼ零にできる為、再生される音声の音質も
向上させることができる。
以上説明したように、本発明によれば前記方法1(従
来技術3)と同程度の演算量で、方法1の数倍の演算量
を要する方法2−1や方法2−2(従来技術3)と同程
度の音声の音質を得ることができる。
来技術3)と同程度の演算量で、方法1の数倍の演算量
を要する方法2−1や方法2−2(従来技術3)と同程
度の音声の音質を得ることができる。
第1図は、本発明のマルチパルス駆動音声符号化方式の
一実施例のブロック図、第2図は、本発明におけるフロ
ーチャートである。 11……影響信号合成フィルタ、12……重み付けフィル
タ、13……線形予測分析部、14…重み付けインパルス応
答部、15……相互相関部、16……自己相関部、17……パ
ルス探索部、18……符号化部。
一実施例のブロック図、第2図は、本発明におけるフロ
ーチャートである。 11……影響信号合成フィルタ、12……重み付けフィル
タ、13……線形予測分析部、14…重み付けインパルス応
答部、15……相互相関部、16……自己相関部、17……パ
ルス探索部、18……符号化部。
Claims (1)
- 【請求項1】入力信号を線形予測分析し、該線形予測フ
ィルタのインパルス応答を求め、入力信号とインパルス
応答の相互相関を求め、該相互相関を評価関数とし、評
価関数の絶対値の最大の位置に第一のパルスを立て、評
価関数から、パルスを立てた位置にインパルス応答の自
己相関をパルスの大きさに正規化して引いたものを新た
な評価関数とし、該評価関数から、同様にして、予め定
めた個数のパルスをもとめ、前記線形予測フィルタの係
数と予め定めた個数のパルスの位置と大きさを伝送する
音声符号化器において、予め定めた個数のパルスを求め
た後、パルスの立った位置の中で評価関数の絶対値の最
大の位置のパルスの大きさを修正し、評価関数から、パ
ルスの大きさを修正した位置にインパルス応答の自己相
関をパルスの修正分の大きさに正規化して引いたものを
新たな評価関数とし、該評価関数から、同様にして、予
め定めた回数だけパルスの大きさの修正を繰り返す事を
特徴とする音声符号化方式。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22130886 | 1986-09-18 | ||
JP61-221308 | 1986-09-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63184800A JPS63184800A (ja) | 1988-07-30 |
JP2615664B2 true JP2615664B2 (ja) | 1997-06-04 |
Family
ID=16764759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62233855A Expired - Lifetime JP2615664B2 (ja) | 1986-09-18 | 1987-09-18 | 音声符号化方式 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5001759A (ja) |
JP (1) | JP2615664B2 (ja) |
CA (1) | CA1312673C (ja) |
GB (1) | GB2195518B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5293448A (en) * | 1989-10-02 | 1994-03-08 | Nippon Telegraph And Telephone Corporation | Speech analysis-synthesis method and apparatus therefor |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
CA2084323C (en) * | 1991-12-03 | 1996-12-03 | Tetsu Taguchi | Speech signal encoding system capable of transmitting a speech signal at a low bit rate |
JP2947012B2 (ja) * | 1993-07-07 | 1999-09-13 | 日本電気株式会社 | 音声符号化装置並びにその分析器及び合成器 |
JP2906968B2 (ja) * | 1993-12-10 | 1999-06-21 | 日本電気株式会社 | マルチパルス符号化方法とその装置並びに分析器及び合成器 |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4720865A (en) * | 1983-06-27 | 1988-01-19 | Nec Corporation | Multi-pulse type vocoder |
JPS61134000A (ja) * | 1984-12-05 | 1986-06-21 | 株式会社日立製作所 | 音声分析合成方式 |
-
1987
- 1987-09-15 CA CA000546869A patent/CA1312673C/en not_active Expired - Fee Related
- 1987-09-18 JP JP62233855A patent/JP2615664B2/ja not_active Expired - Lifetime
- 1987-09-18 GB GB8722048A patent/GB2195518B/en not_active Expired - Lifetime
-
1989
- 1989-09-27 US US07/414,643 patent/US5001759A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5001759A (en) | 1991-03-19 |
GB2195518A (en) | 1988-04-07 |
GB8722048D0 (en) | 1987-10-28 |
JPS63184800A (ja) | 1988-07-30 |
CA1312673C (en) | 1993-01-12 |
GB2195518B (en) | 1990-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940005B2 (ja) | 音声符号化装置 | |
JP3566652B2 (ja) | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 | |
US4720865A (en) | Multi-pulse type vocoder | |
EP0550657A1 (en) | METHOD AND DEVICE FOR CODING ANALOG SIGNALS. | |
JPWO2008072671A1 (ja) | 音声復号化装置およびパワ調整方法 | |
JP2615664B2 (ja) | 音声符号化方式 | |
JP2829978B2 (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
JPH07101358B2 (ja) | マルチパルス符号化方法および装置 | |
JPH0782360B2 (ja) | 音声分析合成方法 | |
JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
JPH05265495A (ja) | 音声符号化装置並びにその分析器及び合成器 | |
JP3163206B2 (ja) | 音響信号符号化装置 | |
JPH0738116B2 (ja) | マルチパルス符号化装置 | |
JP2560682B2 (ja) | 音声信号符号化復号化方法とその装置 | |
JPH05158497A (ja) | 音声伝送方式 | |
JP2658438B2 (ja) | 音声符号化方法とその装置 | |
JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
JP3074703B2 (ja) | マルチパルス符号化装置 | |
JP2508002B2 (ja) | 音声符号化方法とその装置 | |
JPS6396699A (ja) | 音声符号化装置 | |
JP3144244B2 (ja) | 音声符号化装置 | |
JP2001013999A (ja) | 音声符号化方法および装置 | |
JPH08202398A (ja) | 音声符号化装置 | |
JPH0378638B2 (ja) | ||
JP2969619B2 (ja) | 音声符号化器 |