JPH02293800A - ピツチ関連遅延値を導出する方法 - Google Patents
ピツチ関連遅延値を導出する方法Info
- Publication number
- JPH02293800A JPH02293800A JP2093314A JP9331490A JPH02293800A JP H02293800 A JPH02293800 A JP H02293800A JP 2093314 A JP2093314 A JP 2093314A JP 9331490 A JP9331490 A JP 9331490A JP H02293800 A JPH02293800 A JP H02293800A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- delay value
- segment
- value
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 18
- 238000005314 correlation function Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 abstract description 14
- 238000004422 calculation algorithm Methods 0.000 abstract description 8
- 238000009795 derivation Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A.産業上の利用分野
本発明は音声信号を効率的にコーディングする方法に関
する。
する。
B.従来の技術及びその課題
音声信号の効率的なコーディングという場合、これは音
声信号の高品質のデジタルエンコーディングを得るとい
うことを意味するだけでなく、コスト及びコーダの複雑
さの最適化をも意味している。
声信号の高品質のデジタルエンコーディングを得るとい
うことを意味するだけでなく、コスト及びコーダの複雑
さの最適化をも意味している。
既に知られたコーダのうちあるものは、もとの音声信号
を処理し、そこから音声代表残差信号を導出し、遅延装
置を調整するのに使用される検出されたピッチ関連デー
タで調節されるLTP(Long−Term Pred
iction)手段を用いて残差予測信号を計算し、現
在の残差と予測された残差を組合せて残差誤差信号を生
成し、最後にこの残差誤差信号を低ビットレートでコー
ド化する。、上述のタイプのコーディング手法の効率に
対する大きな改善は欧州特許出願第EP8743000
6.4号(特開昭63−223799号)において示さ
れるように,ピッチ又はそのピッチの調波(以下、単に
ピッチ、ピッチ代表データ又はピッチ関連データともい
う)を次のようにして検出することによって達成された
。すなわち、この方法は、第1のステップでゼロクロス
及びピークの検出による粗いピッチの測定を行い、第2
のステップで検出されたピッチのピークについて遂行さ
れる自己相関に基づいてピッチを徴調するものである。
を処理し、そこから音声代表残差信号を導出し、遅延装
置を調整するのに使用される検出されたピッチ関連デー
タで調節されるLTP(Long−Term Pred
iction)手段を用いて残差予測信号を計算し、現
在の残差と予測された残差を組合せて残差誤差信号を生
成し、最後にこの残差誤差信号を低ビットレートでコー
ド化する。、上述のタイプのコーディング手法の効率に
対する大きな改善は欧州特許出願第EP8743000
6.4号(特開昭63−223799号)において示さ
れるように,ピッチ又はそのピッチの調波(以下、単に
ピッチ、ピッチ代表データ又はピッチ関連データともい
う)を次のようにして検出することによって達成された
。すなわち、この方法は、第1のステップでゼロクロス
及びピークの検出による粗いピッチの測定を行い、第2
のステップで検出されたピッチのピークについて遂行さ
れる自己相関に基づいてピッチを徴調するものである。
上記のピッチ検出方法は特に有益なものであるけれども
、コーダの全体的な計算負荷に比してかなり大きい計算
負荷をもたらす。したがって本発明の目的は従来に比べ
て計算負荷の少ないピンチ検出の技術を提供することに
ある。
、コーダの全体的な計算負荷に比してかなり大きい計算
負荷をもたらす。したがって本発明の目的は従来に比べ
て計算負荷の少ないピンチ検出の技術を提供することに
ある。
C.課題を解決するための手段
この目的を達成するため、音声から導出されたデジタル
信号r (n)を低ビットレー1・の信号に変換する長
区間予測に基づく音声コーダで使用される長区間予測フ
ィルタを調整するためのピッチ関連遅延値Mを導出する
本発明の方法は下記の(a)ないし(h)のステップを
有することを特徴としている。
信号r (n)を低ビットレー1・の信号に変換する長
区間予測に基づく音声コーダで使用される長区間予測フ
ィルタを調整するためのピッチ関連遅延値Mを導出する
本発明の方法は下記の(a)ないし(h)のステップを
有することを特徴としている。
(a)上記信号r (n)を各々がN個のサンプルから
成るセグメントに分割するステップ。
成るセグメントに分割するステップ。
(b)各セグメントをj個(jは所定の整数)のサ一3
ブセグメントに分割するステップ。
(c)現信号の最初のサブセグメントと復元された信号
のセグメントとの相互相関をとって下記の相ただしk’
=N/j (d)ピーク位置R(Ml)についてR (n)の値を
選出し、上記フィルタの遅延値をM1に設定し、信号を
サブセグメント1個分についてシフトするステップ。
のセグメントとの相互相関をとって下記の相ただしk’
=N/j (d)ピーク位置R(Ml)についてR (n)の値を
選出し、上記フィルタの遅延値をM1に設定し、信号を
サブセグメント1個分についてシフトするステップ。
(e)Mlの高調波及び低調波のところに位置する所定
数のサンプルについてのサンプル指標nを計算するステ
ップ。
数のサンプルについてのサンプル指標nを計算するステ
ップ。
(f)ステップ(e)で定義されたnについて相互相関
関数の値R (n)を計算するステップ。
関数の値R (n)を計算するステップ。
(g)新しい遅延値M2を導出するためピーク位置につ
いてR (n)の値を選出するステップ。
いてR (n)の値を選出するステップ。
(h)上記(e)から(g)までのステップをM1の代
わりにM2について実行し、以下同様にMjになるまで
(e)から(g)までのステップを繰返すステップ。
わりにM2について実行し、以下同様にMjになるまで
(e)から(g)までのステップを繰返すステップ。
なお、ステップ(e)において、p及びkを所定の整数
としてn = p M 1 + kであるようなMl/
p,・・・・・・、M1/3、M1/2、M1、2M1
、3M1、・・・・・・、pM1となる所定数のサンプ
ルについてnを計算する。
としてn = p M 1 + kであるようなMl/
p,・・・・・・、M1/3、M1/2、M1、2M1
、3M1、・・・・・・、pM1となる所定数のサンプ
ルについてnを計算する。
以下、本発明の作用を実施例とともに説明する。
D.実施例
はじめに本実施例を概説する。本実施例は長区間予測に
基づく音声コーダにおいて遅延データとして用いられる
ピッチ関連データを最小の計算負荷で高速に導出する方
法を提供するものである。
基づく音声コーダにおいて遅延データとして用いられる
ピッチ関連データを最小の計算負荷で高速に導出する方
法を提供するものである。
これは、処理すべき信号を各々N個のサンプルから成る
連続的なセグメントに分割し、各6セグメントをj個の
サブセグメントに分割し、現在の最初のサブセグメント
のサンプルと既にデコードされたセグメントとの相互相
関をとって相互相関関数を導出するとともに第1の遅延
M1として用いられる相互相関のピーク位置の指標を導
出し、音声コーダのLTPループに対してM1を設定し
、上記第1の遅延M]の高調波及び低調波のところのサ
ンプル指標を計算し、上記指標されたサンプルについて
新しい相互相関関数を計算して新しい遅延データM2を
導出し、これを最後のサブセグメン1−まで続行し、さ
らに次の信号セグメントについてこのプロセスを繰返す
ことによって達成される。以下、図面を参照しながら本
実施例を詳細に説明する。
連続的なセグメントに分割し、各6セグメントをj個の
サブセグメントに分割し、現在の最初のサブセグメント
のサンプルと既にデコードされたセグメントとの相互相
関をとって相互相関関数を導出するとともに第1の遅延
M1として用いられる相互相関のピーク位置の指標を導
出し、音声コーダのLTPループに対してM1を設定し
、上記第1の遅延M]の高調波及び低調波のところのサ
ンプル指標を計算し、上記指標されたサンプルについて
新しい相互相関関数を計算して新しい遅延データM2を
導出し、これを最後のサブセグメン1−まで続行し、さ
らに次の信号セグメントについてこのプロセスを繰返す
ことによって達成される。以下、図面を参照しながら本
実施例を詳細に説明する。
第1図は本発明を適用することのできる音声コーダを示
す図である。もとの音声信号s (n)はA/Dコンバ
ータ(図示せず)においてナイキスト周波数でサンプリ
ングされ1サンプルにっき12ビッ1〜でPCMコード
化される。そのようなコーダ(RPE/LTP)は中程
度のビットレ−1・で市外品質の音声コード化圧縮を実
現できるけれども、圧縮すべき信号が連続的成分を呈す
る場合には可聴周波のノイズトーンが生成されることが
ある。この場合、これはA/Dコンバータの使用に起因
するものである。RPE/LTPコーダ又はデコーダに
おいては、高周波成分が生成されることが必要であり、
これはベースバンドフォールディング(baseban
d folding)によって達成される。その結果、
音声信号が高レベルのオフセッ1・を含んでいる場合は
、ベースバンド信号もまたこのオフセットを含み、余分
に復元された信号がミラー周波数で純音を呈することに
なる。オフセットの検出はC E P T (Euro
pean Commission forPost a
nd Telecommunication)のGSM
O6.10で定義されるようなノッチハイパスフィルタ
を使用する装置9で行われる。
す図である。もとの音声信号s (n)はA/Dコンバ
ータ(図示せず)においてナイキスト周波数でサンプリ
ングされ1サンプルにっき12ビッ1〜でPCMコード
化される。そのようなコーダ(RPE/LTP)は中程
度のビットレ−1・で市外品質の音声コード化圧縮を実
現できるけれども、圧縮すべき信号が連続的成分を呈す
る場合には可聴周波のノイズトーンが生成されることが
ある。この場合、これはA/Dコンバータの使用に起因
するものである。RPE/LTPコーダ又はデコーダに
おいては、高周波成分が生成されることが必要であり、
これはベースバンドフォールディング(baseban
d folding)によって達成される。その結果、
音声信号が高レベルのオフセッ1・を含んでいる場合は
、ベースバンド信号もまたこのオフセットを含み、余分
に復元された信号がミラー周波数で純音を呈することに
なる。オフセットの検出はC E P T (Euro
pean Commission forPost a
nd Telecommunication)のGSM
O6.10で定義されるようなノッチハイパスフィルタ
を使用する装置9で行われる。
要約するに、DC成分を除去するために作られたこのフ
ィルタは固定係数の再帰的デジタルフィルタから成る(
この係数はCEPTによって無線電話について定義され
ているものである)。
ィルタは固定係数の再帰的デジタルフィルタから成る(
この係数はCEPTによって無線電話について定義され
ているものである)。
オフセット検出のためのより簡単な別のアルゴリズムは
以下のようにLTPループにおいて(すなわち、装置2
2の出力に関して)実施するものである。
以下のようにLTPループにおいて(すなわち、装置2
2の出力に関して)実施するものである。
デコードされた信号のDC成分は残差誤差信号eJ(n
)から除去されてオフセットのない新しい信号e’ (
n)が以下の計算を実行することにより得られる。
)から除去されてオフセットのない新しい信号e’ (
n)が以下の計算を実行することにより得られる。
xof(1)=x’L(].)−Σ(x’L(i))/
C 1=1、Cj=1 ここでx ’ L ( 1 )はRI’Eで選択した遅
延Lについてデコードされたパルスの振幅を表わし、C
はこれらのパルスの数を表わす。
C 1=1、Cj=1 ここでx ’ L ( 1 )はRI’Eで選択した遅
延Lについてデコードされたパルスの振幅を表わし、C
はこれらのパルスの数を表わす。
次に、信号X。f(n)がゼロの値のサンプルをインタ
ーリーブすることによってオーバーサンプリングされ、
オフセットのない全帯域信号e’(n)が生成される。
ーリーブすることによってオーバーサンプリングされ、
オフセットのない全帯域信号e’(n)が生成される。
受信側では、同様なオペレーションがデコードされたベ
ースバンド信号について行われる。
ースバンド信号について行われる。
再び第1図の説明に戻る。装置9によって供給される事
前処理された信号が短区間予測フィルタ10に送られる
。
前処理された信号が短区間予測フィルタ10に送られる
。
短区間予測フィルタはラティスデジタルフィル゛タから
成り、このフィルタのタップ係数はLPG分析によって
装置11において信号から動的に導出される。この目的
のため、事前処理される信号は各セグメントがオーバー
ラップしない160個のサンプルに分けられる(各々は
20ミリ秒の信号である)。LPC分析はShur再帰
アルゴリズムを用いて8つの反射係数を計算することに
よって各セグメン1へについて行われる。Shurアル
ゴリズムの詳細が必要であれば、前掲のGSMO6.1
0の仕様を参照されたい。
成り、このフィルタのタップ係数はLPG分析によって
装置11において信号から動的に導出される。この目的
のため、事前処理される信号は各セグメントがオーバー
ラップしない160個のサンプルに分けられる(各々は
20ミリ秒の信号である)。LPC分析はShur再帰
アルゴリズムを用いて8つの反射係数を計算することに
よって各セグメン1へについて行われる。Shurアル
ゴリズムの詳細が必要であれば、前掲のGSMO6.1
0の仕様を参照されたい。
反射係数はL A R (log area rati
o)係数に変換される。これは区分的かつ線形的に32
ビッ1・(6、5、5、4、3、3、3、3)で量子化
され、s (n)の再合成の間に使用するためにコード
化される。
o)係数に変換される。これは区分的かつ線形的に32
ビッ1・(6、5、5、4、3、3、3、3)で量子化
され、s (n)の再合成の間に使用するためにコード
化される。
短区間分析フィルタの8つの係数は次のように処理され
る。まず、量子化されコード化されたLAR係数がデコ
ードされる。次に、直前のT− A R係数のセツ1〜
が5ミリ秒の遷移期間内で線形的に補間され、スプリア
スな過渡状態が防止される。
る。まず、量子化されコード化されたLAR係数がデコ
ードされる。次に、直前のT− A R係数のセツ1〜
が5ミリ秒の遷移期間内で線形的に補間され、スプリア
スな過渡状態が防止される。
最後に、補間されたLARがラティスフィルタの反射係
数に再変換される。このフィルタは音声から導出された
(すなわち、残差)信号r(n)の160個のサンプル
を生成する。信号r (n)はピッチ関連周波数で一定
の冗長性を有する比較的平坦な周波数スペクトラムを示
す。
数に再変換される。このフィルタは音声から導出された
(すなわち、残差)信号r(n)の160個のサンプル
を生成する。信号r (n)はピッチ関連周波数で一定
の冗長性を有する比較的平坦な周波数スペクトラムを示
す。
装置12はこの残差信号を処理してそこからピッチ、調
波を表わすデータ、換言すればピッチ関連情報M及びゲ
インパラメータbを導出する。M及びbは次の式で表わ
されるような2領域における演算を実行する長区間予測
フィルタ14を調整するのに使用される。
波を表わすデータ、換言すればピッチ関連情報M及びゲ
インパラメータbを導出する。M及びbは次の式で表わ
されるような2領域における演算を実行する長区間予測
フィルタ14を調整するのに使用される。
一阿
R”(z)=b.z R’ (z) (1)
ここで、R’(z)及びR II ( z)はそれぞれ
時間領域信号r’ (n)及びru(n)の2領域変換
を表わす。
ここで、R’(z)及びR II ( z)はそれぞれ
時間領域信号r’ (n)及びru(n)の2領域変換
を表わす。
したがって式(1)の演算を実行する装置は動的にMに
調整すべき長さ(ピッチ又は調波に関連する遅延データ
)を有する遅延線と、ゲイン装置とを具備しなければな
らない。これについては後でさらに詳しく説明する。
調整すべき長さ(ピッチ又は調波に関連する遅延データ
)を有する遅延線と、ゲイン装置とを具備しなければな
らない。これについては後でさらに詳しく説明する。
b及びMを効率的に測定することはコーダにとっては重
要な事項である。というのは、Mで調整された長区間予
測フィルタからの予測残差信号出力r″′(n)は長区
間相関解除された予測誤差信号e (n)を導出するた
めに残差信号から減ずる必要があり、.(n)はR P
E (Regular PulseExcitati
on )手法を用いてパルスx (n)のシーケンスに
コード化されるからである。換言すれば、RPE装置1
6を使用して、たとえば連続的なPCMコード化された
e (n)のサンプルのサブセグメントをAPCM量子
化器20で次に量子化されるより少ない数(たとえば1
5未満)の最も有意なパルスに変換する。以上の考察に
より、フィルタ14の正確な調整したがってb及びMの
良好な算定の重要性が理解されよう。
要な事項である。というのは、Mで調整された長区間予
測フィルタからの予測残差信号出力r″′(n)は長区
間相関解除された予測誤差信号e (n)を導出するた
めに残差信号から減ずる必要があり、.(n)はR P
E (Regular PulseExcitati
on )手法を用いてパルスx (n)のシーケンスに
コード化されるからである。換言すれば、RPE装置1
6を使用して、たとえば連続的なPCMコード化された
e (n)のサンプルのサブセグメントをAPCM量子
化器20で次に量子化されるより少ない数(たとえば1
5未満)の最も有意なパルスに変換する。以上の考察に
より、フィルタ14の正確な調整したがってb及びMの
良好な算定の重要性が理解されよう。
簡単にいうと、RPE手法を用いる場合、40個のe
(n)のサンプルから成る各サブグループはインターリ
ーブされたシーケンスに分けられる。
(n)のサンプルから成る各サブグループはインターリ
ーブされたシーケンスに分けられる。
たとえば、2つの13サンプルと1つの14サンプルが
インターリーブされる。RPE16はこの3つのインタ
ーリーブされたシーケンスの中から1つを選択する。こ
れは、もとのシーケンスと比較された場合に最小2乗誤
差を与えるものである。
インターリーブされる。RPE16はこの3つのインタ
ーリーブされたシーケンスの中から1つを選択する。こ
れは、もとのシーケンスと比較された場合に最小2乗誤
差を与えるものである。
2ビット(L)で選択されたシーケンスを識別すること
はデータシーケンスx (n)の適切な同期L に役立つ。
はデータシーケンスx (n)の適切な同期L に役立つ。
RPEコーディングの動作についてさらに詳細が必要で
あれば、P. Kroonらによる”Regu’lar
Pulse Excitation, a Novel
Approach toEffective and
Efficient Multiple Codin
g aSpeech” (IEEH Transact
ions and AcousticsSpeech
and Signal Processing ASS
P34 第5号1986年10月)を参照されたい。
あれば、P. Kroonらによる”Regu’lar
Pulse Excitation, a Novel
Approach toEffective and
Efficient Multiple Codin
g aSpeech” (IEEH Transact
ions and AcousticsSpeech
and Signal Processing ASS
P34 第5号1986年10月)を参照されたい。
RPEによる長区間予測を使うと,特に次の場合に全体
的ビットレート対品質パラメータを最適化することがで
きる。すなわち、長区間予測フイルタ14にr (n)
にできるだけ近いパルス列r′(n)を供給した場合、
換言すれば,装置16及び量子化器20によって供給さ
れるコード化ノイズ及び量子化ノイズが補償された場合
である。このため、デコーディングオペレーションは装
置22で行われる。装置22の出力e’ (n)に予測
一12 残差r″′(n)が加えられて復元された残差r′(n
)が生成される。さらに、RPEコーダのまわりの閉ル
ープは最小の範囲をピッチ関連データ検出ウィンドウに
設定することによって実時間で動作することができる。
的ビットレート対品質パラメータを最適化することがで
きる。すなわち、長区間予測フイルタ14にr (n)
にできるだけ近いパルス列r′(n)を供給した場合、
換言すれば,装置16及び量子化器20によって供給さ
れるコード化ノイズ及び量子化ノイズが補償された場合
である。このため、デコーディングオペレーションは装
置22で行われる。装置22の出力e’ (n)に予測
一12 残差r″′(n)が加えられて復元された残差r′(n
)が生成される。さらに、RPEコーダのまわりの閉ル
ープは最小の範囲をピッチ関連データ検出ウィンドウに
設定することによって実時間で動作することができる。
第1図の長区間予測フィルタ14のインプリメンテーシ
ミンが第2図に示されている。復元された残差信号は1
20個分のサンプルの長さ(Mについての最大値は12
0)の遅延線(又はシフ1〜レジスタ)に供給される。
ミンが第2図に示されている。復元された残差信号は1
20個分のサンプルの長さ(Mについての最大値は12
0)の遅延線(又はシフ1〜レジスタ)に供給される。
この遅延線の出方はLTP係数計算手段12に与えられ
、後の処理のため,係数b及びMが導出される。遅延線
のタップは前に計算されたMの値に調整される。ゲイン
係数bは、r(n)からrII(n)を減じてe (n
)を生成する前に上記タップで利用可能なデータに適用
される。
、後の処理のため,係数b及びMが導出される。遅延線
のタップは前に計算されたMの値に調整される。ゲイン
係数bは、r(n)からrII(n)を減じてe (n
)を生成する前に上記タップで利用可能なデータに適用
される。
長区間予測残差信号をこうして残差信号から減じて誤差
信号e(n)を導出する。誤差信号e(n)は量子化器
20による量子化の前にRPE16によってコード化さ
れる。
信号e(n)を導出する。誤差信号e(n)は量子化器
20による量子化の前にRPE16によってコード化さ
れる。
このコーダのアーキテクチャの重要な利点はMが装置1
2で正確に測定されている限りそれはS(n)のピッチ
又はピッチの調波を表わす遅延となるはずであるという
事実から導かれる。
2で正確に測定されている限りそれはS(n)のピッチ
又はピッチの調波を表わす遅延となるはずであるという
事実から導かれる。
このため、遅延Mは5ミリ秒(サンプル40個分)ごと
に計算される。信号r (n)は160個分のサンプル
の長さの連続的なセグメントに分けられる。なお、各セ
グメントはj(たとえばj=4)個のサブセグメントに
さらに分けられる。
に計算される。信号r (n)は160個分のサンプル
の長さの連続的なセグメントに分けられる。なお、各セ
グメントはj(たとえばj=4)個のサブセグメントに
さらに分けられる。
r (n)のサンプルのうちの最初のサブセグメント及
び前に復元された励起( excitation )セ
グメントy (n)は以下のようにして相互相関が計算
される。
び前に復元された励起( excitation )セ
グメントy (n)は以下のようにして相互相関が計算
される。
計算されたR (n)の値はピークの場所に関して分類
(選出)され以下の式によって第1の最適遅延値M1が
導出される。
(選出)され以下の式によって第1の最適遅延値M1が
導出される。
R (Ml) =Max (R (n)) n =4
0,120 (3)対応するゲインの値b1は以下の
式から導出される。
0,120 (3)対応するゲインの値b1は以下の
式から導出される。
LTPフィルタはb1及びM1で調整され、その信号が
1サブセグメント(40個分のサンプル)にわたっーで
シフトされる。
1サブセグメント(40個分のサンプル)にわたっーで
シフトされる。
次のサブセグメン1・の場合、ピッチ関連遅延値は次の
ようにして算定される。
ようにして算定される。
pが所定の整数値(たとえばp=3)であるようなM1
、2M1、3M1、・・・・・・、pMl、M1/2、
M1/3、・・・・・・、Ml/pを導出するため第1
のM1の倍数及び約数が計算される。次にkを所定の整
数値(たとえばk=5)として以下のようなサンプルの
指標nが定義される。
、2M1、3M1、・・・・・・、pMl、M1/2、
M1/3、・・・・・・、Ml/pを導出するため第1
のM1の倍数及び約数が計算される。次にkを所定の整
数値(たとえばk=5)として以下のようなサンプルの
指標nが定義される。
n = (Ml−k)、 (Ml−k−1)、 ・・・
・・ 、 (M1)、 (Ml+k−1)、 (Ml
十k)n = (2M1−k)、(2M1−k−1)、
・・・・・・、(2M1)、(2M14k−1)、(2
M1+k)n = (pM1−k)、(pM1−k−1
)、・曲・、(pM1)、・・曲、(pM1+k−1)
、(pM1+k) n = ((Ml/2)−k)、((Ml/2)−k−
1)、・・・・・・、(Ml/2)、・・曲((Ml/
2)+k−1)、 ((Ml/2)+k)n = ((
Ml/3)−k)、((Ml/3)−k−1)、・・・
・・・、(Ml/3)、・・・・・・((Ml/3)+
k−1)、((Ml/3)+k)n=((阿1/p)−
k)、 ((Ml/p)−k−1)、 ・・・・・・、
(Ml/p)、 ・・・・・・((Ml/p)+k−
1)、((Ml/p)+k)ただし、3 9 < n
< 1 2 1換言すれば、上記の計算されたnの値は
M1の倍数及び約数に選択すべきピッチ関連値に関して
位置するサンプルについてのサンプル指標である。
・・ 、 (M1)、 (Ml+k−1)、 (Ml
十k)n = (2M1−k)、(2M1−k−1)、
・・・・・・、(2M1)、(2M14k−1)、(2
M1+k)n = (pM1−k)、(pM1−k−1
)、・曲・、(pM1)、・・曲、(pM1+k−1)
、(pM1+k) n = ((Ml/2)−k)、((Ml/2)−k−
1)、・・・・・・、(Ml/2)、・・曲((Ml/
2)+k−1)、 ((Ml/2)+k)n = ((
Ml/3)−k)、((Ml/3)−k−1)、・・・
・・・、(Ml/3)、・・・・・・((Ml/3)+
k−1)、((Ml/3)+k)n=((阿1/p)−
k)、 ((Ml/p)−k−1)、 ・・・・・・、
(Ml/p)、 ・・・・・・((Ml/p)+k−
1)、((Ml/p)+k)ただし、3 9 < n
< 1 2 1換言すれば、上記の計算されたnの値は
M1の倍数及び約数に選択すべきピッチ関連値に関して
位置するサンプルについてのサンプル指標である。
相互相関関数(2)は上記のように定義され指標された
サンプルについて計算され、そのようにして計算された
R (n)の値は再びピークの場所に関して分類(選出
)される。これにより、第2のサブセグメントについて
の新しい最適の遅延M2が導出される。
サンプルについて計算され、そのようにして計算された
R (n)の値は再びピークの場所に関して分類(選出
)される。これにより、第2のサブセグメントについて
の新しい最適の遅延M2が導出される。
同じアルゴリズムがM1の代わりにM2に対して繰返さ
れ、次の遅延M3が計算される。これは直前の現サブセ
グメントMjに到達するまで続けられる。そして全体的
なプロセスを次のサンプルセグメントに対して繰返すこ
とができる。
れ、次の遅延M3が計算される。これは直前の現サブセ
グメントMjに到達するまで続けられる。そして全体的
なプロセスを次のサンプルセグメントに対して繰返すこ
とができる。
各々のMの値について、式(4)に基づき対応するゲイ
ンbが計算される。これらのLTPパラメータは2ビッ
ト及び7ビットでそれぞれコード化することができる。
ンbが計算される。これらのLTPパラメータは2ビッ
ト及び7ビットでそれぞれコード化することができる。
第3A図、第3B図及び第4図は以上の高速ピッチ検出
プロセスのアルゴリズムを示す図である。
プロセスのアルゴリズムを示す図である。
このアルゴリズムはマイクロプロセッサで走行するプロ
グラムに容易に変換することができる。この例はj=4
個のサブセグメントに分けられる160個分のサンプル
の長さを有するセグメン1・の処理に関するものである
。音声コーディング分析の場合、s (n)のフローは
160個分のサンプルの長さのセグメントに分けられ、
まず、オフセット検出処理及び160個の11 8.
IIサンプルの生成が行われる。次にサンプル“So′
はLARデータに量子化される8つのPARCOR係数
kiを生成するLPG分析に付される。
グラムに容易に変換することができる。この例はj=4
個のサブセグメントに分けられる160個分のサンプル
の長さを有するセグメン1・の処理に関するものである
。音声コーディング分析の場合、s (n)のフローは
160個分のサンプルの長さのセグメントに分けられ、
まず、オフセット検出処理及び160個の11 8.
IIサンプルの生成が行われる。次にサンプル“So′
はLARデータに量子化される8つのPARCOR係数
kiを生成するLPG分析に付される。
PARCOR係数kiを用いてLPG短区間フィルタを
調整し、160個のサンプルIt soI+を処理して
残差信号r (n)を導出する。上記r(n)のサンプ
ルセグメントは40個分のサンプルの長さのサブセグメ
ントに分けられる。これらのサブセグメントの各々は前
に導出された120個分のサンプルの長さのyセグメン
トを用いるLTP係数の計算のために処理される。LT
P係数の計算によってサブセグメントの合成のために量
子化されたb及びMが与えられる。これらのb及びMの
データはLTPフィルタの調整のために用いられる量子
化(Q)の前に一度量子化解除(Q)される(又は直接
的に選択される)。次に、r(n)から上記LTPフィ
ルタの出力を減じると、e (n)が得られる。
調整し、160個のサンプルIt soI+を処理して
残差信号r (n)を導出する。上記r(n)のサンプ
ルセグメントは40個分のサンプルの長さのサブセグメ
ントに分けられる。これらのサブセグメントの各々は前
に導出された120個分のサンプルの長さのyセグメン
トを用いるLTP係数の計算のために処理される。LT
P係数の計算によってサブセグメントの合成のために量
子化されたb及びMが与えられる。これらのb及びMの
データはLTPフィルタの調整のために用いられる量子
化(Q)の前に一度量子化解除(Q)される(又は直接
的に選択される)。次に、r(n)から上記LTPフィ
ルタの出力を減じると、e (n)が得られる。
40個の連続的なe(n)のサンプルはより少ないXL
個のサンプルのセット及びセット参照しにコード化され
る。X及びLはそれぞれ量子化L (Q)される。量子化解除(Q)されオーバーサンプリ
ングされたサンプルのサブセグメンl−(e’(n))
はLTP係数の計算から始まるオペレーションを繰返す
ことによって完全なセグメン1−までのLTPの合成及
び遅延線の更新のために使用される。
個のサンプルのセット及びセット参照しにコード化され
る。X及びLはそれぞれ量子化L (Q)される。量子化解除(Q)されオーバーサンプリ
ングされたサンプルのサブセグメンl−(e’(n))
はLTP係数の計算から始まるオペレーションを繰返す
ことによって完全なセグメン1−までのLTPの合成及
び遅延線の更新のために使用される。
相関的な音声合成(すなわち、デコーディング)は以下
のオペレーションを有する。
のオペレーションを有する。
・160個のe′のサンプルを生成するための量子化解
除されたパラメータXL及びLを用いるRPEデコーデ
ィング ・量子化解除されたLTPパラメータを用いるLTP合
成及び遅延線の更新、160個の復元された残差サンプ
ルr″の導出 ・合成された残差信号サンプルについてのLPG合成及
び合成された音声信号S′の生成LTP係数の計算ステ
ップをさらに詳しく説明する(第4図)。M1のH1算
のためにバッファされた最初の入力サンプルは現在のy
の120個のサン−プル(Oないし119)とrの40
個のサンプル(0ないし39)である。次にR (n)
の値が式(3)に従って分類され、M1が導出される。
除されたパラメータXL及びLを用いるRPEデコーデ
ィング ・量子化解除されたLTPパラメータを用いるLTP合
成及び遅延線の更新、160個の復元された残差サンプ
ルr″の導出 ・合成された残差信号サンプルについてのLPG合成及
び合成された音声信号S′の生成LTP係数の計算ステ
ップをさらに詳しく説明する(第4図)。M1のH1算
のためにバッファされた最初の入力サンプルは現在のy
の120個のサン−プル(Oないし119)とrの40
個のサンプル(0ないし39)である。次にR (n)
の値が式(3)に従って分類され、M1が導出される。
このMlk用いて式(4)に従ってb1が計算され、こ
れに応じてLTPフィルタがセットされ、信号が1サブ
セグメント(すなわち、サンプル40個分)だけシフト
される。次に以下の式に従ってサンプル指標をセットす
ることによってM2が計算される。
れに応じてLTPフィルタがセットされ、信号が1サブ
セグメント(すなわち、サンプル40個分)だけシフト
される。次に以下の式に従ってサンプル指標をセットす
ることによってM2が計算される。
n=pMj−1+k .
(5)p= (1/3、1/2、1、2、3).k=
−5、−4,・・一・、+5及び3 9 < n <
1 2 1換言すれば、ピッチ関連データMの高調波及
び低調波に関して位置するサンプルについてサンプル指
標nをセッ1へすることである。次に、を計算し、M2
及びb2の導出のためR(n)の分類(選出)にもどる
。
(5)p= (1/3、1/2、1、2、3).k=
−5、−4,・・一・、+5及び3 9 < n <
1 2 1換言すれば、ピッチ関連データMの高調波及
び低調波に関して位置するサンプルについてサンプル指
標nをセッ1へすることである。次に、を計算し、M2
及びb2の導出のためR(n)の分類(選出)にもどる
。
最終的に、式(5)で始まるプロセスはM3、b3及び
M4、b4を導出するために繰返される。
M4、b4を導出するために繰返される。
以上本発明のプロセスを.RPE手法を用いることによ
って低レー1〜が達成されるような特定のコーダの例に
関して説明したが、本発明はM P E(multip
le excitation)やC E L P (c
odeexcited linear predict
ive coding)のような他の低レートコード化
手法にも適用できる。また、r (n)はフルバンド残
差又はベースバンド残差のいずれでもよい。
って低レー1〜が達成されるような特定のコーダの例に
関して説明したが、本発明はM P E(multip
le excitation)やC E L P (c
odeexcited linear predict
ive coding)のような他の低レートコード化
手法にも適用できる。また、r (n)はフルバンド残
差又はベースバンド残差のいずれでもよい。
E.発明の効果
以上説明したように本発明よれば、ピーク検出に関する
計算負荷を減ずることができる。
計算負荷を減ずることができる。
第1図及び第2図は本発明を適用することのできる音声
コーダを示す図、第3A図、第3B図及び第4図は本発
明に基づくプロセスを表わすアルゴリズムを説明する図
である。 出願人 インターナショナル・ビジネス・マシーンズ
・コーポレーション 代理人 弁理士 頓 宮 孝 (外1名)
コーダを示す図、第3A図、第3B図及び第4図は本発
明に基づくプロセスを表わすアルゴリズムを説明する図
である。 出願人 インターナショナル・ビジネス・マシーンズ
・コーポレーション 代理人 弁理士 頓 宮 孝 (外1名)
Claims (1)
- 【特許請求の範囲】 音声から導出されたデジタル信号r(n)を低ビットレ
ートの信号に変換する長区間予測に基づく音声コーダで
使用される長区間予測フィルタを調整するためのピッチ
関連遅延値Mを導出する下記の(a)ないし(h)のス
テップを有する方法。 (a)上記信号r(n)を各々がN個のサンプルから成
るセグメントに分割するステップ。 (b)各セグメントをj個(jは所定の整数)のサブセ
グメントに分割するステップ。 (c)現信号の最初のサブセグメントと復元された信号
のセグメントと相互相関をとって下記の相互相関関数R
(n)を導出するステップ。 R(n)=Σ^k’^−^1_i_=_0r(i)y(
i−n)n=k’ないしNただしk’=N/j (d)ピーク位置R(M1)についてR(n)の値を選
出し、上記フィルタの遅延値をM1に設定し、信号をサ
ブセグメント1個分についてシフトするステップ。 (e)M1の高調波及び低調波のところに位置する所定
数のサンプルについてのサンプル指標nを計算するステ
ップ。 (f)ステップ(e)で定義されたnについて相互相関
関数の値R(n)を計算するステップ。 (g)新しい遅延値M2を導出するためピーク位置につ
いてR(n)の値を選出するステップ。 (h)上記(e)から(g)までのステップをM1の代
わりにM2について実行し、以下同様にMjになるまで
(e)から(g)までのステップを繰返すステップ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP89480052A EP0392126B1 (en) | 1989-04-11 | 1989-04-11 | Fast pitch tracking process for LTP-based speech coders |
EP89480052.3 | 1989-04-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02293800A true JPH02293800A (ja) | 1990-12-04 |
JP2650201B2 JP2650201B2 (ja) | 1997-09-03 |
Family
ID=8203055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2093314A Expired - Lifetime JP2650201B2 (ja) | 1989-04-11 | 1990-04-10 | ピツチ関連遅延値を導出する方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5093863A (ja) |
EP (1) | EP0392126B1 (ja) |
JP (1) | JP2650201B2 (ja) |
DE (1) | DE68916944T2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04270398A (ja) * | 1991-02-26 | 1992-09-25 | Nec Corp | 音声符号化方式 |
JPH09181611A (ja) * | 1995-12-23 | 1997-07-11 | Nec Corp | 信号符号化装置及び方法 |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
ES2225321T3 (es) * | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
US5448683A (en) * | 1991-06-24 | 1995-09-05 | Kokusai Electric Co., Ltd. | Speech encoder |
US5353372A (en) * | 1992-01-27 | 1994-10-04 | The Board Of Trustees Of The Leland Stanford Junior University | Accurate pitch measurement and tracking system and method |
US5630016A (en) * | 1992-05-28 | 1997-05-13 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
CA2124713C (en) * | 1993-06-18 | 1998-09-22 | Willem Bastiaan Kleijn | Long term predictor |
US6463406B1 (en) * | 1994-03-25 | 2002-10-08 | Texas Instruments Incorporated | Fractional pitch method |
TW271524B (ja) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
DE69836454T2 (de) * | 1997-02-10 | 2007-10-04 | Koninklijke Philips Electronics N.V. | Kommunikationsnetzwerk zur übertragung von sprachsignalen |
EP0938781A2 (en) * | 1997-09-12 | 1999-09-01 | Cellon France SAS | Transmission system with improved reconstruction of missing parts |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US8670390B2 (en) | 2000-11-22 | 2014-03-11 | Genghiscomm Holdings, LLC | Cooperative beam-forming in wireless networks |
US9819449B2 (en) | 2002-05-14 | 2017-11-14 | Genghiscomm Holdings, LLC | Cooperative subspace demultiplexing in content delivery networks |
US10931338B2 (en) | 2001-04-26 | 2021-02-23 | Genghiscomm Holdings, LLC | Coordinated multipoint systems |
US10355720B2 (en) | 2001-04-26 | 2019-07-16 | Genghiscomm Holdings, LLC | Distributed software-defined radio |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US10644916B1 (en) | 2002-05-14 | 2020-05-05 | Genghiscomm Holdings, LLC | Spreading and precoding in OFDM |
US9628231B2 (en) | 2002-05-14 | 2017-04-18 | Genghiscomm Holdings, LLC | Spreading and precoding in OFDM |
US10200227B2 (en) | 2002-05-14 | 2019-02-05 | Genghiscomm Holdings, LLC | Pre-coding in multi-user MIMO |
US10142082B1 (en) | 2002-05-14 | 2018-11-27 | Genghiscomm Holdings, LLC | Pre-coding in OFDM |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7286604B2 (en) * | 2003-05-27 | 2007-10-23 | Aquity Llc | Carrier interferometry coding and multicarrier processing |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
US11431386B1 (en) | 2004-08-02 | 2022-08-30 | Genghiscomm Holdings, LLC | Transmit pre-coding |
US11552737B1 (en) | 2004-08-02 | 2023-01-10 | Genghiscomm Holdings, LLC | Cooperative MIMO |
US11184037B1 (en) | 2004-08-02 | 2021-11-23 | Genghiscomm Holdings, LLC | Demodulating and decoding carrier interferometry signals |
US12224860B1 (en) | 2014-01-30 | 2025-02-11 | Genghiscomm Holdings, LLC | Linear coding in decentralized networks |
US10243773B1 (en) | 2017-06-30 | 2019-03-26 | Genghiscomm Holdings, LLC | Efficient peak-to-average-power reduction for OFDM and MIMO-OFDM |
US10637705B1 (en) | 2017-05-25 | 2020-04-28 | Genghiscomm Holdings, LLC | Peak-to-average-power reduction for OFDM multiple access |
US11343823B2 (en) | 2020-08-16 | 2022-05-24 | Tybalt, Llc | Orthogonal multiple access and non-orthogonal multiple access |
US12206535B1 (en) | 2018-06-17 | 2025-01-21 | Tybalt, Llc | Artificial neural networks in wireless communication systems |
US11917604B2 (en) | 2019-01-25 | 2024-02-27 | Tybalt, Llc | Orthogonal multiple access and non-orthogonal multiple access |
WO2020154550A1 (en) | 2019-01-25 | 2020-07-30 | Genghiscomm Holdings, LLC | Orthogonal multiple access and non-orthogonal multiple access |
WO2020242898A1 (en) | 2019-05-26 | 2020-12-03 | Genghiscomm Holdings, LLC | Non-orthogonal multiple access |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0243562B1 (en) * | 1986-04-30 | 1992-01-29 | International Business Machines Corporation | Improved voice coding process and device for implementing said process |
US5012517A (en) * | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
-
1989
- 1989-04-11 DE DE68916944T patent/DE68916944T2/de not_active Expired - Fee Related
- 1989-04-11 EP EP89480052A patent/EP0392126B1/en not_active Expired - Lifetime
-
1990
- 1990-04-06 US US07/505,732 patent/US5093863A/en not_active Expired - Fee Related
- 1990-04-10 JP JP2093314A patent/JP2650201B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04270398A (ja) * | 1991-02-26 | 1992-09-25 | Nec Corp | 音声符号化方式 |
JPH09181611A (ja) * | 1995-12-23 | 1997-07-11 | Nec Corp | 信号符号化装置及び方法 |
Also Published As
Publication number | Publication date |
---|---|
EP0392126A1 (en) | 1990-10-17 |
EP0392126B1 (en) | 1994-07-20 |
DE68916944T2 (de) | 1995-03-16 |
US5093863A (en) | 1992-03-03 |
JP2650201B2 (ja) | 1997-09-03 |
DE68916944D1 (de) | 1994-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH02293800A (ja) | ピツチ関連遅延値を導出する方法 | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
US6427135B1 (en) | Method for encoding speech wherein pitch periods are changed based upon input speech signal | |
US5359696A (en) | Digital speech coder having improved sub-sample resolution long-term predictor | |
US5495555A (en) | High quality low bit rate celp-based speech codec | |
JP3936139B2 (ja) | オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置 | |
US5734789A (en) | Voiced, unvoiced or noise modes in a CELP vocoder | |
KR100304682B1 (ko) | 음성 코더용 고속 여기 코딩 | |
JP2003512654A (ja) | 音声の可変レートコーディングのための方法およびその装置 | |
US5577159A (en) | Time-frequency interpolation with application to low rate speech coding | |
EP0450064B1 (en) | Digital speech coder having improved sub-sample resolution long-term predictor | |
US20240177720A1 (en) | Processor for generating a prediction spectrum based on long-term prediction and/or harmonic post-filtering | |
EP0415675B1 (en) | Constrained-stochastic-excitation coding | |
AU669788B2 (en) | Method for generating a spectral noise weighting filter for use in a speech coder | |
Prandoni et al. | R/D optimal linear prediction | |
KR20240040086A (ko) | 적분 대역별 파라메트릭 오디오 코딩 | |
US5692101A (en) | Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques | |
US6535847B1 (en) | Audio signal processing | |
JP3168238B2 (ja) | 再構成音声信号の周期性を増大させる方法および装置 | |
JP2000132194A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH06130994A (ja) | 音声符号化方法 | |
GB2352949A (en) | Speech coder for communications unit | |
JP4007730B2 (ja) | 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体 | |
EP0987680A1 (en) | Audio signal processing | |
JP2000132195A (ja) | 信号符号化装置及び方法 |