JP3490685B2 - 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 - Google Patents
広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置Info
- Publication number
- JP3490685B2 JP3490685B2 JP2000578808A JP2000578808A JP3490685B2 JP 3490685 B2 JP3490685 B2 JP 3490685B2 JP 2000578808 A JP2000578808 A JP 2000578808A JP 2000578808 A JP2000578808 A JP 2000578808A JP 3490685 B2 JP3490685 B2 JP 3490685B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- code vector
- signal
- prediction error
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Optical Recording Or Reproduction (AREA)
- Error Detection And Correction (AREA)
- Mobile Radio Communication Systems (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Dc Digital Transmission (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Networks Using Active Elements (AREA)
- Measuring Frequencies, Analyzing Spectra (AREA)
- Radar Systems Or Details Thereof (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Preliminary Treatment Of Fibers (AREA)
- Package Frames And Binding Bands (AREA)
- Coils Or Transformers For Communication (AREA)
- Inorganic Insulating Materials (AREA)
- Parts Printed On Printed Circuit Boards (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereo-Broadcasting Methods (AREA)
- Television Systems (AREA)
- Installation Of Indoor Wiring (AREA)
- Image Processing (AREA)
- Optical Communication System (AREA)
- Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
Description
ものではないが音声信号を、この広帯域音響信号の送信
または記憶および合成のためにディジタル符号化するた
めの効率的な方法に関する。さらに特に、本発明は、改
良されたピッチ探索装置および方法に関する。 2. 従来技術の簡単な説明 例えば音声/映像電子会議システム、マルチメディア、
ワイヤレスアプリケーション、並びに、インターネット
およびパケットネットワークアプリケーションのような
様々な用途において、主観的品質/ビットレートの良好
なトレードオフを有する効率的なディジタル広帯域音声
/オーディオ符号化技術に対する要求がますます高まっ
ている。最近になるまで、主として200−3400H
z帯域内のフィルタリングされた電話帯域幅が音声符号
化アプリケーションで使用されていた。しかし、音声信
号の了解性と自然さを向上させるために、広帯域音声ア
プリケーションに対する要求がますます高まっている。
50−7000Hz帯域の帯域幅が、対面音声品質を実
現するのに十分であることが発見された。オーディオ信
号に関しては、この帯域は許容可能なオーディオ品質を
もたらすが、この品質は20−20000Hz帯域を使
用するCD品質よりは依然として低い。
ットストリームに変換し、このディジタルビットストリ
ームが通信チャネルを経由して伝送される(または、記
憶媒体内に記憶される)。音声信号はディジタル化され
(すなわち、通常は16ビットサンプリングによって量
子化され)、音声エンコーダは、より少ないビット数で
これらのディジタルサンプルを表現すると同時に良好な
主観的音声品質を維持するという役割を有する。この音
声デコーダ或いはシンセサイザは、伝送または記憶され
たビットストリームに演算を施し、このビットストリー
ムを変換して音声信号に戻す。
を実現することが可能な最良の従来技術の1つが、いわ
ゆる符号励起線形予測(CELP)方式である。この方
式では、サンプリングされた音声信号を、一般にフレー
ムと呼ばれる、1個のブロックがL個のサンプルから成
る連続したブロックの形で処理し、ここでLは(10−
30ミリ秒の音声に対応する)何らかの予め決められた
数である。CELPでは、各フレーム毎に線形予測(L
P)合成フィルタを計算して伝送する。その次に、L個
のサンプルから成るフレームを、N個のサンプルから成
るサブフレームと呼ばれるより小さいブロックに分割
し、ここではL=kNでありかつkは1フレーム内のサ
ブフレームの個数である(Nは一般に4−10ミリ秒の
音声に対応する)。励起信号を各サブフレーム内で求
め、この励起信号は、一般に、2つの成分、すなわち、
直前の励起(ピッチ寄与(pitch contrib
ution)または適応コードブックとも呼ばれる)か
らの一方の成分と、イノベーティブコードブック(in
novative codebook)(固定コードブ
ックとも呼ばれる)からの他方の成分とから成る。この
励起信号が伝送され、合成音声を得るためにLP合成フ
ィルタの入力としてデコーダで使用される。
ックは、N次元のコードベクトルと呼ばれるサンプルN
個分の長さのシーケンスの索引付きセットである。各々
のコードブックシーケンスは、1からMの範囲内の整数
kによる索引を付けられ、ここでMはビット数bとして
表現されることが多いコードブックのサイズを表し、こ
こでM=2bである。
には、コードブックからの適切なコードベクトルを音声
信号のスペクトル特徴をモデル化する時変フィルタに通
してフィルタリングすることによって、N個のサンプル
から成るブロックの各々を合成する。エンコーダ側で
は、コードブックからのコードベクトルの全てまたはそ
のサブセットに関して合成出力を計算する(コードブッ
ク探索)。こうして得られたコードベクトルは、聴覚的
に重み付けされた歪み測度にしたがってオリジナルの音
声信号に最も近い合成出力を生成するコードベクトルで
ある。この聴覚重み付けを、いわゆる聴覚重み付けフィ
ルタを使用して行い、この聴覚重み付けフィルタは一般
的にLP合成フィルタから得られる。
号化に非常に有効であり、CELPを基礎とする幾つか
の規格が、広範囲のアプリケーション、特にディジタル
移動電話アプリケーションにおいて存在している。電話
帯域では、音声信号は200−3400Hzに帯域制限
され、8000サンプル/秒でサンプリングされる。広
帯域音声/オーディオアプリケーションでは、音声信号
は50−7000Hzに帯域制限され、16000サン
プル/秒でサンプリングされる。
広帯域信号に適用する時には幾つかの問題が生じ、高品
質の広帯域信号を得るためにはこのモデルに追加の特徴
を加えることが必要である。広帯域信号は、電話帯域信
号に比較してはるかに広いダイナミックレンジを示し、
このことが、(ワイヤレスアプリケーションでは必須で
ある)このアルゴリズムの固定小数点処理系が必要とさ
れる時に、精度上の問題を生じさせる。さらに、CEL
Pモデルは、通常はより高いエネルギー成分を有する低
周波数領域にその符号化ビットの大半を費やすことが多
く、この結果としてローパスの出力信号が生じる。この
問題を克服するために、聴覚重み付けフィルタを広帯域
信号に適合するように改変しなければならず、かつ、高
周波数領域を強調するプリエンファシス方式が、ダイナ
ミックレンジを低減させてより単純な固定小数点処理系
を実現するために、および、信号のより高い周波数の成
分をより適切に符号化することを確実にするために重要
になる。さらに、広帯域信号中の有声音セグメントのス
ペクトルのピッチ成分はスペクトル全体にわたらず、有
声音の量は狭帯域信号に比較して、より狭いばらつきを
見せる。したがって、広帯域信号の場合には、既存のピ
ッチ探索構造はあまり効率的ではない。したがって、有
声音レベルのばらつきによりうまく対応するように、閉
ループピッチ分析を改良することが重要である。 発明の目的 したがって、本発明の目的は、高音質の再生音響信号を
得るために改良されたピッチ分析を使用する、CELP
タイプの符号化技術を使用して広帯域(7000Hz)
の音響信号を効率的に符号化する方法および装置を提供
することである。 発明の概要 さらに明確に述べると、本発明によって、少なくとも2
つの信号経路から、最小の計算ピッチ予測誤差を有する
信号経路に関連しているピッチコードブックパラメータ
の最適なセットを選択する方法が提供される。ピッチ予
測誤差は、ピッチコードブック探索装置からのピッチコ
ードベクトルに応答して計算される。2つの信号経路の
うちの少なくとも1つの信号経路では、その1つの信号
経路のピッチ予測誤差の計算のためにピッチコードベク
トルを供給する前に、ピッチ予測誤差がフィルタリング
される。最後に、少なくとも2つの信号経路で計算され
たピッチ予測誤差が互いに比較され、最小の計算ピッチ
予測誤差を有する信号経路が選択され、この選択された
信号経路に関連しているピッチコードブックパラメータ
のセットが選択される。
ットを生成するための本発明のピッチ分析装置は、 a)ピッチコードブックパラメータのそれぞれのセット
に関連している少なくとも2つの信号経路であって、 i)各信号経路は、ピッチコードブック探索装置からの
ピッチコードベクトルのピッチ予測誤差を計算するピッ
チ予測誤差計算装置を含み、 ii)2つの信号経路のうちの少なくとも1つの信号経
路は、ピッチコードベクトルをその経路のピッチ予測誤
差計算装置に供給する前にピッチコードベクトルをフィ
ルタリングするフィルタを含む信号経路と、 b)信号経路において計算されたピッチ予測誤差を互い
に比較し、最小の計算ピッチ予測誤差を有する信号経路
を選択し、その選択された信号経路に関連しているピッ
チコードブックパラメータのセットを選択するセレクタ
とを含む。
デル化を行うこの新たな方法および装置は、直前の励起
に適用される幾つかの形のローパスフィルタを使用し、
より高い予測ゲインを生じさせるローパスフィルタが選
択される。サブサンプルピッチ分解能が使用される時に
は、これらのローパスフィルタは、より高いピッチ分解
能を得るために使用される補間フィルタの中に組み込ま
れることが可能である。
ッチ分析装置のピッチ予測誤差計算装置の各々が、 a)ピッチコードベクトルを重み付けされた合成フィル
タインパルス応答信号と畳み込み演算し、それによって
畳み込まれたピッチコードベクトルを計算する畳み込み
ユニットと、 b)畳み込まれたピッチコードベクトルとピッチ探索タ
ーゲットベクトルとに応答してピッチゲインを計算する
ピッチゲイン計算器と、 c)畳み込まれたピッチコードベクトルにピッチゲイン
を乗算して、増幅された畳み込みピッチコードベクトル
を生成する増幅器と、 d)増幅された畳み込みピッチコードベクトルをピッチ
探索ターゲットベクトルと組み合わせてピッチ予測誤差
を生成するコンバイナー回路とを含む。
チゲイン計算器は、次の関係を使用してピッチゲインb
(j)を計算する手段を含み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、さらに、ここでxはピッチ探索ターゲ
ットベクトルであり、y(j)は畳み込みピッチコードベ
クトルである。
を有する、広帯域入力信号を符号化するためのエンコー
ダにも関し、このエンコーダは、 a)広帯域信号に応答して線形予測合成フィルタ係数を
生成する線形予測合成フィルタ計算器と、 b)広帯域信号と線形予測合成フィルタ係数とに応答し
て、聴覚的に重み付けされた信号を生成する聴覚重み付
けフィルタと、 c)線形予測合成フィルタ係数に応答して、重み付けさ
れた合成フィルタインパルス応答信号を生成するインパ
ルス応答発生器と、 d)ピッチコードブックパラメータを生成するピッチ探
索ユニットであって、 i)聴覚重み付けされた信号と線形予測合成フィルタ係
数とに応答して、ピッチコードベクトルとイノベーティ
ブ探索ターゲットベクトルとを生成するピッチコードブ
ック探索装置と、 ii)ピッチコードベクトルに応答して、ピッチコード
ブックパラメータのセットから、最小の計算ピッチ予測
誤差を有する経路に関連しているピッチコードブックパ
ラメータのセットを選択するピッチ分析装置とを含むピ
ッチ探索ユニットと、 d)重み付けされた合成フィルタインパルス応答信号と
イノベーティブ探索ターゲットベクトルとに応答して、
イノベーティブコードブックパラメータを生成するイノ
ベーティブコードブック探索装置と、 e)最小のピッチ予測誤差を有する経路に関連している
ピッチコードブックパラメータのセットと、イノベーテ
ィブコードブックパラメータと、線形予測合成フィルタ
係数とを含む、符号化された広帯域信号を生成する信号
形成装置とを含む。
む、セルラー通信システムと、セルラー移動送信機/受
信機ユニットと、セルラーネットワーク要素と、双方向
無線通信サブシステムとに関する。本発明の単なる例示
を行う下記の本発明の好ましい実施形態の非限定的な説
明を添付図面を参照しながら理解することによって、本
発明の目的と利点と他の特徴とがより明確になるだろ
う。 好ましい実施形態の詳細な説明 当業者に周知であるように、401(図4を参照された
い)のようなセルラー通信システムが、広い地理的区域
をC個のより小さいセルに分割することによってその広
い地理的区域全体にわたって通信サービスを提供する。
C個の小さいセルは、その各セルに無線信号チャネルと
オーディオチャネルとデータチャネルとを提供するべつ
べつのセルラー基地局4021、4022、...、40
2Cによって通信サービスを提供される。
2のサービスエリア(セル)の限界内の403のような
移動無線電話(移動送信機/受信機ユニット)の呼出
と、基地局のセルの内側もしくは外側に位置する他の無
線電話403に対して、または、公衆交換電話網(PS
TN)404のような別のネットワークに対して呼出を
行うために使用される。
るかまたは呼出を受信することに成功すると、オーディ
オチャネルまたはデータチャネルが、この無線電話40
3と、この無線電話403が中に位置しているセルに対
応するセルラー基地局402との間に確立され、基地局
402と無線電話403との間の通信がオーディオチャ
ネルまたはデータチャネルを通して行われる。さらに、
無線電話403は、通話が進行している最中に無線信号
チャネルを通して制御情報またはタイミング情報を受信
することもできる。
がセルの外に出て別の隣接セルの中に入る場合には、無
線電話403は、その新たなセル基地局402の使用可
能なオーディオまたはデータチャネルに通話をハンドオ
ーバーする。通話が進行していない時に無線電話403
がセルの外に出て別の隣接セルの中に入る場合には、無
線電話403は、新たなセルの基地局402にログイン
するために無線信号送信チャネルを通して制御メッセー
ジを送る。このようにして、広い地理的区域全体にわた
っての移動通信が可能である。
例えば無線電話403とPSTN404との間の通信、
または、第1のセル内に位置した無線電話403と第2
のセル内に位置した無線電話403との間の通信の最中
に、セルラー基地局402とPSTN 404との間の
通信を制御するための制御端末装置405を含む。もち
ろん、1つのセルの基地局402とそのセル内に位置し
た無線電話403との間にオーディオチャネルまたはデ
ータチャネルを確立するためには、双方向無線通信サブ
システムが必要である。図4に非常に単純化して示して
いるように、こうした双方向無線通信サブシステムは、
一般に、無線電話403内に、音声信号を符号化するエ
ンコーダ407と、エンコーダ407からの符号化音声
信号を409のようなアンテナを通して送信する送信回
路408とを含む送信機406と、一般には同一のアン
テナ409を通して、送信された符号化音声信号を受信
する受信回路411と、受信回路411からの受信した
符号化音声信号を復号するデコーダ412とを含む受信
機410とを含む。
デコーダ412とが接続されておりかつこれらからの信
号を処理するための他の従来通りの無線電話回路413
も含み、この回路413は当業者に公知であり、したが
って本明細書ではさらに詳細には説明しない。さらに、
こうした双方向無線通信サブシステムは、一般に、その
基地局402内に、音声信号を符号化するエンコーダ4
15と、エンコーダ415からの符号化音声信号を41
7のようなアンテナを通して送信する送信回路416と
を含む送信機414と、同一のアンテナ409または別
のアンテナ(図示していない)を通して、送信された符
号化音声信号を受信する受信回路419と、受信回路4
19からの受信した符号化音声信号を復号するデコーダ
420とを含む受信機418とを含む。
末装置405と送信機414と受信機418の間の通信
を制御するための、基地局制御装置421とこれに関連
したデータベース422とを含む。当業者には周知であ
るように、双方向無線通信サブシステムにおいて、すな
わち、無線電話403と基地局402との間で、例えば
音声といった有声音信号のような音響信号を送信するの
に必要な帯域幅を縮小するために、音声符号化が必要と
されている。
のように一般に13キロビット/秒以下で動作する(4
15および407のような)LPボイスエンコーダは、
音声信号の短期スペクトル包絡線をモデル化するために
LP合成フィルタを使用することが一般的である。一般
には10ミリ秒毎または20ミリ秒毎にLP情報がデコ
ーダ(例えば、420、412)に伝送され、デコーダ
側で抽出される。
基づく別の符号化システムを使用してもよい。しかし、
CELPタイプの符号化システムを、本発明の方法を非
限定的に例示するための好ましい実施形態で使用する。
同様に、こうした方式を、有声音および音声以外の音響
信号と共に使用することも、他のタイプの広帯域信号と
共に使用することも可能である。
ように改変されたCELPタイプの音声符号化装置10
0の略ブロック図を示す。サンプリングされた入力音声
信号114が、ブロック1個当たりL個のサンプルから
成る連続した「フレーム」と呼ばれるブロックに分割さ
れる。各フレームにおいて、そのフレーム内の音声信号
を表す異なったパラメータが計算され、符号化され、伝
送される。一般的に、LP合成フィルタを表現するLP
パラメータが各フレーム毎に1回計算される。各フレー
ムは、N個のサンプルから成るより小さいブロック(長
さNのブロック)にさらに分割され、このブロックでは
励起パラメータ(ピッチおよびイノベーション)が求め
られる。CELPの文献では、こうした長さNのブロッ
クは「サブフレーム」と呼ばれ、このサブフレーム中の
N個のサンプル信号は「N次元ベクトル」と呼ばれてい
る。この好ましい実施形態では、長さNは5ミリ秒に相
当し、一方、長さLは20ミリ秒に相当し、このこと
は、1個のフレームが4個のサブフレームを含むことを
意味する(16kHzのサンプリングレートではN=8
0であり、12.8kHzへのダウンサンプリング後で
は、N=64である)。様々なN次元ベクトルが符号化
手順中に生じる。図1と図2に現れるベクトルのリスト
と、伝送されるパラメータのリストとを次に示す。 主要なN次元ベクトルのリスト s 広帯域信号入力音声ベクトル(ダウンサンプリング
と前処理とプリエンファシスとの後)、 sw 重み付けされた音声ベクトル、 so 重み付けされた合成フィルタのゼロ入力応答、 sp ダウンサンプリングされ前処理された信号、 オーバサンプリングされた合成音声信号、 s′ デエンファシス前の合成信号、 sd デエンファシスされた合成信号、 sh デエンファシスおよび後処理後の合成信号、 x ピッチ探索のためのターゲットベクトル、 x′ イノベーション探索のためのターゲットベクト
ル、 h 重み付けされた合成フィルタインパルス応答、 vT 遅延Tにおける適応(ピッチ)コードブック、 yT フィルタリングされたピッチコードブックベクト
ル(hと畳み込み演算されたvT)、 ck 索引kにおけるイノベーティブコードベクトル
(イノベーションコードブックからのk番目のエント
リ)、 cf 強調されたスケーリング済みイノベーションコー
ドベクトル、 u 励起信号(スケーリングされたイノベーションコー
ドベクトルおよびピッチコードベクトル)、 u′ 強調された励起、 z 帯域通過ノイズシーケンス、 w′ ホワイトノイズシーケンス、 w スケーリングされたノイズシーケンス。 伝送されるパラメータのリスト STP 短期予測パラメータ(A(z)を定義する)、 T ピッチ遅れ(すなわち、ピッチコードブック索
引)、 b ピッチゲイン(すなわち、ピッチコードブックゲイ
ン)、 j ピッチコードベクトルで使用されるローパスフィル
タの索引、 k コードベクトル索引(イノベーションコードブック
エントリ)、 g イノベーションコードブックゲイン。
ータはフレーム1個当たり1回伝送され、その他のパラ
メータはフレーム1個当たり4回(すなわち各サブフレ
ーム毎に1回)伝送される。 エンコーダ側 サンプリングされた音声信号を、101から111の番
号が付いた11個のモジュールに分けた図1の符号化装
置100によって各ブロック単位で符号化する。
個のサンプルから成るブロックの形に処理する。図1を
参照すると、サンプリングされた入力音声信号114を
ダウンサンプリングモジュール101においてダウンサ
ンプリングする。例えば、当業者に周知の方法を使用し
て、この信号を16kHzから12.8kHzにダウン
サンプリングする。もちろん、別の周波数へのダウンサ
ンプリングも想定可能である。ダウンサンプリングは、
より小さい周波数帯域幅が符号化されるので、符号化効
率を向上させる。さらに、これは、1フレーム中のサン
プルの数が減少させられるので、アルゴリズムの複雑性
を低減させる。ビットレートを16キロビット/秒未満
に低下させる時には、ダウンサンプリングの使用が重要
になるが、16キロビット/秒を越える場合にはダウン
サンプリングは不可欠ではない。
り320サンプルフレームが245サンプルフレームに
縮小される(ダウンサンプリング率は4/5である)。
その次に、入力フレームを随意採用の前処理ブロック1
02に送る。前処理ブロック102は、50Hzのカッ
トオフ周波数を有するハイパスフィルタから成ってもよ
い。ハイパスフィルタ102は、50Hz未満の不要な
音響成分を除去する。
を、sp(n)、n=0,1,2,...、L−1で表
し、ここでLはフレームの長さである(12.8kHz
のサンプリング周波数では256)。プリエンファシス
フィルタ103の好ましい具体例では、信号sp(n)
は、次の伝達関数を有するフィルタを使用してプリエン
ファシスされる。
数である(典型的な値はμ=0.7である)。より高次
のフィルタを使用してもよい。より効率的な固定小数点
処理系を得るために、ハイパスフィルタ102とプリエ
ンファシスフィルタ103とを互いに交換することが可
能であることを指摘しておかなければならない。
は、入力信号の高周波数成分を強調することである。さ
らに、このプリエンファシスフィルタ103は入力音声
信号のダイナミックレンジを縮小し、このことが入力音
声信号を固定小数点処理系により一層適したものにす
る。プリエンファシスを行わない場合には、固定小数点
を使用する単精度演算の形でのLP分析は実行が困難で
ある。
適正な包括的な聴覚重み付けを実現する上で重要な役割
を果たし、音質の改善に寄与する。これについては、さ
らに詳細に後述する。プリエンファシスフィルタ103
の出力をs(n)で表す。この信号は、計算器モジュー
ル104でLP分析を行うために使用される。LP分析
は当業者に周知の方法である。この好ましい実施形態で
は、自己相関アプローチを使用する。この自己相関アプ
ローチでは、最初に、(約30−40ミリ秒の長さを有
することが一般的である)ハミング窓を使用して信号s
(n)をウィンドウ処理する。このウィンドウ処理され
た信号から自己相関を計算し、LPフィルタ係数aiを
計算するためにレヴィンソン−ダービンの再帰計算を使
用し、ここでi=1,...,pであり、pはLP次数
であり、広帯域符号化の場合には16であることが一般
的である。パラメータaiは、LPフィルタの伝達関数
の係数であり、次の関係式で示される。
い、この計算器モジュール104はさらに、LPフィル
タ係数の量子化と補間も行う。最初に、LPフィルタ係
数を、量子化と補間により適している別の同等のドメイ
ンに変換する。線スペクトル対(LSP)ドメインとイ
ミタンス(immitance)スペクトル対(IS
P)ドメインとが、量子化と補間を効率的に行うことが
できる2つのドメインである。16個のLPフィルタ係
数aiを、分割量子化または多段量子化またはこれらの
組合せを使用して約30ビットから50ビットに量子化
することが可能である。補間の目的は、各フレーム毎に
1回ずつLPフィルタ係数を伝送しつつ各サブフレーム
毎にLPフィルタ係数を更新することを可能にすること
であり、このことがビットレートを増加させることなし
にエンコーダの性能を向上させる。LPフィルタ係数の
量子化と補間は、他の点では当業者に周知であると考え
られ、したがって本明細書ではさらに詳細には説明しな
い。
されたドメインにおいて入力音声と合成音声の間の平均
2乗誤差を最小化することによって、最適のピッチおよ
びイノベーションパラメータを探索する。これは、重み
付けされた入力音声と重み付けされた合成音声との間の
誤差を最小化することと同等である。
み付けフィルタ105で計算する。従来通りに、重み付
けされた信号sw(n)を、次式の伝達関数W(z)を
有する重み付けフィルタによって計算する。 W(z)=A(z/γ1)/A(z/γ2)ここで0<γ2<γ1≦1 当業者には周知であるように、従来技術の「合成による
分析」(AbS)エンコーダでは、聴覚重み付けフィル
タ105の伝達関数の逆関数である伝達関数W-1(z)
によって量子化誤差が重み付けされるということが分析
によって示されている。この結果は、B.S.Atal
およびM.R.Schroeder,“Predict
ive coding of speech and
subjective error criteri
a”,IEEE Transaction ASSP,
vol.27,no.3,pp.247−254,Ju
ne1979に詳細に説明されている。伝達関数W
-1(z)は入力音声信号のフォルマント構造の一部分を
示す。したがって、量子化誤差がフォルマント領域内に
より大きいエネルギーを有し、それによってこのフォル
マント領域内に存在する強い信号エネルギーによって量
子化誤差がマスキングされるように量子化誤差を整形す
ることによって、人間の耳のマスキング特性が利用され
る。重み付けの量を係数γ1、γ2で制御する。
は、電話帯域信号には十分に有効に機能する。しかし、
この従来の聴覚重み付けフィルタ105が広帯域信号の
効率的な聴覚重み付けには適していないことが明らかに
なった。さらに、従来の聴覚重み付けフィルタ105が
フォルマント構造とそれに必要なスペクトル傾斜とを同
時にモデル化する上で固有の制限を有することも明らか
になった。スペクトル傾斜は、広帯域信号においては、
低周波数と高周波数の間の広いダイナミックレンジのた
めにより一層顕著である。従来技術は、広帯域入力信号
の傾斜およびフォルマント重み付けを制御するために、
傾斜フィルタをW(z)に加えることを提案している。
によれば、プリエンファシスフィルタ103を入力に導
入することと、プリエンファシスされた音声s(n)に
基づいてLPフィルタA(z)を計算することと、フィ
ルタW(z)の分母を固定することによって改変された
フィルタW(z)を使用することである。LPフィルタ
A(z)を得るために、プリエンファシスされた信号s
(n)に対してモジュール104においてLP分析を行
う。さらに、固定された分母を有する新たな聴覚重み付
けフィルタ105を使用する。聴覚重み付けフィルタ1
04のための伝達関数の一例を次の関係式で示す。
構造が、フォルマント重み付けを傾斜から実質的に切り
離す。A(z)はプリエンファシスされた音声信号s
(n)に基づいて計算されるので、フィルタの傾斜1/
A(z/γ1)は、A(z)がオリジナルの音声に基づ
いて計算される場合よりは顕著ではないということに留
意されたい。次の伝達関数を有するフィルタを使用し
て、デコーダ側でデエンファシスが行われるので、P-1
(z)=1/(1−μz-1)1量子化誤差のスペクトル
は、伝達関数W-1(z)P-1(z)を有するフィルタに
よって整形される。通常はそうであるように、γ2がμ
に等しく設定されている時には、量子化誤差のスペクト
ルは、伝達関数が1/A(z/γ1)であるフィルタに
よって整形され、A(z)はプリエンファシスされた音
声信号に基づいて計算される。プリエンファシスと改変
された重み付けフィルタリングとの組合せによって誤差
の整形を実現するこの構造は、固定小数点アルゴリズム
の実現が容易であるという利点に加えて、広帯域信号の
符号化に関して非常に効率的であるということが、主観
的な聴取によって明らかになった。 ピッチ分析 ピッチ分析を簡略化するために、重み付けされた音声信
号sw(n)を使用して、開ループピッチ探索モジュー
ル106において開ループピッチ遅れTOLを最初に推定
する。その次に、サブフレーム単位で閉ループピッチ探
索モジュール107において行われる閉ループピッチ分
析を、開ループピッチ遅れTOLの付近に制限し、このこ
とがLTPパラメータT、b(ピッチ遅れとピッチゲイ
ン)の探索の複雑性を著しく低減させる。通常は、当業
者に周知の方法を使用して、開ループピッチ分析を10
ミリ秒(2個のサブフレーム)毎に1回ずつモジュール
106で行う。
ック)パラメータb、T、jを閉ループピッチ探索モジ
ュール107において計算し、この閉ループピッチ探索
モジュール107は、入力としてターゲットベクトルx
とインパルス応答ベクトルhと開ループピッチ遅れTOL
とを使用する。従来においては、ピッチ予測は、次の伝
達関数を有するピッチフィルタによって表現されてお
り、 1/(1−bz-T) ここでbはピッチゲインであり、Tはピッチ遅延すなわ
ち遅れである。この場合に、励起信号u(n)に対する
ピッチの寄与はbu(n−T)によって与えられ、この
場合に全励起が、 u(n)=bu(n−T)+gck(n) で与えられ、ここでgはイノベーティブコードブックゲ
インであり、ck(n)は索引kにおけるイノベーティ
ブコードベクトルである。
短い場合に、この表現は制限を有する。別の表現では、
ピッチ寄与を、直前の励起信号を含むピッチコードブッ
クと見なすことが可能である。一般的に、ピッチコード
ブック中の各ベクトルは先行のベクトルの(1つのサン
プルを捨てて新たなサンプルを加えた)「1つ分ずれ
た」変型である。ピッチ遅れT>Nである場合には、ピ
ッチコードブックはフィルタ構造(1/(1−bz-1)
と同等であり、ピッチ遅れTにおけるピッチコードブッ
クベクトルvT(n)は次式で与えられる。
T(n)は、そのベクトルが完成するまで、直前の励起
からの使用可能なサンプルを反復することによって構築
される(これはフィルタ構造と同等ではない)。最近の
エンコーダでは、より高いピッチ分解能が使用され、こ
のことは有声音音響セグメントの品質を著しく向上させ
る。これは、多相補間フィルタを使用して直前の励起信
号をオーバサンプリングすることによって行われる。こ
の場合には、ベクトルvT(n)は、一般的に、直前の
励起の補間変型に相当し、ピッチ遅れTは非整数の遅延
(例えば、50.25)である。
ケーリングされたフィルタリング済みの直前の励起との
間の平均2乗重み付け誤差Eを最小化する最適のピッチ
遅れTとゲインbとを発見することから成る。誤差Eは
次のように表現され、 E=‖x−byT‖2 ここでyTはピッチ遅れTにおけるフィルタリングされ
たピッチコードブックベクトルであり、
することにより誤差Eを最小化することができる。本発
明のこの好ましい実施形態では、1/3のサブサンプル
ピッチ分解能が使用され、ピッチ(ピッチコードブッ
ク)探索が3つの段階によって構成されている。
が、重み付けされた音声信号sw(n)に応答して開ル
ープピッチ探索モジュール106で推定される。上述の
説明で示したように、この開ループピッチ分析は、当業
者に周知の方法を使用して10ミリ秒(2つのサブフレ
ーム)毎に1回ずつ行われるのが一般的である。第2の
段階では、探索基準Cが、推定された開ループピッチ遅
れTOL(一般に±5)に近い整数ピッチ遅れに関して、
閉ループピッチ探索モジュール107で探索され、この
ことが探索手順を著しく単純化する。各ピッチ遅れ毎に
畳み込みを計算する必要なしに、フィルタリングされた
コードベクトルyTを更新するために、単純な手順を使
用する。
すると、探索の第3の段階(モジュール107)におい
てその最適の整数ピッチ遅れの付近の端数がテストされ
る。ピッチ予測器が、ピッチ遅れT>Nの場合の妥当な
想定である形式1/(1−bz-1)のフィルタによって
表現される時には、ピッチフィルタのスペクトルが、周
波数範囲全体にわたって高調波構造を示し、この高調波
周波数は1/Tに関係している。広帯域信号の場合に
は、広帯域信号における高調波構造がその拡張されたス
ペクトルの全体を含むわけではないので、この高調波構
造はあまり効率的ではない。この高調波構造は、音声セ
グメントに応じて特定の周波数までにだけ存在するにす
ぎない。したがって、広帯域音声の有声音セグメントに
おけるピッチ寄与の効率的な表現を得るためには、ピッ
チ予測フィルタは、広帯域スペクトル全体にわたって周
期性の量を変化させるという柔軟性を有する必要があ
る。
の効率的なモデリングを行う新たな方法を本明細書で開
示し、この方法では、幾つかの形態のローパスフィルタ
が直前の励起に適用され、より高い予測ゲインを有する
ローパスフィルタが選択される。サブサンプルピッチ分
解能を使用する時には、ローパスフィルタを、より高い
ピッチ分解能を得るために使用される補間フィルタの中
に組み込むことが可能である。この場合には、選択され
た整数ピッチ遅れの付近の端数をテストするピッチ探索
の第3の段階を、互いに異なったローパス特性を有する
幾つかの補間フィルタに対して繰り返し、探索基準Cを
最小にする端数とフィルタ索引とを選択する。
階での探索を行って、特定の周波数応答を有する1つだ
けの補間フィルタを使用して最適の端数ピッチ遅れを求
め、異なった予め決められたローパスフィルタを選択さ
れたピッチコードブックベクトルvTに適用することに
よって最適のローパスフィルタ形状を最終的に選択し、
ピッチ予測誤差を最小にするローパスフィルタを選択す
ることである。このアプローチを詳細に後述する。
具体例の略ブロック図を示す。記憶装置モジュール30
3では、直前の励起信号u(n)、n<0を記憶する。
ピッチコードブック探索モジュール301が、ターゲッ
トベクトルxと、開ループピッチ遅れTOLと、記憶装置
モジュール303からの直前の励起信号u(n)、n<
0とに対して応答し、上述の探索基準Cを最小にするピ
ッチコードブック(ピッチコードブック)検索を行う。
モジュール301で行った探索の結果から、モジュール
302が最適のピッチコードブックベクトルvTを生成
する。サブサンプルピッチ分解能(端数ピッチ)を使用
するので、直前の励起信号u(n)、n<0が補間さ
れ、ピッチコードブックベクトルvTは、補間された直
前の励起信号に対応するということに留意されたい。こ
の好ましい実施形態では、補間フィルタ(モジュール3
01内、図示していない)が、7000Hzを越える周
波数成分を除去するローパスフィルタ特性を有する。
特性を使用する。これらのフィルタ特性はローパスフィ
ルタ特性であることも帯域通過フィルタ特性であること
も可能である。最適のコードベクトルvTがピッチコー
ドベクトル発生器302によって決定されて供給される
と、vTのK個のフィルタリングされた変型が、305
(j)のようなK個の異なった周波数整形フィルタを使用
してそれぞれに計算され、ここでj=1,2,...,
Kである。これらのフィルタリングされた変型をvf (j)
と表現し、ここでj=1,2,...,Kである。これ
らの異なったベクトルvf (j)を、それぞれのモジュール
304(j)(ここでj=1,2,...,Kである)に
おいてインパルス応答hと畳み込み演算し、ベクトルy
(j)(ここでj=1,2,...,Kである)を得る。
各ベクトルy(j)に関して平均2乗ピッチ予測誤差を計
算するために、対応する増幅器307(j)によって値y
(j)にゲインbを乗算し、さらに、対応する減算器30
8(j)によって値by(j)をターゲットベクトルxから減
算する。セレクタ309が、平均2乗ピッチ予測誤差 e(j)=‖x−b(j)y(j)‖2, j=1,2,...,K を最小にする周波数整形フィルタ305(j)を選択す
る。y(j)の各値に関して平均2乗ピッチ予測誤差e(j)
を計算するために、対応する増幅器307(j)によって
値y(j)にゲインbを乗算し、さらに、減算器308(j)
によって値b(j)y(j)をターゲットベクトルxから減算
する。次の関係式を使用して、索引jにおける周波数整
形フィルタに関連した対応するゲイン計算器306(j)
によって、各々のゲインb(j)を計算する。
乗ピッチ予測誤差eを最小にするvTまたはvf (j)に基
づいて選択される。再び図1を参照すると、ピッチコー
ドブック索引Tは符号化されてマルチプレクサ112に
送られる。ピッチゲインbは量子化されてマルチプレク
サ112に送られる。この新たなアプローチを使用する
場合には、選択された周波数整形フィルタの索引jをマ
ルチプレクサ112で符号化するために、追加の情報が
必要である。例えば、3つのフィルタを使用する場合
(j=1,2,3)には、この情報を表現するために2
ビットが必要である。フィルタ索引情報jをピッチゲイ
ンbと共に符号化することも可能である。 イノベーティブコードブック探索 ピッチ、または、LTP(長期予測)パラメータb、
T、jを求めた後に、次のステップは、図1の探索モジ
ュール110によって最適のイノベーティブ励起を探索
することである。最初に、ターゲットベクトルxを、L
TP寄与 x’=x−byT を減算することによって更新し、ここでbはピッチゲイ
ンであり、yTはフィルタリングされたピッチコードブ
ックベクトル(選択されたローパスフィルタでフィルタ
リングされ、図3を参照して説明したようにインパルス
応答hと畳み込み演算された、遅延Tにおける直前の励
起)である。
ベクトルとスケーリングされたフィルタリング済みコー
ドベクトルとの間の平均2乗誤差 E=‖x’−gHck‖2 を最小にする最適の励起コードベクトルckとゲインg
とを発見することによって行なわれる。ここでHは、イ
ンパルス応答ベクトルhから得られた下三角畳み込み行
列である。
ベーティブコードブック探索を、1995年8月22日
付で発行された米国特許第5,444,816号(Ad
oul他)と、1997年12月17日付でAduol
他に発行された米国特許第5,699,482号と、1
998年5月19日付でAduol他に発行された米国
特許第5,754,976号と、1997年12月23
日付の米国特許第5,701,392号(Adoul
他)とに説明されている通りの代数的コードブックによ
ってモジュール110で行う。
ンgとがモジュール110によって選択され終わると、
コードブック索引kとゲインgとが符号化されてマルチ
プレクサ112に送られる。図1を参照すると、パラメ
ータb、T、j、 、k、gがマルチプレクサ112
を通して多重化され、その後で通信チャネルを通して送
られる。 記憶装置の更新 記憶装置モジュール111(図1)では、重み付けされ
た合成フィルタ
タを通して励起信号u=gck+bvTをフィルタリング
することによって更新される。このフィルタリングの後
に、このフィルタの状態が記憶され、計算器モジュール
108でゼロ入力応答を計算するための初期状態とし
て、その次のサブフレームで使用される。ターゲットベ
クトルxの場合と同様に、当業者に周知の数学的には同
等である別のアプローチを、このフィルタの状態を更新
するために使用することが可能である。 デコーダ側 図2の音声復号装置200が、ディジタル入力222
(デマルチプレクサ217に対する入力ストリーム)と
サンプリングされた出力音声223(加算器221の出
力)との間で行われる様々なステップを示す。
力チャネルから受け取ったバイナリ情報から合成モデル
パラメータを抽出する。受け取ったバイナリフレームの
各々から抽出されるパラメータは、 短期予測パラメータ(STP) (フレーム毎に1
回)、 長期予測(LTP)パラメータT、b、j(各サブフレ
ーム毎)、および、 イノベーションコードブック索引kとゲインg(各サブ
フレーム毎) である。
らのパラメータに基づいて合成される。イノベーティブ
コードブック218が索引kに応答してイノベーション
コードベクトルckを生じさせ、このイノベーションコ
ードベクトルは、復号されたゲイン係数gによって増幅
器224を通してスケーリングされる。この好ましい実
施形態では、上記の米国特許第5,444,816号、
同第5,699,482号、同第5,754,976
号、同第5,701,392号に説明されている通りの
イノベーティブコードブック218を、イノベーティブ
コードベクトルckを表現するために使用する。
スケーリングされたコードベクトルgckを、イノベー
ションフィルタ205を通して処理する。 周期性の強調 増幅器224の出力における、生成されたスケーリング
されたコードベクトルを、周波数依存性のピッチエンハ
ンサ205を通して処理する。
声音セグメントの場合に品質を改善する。これは、過去
においては、導入される周期性の量を制御する式1/
(1−εbz-1)(ただし、εは0.5未満の係数であ
る)のフィルタを通して、イノベーティブコードブック
(固定コードブック)218からのイノベーションベク
トルをフィルタリングすることによって行われた。この
アプローチは、スペクトル全体にわたって周期性を導入
するので、広帯域信号の場合には効果的でない。本発明
の一部分である新たな代案のアプローチを説明すると、
このアプローチでは、より低い周波数よりもより高い周
波数を強調する周波数応答のイノベーションフィルタ2
05(F(z))を通して、イノベーティブ(固定)コ
ードブックからのイノベーティブコードベクトルckを
フィルタリングすることによって、周期性の強調を行
う。F(z)の係数は励起信号uの周期性の量に関係す
る。
性係数を得るために使用可能である。例えば、ゲインb
の値が周期性の表示を与える。すなわち、ゲインbが1
に近い場合には、励起信号uの周期性は高く、ゲインb
が0.5未満である場合には、周期性は低い。好ましい
実施形態で使用するフィルタF(z)の係数を得るため
の別の効果的な方法は、励起信号u全体におけるピッチ
寄与の量をこの係数に関係付けることである。この結果
として、周波数応答がサブフレームの周期性に依存する
ことになり、この場合に、より高い周波数が、ピッチゲ
インが高ければ高いほど強く強調される(より強い全体
的勾配が得られる)。イノベーションフィルタ205
は、励起信号uの周期性がより大きい時に、低周波数に
おけるイノベーティブコードベクトルckのエネルギー
を低下させる効果を有し、このことが、より高い周波数
よりもより低い周波数における励起信号uの周期性を強
調する。イノベーションフィルタ205に関して提案す
る式は、 (1)F(z)=1−σz-1,または(2)F(z)=−αz+1−αz-1 であり、ここでσまたはαは、励起信号uの周期性のレ
ベルから導き出される周期性係数である。
施形態で使用する。周期性係数αは有声音化係数発生器
204で計算する。励起信号uの周期性に基づいて周期
性係数αを導き出すために、幾つかの方法を使用するこ
とが可能である。次にその方法を2つ示す。 方法1: 最初に、全励起信号uに対するピッチ寄与の割合を、次
式によって有声音化係数発生器204で計算し、
であり、bはピッチゲインであり、uは次式によって加
算器219の出力で与えられる励起信号uである。 u=gck+bvT 項bvTが、ピッチ遅れTと、記憶装置203内に記憶
されているuの直前の値とに応答して、ピッチコードブ
ック(ピッチコードブック)201から得られるという
ことに留意されたい。その次に、ピッチコードブック2
01からのピッチコードベクトルvTを、デマルチプレ
クサ217からの索引jによってカットオフ周波数が調
整されるローパスフィルタ202を通して処理する。そ
の次に、得られたコードベクトルvTにデマルチプレク
サ217からのゲインbを増幅器226を通して乗算
し、信号bvTを得る。
器204で計算し、 α=qRp ただし α<q ここでqは強調の量を制御する係数である(この好まし
い実施形態ではqは0.25に設定される。) 方法2: 周期性係数αを計算するために本発明の好ましい実施形
態で使用する別の方法を次に説明する。
て有声音化係数発生器204で計算し、 rv=(Ev−Ec)/(Ev+Ec) ここでEvはスケーリングされたピッチコードベクトル
bvTのエネルギーであり、Ecはスケーリングされたイ
ノベーティブコードベクトルgckのエネルギーであ
る。すなわち、
に留意されたい(1は純粋に有声音の信号に相当し、−
1は純粋に無声音の信号に相当する)。その次に、この
好ましい実施形態では、係数αを次式によって有声音化
係数発生器204で計算し、 α=0.125(1+rv) この係数αは、純粋に無声音の信号の場合には0の値に
相当し、純粋に有声音の信号の場合には0.25に相当
する。
期性係数αを、上述の方法1と方法2においてσ=2α
を使用することによって近似的に求めることが可能であ
る。この場合には、周期性係数σを上述の方法1で次の
ように計算する。 σ=2qRp bounded by σ<2q. 方法2では、周期性係数σを次のように計算する。
たイノベーティブコードベクトルgckをイノベーショ
ンフィルタ205(F(z))を通してフィルタリング
することによって計算される。強調された励起信号u′
を次のように加算器220で計算する。
留意されたい。したがって、エンコーダ100とデコー
ダ200の間の同期を維持するために、強調なしに励起
信号uを使用してピッチコードブック201の内容を更
新することが不可欠である。したがって、励起信号uを
ピッチコードブック201の記憶装置203を更新する
ために使用し、強調された励起信号u′をLP合成フィ
ルタ206の入力で使用する。 合成とデエンファシス
である(典型的な値はμ=0.7である)。より高次の
フィルタも使用可能である。このベクトルs′は、デエ
ンファシスフィルタD(z)(モジュール207)を通
過させられてベクトルsdが得られ、ベクトルsdはハイ
パスフィルタ208を通過させられて50Hz未満の不
要な周波数が除去されてshが得られる。オーバサンプ
リングと高周波数再生
する。ランダムノイズ発生器213が、当業者に周知の
方法を使用して、周波数帯域全体にわたって一様なスペ
クトルを有するホワイトノイズシーケンスw′を生成す
る。生成されたシーケンスは、オリジナルのドメインに
おけるサブフレーム長さである長さN′である。Nがダ
ウンサンプリングされたドメインにおけるサブフレーム
長さであることに留意されたい。この好ましい実施形態
では、N=64でN′=80であり、これらは5ミリ秒
に相当する。
ジュール214で適正にスケーリングする。ゲイン調整
は次のステップを含む。最初に、生成されたノイズシー
ケンスw′のエネルギーを、エネルギー計算モジュール
210によって計算された強調された励起信号u′のエ
ネルギーに等しいように設定し、この結果として得られ
たスケーリングされたノイズシーケンスが次式で与えら
れる。
(無声音セグメントに比較して高周波数のエネルギが小
さい)有声音セグメントの場合には、生成されるノイズ
のエネルギーを減少させるように、有声音化係数発生器
204の出力において合成信号の高周波数成分を計算に
入れることである。この好ましい実施形態では、高周波
数成分の測定を、スペクトル傾斜計算器212によって
合成信号の傾斜を測定することと、それにしたがってエ
ネルギを減少させることとによって実現する。零交叉測
定のような他の測定を同様に使用することが可能であ
る。傾斜が非常に強い場合は、これは有声音セグメント
に対応し、ノイズのエネルギーをさらに減少させる。傾
斜係数tiltをモジュール202で合成信号shの第
1の相関係数として計算し、これは次式で与えられ、
れ、 rv=(Ev−Ec)/(Ev+Ec) ここでEvはスケーリングされたピッチコードベクトル
bvTのエネルギーであり、Ecは上述の通りのスケーリ
ングされたイノベーティブコードベクトルgckのエネ
ルギーである。有声音化係数rvはtiltよりも小さ
い場合が殆どであるが、この条件は、tilt値が負で
ありかつrvの値がHIGHである場合に高周波数トー
ンに対する予防策として導入されている。したがって、
この条件は、こうしたトーン信号の場合のノイズエネル
ギーを減少させる。
0であり、強く有声音化された信号の場合にはtilt
値は1であり、高周波数により多くのエネルギーが存在
する無声音信号の場合にはtilt値は負である。高周
波数成分の量からスケーリング係数glを得るために様
々な方法を使用することが可能である。本発明では、上
述の信号の傾斜に基づいて2つの方法を提示する。 方法1: スケーリング係数glを次式によってtiltから得
る。
は、glは0.2であり、強く無声音化された信号の場
合にはglは1.0になる。 方法2: tilt係数glを最初にゼロ以上に制限し、その次に
このスケーリング係数を次式によってtiltから得
る。
ーリングされたノイズシーケンスwgは次式で与えられ
る。 Wg=g1W. tiltがゼロに近い時には、スケーリング係数glは
1に近く、このことはエネルギーの減少を生じさせな
い。tilt値が1である時は、スケーリング係数gl
は、生成されるノイズのエネルギーの12dBの減少を
もたらす。
記で説明してきたが、この実施形態を、本発明の着想と
本質から逸脱することなしに、添付の特許請求項の範囲
内で自由に改変することが可能である。好ましい実施形
態では広帯域音声信号の使用を説明したが、広帯域信号
一般を使用する他の具体例にも本発明が適用されること
と、本発明が必ずしも音声用途だけには限定されないと
いうこととが、当業者には明らかだろう。 [図面の簡単な説明]
ック図である。
ク図である。
ク図である。
置とが使用可能なセルラー通信システムの単純化した略
ブロック図である。
Claims (63)
- 【請求項1】 ピッチコードブックパラメータの最適な
セットを生成するための本発明のピッチ分析装置であっ
て、 a)ピッチコードブックパラメータのそれぞれのセット
に関連している少なくとも2つの信号経路であって、 i)前記信号経路の各々は、ピッチコードブック探索装
置からのピッチコードベクトルのピッチ予測誤差を計算
するピッチ予測誤差計算装置を含み、 ii)前記2つの信号経路のうちの少なくとも1つの信
号経路は、前記ピッチコードベクトルを前記1つの信号
経路の前記ピッチ予測誤差計算装置に供給する前に前記
ピッチコードベクトルをフィルタリングするフィルタを
含む信号経路と、 b)前記少なくとも2つの信号経路において計算された
前記ピッチ予測誤差を互いに比較し、最小の計算ピッチ
予測誤差を有する前記信号経路を選択し、前記選択され
た信号経路に関連しているピッチコードブックパラメー
タのセットを選択するセレクタとを含むピッチ分析装
置。 - 【請求項2】 前記2つの信号経路のうちの1つの信号
経路は、前記ピッチコードベクトルを前記ピッチ予測誤
差計算装置に供給する前に前記ピッチコードベクトルを
フィルタリングするフィルタを含まない請求項1に記載
のピッチ分析装置。 - 【請求項3】 前記信号経路は、前記ピッチコードベク
トルを前記信号経路の前記ピッチ予測誤差計算装置に供
給する前に前記ピッチコードベクトルをフィルタリング
するフィルタをそれぞれに備えている複数の信号経路を
含む請求項1に記載のピッチ分析装置。 - 【請求項4】 前記複数の信号経路の前記フィルタは、
ローパスフィルタと帯域通過フィルタから成るグループ
から選択され、前記フィルタは互いに異なった周波数応
答を有する請求項3に記載のピッチ分析装置。 - 【請求項5】 前記ピッチ予測誤差計算装置の各々は、 a)前記ピッチコードベクトルを重み付けされた合成フ
ィルタインパルス応答信号と畳み込み演算し、それによ
って畳み込まれたピッチコードベクトルを計算する畳み
込みユニットと、 b)前記畳み込まれたピッチコードベクトルとピッチ探
索ターゲットベクトルとに応答してピッチゲインを計算
するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成するコンバイナー回路とを含む請求
項1に記載のピッチ分析装置。 - 【請求項6】 前記ピッチゲイン計算器は、次の関係を
使用して前記ピッチゲインb(j)を計算する手段を含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項5に記載のピッチ分析装置。 - 【請求項7】 前記信号経路各々の前記ピッチ予測誤差
計算装置は、対応する前記ピッチ予測誤差のエネルギー
を計算する手段を含み、前記セレクタは、前記様々な信
号経路の前記ピッチ予測誤差のエネルギーを互いに比較
するための、および、前記ピッチ予測誤差の最小の計算
エネルギーを有する前記信号経路を、最小の計算ピッチ
予測誤差を有する前記信号経路として選択する手段を含
む請求項1にピッチ分析装置。 - 【請求項8】 a)前記複数の信号経路の前記フィルタ
の各々はフィルタ索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索
引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項5に記載のピッチ分析装置。 - 【請求項9】 前記フィルタは前記ピッチコードブック
探索装置の補間フィルタに一体化されており、前記補間
フィルタは、前記ピッチコードベクトルのサブサンプル
変型を生成するために使用される請求項1に記載のピッ
チ分析装置。 - 【請求項10】 ピッチコードブックパラメタの最適の
セットを生成するピッチ分析方法であって、 a)ピッチコードブックパラメタのそれぞれのセットに
関連している少なくとも2つの信号経路において、ピッ
チコードブック探索装置からのピッチコードベクトルの
ピッチ予測誤差を各信号経路毎に計算することと、 b)前記2つの信号経路のうちの少なくとも1つの信号
経路において、前記1つの信号経路の前記ピッチ予測誤
差の計算のために前記ピッチコードベクトルを供給する
前に、前記ピッチコードベクトルをフィルタリングする
ことと、 c)前記少なくとも2つの信号経路において計算された
前記ピッチ予測誤差を互いに比較し、最小の計算ピッチ
予測誤差を有する信号経路を選択し、その選択された信
号経路に関連しているピッチコードブックパラメータの
セットを選択することとを含むピッチ分析方法。 - 【請求項11】 前記少なくとも2つの信号経路のうち
の1つの信号経路において、前記ピッチ予測誤差計算装
置に前記ピッチコードベクトルを供給する前に、前記ピ
ッチコードベクトルをフィルタリングしない請求項10
に記載のピッチ分析方法。 - 【請求項12】 前記信号経路は複数の信号経路を含
み、前記複数の信号経路の各々の前記ピッチ予測誤差計
算装置に前記ピッチコードベクトルを供給する前に前記
複数の信号経路の各々において前記ピッチコードベクト
ルをフィルタリングする請求項10に記載のピッチ分析
方法。 - 【請求項13】 前記複数の信号経路の前記フィルタ
を、ローパスフィルタと帯域通過フィルタから成るグル
ープから選択することをさらに含み、前記フィルタは互
いに異なった周波数応答を有する請求項12に記載のピ
ッチ分析方法。 - 【請求項14】 各信号経路毎にピッチ予測誤差を計算
することは、 a)前記ピッチコードベクトルを重み付けされた合成フ
ィルタインパルス応答信号と畳み込み演算し、それによ
って畳み込まれたピッチコードベクトルを計算すること
と、 b)前記畳み込まれたピッチコードベクトルとピッチ探
索ターゲットベクトルとに応答してピッチゲインを計算
することと、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成することと、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成することとを含む請求項10に記載
のピッチ分析方法。 - 【請求項15】 前記ピッチゲイン計算は、次の関係を
使用して前記ピッチゲインb(j)を計算することを含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項14に記載のピッチ分析方法。 - 【請求項16】 前記信号経路各々において前記ピッチ
予測誤差を計算することは、対応するピッチ予測誤差の
エネルギーを計算することを含み、前記ピッチ予測誤差
を互いに比較することは、前記各信号経路の前記ピッチ
予測誤差のエネルギーを互いに比較することと、前記ピ
ッチ予想誤差の最小の計算エネルギーを有する前記信号
経路を、最小の計算ピッチ予測誤差を有する前記信号経
路として選択することとを含む請求項10に記載のピッ
チ分析方法。 - 【請求項17】 a)前記複数の信号経路の前記フィル
タの各々をフィルタ索引で識別することと、 b)前記ピッチコードベクトルをピッチコードブック索
引で識別することと c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項14に記載のピッチ分析方法。 - 【請求項18】 前記ピッチコードベクトルをフィルタ
リングすることは、前記ピッチコードブック探索装置の
補間フィルタに一体化されており、前記補間フィルタ
を、前記ピッチコードベクトルのサブサンプル変型を生
成するために使用する請求項10に記載のピッチ分析方
法。 - 【請求項19】 広帯域入力信号を符号化するための請
求項1に記載のピッチ分析装置を有するエンコーダであ
って、 a)前記広帯域信号に応答して、線形予測合成フィルタ
係数を生成する線形予測合成フィルタ計算器と、 b)前記広帯域信号と前記線形予測合成フィルタ係数と
に応答して、聴覚的に重み付けされた信号を生成する聴
覚重み付けフィルタと、 c)前記線形予測合成フィルタ係数に応答して、重み付
けされた合成フィルタインパルス応答信号を生成するイ
ンパルス応答発生器と、 d)ピッチコードブックパラメータを生成するピッチ探
索ユニットであって、 i)前記聴覚的に重み付けされた信号と前記線形予測合
成フィルタ係数とに応答して、前記ピッチコードベクト
ルとイノベーティブ探索ターゲットベクトルとを生成す
る前記ピッチコードブック探索装置と、 ii)前記ピッチコードベクトルに応答して、前記ピッ
チコードブックパラメータのセットから、最小の計算ピ
ッチ予測誤差を有する信号経路に関連しているピッチコ
ードブックパラメータのセットを選択する前記ピッチ分
析装置とを含むピッチ探索ユニットと、 d)前記重み付けされた合成フィルタインパルス応答信
号と前記イノベーティブ探索ターゲットベクトルとに応
答して、イノベーティブコードブックパラメータを生成
するイノベーティブコードブック探索装置と、 e)最小のピッチ予測誤差を有する信号経路に関連して
いる前記ピッチコードブックパラメータのセットと、前
記イノベーティブコードブックパラメータと、前記線形
予測合成フィルタ係数とを含む、符号化された広帯域信
号を生成する信号形成装置とを含むエンコーダ。 - 【請求項20】 前記少なくとも2つの信号経路のうち
の1つの信号経路は、前記ピッチコードベクトルを前記
ピッチ予測誤差計算装置に供給する前に前記ピッチコー
ドベクトルをフィルタリングするフィルタを含まない請
求項19に記載のエンコーダ。 - 【請求項21】 前記信号経路は、各信号経路の前記ピ
ッチ予測誤差計算装置に前記ピッチコードベクトルを供
給する前に前記ピッチコードベクトルをフィルタリング
するフィルタを各々に備えている複数の信号経路を含む
請求項19に記載のエンコーダ。 - 【請求項22】 前記複数の信号経路の前記フィルタ
は、ローパスフィルタと帯域通過フィルタから成るグル
ープから選択され、前記フィルタは互いに異なった周波
数応答を有する請求項21に記載のエンコーダ。 - 【請求項23】 前記ピッチ予測誤差計算装置の各々
は、 a)前記ピッチコードベクトルを重み付けされた合成フ
ィルタインパルス応答信号と畳み込み演算し、それによ
って畳み込まれたピッチコードベクトルを計算する畳み
込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッ
チ探索ターゲットベクトルとに応答してピッチゲインを
計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成するコンバイナー回路とを含む請求
項19に記載のエンコーダ。 - 【請求項24】 前記ピッチゲイン計算器は、次の関係
を使用して前記ピッチゲインb(j)を計算する手段を含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項23に記載のエンコーダ。 - 【請求項25】 各信号経路の前記ピッチ予測誤差計算
装置は、対応するピッチ予測誤差のエネルギーを計算す
る手段を含み、前記セレクタは、前記各信号経路の前記
ピッチ予測誤差のエネルギーを互いに比較するための、
および、前記ピッチ予想誤差の最小の計算エネルギーを
有する前記信号経路を、最小の計算ピッチ予測誤差を有
する前記信号経路として選択するための手段を含む請求
項19に記載のエンコーダ。 - 【請求項26】 a)前記複数の信号経路の前記フィル
タの各々はフィルタ索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索
引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項23に記載のエンコーダ。 - 【請求項27】 前記フィルタは前記ピッチコードブッ
ク探索装置の補間フィルタに一体化されており、前記補
間フィルタは、前記ピッチコードベクトルのサブサンプ
ル変型を生成するために使用される請求項19に記載の
エンコーダ。 - 【請求項28】 複数のセルに分割されている広い地理
的区域に通信サービスを提供するセルラー通信システム
であって、 a)移動送信機/受信機ユニットと、 b)それぞれに前記セル内に配置されているセルラー基
地局と、 c)前記セルラー基地局間の通信を制御する制御端末装
置と、 d)1つのセル内に位置した各移動ユニットと前記1つ
のセルの前記セルラー基地局との間の双方向無線通信サ
ブシステムであって、前記移動ユニットと前記セルラー
基地局との両方において、 i)請求項19に記載の広帯域信号を符号化するエンコ
ーダと、前記符号化された広帯域信号を送信する送信回
路とを含む送信機と、 ii)前記送信された符号化広帯域信号を受信する受信
回路と、前記受信された符号化広帯域信号を復号するデ
コーダとを含む受信機とを含む双方向無線通信サブシス
テムとを含むセルラー通信システム。 - 【請求項29】 前記少なくとも2つの信号経路のうち
の1つの信号経路は、前記ピッチコードベクトルを前記
ピッチ予測誤差計算装置に供給する前に前記ピッチコー
ドベクトルをフィルタリングするフィルタを含まない請
求項28に記載のセルラー通信システム。 - 【請求項30】 前記信号経路は、各信号経路の前記ピ
ッチ予測誤差計算装置に前記ピッチコードベクトルを供
給する前に前記ピッチコードベクトルをフィルタリング
するフィルタを各々に備えている複数の信号経路を含む
請求項28に記載のセルラー通信システム。 - 【請求項31】 前記複数の信号経路の前記フィルタ
は、ローパスフィルタと帯域通過フィルタから成るグル
ープから選択され、前記フィルタは互いに異なった周波
数応答を有する請求項30に記載のセルラー通信システ
ム。 - 【請求項32】 前記ピッチ予測誤差計算装置の各々
は、 a)前記ピッチコードベクトルを前記重み付けされた合
成フィルタインパルス応答信号と畳み込み演算し、それ
によって畳み込まれたピッチコードベクトルを計算する
畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッ
チ探索ターゲットベクトルとに応答してピッチゲインを
計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成するコンバイナー回路とを含む請求
項28に記載のセルラー通信システム。 - 【請求項33】 前記ピッチゲイン計算器は、次の関係
を使用して前記ピッチゲインb(j)を計算する手段を含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項32に記載のセルラー通信システム。 - 【請求項34】 各信号経路の前記ピッチ予測誤差計算
装置は、対応するピッチ予測誤差のエネルギーを計算す
る手段を含み、前記セレクタは、前記各信号経路の前記
ピッチ予測誤差のエネルギーを互いに比較するための、
および、前記ピッチ予想誤差の最小の計算エネルギーを
有する前記信号経路を、最小の計算ピッチ予測誤差を有
する前記信号経路として選択するための手段を含む請求
項28に記載のセルラー通信システム。 - 【請求項35】 a)前記複数の信号経路の前記フィル
タの各々はフィルタ索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索
引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項32に記載のセルラー通信システム。 - 【請求項36】 前記フィルタは前記ピッチコードブッ
ク探索装置の補間フィルタに一体化されており、前記補
間フィルタは、前記ピッチコードベクトルのサブサンプ
ル変型を生成するために使用される請求項28に記載の
セルラー通信システム。 - 【請求項37】 セルラー移動送信機/受信機ユニット
であって、 a)請求項19に記載の広帯域信号を符号化するエンコ
ーダと、前記符号化された広帯域信号を送信する送信回
路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回
路と、前記受信された符号化広帯域信号を復号するデコ
ーダとを含む受信機とを含むセルラー移動送信機/受信
機ユニット。 - 【請求項38】 前記少なくとも2つの信号経路のうち
の1つの信号経路は、前記ピッチコードベクトルを前記
ピッチ予測誤差計算装置に供給する前に前記ピッチコー
ドベクトルをフィルタリングするフィルタを含まない請
求項37に記載のセルラー移動送信機/受信機ユニッ
ト。 - 【請求項39】 前記信号経路は、各信号経路の前記ピ
ッチ予測誤差計算装置に前記ピッチコードベクトルを供
給する前に前記ピッチコードベクトルをフィルタリング
するフィルタを各々に備えている複数の信号経路を含む
請求項37に記載のセルラー移動送信機/受信機ユニッ
ト。 - 【請求項40】 前記複数の信号経路の前記フィルタ
は、ローパスフィルタと帯域通過フィルタから成るグル
ープから選択され、前記フィルタは互いに異なった周波
数応答を有する請求項39に記載のセルラー移動送信機
/受信機ユニット。 - 【請求項41】 前記ピッチ予測誤差計算装置の各々
は、 a)前記ピッチコードベクトルを前記重み付けされた合
成フィルタのインパルス応答信号と畳み込み演算し、そ
れによって畳み込まれたピッチコードベクトルを計算す
る畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッ
チ探索ターゲットベクトルとに応答してピッチゲインを
計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成するコンバイナー回路とを含む請求
項37に記載のセルラー移動送信機/受信機ユニット。 - 【請求項42】 前記ピッチゲイン計算器は、次の関係
を使用して前記ピッチゲインb(j)を計算する手段を含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項41に記載のセルラー移動送信機/受信機ユ
ニット。 - 【請求項43】 各信号経路の前記ピッチ予測誤差計算
装置は、対応するピッチ予測誤差のエネルギーを計算す
る手段を含み、前記セレクタは、前記各信号経路の前記
ピッチ予測誤差のエネルギーを互いに比較するための、
および、前記ピッチ予想誤差の最小の計算エネルギーを
有する前記信号経路を最小の計算ピッチ予測誤差を有す
る前記信号経路として選択するための手段を含む請求項
37に記載のセルラー移動送信機/受信機ユニット。 - 【請求項44】 a)前記複数の信号経路の前記フィル
タの各々はフィルタ索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索
引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項41に記載のセルラー移動送信機/受信
機ユニット。 - 【請求項45】 前記フィルタは前記ピッチコードブッ
ク探索装置の補間フィルタに一体化されており、前記補
間フィルタは、前記ピッチコードベクトルのサブサンプ
ル変型を生成するために使用される請求項37に記載の
セルラー移動送信機/受信機ユニット。 - 【請求項46】 セルラーネットワーク要素であって、 a)請求項19に記載の広帯域信号を符号化するエンコ
ーダと、前記符号化された広帯域信号を送信する送信回
路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回
路と、前記受信された符号化広帯域信号を復号するデコ
ーダとを含む受信機とを含むセルラーネットワーク要
素。 - 【請求項47】 前記少なくとも2つの信号経路のうち
の1つの信号経路は、前記ピッチコードベクトルを前記
ピッチ予測誤差計算装置に供給する前に前記ピッチコー
ドベクトルをフィルタリングするフィルタを含まない請
求項46に記載のセルラーネットワーク要素。 - 【請求項48】 前記信号経路は、各信号経路の前記ピ
ッチ予測誤差計算装置に前記ピッチコードベクトルを供
給する前に前記ピッチコードベクトルをフィルタリング
するフィルタを各々に備えている複数の信号経路を含む
請求項46に記載のセルラーネットワーク要素。 - 【請求項49】 前記複数の信号経路の前記フィルタ
は、ローパスフィルタと帯域通過フィルタから成るグル
ープから選択され、前記フィルタは互いに異なった周波
数応答を有する請求項48に記載のセルラーネットワー
ク要素。 - 【請求項50】 前記ピッチ予測誤差計算装置の各々
は、 a)前記ピッチコードベクトルを前記重み付けされた合
成フィルタインパルス応答信号と畳み込み演算し、それ
によって畳み込まれたピッチコードベクトルを計算する
畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッ
チ探索ターゲットベクトルとに応答してピッチゲインを
計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成するコンバイナー回路とを含む請求
項46に記載のセルラーネットワーク要素。 - 【請求項51】 前記ピッチゲイン計算器は、次の関係
を使用して前記ピッチゲインb(j)を計算する手段を含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項50に記載のセルラーネットワーク要素。 - 【請求項52】 各信号経路の前記ピッチ予測誤差計算
装置は、対応するピッチ予測誤差のエネルギーを計算す
る手段を含み、前記セレクタは、前記各信号経路の前記
ピッチ予測誤差のエネルギーを比較するための、およ
び、前記ピッチ予想誤差の最小の計算エネルギーを有す
る前記信号経路を最小の計算ピッチ予測誤差を有する前
記信号経路として選択するための手段を含む請求項46
に記載のセルラーネットワーク要素。 - 【請求項53】 a)前記複数の信号経路の前記フィル
タの各々はフィルタ索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索
引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項50に記載のセルラーネットワーク要
素。 - 【請求項54】 前記フィルタは前記ピッチコードブッ
ク探索装置の補間フィルタに一体化されており、前記補
間フィルタは、前記ピッチコードベクトルのサブサンプ
ル変型を生成するために使用される請求項46に記載の
セルラーネットワーク要素。 - 【請求項55】 移動送信機/受信機ユニットと、それ
ぞれにセル内に位置したセルラー基地局と、前記セルラ
ー基地局間の通信を制御する制御端末装置とを含む、複
数のセルに分割されている広い地理的区域に通信サービ
スを提供するセルラー通信システムにおける、 1つのセル内に位置した各移動ユニットと前記1つのセ
ルの前記セルラー基地局との間の双方向無線通信サブシ
ステムであって、前記移動ユニットと前記セルラー基地
局の両方において、 a)請求項19に記載の広帯域信号を符号化するエンコ
ーダと、前記符号化された広帯域信号を送信する送信回
路とを含む送信機と、 b)前記送信された符号化広帯域信号を受信する受信回
路と、前記受信された符号化広帯域信号を復号するデコ
ーダとを含む受信機とを含む双方向無線通信サブシステ
ム。 - 【請求項56】 前記少なくとも2つの信号経路のうち
の1つの信号経路は、前記ピッチコードベクトルを前記
ピッチ予測誤差計算装置に供給する前に前記ピッチコー
ドベクトルをフィルタリングするフィルタを含まない請
求項55に記載の双方向無線通信サブシステム。 - 【請求項57】 前記信号経路は、各信号経路の前記ピ
ッチ予測誤差計算装置に前記ピッチコードベクトルを供
給する前に前記ピッチコードベクトルをフィルタリング
するフィルタを各々に備えている複数の信号経路を含む
請求項55に記載の双方向無線通信サブシステム。 - 【請求項58】 前記複数の信号経路の前記フィルタ
は、ローパスフィルタと帯域通過フィルタから成るグル
ープから選択され、前記フィルタは互いに異なった周波
数応答を有する請求項57に記載の双方向無線通信サブ
システム。 - 【請求項59】 前記ピッチ予測誤差計算装置の各々
は、 a)前記ピッチコードベクトルを前記重み付けされた合
成フィルタインパルス応答信号と畳み込み演算し、それ
によって畳み込まれたピッチコードベクトルを計算する
畳み込みユニットと、 b)前記畳み込まれたピッチコードベクトルと前記ピッ
チ探索ターゲットベクトルとに応答してピッチゲインを
計算するピッチゲイン計算器と、 c)前記畳み込まれたピッチコードベクトルに前記ピッ
チゲインを乗算して、増幅された畳み込みピッチコード
ベクトルを生成する増幅器と、 d)前記増幅された畳み込みピッチコードベクトルを前
記ピッチ探索ターゲットベクトルと組み合わせて前記ピ
ッチ予測誤差を生成するコンバイナー回路とを含む請求
項55に記載の双方向無線通信サブシステム。 - 【請求項60】 前記ピッチゲイン計算器は、次の関係
を使用して前記ピッチゲインb(j)を計算する手段を含
み、 b(j)=xty(j)/‖y(j)‖2 ここでj=0,1,2,...,Kであり、Kは信号経
路の数に相当し、 さらに、ここでxは前記ピッチ探索ターゲットベクトル
であり、y(j)は前記畳み込みピッチコードベクトルで
ある請求項59に記載の双方向無線通信サブシステム。 - 【請求項61】 各信号経路の前記ピッチ予測誤差計算
装置は、対応するピッチ予測誤差のエネルギーを計算す
る手段を含み、前記セレクタは、前記各信号経路の前記
ピッチ予測誤差のエネルギーを比較するための、およ
び、前記ピッチ予想誤差の最小の計算エネルギーを有す
る前記信号経路を、最小の計算ピッチ予測誤差を有する
前記信号経路として選択するための手段を含む請求項5
5に記載の双方向無線通信サブシステム。 - 【請求項62】 a)前記複数の信号経路の前記フィル
タの各々はフィルタ索引で識別され、 b)前記ピッチコードベクトルはピッチコードブック索
引で識別され、 c)前記ピッチコードブックパラメータは前記フィルタ
索引と前記ピッチコードブック索引と前記ピッチゲイン
とを含む請求項59に記載の双方向無線通信サブシステ
ム。 - 【請求項63】 前記フィルタは前記ピッチコードブッ
ク探索装置の補間フィルタに一体化されており、前記補
間フィルタは、前記ピッチコードベクトルのサブサンプ
ル変型を生成するために使用される請求項55に記載の
双方向無線通信サブシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA2,252,170 | 1998-10-27 | ||
CA002252170A CA2252170A1 (en) | 1998-10-27 | 1998-10-27 | A method and device for high quality coding of wideband speech and audio signals |
PCT/CA1999/001008 WO2000025298A1 (en) | 1998-10-27 | 1999-10-27 | A method and device for adaptive bandwidth pitch search in coding wideband signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002528775A JP2002528775A (ja) | 2002-09-03 |
JP3490685B2 true JP3490685B2 (ja) | 2004-01-26 |
Family
ID=4162966
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000578811A Expired - Lifetime JP3566652B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 |
JP2000578808A Expired - Lifetime JP3490685B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 |
JP2000578812A Expired - Lifetime JP3936139B2 (ja) | 1998-10-27 | 1999-10-27 | オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置 |
JP2000578810A Expired - Lifetime JP3869211B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の復号における周期性の強調 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000578811A Expired - Lifetime JP3566652B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000578812A Expired - Lifetime JP3936139B2 (ja) | 1998-10-27 | 1999-10-27 | オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置 |
JP2000578810A Expired - Lifetime JP3869211B2 (ja) | 1998-10-27 | 1999-10-27 | 広帯域信号の復号における周期性の強調 |
Country Status (20)
Country | Link |
---|---|
US (8) | US7260521B1 (ja) |
EP (4) | EP1125276B1 (ja) |
JP (4) | JP3566652B2 (ja) |
KR (3) | KR100417634B1 (ja) |
CN (4) | CN1165892C (ja) |
AT (4) | ATE246834T1 (ja) |
AU (4) | AU6457099A (ja) |
BR (2) | BR9914889B1 (ja) |
CA (5) | CA2252170A1 (ja) |
DE (4) | DE69910239T2 (ja) |
DK (4) | DK1125286T3 (ja) |
ES (4) | ES2207968T3 (ja) |
HK (1) | HK1043234B (ja) |
MX (2) | MXPA01004181A (ja) |
NO (4) | NO319181B1 (ja) |
NZ (1) | NZ511163A (ja) |
PT (4) | PT1125284E (ja) |
RU (2) | RU2219507C2 (ja) |
WO (4) | WO2000025304A1 (ja) |
ZA (2) | ZA200103366B (ja) |
Families Citing this family (119)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6704701B1 (en) * | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
DE60137376D1 (de) * | 2000-04-24 | 2009-02-26 | Qualcomm Inc | Verfahren und Vorrichtung zur prädiktiven Quantisierung von stimmhaften Sprachsignalen |
JP3538122B2 (ja) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
US7010480B2 (en) * | 2000-09-15 | 2006-03-07 | Mindspeed Technologies, Inc. | Controlling a weighting filter based on the spectral content of a speech signal |
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
JP2003044098A (ja) * | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
KR100393899B1 (ko) * | 2001-07-27 | 2003-08-09 | 어뮤즈텍(주) | 2-단계 피치 판단 방법 및 장치 |
JP4012506B2 (ja) * | 2001-08-24 | 2007-11-21 | 株式会社ケンウッド | 信号の周波数成分を適応的に補間するための装置および方法 |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
US8463334B2 (en) * | 2002-03-13 | 2013-06-11 | Qualcomm Incorporated | Apparatus and system for providing wideband voice quality in a wireless telephone |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2392640A1 (en) | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
JP4433668B2 (ja) * | 2002-10-31 | 2010-03-17 | 日本電気株式会社 | 帯域拡張装置及び方法 |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
CN100531259C (zh) * | 2002-12-27 | 2009-08-19 | 冲电气工业株式会社 | 语音通信设备 |
US7039222B2 (en) * | 2003-02-28 | 2006-05-02 | Eastman Kodak Company | Method and system for enhancing portrait images that are processed in a batch mode |
US6947449B2 (en) * | 2003-06-20 | 2005-09-20 | Nokia Corporation | Apparatus, and associated method, for communication system exhibiting time-varying communication conditions |
KR100651712B1 (ko) * | 2003-07-10 | 2006-11-30 | 학교법인연세대학교 | 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법 |
CN100590712C (zh) * | 2003-09-16 | 2010-02-17 | 松下电器产业株式会社 | 编码装置和译码装置 |
US7792670B2 (en) * | 2003-12-19 | 2010-09-07 | Motorola, Inc. | Method and apparatus for speech coding |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR101143724B1 (ko) * | 2004-05-14 | 2012-05-11 | 파나소닉 주식회사 | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 |
DE602005006551D1 (de) * | 2004-05-19 | 2008-06-19 | Matsushita Electric Ind Co Ltd | Kodierungs-, dekodierungsvorrichtung und methode dafür |
US8024181B2 (en) * | 2004-09-06 | 2011-09-20 | Panasonic Corporation | Scalable encoding device and scalable encoding method |
DE102005000828A1 (de) * | 2005-01-05 | 2006-07-13 | Siemens Ag | Verfahren zum Codieren eines analogen Signals |
DE602006009215D1 (de) * | 2005-01-14 | 2009-10-29 | Panasonic Corp | Audioumschaltungsvorrichtung und -methode |
CN100592389C (zh) | 2008-01-18 | 2010-02-24 | 华为技术有限公司 | 合成滤波器状态更新方法及装置 |
US8145478B2 (en) | 2005-06-08 | 2012-03-27 | Panasonic Corporation | Apparatus and method for widening audio signal band |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
FR2889017A1 (fr) * | 2005-07-19 | 2007-01-26 | France Telecom | Procedes de filtrage, de transmission et de reception de flux video scalables, signal, programmes, serveur, noeud intermediaire et terminal correspondants |
US8417185B2 (en) | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7885419B2 (en) | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
CN101467203A (zh) * | 2006-04-24 | 2009-06-24 | 尼禄股份公司 | 先进音频编码装置 |
US20090281813A1 (en) * | 2006-06-29 | 2009-11-12 | Nxp B.V. | Noise synthesis |
US8358987B2 (en) * | 2006-09-28 | 2013-01-22 | Mediatek Inc. | Re-quantization in downlink receiver bit rate processor |
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
CN101192410B (zh) * | 2006-12-01 | 2010-05-19 | 华为技术有限公司 | 一种在编解码中调整量化质量的方法和装置 |
GB2444757B (en) * | 2006-12-13 | 2009-04-22 | Motorola Inc | Code excited linear prediction speech coding |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
US20100292986A1 (en) * | 2007-03-16 | 2010-11-18 | Nokia Corporation | encoder |
JP5618826B2 (ja) * | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101765880B (zh) * | 2007-07-27 | 2012-09-26 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
TWI346465B (en) * | 2007-09-04 | 2011-08-01 | Univ Nat Central | Configurable common filterbank processor applicable for various audio video standards and processing method thereof |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8300849B2 (en) * | 2007-11-06 | 2012-10-30 | Microsoft Corporation | Perceptually weighted digital audio level compression |
JP5326311B2 (ja) * | 2008-03-19 | 2013-10-30 | 沖電気工業株式会社 | 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置 |
ES2372014T3 (es) * | 2008-07-11 | 2012-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
KR20100057307A (ko) * | 2008-11-21 | 2010-05-31 | 삼성전자주식회사 | 노래점수 평가방법 및 이를 이용한 가라오케 장치 |
CN101599272B (zh) * | 2008-12-30 | 2011-06-08 | 华为技术有限公司 | 基音搜索方法及装置 |
CN101770778B (zh) * | 2008-12-30 | 2012-04-18 | 华为技术有限公司 | 一种预加重滤波器、感知加权滤波方法及系统 |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
CN102334159B (zh) * | 2009-02-26 | 2014-05-14 | 松下电器产业株式会社 | 编码装置、解码装置及其方法 |
EP2402938A1 (en) * | 2009-02-27 | 2012-01-04 | Panasonic Corporation | Tone determination device and tone determination method |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JPWO2011048810A1 (ja) * | 2009-10-20 | 2013-03-07 | パナソニック株式会社 | ベクトル量子化装置及びベクトル量子化方法 |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
EP2523189B1 (en) | 2010-01-08 | 2014-09-03 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, program and recording medium |
CN101854236B (zh) | 2010-04-05 | 2015-04-01 | 中兴通讯股份有限公司 | 一种信道信息反馈方法和系统 |
CA2789107C (en) | 2010-04-14 | 2017-08-15 | Voiceage Corporation | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
KR102138320B1 (ko) | 2011-10-28 | 2020-08-11 | 한국전자통신연구원 | 통신 시스템에서 신호 코덱 장치 및 방법 |
CN103295578B (zh) * | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN105761724B (zh) * | 2012-03-01 | 2021-02-09 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) * | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN105976830B (zh) | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
PT2951819T (pt) | 2013-01-29 | 2017-06-06 | Fraunhofer Ges Forschung | Aparelho, método e meio computacional para sintetizar um sinal de áudio |
US9620134B2 (en) | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
JP6366705B2 (ja) | 2013-10-18 | 2018-08-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 確定的及びノイズ状情報を用いてオーディオ信号を符号化/復号化する概念 |
BR112016008662B1 (pt) * | 2013-10-18 | 2022-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala |
WO2015079946A1 (ja) * | 2013-11-29 | 2015-06-04 | ソニー株式会社 | 周波数帯域拡大装置および方法、並びにプログラム |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
KR102251833B1 (ko) | 2013-12-16 | 2021-05-13 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN110097892B (zh) * | 2014-06-03 | 2022-05-10 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
CN105047201A (zh) * | 2015-06-15 | 2015-11-11 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于分段扩展的宽带激励信号合成方法 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
CN106601267B (zh) * | 2016-11-30 | 2019-12-06 | 武汉船舶通信研究所 | 一种基于超短波fm调制的语音增强方法 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
CN113324546B (zh) * | 2021-05-24 | 2022-12-13 | 哈尔滨工程大学 | 罗经失效下的多潜航器协同定位自适应调节鲁棒滤波方法 |
US20230318881A1 (en) * | 2022-04-05 | 2023-10-05 | Qualcomm Incorporated | Beam selection using oversampled beamforming codebooks and channel estimates |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
JPH0738118B2 (ja) * | 1987-02-04 | 1995-04-26 | 日本電気株式会社 | マルチパルス符号化装置 |
DE3883519T2 (de) * | 1988-03-08 | 1994-03-17 | Ibm | Verfahren und Einrichtung zur Sprachkodierung mit mehreren Datenraten. |
US5359696A (en) * | 1988-06-28 | 1994-10-25 | Motorola Inc. | Digital speech coder having improved sub-sample resolution long-term predictor |
JP2621376B2 (ja) | 1988-06-30 | 1997-06-18 | 日本電気株式会社 | マルチパルス符号化装置 |
JP2900431B2 (ja) | 1989-09-29 | 1999-06-02 | 日本電気株式会社 | 音声信号符号化装置 |
JPH03123113A (ja) * | 1989-10-05 | 1991-05-24 | Fujitsu Ltd | ピッチ周期探索方式 |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US6134373A (en) * | 1990-08-17 | 2000-10-17 | Samsung Electronics Co., Ltd. | System for recording and reproducing a wide bandwidth video signal via a narrow bandwidth medium |
US5113262A (en) * | 1990-08-17 | 1992-05-12 | Samsung Electronics Co., Ltd. | Video signal recording system enabling limited bandwidth recording and playback |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
US5392284A (en) * | 1990-09-20 | 1995-02-21 | Canon Kabushiki Kaisha | Multi-media communication device |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
US6006174A (en) * | 1990-10-03 | 1999-12-21 | Interdigital Technology Coporation | Multiple impulse excitation speech encoder and decoder |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
JP3089769B2 (ja) | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
GB9218864D0 (en) * | 1992-09-05 | 1992-10-21 | Philips Electronics Uk Ltd | A method of,and system for,transmitting data over a communications channel |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
IT1257431B (it) | 1992-12-04 | 1996-01-16 | Sip | Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
DE4343366C2 (de) | 1993-12-18 | 1996-02-29 | Grundig Emv | Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen |
US5450449A (en) * | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5956624A (en) * | 1994-07-12 | 1999-09-21 | Usa Digital Radio Partners Lp | Method and system for simultaneously broadcasting and receiving digital and analog signals |
JP3483958B2 (ja) | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
FR2729247A1 (fr) | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
AU696092B2 (en) * | 1995-01-12 | 1998-09-03 | Digital Voice Systems, Inc. | Estimation of excitation parameters |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
JP3189614B2 (ja) | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
US5664055A (en) * | 1995-06-07 | 1997-09-02 | Lucent Technologies Inc. | CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity |
US6064962A (en) * | 1995-09-14 | 2000-05-16 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
EP0788091A3 (en) | 1996-01-31 | 1999-02-24 | Kabushiki Kaisha Toshiba | Speech encoding and decoding method and apparatus therefor |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
JP3063668B2 (ja) | 1997-04-04 | 2000-07-12 | 日本電気株式会社 | 音声符号化装置及び復号装置 |
US5999897A (en) * | 1997-11-14 | 1999-12-07 | Comsat Corporation | Method and apparatus for pitch estimation using perception based analysis by synthesis |
US6449590B1 (en) * | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
-
1998
- 1998-10-27 CA CA002252170A patent/CA2252170A1/en not_active Abandoned
-
1999
- 1999-10-27 DE DE69910239T patent/DE69910239T2/de not_active Expired - Lifetime
- 1999-10-27 AU AU64570/99A patent/AU6457099A/en not_active Abandoned
- 1999-10-27 AU AU64569/99A patent/AU763471B2/en not_active Expired
- 1999-10-27 JP JP2000578811A patent/JP3566652B2/ja not_active Expired - Lifetime
- 1999-10-27 CN CNB998136417A patent/CN1165892C/zh not_active Expired - Lifetime
- 1999-10-27 MX MXPA01004181A patent/MXPA01004181A/es active IP Right Grant
- 1999-10-27 CN CN99813602A patent/CN1127055C/zh not_active Expired - Lifetime
- 1999-10-27 ES ES99952183T patent/ES2207968T3/es not_active Expired - Lifetime
- 1999-10-27 DE DE69910240T patent/DE69910240T2/de not_active Expired - Lifetime
- 1999-10-27 DK DK99952201T patent/DK1125286T3/da active
- 1999-10-27 JP JP2000578808A patent/JP3490685B2/ja not_active Expired - Lifetime
- 1999-10-27 CN CNB998136018A patent/CN1172292C/zh not_active Expired - Lifetime
- 1999-10-27 AT AT99952199T patent/ATE246834T1/de active
- 1999-10-27 CN CNB998136409A patent/CN1165891C/zh not_active Expired - Lifetime
- 1999-10-27 DE DE69913724T patent/DE69913724T2/de not_active Expired - Lifetime
- 1999-10-27 WO PCT/CA1999/001010 patent/WO2000025304A1/en active IP Right Grant
- 1999-10-27 AT AT99952200T patent/ATE246389T1/de active
- 1999-10-27 JP JP2000578812A patent/JP3936139B2/ja not_active Expired - Lifetime
- 1999-10-27 US US09/830,114 patent/US7260521B1/en not_active Expired - Lifetime
- 1999-10-27 WO PCT/CA1999/001009 patent/WO2000025303A1/en active IP Right Grant
- 1999-10-27 EP EP99952199A patent/EP1125276B1/en not_active Expired - Lifetime
- 1999-10-27 AT AT99952183T patent/ATE246836T1/de active
- 1999-10-27 CA CA002347735A patent/CA2347735C/en not_active Expired - Lifetime
- 1999-10-27 BR BRPI9914889-7B1A patent/BR9914889B1/pt not_active IP Right Cessation
- 1999-10-27 PT PT99952183T patent/PT1125284E/pt unknown
- 1999-10-27 WO PCT/CA1999/000990 patent/WO2000025305A1/en active IP Right Grant
- 1999-10-27 US US09/830,276 patent/US6807524B1/en not_active Expired - Lifetime
- 1999-10-27 CA CA002347743A patent/CA2347743C/en not_active Expired - Lifetime
- 1999-10-27 KR KR10-2001-7005325A patent/KR100417634B1/ko not_active Expired - Lifetime
- 1999-10-27 ES ES99952199T patent/ES2205891T3/es not_active Expired - Lifetime
- 1999-10-27 BR BRPI9914890-0B1A patent/BR9914890B1/pt not_active IP Right Cessation
- 1999-10-27 AT AT99952201T patent/ATE256910T1/de active
- 1999-10-27 HK HK02104592.2A patent/HK1043234B/zh not_active IP Right Cessation
- 1999-10-27 DK DK99952199T patent/DK1125276T3/da active
- 1999-10-27 KR KR10-2001-7005326A patent/KR100417635B1/ko not_active Expired - Lifetime
- 1999-10-27 JP JP2000578810A patent/JP3869211B2/ja not_active Expired - Lifetime
- 1999-10-27 PT PT99952201T patent/PT1125286E/pt unknown
- 1999-10-27 EP EP99952200A patent/EP1125285B1/en not_active Expired - Lifetime
- 1999-10-27 RU RU2001114194/09A patent/RU2219507C2/ru active
- 1999-10-27 CA CA002347667A patent/CA2347667C/en not_active Expired - Lifetime
- 1999-10-27 EP EP99952201A patent/EP1125286B1/en not_active Expired - Lifetime
- 1999-10-27 RU RU2001114193/09A patent/RU2217718C2/ru active
- 1999-10-27 CA CA002347668A patent/CA2347668C/en not_active Expired - Lifetime
- 1999-10-27 DE DE69910058T patent/DE69910058T2/de not_active Expired - Lifetime
- 1999-10-27 PT PT99952200T patent/PT1125285E/pt unknown
- 1999-10-27 WO PCT/CA1999/001008 patent/WO2000025298A1/en active IP Right Grant
- 1999-10-27 MX MXPA01004137A patent/MXPA01004137A/es active IP Right Grant
- 1999-10-27 ES ES99952201T patent/ES2212642T3/es not_active Expired - Lifetime
- 1999-10-27 NZ NZ511163A patent/NZ511163A/en not_active IP Right Cessation
- 1999-10-27 AU AU64571/99A patent/AU752229B2/en not_active Expired
- 1999-10-27 EP EP99952183A patent/EP1125284B1/en not_active Expired - Lifetime
- 1999-10-27 DK DK99952183T patent/DK1125284T3/da active
- 1999-10-27 KR KR10-2001-7005324A patent/KR100417836B1/ko not_active Expired - Lifetime
- 1999-10-27 ES ES99952200T patent/ES2205892T3/es not_active Expired - Lifetime
- 1999-10-27 PT PT99952199T patent/PT1125276E/pt unknown
- 1999-10-27 DK DK99952200T patent/DK1125285T3/da active
- 1999-10-27 US US09/830,331 patent/US6795805B1/en not_active Expired - Lifetime
- 1999-10-27 AU AU64555/99A patent/AU6455599A/en not_active Abandoned
- 1999-10-27 US US09/830,332 patent/US7151802B1/en not_active Expired - Lifetime
-
2001
- 2001-04-25 ZA ZA200103366A patent/ZA200103366B/en unknown
- 2001-04-25 ZA ZA200103367A patent/ZA200103367B/en unknown
- 2001-04-26 NO NO20012066A patent/NO319181B1/no not_active IP Right Cessation
- 2001-04-26 NO NO20012068A patent/NO317603B1/no not_active IP Right Cessation
- 2001-04-26 NO NO20012067A patent/NO318627B1/no not_active IP Right Cessation
-
2004
- 2004-10-15 US US10/964,752 patent/US20050108005A1/en not_active Abandoned
- 2004-10-18 US US10/965,795 patent/US20050108007A1/en not_active Abandoned
- 2004-12-01 NO NO20045257A patent/NO20045257L/no unknown
-
2006
- 2006-08-04 US US11/498,771 patent/US7672837B2/en not_active Expired - Fee Related
-
2009
- 2009-11-17 US US12/620,394 patent/US8036885B2/en not_active Expired - Fee Related
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3490685B2 (ja) | 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
R150 | Certificate of patent or registration of utility model |
Ref document number: 3490685 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071107 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081107 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091107 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101107 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111107 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121107 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131107 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |