JP4879748B2 - 最適化された複合的符号化方法 - Google Patents
最適化された複合的符号化方法 Download PDFInfo
- Publication number
- JP4879748B2 JP4879748B2 JP2006543574A JP2006543574A JP4879748B2 JP 4879748 B2 JP4879748 B2 JP 4879748B2 JP 2006543574 A JP2006543574 A JP 2006543574A JP 2006543574 A JP2006543574 A JP 2006543574A JP 4879748 B2 JP4879748 B2 JP 4879748B2
- Authority
- JP
- Japan
- Prior art keywords
- encoder
- functional unit
- encoders
- bit rate
- functional units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 239000002131 composite material Substances 0.000 title claims description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 42
- 230000006870 function Effects 0.000 claims abstract description 28
- 230000006835 compression Effects 0.000 claims abstract description 14
- 238000007906 compression Methods 0.000 claims abstract description 14
- 238000013139 quantization Methods 0.000 claims description 52
- 230000003044 adaptive effect Effects 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000036961 partial effect Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 230000000873 masking effect Effects 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000007774 longterm Effects 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims 2
- 238000002360 preparation method Methods 0.000 claims 1
- 230000005284 excitation Effects 0.000 description 25
- 238000012545 processing Methods 0.000 description 19
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000001934 delay Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000135 prohibitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Amplifiers (AREA)
- Separation By Low-Temperature Treatments (AREA)
Description
・完全な符号器に関して(その場合には、全スピーチセグメントが再び符号化される)。
または、
・上記のアスタリスク(*)が最初に付与された参照文献のように、符号化の一部分に関して(その場合には、使用されるべき辞書が閉ループ処理によって選択される)。
a)各符号器を構成する機能ユニット、及び各機能ユニットにより実行される1つ以上の機能を特定する段階。
b)1つの符号器から別の符号器まで共通する機能を選出する段階。
c)共通の計算モジュール内の少なくともいくつかの符号器に関して、前記共通する機能を最終的に実行する段階。
・“共通の”動作を定義すると共に、全ての符号器のために、それらを1度だけ実行すること。
及び、
・各符号器に特有であると共に、特に前述の共通計算の結果を用いる計算方法を使用すること。
これらの符号器は、心理的音響の基準に基づいていると共に、一組の係数を獲得するために、時間領域で信号のブロックを変換する。それらの変換は、時間−周波数タイプ(time-frequency type)の変換であり、最も広く使用されている変換の内の1つは、修正離散コサイン変換(modified discrete cosine transform:MDCT)である。それらの係数が量子化される前に、アルゴリズムは、できる限り量子化雑音が聞き取れないようにビットを割り当てる。ビット割り当て、及び係数量子化は、考察されたスペクトルの各ラインに関して、その周波数における音が聞き取れるために必要な振幅を表すマスキングしきい値を評価するために使用される、心理的音響モデルから獲得されたマスキング曲線を使用する。図2は、周波数領域の符号器の構成図である。機能ユニットの形式におけるその構造が明らかに示される点に注意が必要である。図2を参照すると、主要な機能ユニットは、以下のユニットである。
・入力デジタルオーディオ信号“s0”に関する時間/周波数変換を実行するためのユニット21。
・変換された信号から知覚モデルを決定するためのユニット22。
・概念モデルに関して動作する量子化及び符号化ユニット23。
及び、
・コード化されたオーディオストリーム“Stc”を獲得するために、ビットストリームをフォーマットするためのユニット24。
合成タイプによる分析器の符号器において、符号器は、符号化されるべき信号を作っているパラメータを抽出するために、復元された信号の合成モデルを使用する。それらの信号は、8キロヘルツ(kHz)(300〜3400ヘルツ(Hz)の電話帯域)の周波数で、もしくは、更に高い周波数で、例えば広げられた帯域符号化(broadened band coding)(50[Hz]から7[kHz]までの帯域幅)のための16[kHz]で、サンプリング(標本化)され得る。応用システム、及び必要とされた品質に応じて、圧縮比は、1から16まで変化する。これらの符号器は、電話帯域における2キロビットパーセコンド(kbps)から16[kbps]までのビットレート、及び広げられた帯域における6[kbps]から32[kbps]までのビットレートで動作する。図3は、最も広く現在使用される合成符号器による分析器であるCELPデジタル符号器の主要な機能ユニットを示す。スピーチ信号“s0”は、サンプリングされると共に、Lサンプルを含む一連のフレームに変換される。各フレームは、ディレクトリ(辞書とも呼ばれる)から抽出されると共に、利得を掛けられた波形を、適切な時期に変化する2つのフィルタを介してフィルタ処理することによって合成される。固定励振辞書(fixed excitation dictionary)は、Lサンプルの波形の有限集合である。第1のフィルタは、長期間予測(long-term prediction:LTP)フィルタである。LTP分析は、有声音の周期的な性質を活用する、この長期予測変数のパラメータを評価すると共に、調和成分が、適応辞書の形(ユニット32)でモデル化される。第2のフィルタは、短期間予測フィルタである。線形予測符号化(Linear prediction coding:LPC)分析法は、声道の伝達関数、及び信号のスペクトルのエンベロープの特性を表す短期間予測パラメータを獲得するために使用される。革新シーケンスを決定するために使用される方法は、合成法による分析であると共に、それは、以下のように、“符号器において、固定励振辞書から提供される多数の革新シーケンスは、LPCフィルタ(図3における機能ユニット34の合成フィルタ)によってフィルタ処理される”、と要約され得る。適応励振は、前もって同様の方法で獲得された。選択された波形は、一般的にCELP基準として知られている知覚による加重基準(機能ユニット36)と対照して判断されたとき、最も原信号に近い合成信号を生成する(機能ユニット35のレベルでエラーを最小化する)波形である。
第1の実施例は、特に米国特許出願公開第2001/027393号明細書において示された“TDAC”知覚の周波数領域符号器に関するものである。TDAC符号器は、16[kHz](広げられた帯域信号)でサンプリングされたデジタルオーディオ信号を符号化するために使用される。図4aは、この符号器の主要な機能ユニットを示す。オーディオ信号“x(n)”は、7[kHz]に帯域制限されると共に、16[kHz]でサンプリングされて、320サンプル(20[ms])のフレームに分割される。修正離散コサイン変換(MDCT)が、50[%]のオーバラップによって640サンプルを含む入力信号のフレームに適用されると共に、従ってMDCT分析は20[ms]毎にリフレッシュされる(機能ユニット41)。スペクトルは、最後の31個の係数をゼロに設定する(最初の289個の係数のみがゼロでない)ことによって、7225[Hz]に制限される。マスキング曲線は、このスペクトルから決定される(機能ユニット42)と共に、全てのマスクされた係数はゼロに設定される。そのスペクトルは、同等でない幅の32個の帯域に分割される。あらゆるマスクされた帯域は、信号の変換された係数の関数として決定される。倍率を獲得するために、MDCT係数のエネルギーは、スペクトルの各帯域に関して計算される。量子化された信号のスペクトル包絡線を構成する32個の倍率は、(機能ユニット43において)エントロピー符号化によって符号化されると共に、最終的に符号化されたフレーム“Sc”で送信される。
・MDCT(機能ユニット41)。
・有声の検出(機能ユニット47、図4a)、及び調性の検出(機能ユニット48、図4a)。
・スペクトル包絡線の計算、量子化、及びンエントロピー符号化(機能ユニット43)。及び、
・係数によるマスキング曲線係数の計算、及び各帯域に関するマスキング曲線の計算(機能ユニット42)。
・ビット割り当て(機能ユニット44)。
及び、
・係数量子化(機能ユニット45_i、以下を参照)。
TDAC符号器におけるビット割り当ては、2つの段階によって実行される。第一に、好ましくは下記数1式を用いて、各帯域に割り当てるべきビットの数が計算される。
係数量子化のために、TDAC符号器は、タイプII順列コードの組み合わせから構成される大きさで交互配置された辞書(size-interleaved dictionary)を利用するベクトル量子化を使用する。この種類の量子化は、帯域を横断するMDCT係数の各々のベクトルに適用される。この種類のベクトルは、前もって、その帯域を横断するスペクトル包絡線の逆量子化された値を用いて正規化される。以下の表記法が使用される。
・N(bi,di)は、その辞書における要素の数である。
・CL(bi,di)は、そのリーダー(leader)のセットである。
そして、
・NL(bi,di)は、リーダーの数である。
図6aで示されるMPEG−1レイヤI&II符号器は、入力オーディオ信号s0に時間/周波数変換を適用するために、32個の均一のサブバンドを有するフィルタのバンクを使用する(図6a、及び図7における機能ユニット61)。各サブバンドの出力サンプルは、量子化される(機能ユニット62)前に、グループ化されて、そして共通の倍率(機能ユニット67によって決定される)によって正規化される。各サブバンドに関して使用される均一スカラー量子化器(uniform scalar quantizer)のレベルの数は、ビットの配分を決定するために、量子化雑音を可能な限り微小なものとする心理的音響モデル(機能ユニット64)を使用する、(機能ユニット63によって実行される)動的なビット割り当て手続きの結果である。標準において提案されたヒアリングモデルは、高速フーリエ変換(FFT)を時間領域の入力信号に適用する(機能ユニット65)ことによって獲得されたスペクトルの推定に基づいている。図6bを参照すると、図6aにおける機能ユニット66によって多重化された、最後に送信されるフレームscは、ヘッダフィールドHDの後に、主要な情報を表す、量子化されたサブバンドESBの全てのサンプルと、倍率FE及びビット割り当て因子Aiから構成される、復号化動作のために使用される補足的な情報とを含む。
・倍率の決定のユニット67。
・FFT計算のユニット65。
そして、
・心理的音響モデルを使用するマスキングしきい値決定のユニット64。
MPEG−1レイヤI&II符号器において、ビット割り当ては、以下のとおりに、好ましくは対話型ステップの連続によって実行される。
最後の実施例は、3GPP標準に適合する電話帯域スピーチ符号器である、後天的な決定の3GPPのNB−AMR(Narrow-Band Adaptive Multi-Rate:狭帯域適応マルチレート)符号器を使用したマルチモードスピーチ(multimode speech)の符号化に関係する。この符号器は、その理論が簡潔に上述される有名なCELP符号器の系列に属していると共に、全て代数的な符号励振線形予測(ACELP:algebraic code excited linear prediction)技術に基づく、12.2[kbps]から4.75[kbps]までの8つのモード(または、ビットレート)を有する。図8は、機能ユニットの形態で、この符号器の符号化方式を示す。この構造は、4つNB−AMRモード(7.4;6.7;5.9;5.15)に基づく後天的な決定のマルチモード符号器を生成するために活用された。
以下で示された機能ユニットを共同利用する後天的な決定のマルチモード符号器は、上述の符号化方式に基づくことができる。
・線形予測係数の分析(自己相関のウィンドウイング(windowing)及び計算(機能ユニット82)、“Levinson-Durbin”のアルゴリズムの実行(機能ユニット83)、“A(z)→LSP”変換の実行(機能ユニット84)、LSP補間及び逆変換(機能ユニット862))。
・加重入力信号の計算(機能ユニット87)。
・(機能ユニット85における)LSPパラメータの正規化された周波数領域への変換、LSPのベクトル量子化に関する二次の誤差基準(誤差規範)の重みの計算、LSP剰余のMA予測、最初の3つのLSPのベクトル量子化。
・(1フレーム毎に2度の)開ループLTP遅延検索(機能ユニット88)。
・量子化LSP補間(機能ユニット861)、及び(各サブフレームに関する)フィルタAQ iへの逆変換。
そして、
・(各サブフレームに関する)加重合成フィルタのインパルス応答の計算(機能ユニット89)。
同一でない機能ユニットは、別のモードの機能ユニット、または共通の処理モジュールを活用することによって加速され得る。(品質、及び/または複雑さに関する)応用システムの制限に応じて、異なる変形が使用され得る。いくつかの例が、以下で説明される。それは、同様に、CELP符号器の間の知的なトランスコーディング技術に依存することが可能である。
TDAC符号器の実施例と同様に、特定の辞書を交互配置することは、計算を加速し得る。従って、5.15のモードの第2のLSPのサブベクトルの辞書が、他の3つのモードの辞書に含まれるので、従って、4つのモードによるそのサブベクトルYの量子化が有利に結合され得る。
・5.15に関して、Y1はYを量子化する。
・“Flag=0”:Y1が、同様に、7.4のモード、6.7のモード、及び5.9のモードに関して、Yを量子化する。
・“Flag=1”:Yhが、7.4のモード、6.7のモード、及び5.9のモードに関して、Yを量子化する。
5.15のモードの開ループLTP遅延検索は、検索結果を他のモードに関して使用することができる。もし2つのスーパーサブフレームに関して発見された2つの開ループ遅延が、差分符号化を可能にするのに十分に近い場合、5.15のモードの開ループ検索は実行されない。より高いモードの結果が、その代りに使用される。もしそうでなければ、それらのオプションは、以下のようになる。
または、
・フレーム全体に対する開ループ検索を、より高いモードによって発見された2つの開ループ遅延の周辺に集中させること。
BS0、BS1、...BSN 符号化されたビットストリーム
BF1〜BFn 機能ユニット
C0〜CN 符号器
MM 最適モード選択モジュール
BFi 機能ユニット
MI 独立モジュール
BFicc 選択されたブロック
BFi1〜BFiN1 機能ユニット
MSPi 部分的選択モジュール
21 機能ユニット(時間/周波数変換)
22 機能ユニット(知覚モデルの決定)
23 機能ユニット(量子化及び符号化)
24 機能ユニット(ビットストリームのフォーマット)
31 機能ユニット(LPC分析)
32 機能ユニット(適応励振辞書)
33 機能ユニット(固定励振辞書)
34 機能ユニット(合成フィルタ)
35 機能ユニット(エラーの最小化)
36 機能ユニット(CELP基準/知覚による加重基準)
41 機能ユニット(MDCT)
42 機能ユニット(マスキング曲線)
43 機能ユニット(スペクトル包絡線の符号化)
44 機能ユニット(動的なビット割り当て)
45 機能ユニット(係数のベクトル量子化)
46 機能ユニット(多重化)
47 機能ユニット(有声の検出)
48 機能ユニット(調性の検出)
B0 有声に関する情報
B1 調性に関する情報
eq(i) スペクトル包絡線
yq(j) 符号化されたMDCT係数
45_0 量子化0
45_1 機能ユニット(変換量子化1)
45_(K−2) 機能ユニット(変換量子化K−2)
45_(K−1) 機能ユニット(変換量子化K−1)
46_0,46_1,...,46_(K−2),46_(K−1) 機能ユニット(多重化)
61 機能ユニット(分析フィルタバンク)
62 機能ユニット(量子化)
63 機能ユニット(ビット割り当て)
64 機能ユニット(心理的音響モデル)
65 機能ユニット(高速フーリエ変換)
66 機能ユニット(多重化)
67 機能ユニット(倍率決定)
62_0 機能ユニット(量子化0)
62_(K−2) 機能ユニット(量子化K−2)
62_(K−1) 機能ユニット(量子化K−1)
66_0 機能ユニット(多重化)
66_(K−2) 機能ユニット(多重化)
66_(K−1) 機能ユニット(多重化)
70 機能ユニット(ビット割り当て)
81 機能ユニット(前処理)
82 機能ユニット(自己相関のウィンドウイング及び計算)
83 機能ユニット(“Levinson-Durbin”のアルゴリズム)
84 機能ユニット(“A(z)→LSP”変換)
85 機能ユニット(LSPのベクトル量子化)
861 機能ユニット(量子化LSP補間)
862 機能ユニット(LSP補間及び逆変換)
87 機能ユニット(加重入力信号の計算)
88 機能ユニット(開ループLTP遅延検索)
881 機能ユニット(閉ループLTP検索)
89 機能ユニット(インパルス応答の計算)
90 機能ユニット(適応励振に関する対象信号の計算)
91 機能ユニット(固定励振に関する対象信号の計算)
Claims (27)
- 少なくとも第1の符号器及び第2の符号器に対して、入力信号が並列に供給される複合的圧縮符号化方法であって、
前記第1及び前記第2の符号器のそれぞれが、前記第1及び前記第2の符号器のそれぞれによる前記入力信号の圧縮符号化のための一連の機能ユニットを備え、
前記機能ユニットの少なくとも一部分が、各符号器による前記入力信号の前記符号化に関するそれぞれのパラメータを配信するための計算を実行し、
前記第1及び前記第2の符号器が、共通の動作を実行するように設定された、少なくとも第1及び第2の機能ユニットを、それぞれ備え、
−前記第1の機能ユニット及び前記第2の機能ユニットに対して同じパラメータのセットを配信するための計算が、同じ段階及び共通の機能ユニットにおいて実行されると共に、
−前記第1及び/または前記第2の符号器が、前記共通の機能ユニットのレートと異なるレートで動作する場合、前記パラメータのセットが、前記第1及び/または前記第2の機能ユニットによりそれぞれ使用されるために、前記第1及び/または前記第2の符号器のレートに適合される
ことを特徴とする複合的圧縮符号化方法。 - 前記共通の機能ユニットが、前記第1及び前記第2の符号器の内の1つにおける前記機能ユニットの内の少なくとも1つを備える
ことを特徴とする請求項1に記載の方法。 - a)各符号器を構成する機能ユニット、及び各機能ユニットにより実行される1つ以上の機能を特定する段階と、
b)1つの符号器から別の符号器まで共通する機能を選出する段階と、
c)共通の計算モジュールにおいて、前記共通する機能を実行する段階という
準備段階を更に含む
ことを特徴とする請求項1に記載の方法。 - 前記段階c)において実行される各機能のために、少なくとも前記第1及び前記第2の符号器から選択される符号器の少なくとも1つの機能ユニットが使用されると共に、
前記選択される符号器の機能ユニットが、複雑さと符号化品質との間で最高の基準を立証する他の符号器による効率的な符号化のために、部分的な結果を他の符号器に配信するように構成される
ことを特徴とする請求項3に記載の方法。 - 前記符号器が、それぞれの異なるビットレートで動作するように構成され、
前記選択される符号器が、最も低いビットレートを有する符号器であると共に、
前記段階c)において選択された符号器に特有のパラメータによる機能の実行後に得られた結果が、最も高いビットレートを有する符号器に至るまで、少なくともいくつかの他のモードに関する集中的なパラメータ検索によって、少なくともいくつかの他の符号器のビットレートに適合させられる
ことを特徴とする請求項4に記載の方法。 - 前記符号器が、それぞれの異なるビットレートで動作するように構成され、
前記選択される符号器が、最も高いビットレートを有する符号器であると共に、
前記段階c)において選択された符号器に特有のパラメータによる機能の実行後に得られた結果が、最も高いビットレートを有する符号器に至るまで、少なくともいくつかの他のモードに関する集中的なパラメータ検索によって、少なくともいくつかの他の符号器のビットレートに適合させられる
ことを特徴とする請求項4に記載の方法。 - 所定のビットレートで動作する符号器の機能ユニットが、そのビットレートのための計算モジュールとして使用されると共に、
その符号器に特有の少なくともいくつかのパラメータが、集中的な検索によって最も高いビットレートを有する符号器に至るまで、そして集中的な検索によって最も低いビットレートを有する符号器に至るまで、次第に適合させられる
ことを特徴とする請求項4に記載の方法。 - 様々な符号器の機能ユニットが、格子内に存在し得る複数の経路を有する格子状に配置され、
前記格子内の各経路が、前記機能ユニットの動作モードの組み合わせによって定義されると共に、
各機能ユニットが、次の機能ユニットの存在し得る複数の変形に信号を供給する
ことを特徴とする請求項2に記載の方法。 - 1つ以上の機能ユニットによって実行される各符号化段階の後に、部分的選択モジュールが提供されると共に、
前記部分的選択モジュールが、次の符号化段階のために、それらの機能ユニットの1つ以上によって供給された結果を選択することが可能である
ことを特徴とする請求項8に記載の方法。 - 前記機能ユニットが、前記ビットレートに特有のそれぞれのパラメータを使用して、それぞれの異なるビットレートで動作するように構成され、
所定の機能ユニットに関して、前記格子内で選択された経路は最も低いビットレートの機能ユニットを通過する経路であると共に、
前記最も低いビットレートの機能ユニットから得られた結果が、最も高いビットレートを有する符号器に至るまで、少なくともいくつかの他の機能ユニットに関する集中的なパラメータ検索によって、少なくともいくつかの他の機能ユニットのビットレートに適合させられる
ことを特徴とする請求項8に記載の方法。 - 前記機能ユニットが、前記ビットレートに特有のそれぞれのパラメータを使用して、それぞれの異なるビットレートで動作するように構成され、
所定の機能ユニットに関して、前記格子内で選択された経路は最も高いビットレートの機能ユニットを通過する経路であると共に、
前記最も高いビットレートの機能ユニットから得られた結果が、最も低いビットレートを有する符号器に至るまで、少なくともいくつかの他の機能ユニットに関する集中的なパラメータ検索によって、少なくともいくつかの他の機能ユニットのビットレートに適合させられる
ことを特徴とする請求項8に記載の方法。 - 前記符号器の機能ユニットのパラメータと関連付けられた所定のビットレートに関して、前記所定のビットレートで動作する機能ユニットが、計算モジュールとして使用されると共に、
その機能ユニットに特有の少なくともいくつかのパラメータが、集中的な検索によって最も高いビットレートで動作することができる符号器に至るまで、そして集中的な検索によって最も低いビットレートで動作することができる符号器に至るまで、次第に適合させられる
ことを特徴とする請求項8に記載の方法。 - 前記計算モジュールが、前記符号器から独立していると共に、前記段階c)において得られた結果を全ての符号器に再分配するように構成される
ことを特徴とする請求項3に記載の方法。 - 前記計算モジュールが、前記符号器の内の1つにおける少なくとも1つの機能ユニットを備え、
独立モジュールと、前記符号器の内の少なくとも1つにおける1つの機能ユニットまたは複数の機能ユニットとが、前記段階c)において得られた結果をお互いに交換するように構成されると共に、
前記計算モジュールが、異なる符号器の機能ユニットの間の適応トランスコーディングを実行するように構成される
ことを特徴とする請求項13に記載の方法。 - 独立モジュールが、少なくとも部分的符号化機能ユニット、及び適応トランスコーディング機能ユニットを含む
ことを特徴とする請求項13、または請求項14のいずれか一項に記載の方法。 - 並列の符号器が、マルチモード符号化を処理するように構成されると共に、
前記符号器の内の1つを選択することが可能である後天的選択モジュールが提供される
ことを特徴とする請求項1から請求項15のいずれか一項に記載の方法。 - 1つ以上の機能ユニットによって実行される各符号化段階の後に、前記符号器から独立していると共に、1つ以上の符号器を選択することが可能である部分的選択モジュールが供給される
ことを特徴とする請求項16に記載の方法。 - 前記符号器が、変換タイプの符号器であり、
前記計算モジュールが、全ての符号器の間で共有されたビット割り当て機能ユニットを備えると共に、
1つの符号器に関して実行される各ビット割り当て処理の後に、その符号器に対する適応処理が続いている
ことを特徴とする請求項1から請求項15のいずれか一項に記載の方法。 - その符号器に対する前記適応処理が、前記符号器の前記ビットレートの関数である
ことを特徴とする請求項18に記載の方法。 - その結果が全ての符号器に供給される量子化段階を更に含む、
ことを特徴とする請求項18に記載の方法。 - 全ての符号器に共通の段階を更に含み、前記共通の段階が、
・時間−周波数変換段階と、
・入力信号における有声の検出段階と、
・調性の検出段階と、
・マスキング曲線の決定段階と、
・スペクトル包絡線の符号化段階と
を含むことを特徴とする請求項20に記載の方法。 - 前記符号器がサブバンド符号化を実行すると共に、
全ての符号器に共通の段階を更に含み、前記共通の段階が、
・分析フィルタのバンクの適用段階と、
・倍率の決定段階と、
・スペクトルの変換計算段階と、
・心理的音響のモデルに基づくマスキングしきい値の決定段階と
を含むことを特徴とする請求項18に記載の方法。 - 前記符号器が、合成タイプによる分析の符号器であると共に、
全ての符号器に共通の段階を更に含み、前記共通の段階が、
・前処理段階と、
・線形予測係数分析段階と、
・加重入力信号計算段階と、
・少なくともいくつかのパラメータに関する量子化段階と
を含むことを特徴とする請求項1から請求項14のいずれか一項に記載の方法。 - 1つ以上の機能ユニットによって実行される各符号化段階の後に、前記符号器から独立していると共に、1つ以上の符号器を選択することが可能である部分的選択モジュールが供給され、
前記部分的選択モジュールが、短期パラメータに関する分割ベクトル量子化段階の後で使用される
ことを特徴とする請求項23に記載の方法。 - 1つ以上の機能ユニットによって実行される各符号化段階の後に、前記符号器から独立していると共に、1つ以上の符号器を選択することが可能である部分的選択モジュールが供給され、
前記部分的選択モジュールが、共有された開ループの長期パラメータ検索段階の後で使用される
ことを特徴とする請求項23に記載の方法。 - 少なくとも第1の符号器及び第2の符号器に対して、入力信号が並列に供給される複合的圧縮符号化を支援するためのシステムであって、
前記第1及び前記第2の符号器のそれぞれが、前記第1及び前記第2の符号器のそれぞれによる前記入力信号の圧縮符号化のための一連の機能ユニットを備え、
前記機能ユニットの少なくとも一部分が、各符号器による前記入力信号の前記符号化に関するそれぞれのパラメータを配信するための計算を実行し、
前記第1及び前記第2の符号器が、共通の動作を実行するように設定された、少なくとも第1及び第2の機能ユニットを、それぞれ備え、
前記システムが、請求項1から請求項14のいずれか一項に記載の方法を実行するための命令を記憶するように構成されるメモリを備える
ことを特徴とするシステム。 - 請求項13から請求項17、そして請求項24及び請求項25のいずれか一項に記載の方法を実行するための独立計算モジュールを備える
ことを特徴とする請求項26に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0314490A FR2867649A1 (fr) | 2003-12-10 | 2003-12-10 | Procede de codage multiple optimise |
FR0314490 | 2003-12-10 | ||
PCT/FR2004/003009 WO2005066938A1 (fr) | 2003-12-10 | 2004-11-24 | Procede de codage multiple optimise |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007515677A JP2007515677A (ja) | 2007-06-14 |
JP4879748B2 true JP4879748B2 (ja) | 2012-02-22 |
Family
ID=34746281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006543574A Expired - Fee Related JP4879748B2 (ja) | 2003-12-10 | 2004-11-24 | 最適化された複合的符号化方法 |
Country Status (12)
Country | Link |
---|---|
US (1) | US7792679B2 (ja) |
EP (1) | EP1692689B1 (ja) |
JP (1) | JP4879748B2 (ja) |
KR (1) | KR101175651B1 (ja) |
CN (1) | CN1890714B (ja) |
AT (1) | ATE442646T1 (ja) |
DE (1) | DE602004023115D1 (ja) |
ES (1) | ES2333020T3 (ja) |
FR (1) | FR2867649A1 (ja) |
PL (1) | PL1692689T3 (ja) |
WO (1) | WO2005066938A1 (ja) |
ZA (1) | ZA200604623B (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
EP2084708A4 (en) | 2006-10-19 | 2010-11-24 | Lg Electronics Inc | METHOD AND DEVICE FOR ENCODING; METHOD AND DEVICE FOR DECODING |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
KR101592968B1 (ko) * | 2008-07-10 | 2016-02-11 | 보이세지 코포레이션 | 수퍼-프레임의 lpc 필터들을 양자화 및 역 양자화하기 위한 장치 및 방법 |
FR2936898A1 (fr) * | 2008-10-08 | 2010-04-09 | France Telecom | Codage a echantillonnage critique avec codeur predictif |
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
KR101747917B1 (ko) | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
CN102394658A (zh) * | 2011-10-16 | 2012-03-28 | 西南科技大学 | 一种面向机械振动信号的复合压缩方法 |
US9386267B1 (en) * | 2012-02-14 | 2016-07-05 | Arris Enterprises, Inc. | Cooperative transcoding to multiple streams |
JP2014123865A (ja) * | 2012-12-21 | 2014-07-03 | Xacti Corp | 画像処理装置及び撮像装置 |
US9549178B2 (en) | 2012-12-26 | 2017-01-17 | Verizon Patent And Licensing Inc. | Segmenting and transcoding of video and/or audio data |
WO2015012514A1 (ko) * | 2013-07-26 | 2015-01-29 | 경희대학교 산학협력단 | 서로 다른 다계층 비디오 코덱의 통합 부호화/복호화 방법 및 장치 |
KR101595397B1 (ko) * | 2013-07-26 | 2016-02-29 | 경희대학교 산학협력단 | 서로 다른 다계층 비디오 코덱의 통합 부호화/복호화 방법 및 장치 |
CN104572751A (zh) * | 2013-10-24 | 2015-04-29 | 携程计算机技术(上海)有限公司 | 呼叫中心录音文件的压缩存储方法及系统 |
SE538512C2 (sv) * | 2014-11-26 | 2016-08-30 | Kelicomp Ab | Improved compression and encryption of a file |
SE544304C2 (en) * | 2015-04-17 | 2022-03-29 | URAEUS Communication Systems AB | Improved compression and encryption of a file |
US10872598B2 (en) * | 2017-02-24 | 2020-12-22 | Baidu Usa Llc | Systems and methods for real-time neural text-to-speech |
US10896669B2 (en) | 2017-05-19 | 2021-01-19 | Baidu Usa Llc | Systems and methods for multi-speaker neural text-to-speech |
US10872596B2 (en) | 2017-10-19 | 2020-12-22 | Baidu Usa Llc | Systems and methods for parallel wave generation in end-to-end text-to-speech |
CN114144790B (zh) | 2020-06-12 | 2024-07-02 | 百度时代网络技术(北京)有限公司 | 具有三维骨架正则化和表示性身体姿势的个性化语音到视频 |
US11587548B2 (en) * | 2020-06-12 | 2023-02-21 | Baidu Usa Llc | Text-driven video synthesis with phonetic dictionary |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07170194A (ja) * | 1993-12-16 | 1995-07-04 | Sharp Corp | データ符号化装置 |
JPH1130997A (ja) * | 1997-07-11 | 1999-02-02 | Nec Corp | 音声符号化復号装置 |
JP2000165864A (ja) * | 1998-09-09 | 2000-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 画質調整方法及びその方法を使用した映像通信装置及びその方法を記録した記録媒体 |
JP2000287213A (ja) * | 1999-03-31 | 2000-10-13 | Victor Co Of Japan Ltd | 動画像符号化装置 |
US6141638A (en) * | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
JP2001202097A (ja) * | 1999-12-08 | 2001-07-27 | Fr Telecom | 符号化二進オーディオ処理方法 |
WO2002033697A2 (en) * | 2000-10-18 | 2002-04-25 | Nokia Corporation | Apparatus for bandwidth expansion of a speech signal |
US6526140B1 (en) * | 1999-11-03 | 2003-02-25 | Tellabs Operations, Inc. | Consolidated voice activity detection and noise estimation |
JP2003513296A (ja) * | 1999-09-22 | 2003-04-08 | コネクサント システムズ, インコーポレイテッド | マルチモードの音声符号器 |
JP2003195893A (ja) * | 2001-12-26 | 2003-07-09 | Toshiba Corp | 音声再生装置及び音声再生方法 |
JP2004509366A (ja) * | 2000-09-15 | 2004-03-25 | テレフオンアクチーボラゲツト エル エム エリクソン | 複数チャネル信号の符号化及び復号化 |
JP2004208280A (ja) * | 2002-12-09 | 2004-07-22 | Hitachi Ltd | 符号化装置および符号化方法 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0398318A (ja) * | 1989-09-11 | 1991-04-23 | Fujitsu Ltd | 音声符号化方式 |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5987506A (en) * | 1996-11-22 | 1999-11-16 | Mangosoft Corporation | Remote access and geographically distributed computers in a globally addressable storage environment |
US6249758B1 (en) * | 1998-06-30 | 2001-06-19 | Nortel Networks Limited | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6192335B1 (en) * | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6260009B1 (en) * | 1999-02-12 | 2001-07-10 | Qualcomm Incorporated | CELP-based to CELP-based vocoder packet translation |
US6640209B1 (en) * | 1999-02-26 | 2003-10-28 | Qualcomm Incorporated | Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder |
DE19911179C1 (de) * | 1999-03-12 | 2000-11-02 | Deutsche Telekom Mobil | Verfahren zur Adaption der Betriebsart eines Multi-Mode-Codecs an sich verändernde Funkbedingungen in einem CDMA-Mobilfunknetz |
US6532593B1 (en) * | 1999-08-17 | 2003-03-11 | General Instrument Corporation | Transcoding for consumer set-top storage application |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
JP3549788B2 (ja) * | 1999-11-05 | 2004-08-04 | 三菱電機株式会社 | 多段符号化方法、多段復号方法、多段符号化装置、多段復号装置およびこれらを用いた情報伝送システム |
WO2001052241A1 (en) * | 2000-01-11 | 2001-07-19 | Matsushita Electric Industrial Co., Ltd. | Multi-mode voice encoding device and decoding device |
SE519976C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
EP2627008A3 (en) * | 2000-12-29 | 2013-09-11 | Intel Mobile Communications GmbH | Channel codec processor configurable for multiple wireless communications standards |
US6614370B2 (en) * | 2001-01-26 | 2003-09-02 | Oded Gottesman | Redundant compression techniques for transmitting data over degraded communication links and/or storing data on media subject to degradation |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
EP1292036B1 (en) * | 2001-08-23 | 2012-08-01 | Nippon Telegraph And Telephone Corporation | Digital signal decoding methods and apparatuses |
JP2003125406A (ja) * | 2001-09-25 | 2003-04-25 | Hewlett Packard Co <Hp> | 有向性非周期グラフに基づくビデオ符号化のモード選択最適化方法およびシステム |
US7095343B2 (en) * | 2001-10-09 | 2006-08-22 | Trustees Of Princeton University | code compression algorithms and architectures for embedded systems |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
US7133521B2 (en) * | 2002-10-25 | 2006-11-07 | Dilithium Networks Pty Ltd. | Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain |
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
KR100837451B1 (ko) * | 2003-01-09 | 2008-06-12 | 딜리시움 네트웍스 피티와이 리미티드 | 향상된 품질의 음성 변환부호화를 위한 방법 및 장치 |
KR100554164B1 (ko) * | 2003-07-11 | 2006-02-22 | 학교법인연세대학교 | 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 |
US7469209B2 (en) * | 2003-08-14 | 2008-12-23 | Dilithium Networks Pty Ltd. | Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications |
US7305055B1 (en) * | 2003-08-18 | 2007-12-04 | Qualcomm Incorporated | Search-efficient MIMO trellis decoder |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
US7170988B2 (en) * | 2003-10-27 | 2007-01-30 | Motorola, Inc. | Method and apparatus for network communication |
FR2867648A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques |
US20050258983A1 (en) * | 2004-05-11 | 2005-11-24 | Dilithium Holdings Pty Ltd. (An Australian Corporation) | Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications |
-
2003
- 2003-12-10 FR FR0314490A patent/FR2867649A1/fr active Pending
-
2004
- 2004-11-24 ZA ZA200604623A patent/ZA200604623B/xx unknown
- 2004-11-24 AT AT04805538T patent/ATE442646T1/de not_active IP Right Cessation
- 2004-11-24 EP EP04805538A patent/EP1692689B1/fr not_active Expired - Lifetime
- 2004-11-24 US US10/582,025 patent/US7792679B2/en not_active Expired - Fee Related
- 2004-11-24 CN CN2004800365842A patent/CN1890714B/zh not_active Expired - Fee Related
- 2004-11-24 DE DE602004023115T patent/DE602004023115D1/de not_active Expired - Lifetime
- 2004-11-24 ES ES04805538T patent/ES2333020T3/es not_active Expired - Lifetime
- 2004-11-24 PL PL04805538T patent/PL1692689T3/pl unknown
- 2004-11-24 WO PCT/FR2004/003009 patent/WO2005066938A1/fr active Application Filing
- 2004-11-24 JP JP2006543574A patent/JP4879748B2/ja not_active Expired - Fee Related
-
2006
- 2006-06-12 KR KR1020067011555A patent/KR101175651B1/ko not_active IP Right Cessation
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07170194A (ja) * | 1993-12-16 | 1995-07-04 | Sharp Corp | データ符号化装置 |
JPH1130997A (ja) * | 1997-07-11 | 1999-02-02 | Nec Corp | 音声符号化復号装置 |
US6141638A (en) * | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
JP2000165864A (ja) * | 1998-09-09 | 2000-06-16 | Nippon Telegr & Teleph Corp <Ntt> | 画質調整方法及びその方法を使用した映像通信装置及びその方法を記録した記録媒体 |
JP2000287213A (ja) * | 1999-03-31 | 2000-10-13 | Victor Co Of Japan Ltd | 動画像符号化装置 |
JP2003513296A (ja) * | 1999-09-22 | 2003-04-08 | コネクサント システムズ, インコーポレイテッド | マルチモードの音声符号器 |
US6526140B1 (en) * | 1999-11-03 | 2003-02-25 | Tellabs Operations, Inc. | Consolidated voice activity detection and noise estimation |
JP2001202097A (ja) * | 1999-12-08 | 2001-07-27 | Fr Telecom | 符号化二進オーディオ処理方法 |
JP2004509366A (ja) * | 2000-09-15 | 2004-03-25 | テレフオンアクチーボラゲツト エル エム エリクソン | 複数チャネル信号の符号化及び復号化 |
WO2002033697A2 (en) * | 2000-10-18 | 2002-04-25 | Nokia Corporation | Apparatus for bandwidth expansion of a speech signal |
JP2003195893A (ja) * | 2001-12-26 | 2003-07-09 | Toshiba Corp | 音声再生装置及び音声再生方法 |
JP2004208280A (ja) * | 2002-12-09 | 2004-07-22 | Hitachi Ltd | 符号化装置および符号化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1890714A (zh) | 2007-01-03 |
US20070150271A1 (en) | 2007-06-28 |
DE602004023115D1 (de) | 2009-10-22 |
ES2333020T3 (es) | 2010-02-16 |
WO2005066938A1 (fr) | 2005-07-21 |
ZA200604623B (en) | 2007-11-28 |
KR101175651B1 (ko) | 2012-08-21 |
KR20060131782A (ko) | 2006-12-20 |
EP1692689A1 (fr) | 2006-08-23 |
EP1692689B1 (fr) | 2009-09-09 |
US7792679B2 (en) | 2010-09-07 |
FR2867649A1 (fr) | 2005-09-16 |
ATE442646T1 (de) | 2009-09-15 |
PL1692689T3 (pl) | 2010-02-26 |
CN1890714B (zh) | 2010-12-29 |
JP2007515677A (ja) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4879748B2 (ja) | 最適化された複合的符号化方法 | |
EP2255358B1 (en) | Scalable speech and audio encoding using combinatorial encoding of mdct spectrum | |
KR101139172B1 (ko) | 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술 | |
RU2485606C2 (ru) | Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений | |
US7876966B2 (en) | Switching between coding schemes | |
KR101303145B1 (ko) | 계층적 오디오 신호를 코딩하기 위한 시스템, 오디오 신호를 코딩하는 방법, 컴퓨터-판독가능한 매체 및 계층적 오디오 디코더 | |
CN1820306B (zh) | 可变比特率宽带语音编码中增益量化的方法和装置 | |
CN101276587B (zh) | 声音编码装置及其方法和声音解码装置及其方法 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
KR20020077389A (ko) | 광대역 신호의 코딩을 위한 대수적 코드북에서의 펄스위치 및 부호의 인덱싱 | |
WO2004097796A1 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP2006510947A (ja) | 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 | |
JPH1130997A (ja) | 音声符号化復号装置 | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
US6768978B2 (en) | Speech coding/decoding method and apparatus | |
EP1756807A1 (en) | Audio encoding | |
JP2000132194A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
CN1650156A (zh) | 合成分析语音编码器中用于进行语音编码的方法和装置 | |
EP1212750A1 (en) | Multimode vselp speech coder | |
Nayebi et al. | Analysis of the self-excited subband coder: a new approach to medium band speech coding | |
JPH09244698A (ja) | 音声符号/復号化方式及び装置 | |
Mikhael et al. | A new linear predictor employing vector quantization in nonorthogonal domains for high quality speech coding | |
KR19980036961A (ko) | 음성 부호화 및 복호화 장치와 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110413 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111101 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111130 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |