JP5085543B2 - 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用 - Google Patents
適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用 Download PDFInfo
- Publication number
- JP5085543B2 JP5085543B2 JP2008521610A JP2008521610A JP5085543B2 JP 5085543 B2 JP5085543 B2 JP 5085543B2 JP 2008521610 A JP2008521610 A JP 2008521610A JP 2008521610 A JP2008521610 A JP 2008521610A JP 5085543 B2 JP5085543 B2 JP 5085543B2
- Authority
- JP
- Japan
- Prior art keywords
- entropy
- model
- encoder
- decoder
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
コンピュータは、オーディオ情報を表す数の系列としてオーディオ情報を処理する。例えば、一つの数は、1つのオーディオサンプルを表すことができ、このオーディオサンプルとは、特定の時刻の振幅値である。サンプル深さ、サンプリングレート、およびチャネルモードを含む複数の要因が、オーディオ情報の品質に影響する。
多くのコンピュータおよびコンピュータネットワークには、生デジタルオーディオを処理するリソースが欠けている。圧縮(エンコーディングまたはコーディングとも呼ばれる)は、オーディオ情報をより低ビットレートの形に変換することによって、その情報を格納し、伝送するコストを減らす。圧縮は、ロスレス(lossless:品質が損なわれない)またはロッシイ(lossy:品質は損なわれるが、後続ロスレス圧縮からのビットレート削減がより目覚しい)とすることができる。例えば、ロッシイ圧縮は、オリジナルのオーディオ情報を近似するのに使用され、その後、この近似が、ロスレス圧縮される。圧縮解除(デコーディングとも呼ばれる)は、オリジナルの情報の再構成されたバージョンを圧縮形式から抽出する。
従来、オーディオエンコーダは、様々な異なるロッシイ圧縮技法を使用する。これらのロッシイ圧縮技法は、通常、周波数変換後の知覚モデリング/重み付けおよび量子化を用いる。対応する圧縮解除は、逆量子化、逆重み付け、および逆周波数変換を用いる。
従来、オーディオエンコーダは、様々な異なるロスレス圧縮技法(エントロピコーディング技法とも呼ばれる)のうちの1つまたは複数を使用する。一般に、ロスレス圧縮技法は、ランレングス(run-length)エンコーディング、可変長エンコーディング、および算術(arithmetic)コーディングを含む。対応する圧縮解除技法(エントロピデコーディング技法とも呼ばれる)は、ランレングスデコーディング、可変長デコーディング、および算術デコーディングを含む。
図1に、説明される実施形態のうちの複数を実施できる適切なコンピューティング環境(100)の一般化された例を示す。コンピューティング環境(100)は、使用または機能性の範囲に関する限定を暗示することを意図するものではない。というのは、説明される技法およびツールを、別個の汎用のまたは特殊目的のコンピューティング環境で実施できるからである。
図2に、1つまたは複数の説明される実施形態を実施できる第1のオーディオエンコーダ(200)を示す。エンコーダ(200)は、変換ベースの知覚オーディオエンコーダ(200)である。図3に、対応するオーディオデコーダ(300)を示す。
全体的に、エンコーダ(200)は、あるサンプリング深さおよびサンプリングレートで入力オーディオサンプル(205)の時系列を受け取る。入力オーディオサンプル(205)は、マルチチャネルオーディオ(例えば、ステレオ)またはモノラルオーディオである。エンコーダ(200)は、オーディオサンプル(205)を圧縮し、エンコーダ(200)の様々なモジュールによって作られた情報を多重化して、WMAフォーマット、Advanced Streaming Format(「ASF」)、または他のフォーマットなどのフォーマットでビットストリーム(295)を出力する。
全体的に、デコーダ(300)は、エントロピエンコードされたデータならびにサイド情報を含む圧縮オーディオ情報のビットストリーム(305)を受け取り、このビットストリームから、デコーダ(300)は、オーディオサンプル(395)を再構成する。
図4を参照すると、エンコーダ(400)は、あるサンプリング深さおよびサンプリングレートで入力オーディオサンプル(405)の時系列を受け取る。入力オーディオサンプル(405)は、マルチチャネルオーディオ(例えば、ステレオ、サラウンド)またはモノラルオーディオである。エンコーダ(400)は、オーディオサンプル(405)を圧縮し、エンコーダ(400)の様々なモジュールによって作られた情報を多重化して、WMA Proフォーマットまたは他のフォーマットなどのフォーマットでビットストリーム(495)を出力する。
図5を参照すると、第2のオーディオデコーダ(500)は、圧縮オーディオ情報のビットストリーム(505)を受け取る。ビットストリーム(505)は、エントロピエンコードされたデータならびにサイド情報を含み、このデータならびにサイド情報から、デコーダ(500)はオーディオサンプル(595)を再構成する。
図6に、オーディオコンテンツ、ビデオコンテンツ、または他のメディアコンテンツをエンコードする一般化されたメディアエンコーダ(600)の諸部分を示す。図を単純にするために、メディアコンテンツのタイプに依存する可能性がある、エンコーダ(600)の多数のモジュールおよび多数のタイプのサイド情報は、図示されていない。
図7に、オーディオコンテンツ、ビデオコンテンツ、または他のメディアコンテンツをデコードする一般化されたメディアデコーダ(700)の諸部分を示す。図を単純にするために、メディアコンテンツのタイプに依存する可能性がある、デコーダ(700)の多数のモジュールおよび多数のタイプのサイド情報は、図示されていない。
オーディオエンコーダは、しばしば、圧縮を達成するために、変換コーディングとそれに続く量子化およびエントロピコーディングを使用する。固定された変換が使用される場合に、オーディオ信号のいくつかのパターンについて、変換後に、隣接する係数の間に相関が残っている。そのような相関を活用してコーディング効率を高める様々な技法およびツールを、下で説明する。具体的に言うと、いくつかの実施形態で、図2、4、または6に示されたものなどのエンコーダが、エンコーディング中に、量子化されたスペクトル係数に対する係数予測を実行する。対応するデコーダ(図3、5、または7に示されたものなど)は、デコーディング中に、量子化されたスペクトル係数に対して係数予測を実行する。
波形としてのオーディオを圧縮する通常のオーディオエンコーダでは、入力オーディオ信号が、可変ウィンドウサイズMDCTまたは可変サイズウィンドウを用いる他の変換を使用して変換される。例えば、図8aに示されたステレオオーディオのウィンドウイング分析が、図8bに示されたウィンドウ構成をもたらすと仮定する。一般に、そのようなウィンドウ構成は、デコードされた信号のプリエコーおよびポストエコーを減らす(過渡セグメントにより短いウィンドウを使用することによって)と同時に、全体的なコーディング効率を容易にする(他のセグメントにより長いウィンドを使用することによって)。ウィンドウイング分析の1つのねらいは、任意の所与のウィンドウ内の信号がほぼ静止状態になるウィンドウ境界を識別することである。
いくつかの実施形態で、エンコーダは、エンコーディング中に、量子化されたスペクトル係数に対して係数予測を実行し、対応するデコーダは、デコーディング中に、量子化されたスペクトル係数に対して係数予測を実行する。コンテンツのある種のパターンおよびタイプに関して、係数予測は、後続エントロピコーディングの効率を改善するために、スペクトル係数の冗長性を減らす。この予測は、可逆である、すなわち、デコーディング中に、係数予測(エントロピデコーディングに続く)は、エンコーダでの係数予測の鏡像になる。
図13に、エンコーディング中に量子化されたスペクトル係数を予測する技法(1300)を示す。例えば、図11に示されたものなどのエンコーダが、この技法(1300)を実行する。代替案では、別のエンコーダが、この技法(1300)を実行する。
図14に、デコーディング中に量子化されたスペクトル係数を予測する技法(1400)を示す。例えば、図12に示されたものなどのデコーダが、この技法(1400)を実行する。代替案では、別のデコーダが、この技法(1400)を実行する。
一般に、量子化されたスペクトル係数の予測は、コンテンツのある種のタイプおよびパターンの後続エントロピエンコーディングの効率を改善する。例えば、予測は、隣接する係数の間の冗長性を減らし、後続ベクトル可変長コーディングおよび/またはランレベルコーディングをより効率的にする。対照的に、MPEG TNSの目的は、歪みの時間的分布を制御することである。
前に注記したように、オーディオエンコーダは、しばしば、圧縮を達成するために、変換コーディングとそれに続く量子化およびエントロピコーディングを使用する。オーディオ信号のいくつかのパターンについて、周波数変換後に、スペクトル係数に周期的パターンが残っている。そのような冗長性を活用してコーディング効率を高める様々な技法およびツールを説明する。具体的に言うと、いくつかの実施形態で、図2、4、または6に示されたものなどのエンコーダが、量子化されたスペクトル係数のインターリービングまたは並べ換えを実行する。対応するデコーダ(図3、5、または7に示されたものなど)は、量子化されたスペクトル係数のインターリービングまたは並べ換えを逆転する。
従来、サブフレームまたは他のウィンドウのスペクトル係数は、その間に線形相関をまったく有しないと仮定される。そうではなく、スペクトル係数は、通常、あるより高次の統計的関係を有すると仮定され、エンコーダは、エントロピコーディング中にその関係を活用することを試みる。
いくつかの実施形態で、エンコーダは、エントロピコーディングの前に、量子化されたスペクトル係数に対して並べ換えを実行し、対応するデコーダは、エントロピコーディングの後に、量子化されたスペクトル係数に対して並べ換えを実行する。トーンまたは高調波を有する周期的信号などのコンテンツのある種のパターンおよびタイプに関して、並べ換えは、後続エントロピエンコーディングの効率を改善するために、スペクトル係数の冗長性を減らす。デコーディング中には、並べ換え(エントロピデコーディングに続く)は、エンコーダでの並べ換えを補償する。
A0 A1 A2 A3 B0 B1 B2 B3 C0 C1 C2 C3 D0 D1 D2 D3
であり、インターリーブの後には、この系列は、
A0 B0 C0 D0 A1 B1 C1 D1 A2 B2 C2 D2 A3 B3 C3 D3
である。
図18aに、エンコーディング中に量子化されたスペクトル係数を並べ換える技法(1800)を示し、図18bおよび18cに、この技法(1800)のある種の行為を実行する可能な形を詳細に示す。例えば、図16に示されたものなどのエンコーダが、この技法(1800)を実行する。代替案では、別のエンコーダが、この技法(1800)を実行する。
図19aに、デコーディング中に量子化されたスペクトル係数を並べ換える技法(1900)を示し、図19bおよび19cに、技法(1900)のある種の行為を実行する可能な形を詳細に示す。例えば、図12に示されたものなどのデコーダが、技法(1900)を実行する。代替案では、別のデコーダが、技法(1900)を実行する。
一般に、量子化されたスペクトル係数の並べ換えは、周期的信号の後続エントロピエンコーディングの効率を改善する。例えば、並べ換えは、類似する値を有する係数をローカルにグループ化し、後続のベクトル可変長コーディングおよび/またはランレベルコーディングをより効率的にする。
いくつかの実施形態で、図2、4、または6に示されたものなどのエンコーダは、エンコーダが複数のエントロピモデルを選択的に使用する適応エントロピコーディングを実行する。対応するデコーダ(図3、5、または7に示されたものなど)は、デコーダが複数のエントロピモデルを選択的に使用する適応エントロピデコーディングを実行する。複数のエントロピモデルを選択的に使用する技法およびツールは、オーディオ、ビデオ、イメージ、または任意の他のデータのロスレスおよびロッシイの圧縮および圧縮解除を含む、シンボル値が複数の確率分布を有する様々なシナリオに適用可能である。
シンボルの適応コーディングは、しばしば、シンボル値の確率分布が変化する時にエントロピコーディングの効率を改善するのに使用される。適応算術コーディングは、異なるまたは変化する確率分布を直接に使用することができる。適応可変長コーディング(適応ハフマンコーディングなど)について、シンボル値に関する異なるエントロピモデルは、異なるまたは変化するVLCテーブル内で実施される。
複数のエントロピモデルを選択的に使用することによって、複数の分布/VLCテーブルのためのリソース使用量を大幅に減らすことができる。それと同時に、複数のエントロピモデルの使用に関連するエンコーディング利益の多くを、それでも達成することができる。様々な一般的なシナリオで、複数のエントロピモデルの選択的使用は、すべてではなくいくつかのシンボル値について異なる分布/VLCテーブルの間で選択することを含む。より一般的には、これは、いくつかのシンボル値に関するより多くの適応性および他のシンボル値に関するより少ない適応性を可能にするために階層的に編成された異なる分布/VLCテーブルの間で選択することを含む。
エンコーダまたはデコーダが、一部のシンボル値(すべてのシンボル値ではなく)について複数のエントロピモデルを選択的に使用するために、複数のエントロピモデルが、それ相応に調整される。次の分析は、単純な例を参照して、状態の集合に関する実際の確率分布に対する調整を例示するものである。
異なる状態のシンボル値の近似分布は、ハフマンコーディングおよびデコーディングならびに他の可変長コーディングおよびデコーディングを含む、様々なタイプの適応エントロピコーディングおよび適応エントロピデコーディングに使用することができる。
他のエンコーダ/デコーダでは、近似分布が、算術コーディング/デコーディングに使用される。算術コーディングは、一般に、シンボルの系列を所与の範囲内の単一の数として表すことを用いる。通常、この数は、0と1との間の分数である。シンボルは、それを範囲の一部に置くことによってコーディングされ、この範囲は、シンボル値の確率分布に依存して区分される。
エンコーダおよびデコーダが、シンボルについて複数のエントロピモデルを選択的に使用する時に、エントロピモデルは、最終的に、シンボルの確率分布情報に依存する。いくつかの実施態様で、エンコーダまたは等的分析ソフトウェアなどのツールは、次の手法を使用して、エントロピモデルの状態および確率分布を判定する。
前の例の多くは、いくつかのシンボル値に複数の分布/テーブルを使用することおよび他のシンボル値に単一の分布/テーブルを使用することを用いる。この構成は、通常、エントロピコーディング性能を大きく損なわずにメモリ使用量を減らすが、セクションVで説明した技法およびツールは、より一般的に階層編成されたエントロピモデルに適用可能である。エンコーダまたはデコーダは、いくつかのシンボル値についてより多くの適応性、他のシンボルについてより少ない適応性を可能にする、階層編成内の異なるエントロピモデルの間で選択的に選択することができる。
図26に、複数のエントロピモデルの選択的使用を用いてシンボルをエンコードする技法(2600)を示す。図2、4、または6に示されたエンコーダなどのエンコーダが、この技法(2600)を実行する。
図27に、複数のエントロピモデルの選択的使用を用いてシンボルをデコードする技法(2700)を示す。図3、5、または7に示されたデコーダなどのデコーダが、この技法(2700)を実行する。
可能性のより低いシンボル値について近似された分布を使用するコーディングは、エンコーダおよびデコーダ内で分布またはコードテーブルに必要なメモリの節約を可能にする。セクションV.A.1の分析フレームワークに関して、エンコーダおよびデコーダは、PS(j),X(q)の分布および/またはコードテーブルを格納する。すなわち、エンコーダおよびデコーダは、集合Qに含まれるシンボル値X(i)の状態S(j)ごとに1つの分布および/またはテーブルを格納する。集合Rに含まれるシンボル値X(i)について、エンコーダおよびデコーダは、単一の分布P’S(j),X(i),Rの分布および/またはテーブルを格納する。
Claims (20)
- エンコーダまたはデコーダによって実行される方法であって、前記方法は、
複数のシンボルについて、複数のエントロピーモデルを含む第1モデルセットからエントロピーモデルを選択するステップであって、前記第1モデルセットの前記複数のエントロピーモデルはそれぞれ、1つまたは複数のエントロピーモデルを含む第2モデルセットに切り替えるモデル切替点を含み、エントロピーモデルの選択は複数のエントロピーモデルを使用してエンコーディングの性能を評価することに基づいて行われる、選択するステップと、
前記選択されたエントロピーモデルを使用して前記複数のシンボルを処理するステップと、
前記処理の結果を出力するステップであって、前記第1モデルセットの前記複数のエントロピーモデルおよび前記第2モデルセットの前記1つまたは複数のエントロピーモデルは、コーディングおよび/またはデコーディング用の確率分布を反映し、前記第1モデルセットの前記複数のエントロピーモデルは可能性のより高いシンボルの前記確率分布を反映し、前記第2モデルセットの前記1つまたは複数のエントロピーモデルは可能性のより低いシンボルの前記確率分布を反映し、前記選択された確率分布が前記複数のシンボルの各シンボルを含まない場合には切替点が生じる、出力するステップと
を含むことを特徴とする方法。 - エンコーダは、前記選択、前記処理、および前記出力をエンコード中に実行し、前記処理は、エントロピーコーディングを含むことを特徴とする請求項1に記載の方法。
- デコーダは、前記選択、前記処理、および前記出力をデコード中に実行し、前記処理は、エントロピーデコーディングを含むことを特徴とする請求項1に記載の方法。
- 前記第1モデルセットの前記複数のエントロピーモデルおよび前記第2モデルセットの前記1つまたは複数のエントロピーモデルは、算術コーディングおよび/または算術デコーディング用の確率分布であり、前記モデル切替点は、前記第1モデルセットの複数の前記確率分布でのモデル切替確率であることを特徴とする請求項1に記載の方法。
- 前記第1モデルセットの前記複数のエントロピーモデルは、それぞれ第1テーブルセットの複数のVLCテーブル内で実施され、前記第2モデルセットの前記1つまたは複数のエントロピーモデルは、それぞれ第2テーブルセットの1つまたは複数のVLCテーブル内で実施され、前記モデル切替点は、エスケープコードであり、前記第1テーブルセットの前記複数のVLCテーブルのそれぞれは、前記第2テーブルセットに切り替える前記エスケープコードを含むことを特徴とする請求項1に記載の方法。
- 前記第1テーブルセットの前記複数のVLCテーブルおよび前記第2テーブルセットの前記1つまたは複数のVLCテーブルは、ハフマンコードテーブルであり、前記第2テーブルセットは、単一のハフマンコードテーブルを含み、前記単一のハフマンコードテーブルは、前記第1テーブルセットの前記複数のハフマンコードテーブルそれぞれを表すツリー内の共通の枝を表すようになっていることを特徴とする請求項5に記載の方法。
- 前記第1テーブルセットの前記複数のVLCテーブルは、可能性のより高いシンボル値を含む第1シンボル値セットに適合され、前記第2テーブルセットの前記1つまたは複数のVLCテーブルは、可能性のより低いシンボル値を含む第2シンボル値セットに適合されることを特徴とする請求項5に記載の方法。
- 前記第2テーブルセットは、単一のVLCテーブルを含み、前記処理は、前記複数のシンボルのうちで前記可能性のより低いシンボル値を有するシンボルの2ステージ可変長コーディングまたは2ステージ可変長デコーディングに関することを特徴とする請求項7に記載の方法。
- 前記第1モデルセットの前記複数のエントロピーモデルおよび前記第2モデルセットの前記1つまたは複数のエントロピーモデルを生成するステップをさらに含み、前記生成するステップは、
第1コストメトリックに従って確率分布をクラスタ化し、複数の予備クラスタをもたらすステップと、
前記第1コストメトリックと異なる第2コストメトリックに従って前記複数の予備クラスタを精密化し、複数の最終クラスタをもたらすステップと
を含むことを特徴とする請求項1に記載の方法。 - 前記第2モデルセットは、単一のエントロピーモデルを含み、前記方法は、前記第1モデルセットの前記複数のエントロピーモデルおよび前記第2モデルセットの前記単一のエントロピーモデルを生成するステップをさらに含み、前記生成するステップは、前記第2モデルセットの前記単一のエントロピーモデルについて、確率分布にまたがって共通な条件付き分布を有するように可能性のより低いシンボル値を制約するステップを含むことを特徴とする請求項1に記載の方法。
- 前記第2モデルセットの前記1つまたは複数のエントロピーモデルのそれぞれは、1つまたは複数のエントロピーモデルを含む第3モデルセットに切り替える第2モデル切替点を含むことを特徴とする請求項1に記載の方法。
- 前記第1モデルセットの前記複数のエントロピーモデルのうちの少なくともいくつかについて、前記モデル切替点は、モデルによって異なる値を有することを特徴とする請求項1に記載の方法。
- 前記第1モデルセットの前記複数のエントロピーモデルのそれぞれは、1つまたは複数のエントロピーモデルを含む第3モデルセットに切り替える第2モデル切替点をさらに含むことを特徴とする請求項1に記載の方法。
- 前記複数のシンボルは、オーディオデータの量子化されたスペクトル係数のためのものであることを特徴とする請求項1に記載の方法。
- 前記選択は、順方向適応切替の一部であることを特徴とする請求項1に記載の方法。
- 前記選択は、逆方向適応切替の一部であることを特徴とする請求項1に記載の方法。
- エンコーダまたはデコーダを備えるシステムであって、前記システムは、
複数のエントロピーモデルを含む第1モデルセットからエントロピーモデルを選択する手段であって、前記第1モデルセットの前記複数のエントロピーモデルはそれぞれ、1つまたは複数のエントロピーモデルを含む第2モデルセットに切り替えるモデル切替点を含み、エントロピーモデルの選択は複数のエントロピーモデルを使用してエンコーディングの性能を評価することに基づいて行われる、選択する手段と、
前記選択されたエントロピーモデルを使用して前記複数のシンボルを処理する手段と、
前記処理の結果を出力する手段であって、前記第1モデルセットの前記複数のエントロピーモデルおよび前記第2モデルセットの前記1つまたは複数のエントロピーモデルは、コーディングおよび/またはデコーディング用の確率分布を反映し、前記第1モデルセットの前記複数のエントロピーモデルは可能性のより高いシンボルの前記確率分布を反映し、前記第2モデルセットの前記1つまたは複数のエントロピーモデルは可能性のより低いシンボルの前記確率分布を反映し、前記選択された確率分布が前記複数のシンボル値の各シンボルを含まない場合には切替点が生じる、出力する手段と
を含むことを特徴とするシステム。 - 前記第1モデルセットの前記複数のエントロピーモデルは、それぞれ第1テーブルセットの複数のVLCテーブル内で実施され、前記第2モデルセットの前記1つまたは複数のエントロピーモデルは、それぞれ第2テーブルセットの1つまたは複数のVLCテーブル内で実施され、前記モデル切替点は、エスケープコードであり、前記第1テーブルセットの前記複数のVLCテーブルのそれぞれは、前記第2テーブルセットに切り替える前記エスケープコードを含むことを特徴とする請求項17に記載のシステム。
- 前記第1テーブルセットの前記複数のVLCテーブルおよび前記第2テーブルセットの前記1つまたは複数のVLCテーブルは、ハフマンコードテーブルであり、前記第2テーブルセットは、単一のハフマンコードテーブルを含み、前記単一のハフマンコードテーブルは、前記第1テーブルセットの前記複数のハフマンコードテーブルそれぞれを表すツリー内の共通の枝を表すようになっていることを特徴とする請求項18に記載のシステム。
- 前記複数のシンボルは、オーディオデータの量子化されたスペクトル係数のためのものであることを特徴とする請求項18に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/183,266 | 2005-07-15 | ||
US11/183,266 US7599840B2 (en) | 2005-07-15 | 2005-07-15 | Selectively using multiple entropy models in adaptive coding and decoding |
PCT/US2006/027231 WO2007011653A2 (en) | 2005-07-15 | 2006-07-14 | Selectively using multiple entropy models in adaptive coding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009501943A JP2009501943A (ja) | 2009-01-22 |
JP5085543B2 true JP5085543B2 (ja) | 2012-11-28 |
Family
ID=37662739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008521610A Active JP5085543B2 (ja) | 2005-07-15 | 2006-07-14 | 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用 |
Country Status (12)
Country | Link |
---|---|
US (1) | US7599840B2 (ja) |
EP (1) | EP1905000B1 (ja) |
JP (1) | JP5085543B2 (ja) |
KR (1) | KR101278805B1 (ja) |
CN (1) | CN101223573B (ja) |
AT (1) | ATE536001T1 (ja) |
AU (1) | AU2006270259B2 (ja) |
CA (1) | CA2612537C (ja) |
ES (1) | ES2378393T3 (ja) |
MX (1) | MX2008000524A (ja) |
NO (1) | NO341186B1 (ja) |
WO (1) | WO2007011653A2 (ja) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE20321883U1 (de) | 2002-09-04 | 2012-01-20 | Microsoft Corp. | Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes |
US7882167B2 (en) * | 2005-02-18 | 2011-02-01 | Beth Israel Deaconess Medical Center | Complexity-based dynamical analysis of a network |
US20080243518A1 (en) * | 2006-11-16 | 2008-10-02 | Alexey Oraevsky | System And Method For Compressing And Reconstructing Audio Files |
TWI312981B (en) * | 2006-11-30 | 2009-08-01 | Inst Information Industr | Voice detection apparatus, method, computer program product, and computer readable medium for adjusting a window size dynamically |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
JP2008228208A (ja) * | 2007-03-15 | 2008-09-25 | Ricoh Co Ltd | 画像符号化方法、画像符号化装置、画像符号化回路、情報記録媒体、及び、コンピュータプログラム |
KR101418248B1 (ko) * | 2007-04-12 | 2014-07-24 | 삼성전자주식회사 | 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치 |
KR101317269B1 (ko) * | 2007-06-07 | 2013-10-14 | 삼성전자주식회사 | 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 |
ATE479182T1 (de) * | 2007-07-30 | 2010-09-15 | Global Ip Solutions Gips Ab | Audiodekoder mit geringer verzögerung |
US8463615B2 (en) * | 2007-07-30 | 2013-06-11 | Google Inc. | Low-delay audio coder |
US8483282B2 (en) * | 2007-10-12 | 2013-07-09 | Qualcomm, Incorporated | Entropy coding of interleaved sub-blocks of a video block |
CA2858944C (en) | 2007-11-12 | 2017-08-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8972247B2 (en) * | 2007-12-26 | 2015-03-03 | Marvell World Trade Ltd. | Selection of speech encoding scheme in wireless communication terminals |
US8457951B2 (en) | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
TWI349487B (en) * | 2008-03-25 | 2011-09-21 | Novatek Microelectronics Corp | Entropy encoding circuit and encoding method thereof |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8630848B2 (en) | 2008-05-30 | 2014-01-14 | Digital Rise Technology Co., Ltd. | Audio signal transient detection |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
KR101485339B1 (ko) | 2008-09-29 | 2015-01-26 | 삼성전자주식회사 | 무손실 부호화/복호화 장치 및 방법 |
KR100968373B1 (ko) * | 2008-10-07 | 2010-07-09 | 주식회사 코아로직 | 가변장 부호 테이블 분할 방법 및 이를 이용한 멀티 코덱의메모리 공유 방법 및 장치 |
GB2466666B (en) * | 2009-01-06 | 2013-01-23 | Skype | Speech coding |
US8805723B2 (en) * | 2009-05-27 | 2014-08-12 | Iviu Technologies, Llc | Acoustically transmitting a resource identifier in multiple concurrent segments |
CN101615910B (zh) | 2009-05-31 | 2010-12-22 | 华为技术有限公司 | 压缩编码的方法、装置和设备以及压缩解码方法 |
EP2273495A1 (en) * | 2009-07-07 | 2011-01-12 | TELEFONAKTIEBOLAGET LM ERICSSON (publ) | Digital audio signal processing system |
CN102473315B (zh) * | 2009-08-20 | 2016-08-03 | 汤姆森特许公司 | 再次使用树结构编码和解码二元集的方法和装置 |
US8788277B2 (en) * | 2009-09-11 | 2014-07-22 | The Trustees Of Columbia University In The City Of New York | Apparatus and methods for processing a signal using a fixed-point operation |
AU2010305383B2 (en) * | 2009-10-08 | 2013-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
US8380524B2 (en) * | 2009-11-26 | 2013-02-19 | Research In Motion Limited | Rate-distortion optimization for advanced audio coding |
KR101885258B1 (ko) * | 2010-05-14 | 2018-08-06 | 삼성전자주식회사 | 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
US8761240B2 (en) * | 2010-07-13 | 2014-06-24 | Blackberry Limited | Methods and devices for data compression using context-based coding order |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
ES2759513T3 (es) | 2011-01-14 | 2020-05-11 | Ge Video Compression Llc | Esquema de codificación y decodificación entrópica |
ES2558508T3 (es) * | 2011-01-25 | 2016-02-04 | Nippon Telegraph And Telephone Corporation | Método de codificación, codificador, método de determinación de la cantidad de una característica periódica, aparato de determinación de la cantidad de una característica periódica, programa y medio de grabación |
US8942917B2 (en) | 2011-02-14 | 2015-01-27 | Microsoft Corporation | Change invariant scene recognition by an agent |
WO2012144128A1 (ja) * | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
US9557836B2 (en) * | 2011-11-01 | 2017-01-31 | Microsoft Technology Licensing, Llc | Depth image compression |
US9459866B2 (en) | 2011-12-30 | 2016-10-04 | Intel Corporation | Vector frequency compress instruction |
CN103391433B (zh) * | 2012-05-09 | 2017-07-18 | 腾讯科技(深圳)有限公司 | 视频编码帧内预测扫描方法及视频编码方法 |
DE102012211031B3 (de) * | 2012-06-27 | 2013-11-28 | Siemens Aktiengesellschaft | Verfahren zur Codierung eines Datenstroms |
KR101700855B1 (ko) * | 2012-10-01 | 2017-01-31 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
CN104509122B (zh) * | 2012-11-19 | 2018-10-16 | Lg 电子株式会社 | 信号收发装置和信号收发方法 |
US9857470B2 (en) | 2012-12-28 | 2018-01-02 | Microsoft Technology Licensing, Llc | Using photometric stereo for 3D environment modeling |
US10043535B2 (en) | 2013-01-15 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
US9940553B2 (en) | 2013-02-22 | 2018-04-10 | Microsoft Technology Licensing, Llc | Camera/object pose from predicted coordinates |
JP5641090B2 (ja) * | 2013-03-14 | 2014-12-17 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US9786269B2 (en) * | 2013-03-14 | 2017-10-10 | Google Inc. | Language modeling of complete language sequences |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9245352B1 (en) | 2013-04-12 | 2016-01-26 | Google Inc. | Systems and methods for near lossless image compression |
US20140328406A1 (en) | 2013-05-01 | 2014-11-06 | Raymond John Westwater | Method and Apparatus to Perform Optimal Visually-Weighed Quantization of Time-Varying Visual Sequences in Transform Space |
US9980074B2 (en) * | 2013-05-29 | 2018-05-22 | Qualcomm Incorporated | Quantization step sizes for compression of spatial components of a sound field |
US9626184B2 (en) * | 2013-06-28 | 2017-04-18 | Intel Corporation | Processors, methods, systems, and instructions to transcode variable length code points of unicode characters |
US9781539B2 (en) | 2013-10-09 | 2017-10-03 | Sony Corporation | Encoding device and method, decoding device and method, and program |
WO2015055800A1 (en) * | 2013-10-18 | 2015-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding of spectral coefficients of a spectrum of an audio signal |
US10045135B2 (en) | 2013-10-24 | 2018-08-07 | Staton Techiya, Llc | Method and device for recognition and arbitration of an input connection |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
ES2768090T3 (es) * | 2014-03-24 | 2020-06-19 | Nippon Telegraph & Telephone | Método de codificación, codificador, programa y soporte de registro |
EP2963949A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
US9794714B2 (en) * | 2014-07-02 | 2017-10-17 | Dolby Laboratories Licensing Corporation | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
US10452658B2 (en) | 2014-12-23 | 2019-10-22 | Teradata Us, Inc. | Caching methods and a system for entropy-based cardinality estimation |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10763893B2 (en) * | 2016-07-20 | 2020-09-01 | Georges Harik | Method for data compression |
KR102252298B1 (ko) * | 2016-10-21 | 2021-05-14 | 삼성전자주식회사 | 표정 인식 방법 및 장치 |
US10735736B2 (en) | 2017-08-29 | 2020-08-04 | Google Llc | Selective mixing for entropy coding in video compression |
US11177823B2 (en) * | 2018-05-21 | 2021-11-16 | Google Llc | Data compression by local entropy encoding |
US10475456B1 (en) * | 2018-06-04 | 2019-11-12 | Qualcomm Incorporated | Smart coding mode switching in audio rate adaptation |
US11257254B2 (en) * | 2018-07-20 | 2022-02-22 | Google Llc | Data compression using conditional entropy models |
CN111641826B (zh) * | 2019-03-01 | 2022-05-20 | 杭州海康威视数字技术股份有限公司 | 对数据进行编码、解码的方法、装置与系统 |
US11095311B2 (en) * | 2019-11-27 | 2021-08-17 | Qualcomm Incorporated | Quantization codeword selection for low cost parity checking |
KR20230066056A (ko) * | 2020-09-09 | 2023-05-12 | 보이세지 코포레이션 | 사운드 코덱에 있어서 비상관 스테레오 콘텐츠의 분류, 크로스-토크 검출 및 스테레오 모드 선택을 위한 방법 및 디바이스 |
FR3124671B1 (fr) * | 2021-06-25 | 2023-07-07 | Fond B Com | Procédés de décodage et de codage d’une image, dispositifs et signal associés |
CN113656906B (zh) * | 2021-07-29 | 2023-10-03 | 浙江大学 | 一种面向燃气轮机的非平稳多变量因果关系分析方法 |
Family Cites Families (155)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4420771A (en) | 1981-02-09 | 1983-12-13 | Bell Telephone Laboratories, Incorporated | Technique for encoding multi-level signals |
EP0260748B1 (de) * | 1986-09-13 | 1994-07-13 | Philips Patentverwaltung GmbH | Verfahren und Schaltungsanordung zur Bitratenreduktion |
US4730348A (en) * | 1986-09-19 | 1988-03-08 | Adaptive Computer Technologies | Adaptive data compression system |
US4698672A (en) | 1986-10-27 | 1987-10-06 | Compression Labs, Inc. | Coding system for reducing redundancy |
FR2618354B1 (fr) * | 1987-07-20 | 1989-12-01 | Sames Sa | Installation de pulverisation de produit de revetement a commande manuelle et projecteur pneumatique d'un tel produit de revetement |
US4968135A (en) | 1987-08-17 | 1990-11-06 | Digital Equipment Corporation | System for producing pixel image data from CCITT encoded pixel data |
US4792981A (en) | 1987-09-21 | 1988-12-20 | Am International, Inc. | Manipulation of run-length encoded images |
US4813056A (en) * | 1987-12-08 | 1989-03-14 | General Electric Company | Modified statistical coding of digital signals |
JPH0621830Y2 (ja) | 1988-03-11 | 1994-06-08 | 本田技研工業株式会社 | 自動車のサイドシル構造 |
EP0339589A3 (en) * | 1988-04-28 | 1992-01-02 | Sharp Kabushiki Kaisha | Orthogonal transform coding system for image data |
US5043919A (en) * | 1988-12-19 | 1991-08-27 | International Business Machines Corporation | Method of and system for updating a display unit |
US5033087A (en) * | 1989-03-14 | 1991-07-16 | International Business Machines Corp. | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system |
DE3943879B4 (de) | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
FR2646978B1 (fr) * | 1989-05-11 | 1991-08-23 | France Etat | Procede et installation a codage de signaux sonores |
US5179442A (en) * | 1989-06-02 | 1993-01-12 | North American Philips Corporation | Method and apparatus for digitally processing a high definition television augmentation signal |
US5128758A (en) * | 1989-06-02 | 1992-07-07 | North American Philips Corporation | Method and apparatus for digitally processing a high definition television augmentation signal |
JPH0773249B2 (ja) * | 1989-06-29 | 1995-08-02 | 富士通株式会社 | 音声符号化・復号化伝送方式 |
US5270832A (en) | 1990-03-14 | 1993-12-14 | C-Cube Microsystems | System for compression and decompression of video data using discrete cosine transform and coding techniques |
US5146324A (en) * | 1990-07-31 | 1992-09-08 | Ampex Corporation | Data compression using a feedforward quantization estimator |
JPH04199981A (ja) * | 1990-11-29 | 1992-07-21 | Nec Corp | 即時処理型1次元符号器 |
US5253053A (en) | 1990-12-31 | 1993-10-12 | Apple Computer, Inc. | Variable length decoding using lookup tables |
US5266941A (en) | 1991-02-15 | 1993-11-30 | Silicon Graphics, Inc. | Apparatus and method for controlling storage of display information in a computer system |
JP2670201B2 (ja) * | 1991-08-30 | 1997-10-29 | 富士写真フイルム株式会社 | 画像データ圧縮符号化装置および方法 |
JP2586260B2 (ja) | 1991-10-22 | 1997-02-26 | 三菱電機株式会社 | 適応的ブロッキング画像符号化装置 |
JP3134424B2 (ja) | 1991-10-31 | 2001-02-13 | ソニー株式会社 | 可変長符号化方法及び装置 |
US5227878A (en) * | 1991-11-15 | 1993-07-13 | At&T Bell Laboratories | Adaptive coding and decoding of frames and fields of video |
JP2812446B2 (ja) | 1991-11-21 | 1998-10-22 | 三洋電機株式会社 | 画像符号化方式 |
DE69228983T2 (de) * | 1991-12-18 | 1999-10-28 | Koninklijke Philips Electronics N.V., Eindhoven | System zum Übertragen und/oder Speichern von Signalen von texturierten Bildern |
US5227788A (en) | 1992-03-02 | 1993-07-13 | At&T Bell Laboratories | Method and apparatus for two-component signal compression |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
KR950010913B1 (ko) * | 1992-07-23 | 1995-09-25 | 삼성전자주식회사 | 가변장부호화 및 복호화시스템 |
US5714950A (en) * | 1992-07-23 | 1998-02-03 | Samsung Electronics Co., Ltd. | System for variable-length-coding and variable-length-decoding digitaldata |
JP3348310B2 (ja) * | 1992-09-28 | 2002-11-20 | ソニー株式会社 | 動画像符号化方法および動画像符号化装置 |
CA2107727C (en) * | 1992-10-07 | 1999-06-01 | Hiroaki Ueda | Synchronous compression and reconstruction system |
US5982437A (en) | 1992-10-26 | 1999-11-09 | Sony Corporation | Coding method and system, and decoding method and system |
JP2959916B2 (ja) * | 1992-10-28 | 1999-10-06 | 松下電器産業株式会社 | デジタル・ビデオ・コーダ用のバーサタイルなエスケープ・ラン・レベル・コーダ |
KR0166722B1 (ko) | 1992-11-30 | 1999-03-20 | 윤종용 | 부호화 및 복호화방법 및 그 장치 |
US5467134A (en) | 1992-12-22 | 1995-11-14 | Microsoft Corporation | Method and system for compressing video data |
JP2922376B2 (ja) * | 1992-12-26 | 1999-07-19 | キヤノン株式会社 | シート厚測定装置 |
US5535305A (en) * | 1992-12-31 | 1996-07-09 | Apple Computer, Inc. | Sub-partitioned vector quantization of probability density functions |
US5400075A (en) * | 1993-01-13 | 1995-03-21 | Thomson Consumer Electronics, Inc. | Adaptive variable length encoder/decoder |
JPH06217110A (ja) | 1993-01-20 | 1994-08-05 | Process Shizai Kk | 画像変換方法 |
US5544286A (en) * | 1993-01-29 | 1996-08-06 | Microsoft Corporation | Digital video data compression technique |
TW224553B (en) * | 1993-03-01 | 1994-06-01 | Sony Co Ltd | Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture |
US5376968A (en) | 1993-03-11 | 1994-12-27 | General Instrument Corporation | Adaptive compression of digital video data using different modes such as PCM and DPCM |
US5408234A (en) * | 1993-04-30 | 1995-04-18 | Apple Computer, Inc. | Multi-codebook coding process |
CA2140779C (en) * | 1993-05-31 | 2005-09-20 | Kyoya Tsutsui | Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal |
US5664057A (en) * | 1993-07-07 | 1997-09-02 | Picturetel Corporation | Fixed bit rate speech encoder/decoder |
US5590960A (en) * | 1993-11-04 | 1997-01-07 | E. I. Du Pont De Nemours And Company | One tank paint makeup process using a recirculation loop with liquid injection |
KR0155784B1 (ko) * | 1993-12-16 | 1998-12-15 | 김광호 | 영상데이타의 적응형 가변장 부호화/복호화방법 |
KR970009408B1 (ko) * | 1994-01-18 | 1997-06-13 | 대우전자 주식회사 | 인터/인트라 테이블 선택 회로 |
US5504591A (en) * | 1994-04-25 | 1996-04-02 | Microsoft Corporation | System and method for compressing graphic images |
US5457495A (en) | 1994-05-25 | 1995-10-10 | At&T Ipm Corp. | Adaptive video coder with dynamic bit allocation |
US6141446A (en) * | 1994-09-21 | 2000-10-31 | Ricoh Company, Ltd. | Compression and decompression system with reversible wavelets and lossy reconstruction |
US6195465B1 (en) * | 1994-09-21 | 2001-02-27 | Ricoh Company, Ltd. | Method and apparatus for compression using reversible wavelet transforms and an embedded codestream |
US5568167A (en) | 1994-09-23 | 1996-10-22 | C-Cube Microsystems, Inc. | System for providing antialiased video overlays |
JP3474005B2 (ja) | 1994-10-13 | 2003-12-08 | 沖電気工業株式会社 | 動画像符号化方法及び動画像復号方法 |
US5802213A (en) * | 1994-10-18 | 1998-09-01 | Intel Corporation | Encoding video signals using local quantization levels |
AU697176B2 (en) * | 1994-11-04 | 1998-10-01 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
JP2951861B2 (ja) | 1994-12-28 | 1999-09-20 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
JP3371590B2 (ja) | 1994-12-28 | 2003-01-27 | ソニー株式会社 | 高能率符号化方法及び高能率復号化方法 |
US5574449A (en) | 1995-02-24 | 1996-11-12 | Intel Corporation | Signal processing with hybrid variable-length and entropy encodidng |
US5991451A (en) | 1995-03-23 | 1999-11-23 | Intel Corporation | Variable-length encoding using code swapping |
US5884269A (en) * | 1995-04-17 | 1999-03-16 | Merging Technologies | Lossless compression/decompression of digital audio data |
US5864711A (en) | 1995-07-05 | 1999-01-26 | Microsoft Corporation | System for determining more accurate translation between first and second translator, and providing translated data to second computer if first translator is more accurate |
US5825830A (en) | 1995-08-17 | 1998-10-20 | Kopf; David A. | Method and apparatus for the compression of audio, video or other data |
US5784175A (en) | 1995-10-05 | 1998-07-21 | Microsoft Corporation | Pixel block correlation process |
US5819215A (en) | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
US5889891A (en) * | 1995-11-21 | 1999-03-30 | Regents Of The University Of California | Universal codebook vector quantization with constrained storage |
JP3283413B2 (ja) | 1995-11-30 | 2002-05-20 | 株式会社日立製作所 | 符号化復号方法、符号化装置および復号装置 |
JPH09162748A (ja) * | 1995-12-01 | 1997-06-20 | Fujitsu Ltd | データ符号化方法、データ復号方法、データ圧縮装置、データ復元装置、及びデータ圧縮・復元システム |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5831559A (en) | 1996-01-24 | 1998-11-03 | Intel Corporation | Encoding/decoding video signals using multiple run-val mapping tables |
US6957350B1 (en) * | 1996-01-30 | 2005-10-18 | Dolby Laboratories Licensing Corporation | Encrypted and watermarked temporal and resolution layering in advanced television |
US5682152A (en) * | 1996-03-19 | 1997-10-28 | Johnson-Grace Company | Data compression using adaptive bit allocation and hybrid lossless entropy encoding |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
US6215910B1 (en) * | 1996-03-28 | 2001-04-10 | Microsoft Corporation | Table-based compression with embedded coding |
US5850482A (en) | 1996-04-17 | 1998-12-15 | Mcdonnell Douglas Corporation | Error resilient method and apparatus for entropy coding |
ES2170745T3 (es) | 1996-05-28 | 2002-08-16 | Matsushita Electric Ind Co Ltd | Dispositivo de prediccion y de decodificado de imagen. |
EP0855106A1 (en) | 1996-06-28 | 1998-07-29 | Koninklijke Philips Electronics N.V. | High performance variable length decoder with two-word bit stream segmentation and related method |
DE19628292B4 (de) * | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
JP3318825B2 (ja) * | 1996-08-20 | 2002-08-26 | ソニー株式会社 | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 |
US5828426A (en) | 1996-08-20 | 1998-10-27 | Samsung Electronics Co., Ltd. | Apparatus for decoding variable length coded data of both MPEG-1 and MPEG-2 standards |
US6233017B1 (en) | 1996-09-16 | 2001-05-15 | Microsoft Corporation | Multimedia compression system with adaptive block sizes |
US5748789A (en) * | 1996-10-31 | 1998-05-05 | Microsoft Corporation | Transparent block skipping in object-based video coding systems |
KR100318055B1 (ko) * | 1996-11-06 | 2001-12-24 | 모리시타 요이찌 | 화상 복호화 방법 |
ATE371298T1 (de) | 1996-11-07 | 2007-09-15 | Koninkl Philips Electronics Nv | Übertragung eines bitstromsignals |
KR100518640B1 (ko) * | 1996-11-11 | 2005-12-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 라이스인코더/디코더를사용한데이터압축/복원장치및방법 |
JP3484310B2 (ja) | 1997-01-17 | 2004-01-06 | 松下電器産業株式会社 | 可変長符号器 |
NL1005084C2 (nl) * | 1997-01-24 | 1998-07-27 | Oce Tech Bv | Werkwijze voor het uitvoeren van een beeldbewerkingsoperatie op looplengte gecodeerde bitmaps. |
US6038536A (en) * | 1997-01-31 | 2000-03-14 | Texas Instruments Incorporated | Data compression using bit change statistics |
US6272175B1 (en) * | 1997-02-13 | 2001-08-07 | Conexant Systems, Inc. | Video signal coding systems and processes using adaptive quantization |
US5974184A (en) | 1997-03-07 | 1999-10-26 | General Instrument Corporation | Intra-macroblock DC and AC coefficient prediction for interlaced digital video |
US6005980A (en) * | 1997-03-07 | 1999-12-21 | General Instrument Corporation | Motion estimation and compensation of video object planes for interlaced digital video |
FI114248B (fi) | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
US6728775B1 (en) * | 1997-03-17 | 2004-04-27 | Microsoft Corporation | Multiple multicasting of multimedia streams |
US6404813B1 (en) * | 1997-03-27 | 2002-06-11 | At&T Corp. | Bidirectionally predicted pictures or video object planes for efficient and flexible video coding |
US5883633A (en) | 1997-04-15 | 1999-03-16 | Microsoft Corporation | Method and system of variable run length image encoding using sub-palette |
US6259810B1 (en) * | 1997-04-15 | 2001-07-10 | Microsoft Corporation | Method and system of decoding compressed image data |
US6580834B2 (en) * | 1997-05-30 | 2003-06-17 | Competitive Technologies Of Pa, Inc. | Method and apparatus for encoding and decoding signals |
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
US6421738B1 (en) | 1997-07-15 | 2002-07-16 | Microsoft Corporation | Method and system for capturing and encoding full-screen video graphics |
JP3884172B2 (ja) | 1997-10-02 | 2007-02-21 | 株式会社東芝 | 可変長復号化装置および復号化方法 |
US6493385B1 (en) | 1997-10-23 | 2002-12-10 | Mitsubishi Denki Kabushiki Kaisha | Image encoding method, image encoder, image decoding method, and image decoder |
JPH11161782A (ja) * | 1997-11-27 | 1999-06-18 | Seiko Epson Corp | カラー画像の符号化方法およびその符号化装置ならびにカラー画像の復号化方法およびその復号化装置 |
US6111914A (en) * | 1997-12-01 | 2000-08-29 | Conexant Systems, Inc. | Adaptive entropy coding in adaptive quantization framework for video signal coding systems and processes |
US5946043A (en) * | 1997-12-31 | 1999-08-31 | Microsoft Corporation | Video coding using adaptive coding of block parameters for coded/uncoded blocks |
US6226407B1 (en) * | 1998-03-18 | 2001-05-01 | Microsoft Corporation | Method and apparatus for analyzing computer screens |
US6054943A (en) * | 1998-03-25 | 2000-04-25 | Lawrence; John Clifton | Multilevel digital information compression based on lawrence algorithm |
US7263127B1 (en) * | 1998-04-02 | 2007-08-28 | Intel Corporation | Method and apparatus for simplifying frame-based motion estimation |
JP2002518916A (ja) * | 1998-06-19 | 2002-06-25 | イクエーター テクノロジーズ インコーポレイテッド | 第1の解像度を有する符号化された形式の画像を第2の解像度を有するデコードされた形式の画像に直接にデコードする回路及び方法 |
JP3413720B2 (ja) * | 1998-06-26 | 2003-06-09 | ソニー株式会社 | 画像符号化方法及び装置、並びに画像復号方法及び装置 |
US6253165B1 (en) * | 1998-06-30 | 2001-06-26 | Microsoft Corporation | System and method for modeling probability distribution functions of transform coefficients of encoded signal |
DE19840835C2 (de) * | 1998-09-07 | 2003-01-09 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern |
US6420980B1 (en) * | 1998-10-06 | 2002-07-16 | Matsushita Electric Industrial Co., Ltd. | Lossless compression encoding method and device, and lossless compression decoding method and device |
US6223162B1 (en) * | 1998-12-14 | 2001-04-24 | Microsoft Corporation | Multi-level run length coding for frequency-domain audio coding |
US6404931B1 (en) * | 1998-12-14 | 2002-06-11 | Microsoft Corporation | Code book construction for variable to variable length entropy encoding |
US6300888B1 (en) * | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
US6377930B1 (en) | 1998-12-14 | 2002-04-23 | Microsoft Corporation | Variable to variable length entropy encoding |
US6100825A (en) * | 1998-12-31 | 2000-08-08 | Microsoft Corporation | Cluster-based data compression system and method |
US6678419B1 (en) * | 1999-03-26 | 2004-01-13 | Microsoft Corporation | Reordering wavelet coefficients for improved encoding |
US6477280B1 (en) | 1999-03-26 | 2002-11-05 | Microsoft Corporation | Lossless adaptive encoding of finite alphabet data |
US6573915B1 (en) * | 1999-12-08 | 2003-06-03 | International Business Machines Corporation | Efficient capture of computer screens |
US6567781B1 (en) * | 1999-12-30 | 2003-05-20 | Quikcat.Com, Inc. | Method and apparatus for compressing audio data using a dynamical system having a multi-state dynamical rule set and associated transform basis function |
JP2001236088A (ja) * | 2000-02-22 | 2001-08-31 | Mitsubishi Electric Corp | 統計的言語モデル作成装置、統計的言語モデル作成方法及び統計的言語モデル作成プログラムが記述された記録媒体 |
JP3573735B2 (ja) * | 2000-05-23 | 2004-10-06 | 松下電器産業株式会社 | 可変長符号化方法および可変長符号化装置 |
US6542863B1 (en) * | 2000-06-14 | 2003-04-01 | Intervideo, Inc. | Fast codebook search method for MPEG audio encoding |
JP4508490B2 (ja) * | 2000-09-11 | 2010-07-21 | パナソニック株式会社 | 符号化装置および復号化装置 |
US6961685B2 (en) * | 2000-09-19 | 2005-11-01 | Sy Bon K | Probability model selection using information-theoretic optimization criterion |
US6735339B1 (en) | 2000-10-27 | 2004-05-11 | Dolby Laboratories Licensing Corporation | Multi-stage encoding of signal components that are classified according to component value |
US6650784B2 (en) | 2001-07-02 | 2003-11-18 | Qualcomm, Incorporated | Lossless intraframe encoding using Golomb-Rice |
US6587057B2 (en) * | 2001-07-25 | 2003-07-01 | Quicksilver Technology, Inc. | High performance memory efficient variable-length coding decoder |
US20030033143A1 (en) * | 2001-08-13 | 2003-02-13 | Hagai Aronowitz | Decreasing noise sensitivity in speech processing under adverse conditions |
US6825847B1 (en) | 2001-11-30 | 2004-11-30 | Nvidia Corporation | System and method for real-time compression of pixel colors |
US7165028B2 (en) * | 2001-12-12 | 2007-01-16 | Texas Instruments Incorporated | Method of speech recognition resistant to convolutive distortion and additive distortion |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
CN101448162B (zh) * | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
US7139703B2 (en) | 2002-04-05 | 2006-11-21 | Microsoft Corporation | Method of iterative noise estimation in a recursive framework |
US6653955B1 (en) | 2002-05-09 | 2003-11-25 | Lsi Logic Corporation | Multi-symbol variable length code decoder |
GB2388502A (en) | 2002-05-10 | 2003-11-12 | Chris Dunn | Compression of frequency domain audio signals |
US7016547B1 (en) * | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7424434B2 (en) * | 2002-09-04 | 2008-09-09 | Microsoft Corporation | Unified lossy and lossless audio compression |
DE20321883U1 (de) * | 2002-09-04 | 2012-01-20 | Microsoft Corp. | Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7328150B2 (en) * | 2002-09-04 | 2008-02-05 | Microsoft Corporation | Innovations in pure lossless audio compression |
JP4728568B2 (ja) * | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
US6795584B2 (en) | 2002-10-03 | 2004-09-21 | Nokia Corporation | Context-based adaptive variable length coding for adaptive block transforms |
US20040136457A1 (en) * | 2002-10-23 | 2004-07-15 | John Funnell | Method and system for supercompression of compressed digital video |
US6646578B1 (en) | 2002-11-22 | 2003-11-11 | Ub Video Inc. | Context adaptive variable length decoding system and method |
US7324927B2 (en) * | 2003-07-03 | 2008-01-29 | Robert Bosch Gmbh | Fast feature selection method and system for maximum entropy modeling |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
-
2005
- 2005-07-15 US US11/183,266 patent/US7599840B2/en active Active
-
2006
- 2006-07-14 JP JP2008521610A patent/JP5085543B2/ja active Active
- 2006-07-14 AT AT06787173T patent/ATE536001T1/de active
- 2006-07-14 CN CN2006800258106A patent/CN101223573B/zh active Active
- 2006-07-14 MX MX2008000524A patent/MX2008000524A/es active IP Right Grant
- 2006-07-14 CA CA2612537A patent/CA2612537C/en active Active
- 2006-07-14 KR KR1020087000635A patent/KR101278805B1/ko active IP Right Grant
- 2006-07-14 WO PCT/US2006/027231 patent/WO2007011653A2/en active Application Filing
- 2006-07-14 EP EP06787173A patent/EP1905000B1/en active Active
- 2006-07-14 AU AU2006270259A patent/AU2006270259B2/en active Active
- 2006-07-14 ES ES06787173T patent/ES2378393T3/es active Active
-
2007
- 2007-12-05 NO NO20076261A patent/NO341186B1/no unknown
Also Published As
Publication number | Publication date |
---|---|
AU2006270259B2 (en) | 2011-03-03 |
MX2008000524A (es) | 2008-03-06 |
CA2612537C (en) | 2014-09-09 |
CA2612537A1 (en) | 2007-01-25 |
CN101223573A (zh) | 2008-07-16 |
AU2006270259A1 (en) | 2007-01-25 |
KR20080025399A (ko) | 2008-03-20 |
WO2007011653A2 (en) | 2007-01-25 |
EP1905000A4 (en) | 2009-08-26 |
EP1905000A2 (en) | 2008-04-02 |
ES2378393T3 (es) | 2012-04-12 |
KR101278805B1 (ko) | 2013-06-25 |
EP1905000B1 (en) | 2011-11-30 |
US7599840B2 (en) | 2009-10-06 |
US20070016418A1 (en) | 2007-01-18 |
WO2007011653A3 (en) | 2007-06-07 |
CN101223573B (zh) | 2011-07-27 |
NO341186B1 (no) | 2017-09-04 |
NO20076261L (no) | 2008-02-06 |
ATE536001T1 (de) | 2011-12-15 |
JP2009501943A (ja) | 2009-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5085543B2 (ja) | 適応コーディングおよびデコーディングでの複数のエントロピモデルの選択的使用 | |
US7693709B2 (en) | Reordering coefficients for waveform coding or decoding | |
US7684981B2 (en) | Prediction of spectral coefficients in waveform coding and decoding | |
US7761290B2 (en) | Flexible frequency and time partitioning in perceptual transform coding of audio | |
US7383180B2 (en) | Constant bitrate media encoding techniques | |
KR101343267B1 (ko) | 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치 | |
US7539612B2 (en) | Coding and decoding scale factor information | |
US7433824B2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
KR101330362B1 (ko) | 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스 | |
EP1396843B1 (en) | Mixed lossless audio compression | |
US7822601B2 (en) | Adaptive vector Huffman coding and decoding based on a sum of values of audio data symbols | |
KR101130355B1 (ko) | 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩 | |
US7774205B2 (en) | Coding of sparse digital media spectral data | |
RU2740690C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
JP5400143B2 (ja) | オーバーラッピング変換の2つのブロック変換への因数分解 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120831 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5085543 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |