JP2006502604A - 任意形状オブジェクトの画像圧縮方法 - Google Patents
任意形状オブジェクトの画像圧縮方法 Download PDFInfo
- Publication number
- JP2006502604A JP2006502604A JP2003559158A JP2003559158A JP2006502604A JP 2006502604 A JP2006502604 A JP 2006502604A JP 2003559158 A JP2003559158 A JP 2003559158A JP 2003559158 A JP2003559158 A JP 2003559158A JP 2006502604 A JP2006502604 A JP 2006502604A
- Authority
- JP
- Japan
- Prior art keywords
- block
- coefficient
- pixel
- zero
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000007906 compression Methods 0.000 title claims description 33
- 230000006835 compression Effects 0.000 title claims description 30
- 230000003595 spectral effect Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 description 23
- 230000008569 process Effects 0.000 description 23
- 238000013139 quantization Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000013144 data compression Methods 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/649—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】 改良されたソース画像を圧縮する方法および装置を提供する。
【解決手段】 圧縮するピクセルブロックのスペクトルの内容を操作する方法は、選択されたピクセルブロック(110)内の各ピクセルを関係ピクセル(114)または無関係ピクセル(112)として分類するステップ(620)を含む。この選択されたブロックに、フォワード変換が適用されて(720)、係数ブロックが生成される。1組の所定の制約条件に従って、係数値が変更され(754)、変更された係数ブロックが生成される。この1組の所定の制約条件は、関係ピクセルが、変更された係数ブロックを逆変換したものにおいて、選択されたブロックにおける値と同じ値を有するという制約条件を含む。逆のジグザグの係数の順序で進んで(740)、この方法は、非ゼロの量子化値を有する他の係数に対して繰り返される。
【解決手段】 圧縮するピクセルブロックのスペクトルの内容を操作する方法は、選択されたピクセルブロック(110)内の各ピクセルを関係ピクセル(114)または無関係ピクセル(112)として分類するステップ(620)を含む。この選択されたブロックに、フォワード変換が適用されて(720)、係数ブロックが生成される。1組の所定の制約条件に従って、係数値が変更され(754)、変更された係数ブロックが生成される。この1組の所定の制約条件は、関係ピクセルが、変更された係数ブロックを逆変換したものにおいて、選択されたブロックにおける値と同じ値を有するという制約条件を含む。逆のジグザグの係数の順序で進んで(740)、この方法は、非ゼロの量子化値を有する他の係数に対して繰り返される。
Description
[発明の分野]
この発明は、データ圧縮の分野に関する。
特に、この発明は、レートを最適化するデータ圧縮に向けられている。
この発明は、データ圧縮の分野に関する。
特に、この発明は、レートを最適化するデータ圧縮に向けられている。
[発明の背景]
連続階調画像とは、実質的に無制限の範囲の色またはグレーの濃淡を有する画像を指す。
例えば、写真は、連続階調画像である。
しかしながら、デジタルハードウェアは、有限のビット数、さらには単一のビット(すなわち「オン」または「オフ」)内で色または階調を表現することに制限される。
通常、連続階調画像は、画像要素(ピクセル)の配列に分解される。
各画素は、有限個の色または濃淡を表現することができる。
グレースケール化およびディザリングは、デジタルハードウェアの制限内で連続階調画像に近づけるために使用される2つのプロセスである。
画像をデジタル表現することにより、その画像の再現、記憶、変更、および分配が簡単になる。
連続階調画像とは、実質的に無制限の範囲の色またはグレーの濃淡を有する画像を指す。
例えば、写真は、連続階調画像である。
しかしながら、デジタルハードウェアは、有限のビット数、さらには単一のビット(すなわち「オン」または「オフ」)内で色または階調を表現することに制限される。
通常、連続階調画像は、画像要素(ピクセル)の配列に分解される。
各画素は、有限個の色または濃淡を表現することができる。
グレースケール化およびディザリングは、デジタルハードウェアの制限内で連続階調画像に近づけるために使用される2つのプロセスである。
画像をデジタル表現することにより、その画像の再現、記憶、変更、および分配が簡単になる。
連続階調画像が、デジタル形式に離散化されると、そのデジタル形式を圧縮を通じてさらに処理し、記憶必要量を削減することができる。
圧縮は、デジタル化されたソース画像と復元画像との間の相違が視覚的に知覚できないように、または、視覚的に許容できるものとなるように情報を除去する。
圧縮は、デジタル化されたソース画像と復元画像との間の相違が視覚的に知覚できないように、または、視覚的に許容できるものとなるように情報を除去する。
画像圧縮手法の中には、スペクトルの内容を直接操作することを伴うものがある。
他のファクタを考慮せずにスペクトルエネルギーを削減すると、スペクトルの内容を操作する圧縮プロセスに存在する量子化やエントロピー符号化などのレートに影響を与える要素が原因となって、最適な記憶結果は達成されないことが多い。
他のファクタを考慮せずにスペクトルエネルギーを削減すると、スペクトルの内容を操作する圧縮プロセスに存在する量子化やエントロピー符号化などのレートに影響を与える要素が原因となって、最適な記憶結果は達成されないことが多い。
[発明の概要]
既知のシステムおよび方法の限界に鑑み、ソース画像を圧縮する方法および装置が提供される。
既知のシステムおよび方法の限界に鑑み、ソース画像を圧縮する方法および装置が提供される。
圧縮するピクセルブロックのスペクトルの内容を操作する方法は、選択されたピクセルブロック内の各ピクセルを関係ピクセルまたは無関係ピクセルとして分類するステップを含む。
この選択されたブロックに、フォワード変換が適用されて、係数ブロックが生成される。
1組の所定の制約条件に従って、係数値が変更され、変更された係数ブロックが生成される。
この1組の所定の制約条件は、関係ピクセルが、変更された係数ブロックを逆変換したものにおいて、選択されたブロックにおける値と同じ値を有するという制約条件を含む。
この選択されたブロックに、フォワード変換が適用されて、係数ブロックが生成される。
1組の所定の制約条件に従って、係数値が変更され、変更された係数ブロックが生成される。
この1組の所定の制約条件は、関係ピクセルが、変更された係数ブロックを逆変換したものにおいて、選択されたブロックにおける値と同じ値を有するという制約条件を含む。
圧縮するピクセルブロックのスペクトルの内容を操作する別の方法は、ソース画像からソースピクセルブロックを提供するステップを含む。
これらのピクセルは、変更可能ピクセルまたは変更不能ピクセルのいずれかとして分類される。
選択されたブロックに対してフォワード変換が実行され、係数ブロックが生成される。
この係数ブロックは量子化される。
少なくとも1つの係数は、その後、複数の制約条件に従って変更され、対応するゼロの量子化係数が生成される。
特に、この係数は、選択されたブロック内の変更不能ピクセルに対応する、逆変換したもののピクセル値を変えることなく変更される。
これらのピクセルは、変更可能ピクセルまたは変更不能ピクセルのいずれかとして分類される。
選択されたブロックに対してフォワード変換が実行され、係数ブロックが生成される。
この係数ブロックは量子化される。
少なくとも1つの係数は、その後、複数の制約条件に従って変更され、対応するゼロの量子化係数が生成される。
特に、この係数は、選択されたブロック内の変更不能ピクセルに対応する、逆変換したもののピクセル値を変えることなく変更される。
本発明の他の特徴および利点は、添付図面および以下の詳細な説明から明らかになる。
本発明は、添付図面の図に、限定ではなく例として図示される。
これらの図において、同じ参照符号は、同様の要素を示す。
これらの図において、同じ参照符号は、同様の要素を示す。
[詳細な説明]
画像処理の用途においては、ブロック圧縮アルゴリズムが普及している。
画像の形状を問わず、画像データは、ブロック圧縮アルゴリズムにより、ブロックで取り込まれて処理される。
一部のブロックは、その全体がソース画像の部分を表すピクセルから成ることがある。
他のブロックは、ブロックの形状が画像の形状と一致しないことの結果として、ソース画像の部分を表すピクセルと、ソース画像に関連しないピクセルとを含むことがある。
さらに他のブロックは、その全体がソース画像に全く関連しないピクセルから成ることがある。
画像処理の用途においては、ブロック圧縮アルゴリズムが普及している。
画像の形状を問わず、画像データは、ブロック圧縮アルゴリズムにより、ブロックで取り込まれて処理される。
一部のブロックは、その全体がソース画像の部分を表すピクセルから成ることがある。
他のブロックは、ブロックの形状が画像の形状と一致しないことの結果として、ソース画像の部分を表すピクセルと、ソース画像に関連しないピクセルとを含むことがある。
さらに他のブロックは、その全体がソース画像に全く関連しないピクセルから成ることがある。
図1は、任意形状のオブジェクト102を含んだサンプルの離散化ソース画像から選択された8×8ピクセルブロック110を示している。
この任意形状のオブジェクトに対応する選択されたブロックの部分は、陰影付きピクセルによって示されている。
一実施の形態では、最大256個の異なる色またはグレーレベル(すなわち0〜255)を実現できるように、各ピクセルは、関連した8ビット値を有する。
この任意形状のオブジェクトに対応する選択されたブロックの部分は、陰影付きピクセルによって示されている。
一実施の形態では、最大256個の異なる色またはグレーレベル(すなわち0〜255)を実現できるように、各ピクセルは、関連した8ビット値を有する。
この選択されたブロックは、符号化可能平面に分解される。
選択されたブロック110がグレーレベルの場合、ブロック120およびマスク130に分解することができる。
代替的な実施の形態では、ソース画像ブロックは、複数の平面および関連したマスクに分解することができる。
これらのそれぞれは、画像の異なる色平面に関連付けられている。
選択されたブロック110がグレーレベルの場合、ブロック120およびマスク130に分解することができる。
代替的な実施の形態では、ソース画像ブロックは、複数の平面および関連したマスクに分解することができる。
これらのそれぞれは、画像の異なる色平面に関連付けられている。
ブロック120は、ソースブロック110そのものである。
マスク130は、ブロック120の特定のピクセルが、任意形状のオブジェクトの一部(例えばピクセル144)を形成するのか、それとも背景(例えばピクセル112)を形成するのかを示す複数の「1」および「0」からなる。
マスクは、保存されるべきブロック120のピクセルを効果的に特定し、任意形状のオブジェクトをその背景から弁別することを可能にする。
したがって、マスクは、本質的には、対象となっている任意形状のオブジェクトに関して、選択されたブロックのピクセルを「関係」ピクセルまたは「無関係」ピクセルとして特定するものである。
マスク130は、ブロック120の特定のピクセルが、任意形状のオブジェクトの一部(例えばピクセル144)を形成するのか、それとも背景(例えばピクセル112)を形成するのかを示す複数の「1」および「0」からなる。
マスクは、保存されるべきブロック120のピクセルを効果的に特定し、任意形状のオブジェクトをその背景から弁別することを可能にする。
したがって、マスクは、本質的には、対象となっている任意形状のオブジェクトに関して、選択されたブロックのピクセルを「関係」ピクセルまたは「無関係」ピクセルとして特定するものである。
ブロック圧縮アルゴリズムは、ブロック120に対して適用される。
通常、マスクは、圧縮データと共に記憶されて、圧縮データからソース画像を復元することを助ける。
ソースブロックが、圧縮データから復元される際に、マスクは、関係ピクセルを特定するために使用される。
達成可能な圧縮量は、ソースブロックの許容可能な情報損失量と、選択された圧縮アルゴリズムと、ブロック内の画像の特徴との関数となる。
ピクセル値の特定の組み合わせおよび配置が、圧縮量に影響を及ぼすことを認識すると、データ圧縮の一方法は、無関係ピクセルの値を効果的に変更して、より大きな圧縮を達成するものとなる。
通常、マスクは、圧縮データと共に記憶されて、圧縮データからソース画像を復元することを助ける。
ソースブロックが、圧縮データから復元される際に、マスクは、関係ピクセルを特定するために使用される。
達成可能な圧縮量は、ソースブロックの許容可能な情報損失量と、選択された圧縮アルゴリズムと、ブロック内の画像の特徴との関数となる。
ピクセル値の特定の組み合わせおよび配置が、圧縮量に影響を及ぼすことを認識すると、データ圧縮の一方法は、無関係ピクセルの値を効果的に変更して、より大きな圧縮を達成するものとなる。
ブロック120は、マスク130に基づいて「ドントケア」ピクセルまたは「無関係」ピクセルの位置を強調するために「×」が使用されたブロック140として描き直される。
「×」のマークを付けられたピクセルの値は、いずれにしてもマスク130で除外されないことになるので、重要ではない。
これらの「ドントケア」ピクセルの値は、任意形状のオブジェクトの復元には無関係であるが、それらのピクセルの値は、ブロック120の圧縮レートに影響することがある。
したがって、より大きな圧縮効率を達成するために、これらの「ドントケア」ピクセルの値を変えるように符号化技法を変更することができる。
この手法は、再生品質に影響せず、復号アルゴリズムの変更を必要としない。
「×」のマークを付けられたピクセルの値は、いずれにしてもマスク130で除外されないことになるので、重要ではない。
これらの「ドントケア」ピクセルの値は、任意形状のオブジェクトの復元には無関係であるが、それらのピクセルの値は、ブロック120の圧縮レートに影響することがある。
したがって、より大きな圧縮効率を達成するために、これらの「ドントケア」ピクセルの値を変えるように符号化技法を変更することができる。
この手法は、再生品質に影響せず、復号アルゴリズムの変更を必要としない。
いくつかのピクセルが、ソース画像の復元に無関係であることから変更可能であるとみなすことができる多くの状況が存在する。
多くの場合、元のソース画像は、複数の平面に分解されて圧縮される。
例えば、画像を個々の色平面に分解して処理することができる。
画像を前景平面/背景平面に分解することができ、これらの平面は、ソース画像の復元中にどの平面からピクセルを供給すべきかを指定するマスクと共に使用される。
例えば、背景の前面にある任意形状のオブジェクトは、背景ではなく任意形状のオブジェクトの一部を形成するピクセルを特定するマスクの使用を通じて、背景から弁別することができる。
このようなマスクは、背景自体が対象となっていない場合に有益である。
この場合、マスクは、本質的に、関係ピクセルおよび無関係ピクセルを特定し、したがって、変更可能なピクセルを示す。
多くの場合、元のソース画像は、複数の平面に分解されて圧縮される。
例えば、画像を個々の色平面に分解して処理することができる。
画像を前景平面/背景平面に分解することができ、これらの平面は、ソース画像の復元中にどの平面からピクセルを供給すべきかを指定するマスクと共に使用される。
例えば、背景の前面にある任意形状のオブジェクトは、背景ではなく任意形状のオブジェクトの一部を形成するピクセルを特定するマスクの使用を通じて、背景から弁別することができる。
このようなマスクは、背景自体が対象となっていない場合に有益である。
この場合、マスクは、本質的に、関係ピクセルおよび無関係ピクセルを特定し、したがって、変更可能なピクセルを示す。
図2は、空間領域においてオペレーションを行うことができる場合のデータ圧縮の一方法を示している。
ステップ210において、複数のピクセルからなるソースブロックが、ソース画像から選択される。
ステップ220において、これらの複数のピクセルが、少なくとも2つのクラスに分類される。
第1のクラスのピクセルは、無関係または変更可能と指定される。
第2のクラスは、関係または変更不能と指定される。
例えば、任意形状のオブジェクトに関連したピクセルは、変更不能と指定される。
背景に関連したピクセル、またはそれ以外に、対象となっているオブジェクトに関連しないピクセルは、変更可能と指定される。
図1を参照して、マスク130は、本質的に、ソースブロックにおけるそれぞれの対応するピクセルが属するクラス(例えば、1=変更不能、0=変更可能)を決定する。
ステップ210において、複数のピクセルからなるソースブロックが、ソース画像から選択される。
ステップ220において、これらの複数のピクセルが、少なくとも2つのクラスに分類される。
第1のクラスのピクセルは、無関係または変更可能と指定される。
第2のクラスは、関係または変更不能と指定される。
例えば、任意形状のオブジェクトに関連したピクセルは、変更不能と指定される。
背景に関連したピクセル、またはそれ以外に、対象となっているオブジェクトに関連しないピクセルは、変更可能と指定される。
図1を参照して、マスク130は、本質的に、ソースブロックにおけるそれぞれの対応するピクセルが属するクラス(例えば、1=変更不能、0=変更可能)を決定する。
ソース画像データのデジタル表現を圧縮する一技法は、空間領域の画像データを周波数領域のデータに変換するステップを含む。
空間領域から周波数領域への変換は、フォワード変換とも呼ばれる。
空間領域から周波数領域への変換は、フォワード変換とも呼ばれる。
フォワード変換は、ソース画像の調和分析に類似している。
フォワード変換を使用すると、空間画像データは、基底関数の線形結合として表される。
これらの基底関数の係数は、変換プロセス中に求められる。
フォワード変換を使用すると、空間画像データは、基底関数の線形結合として表される。
これらの基底関数の係数は、変換プロセス中に求められる。
次いで、これらの基底係数は、量子化または閾値処理を受けて、対応する基底関数からの寄与が除去され、あるレベルの圧縮が達成される。
次いで、残りの係数は、並べ替えられるかまたは連長符号化され、そうでない場合には画像データのさらなる圧縮を容易にするように処理される。
次いで、その結果生成された圧縮画像データは、記憶、分配、またはさらなる処理のために利用可能とされる。
これは、ジョイントフォトグラフィックエキスパートグループ(JPEG)によって公表された基本的技法である。
次いで、残りの係数は、並べ替えられるかまたは連長符号化され、そうでない場合には画像データのさらなる圧縮を容易にするように処理される。
次いで、その結果生成された圧縮画像データは、記憶、分配、またはさらなる処理のために利用可能とされる。
これは、ジョイントフォトグラフィックエキスパートグループ(JPEG)によって公表された基本的技法である。
通常、ゼロの値の量子化係数の個数が多くなるほど、圧縮レートは大きくなる。
したがって、ステップ230において、変更可能ピクセルの値を変更して、非ゼロの量子化係数の個数を減少させることができる。
変更可能ピクセルは、変更されたブロックを量子化フォワード変換したものが、選択されたブロックを量子化フォワード変換したものよりも多くの個数のゼロの値を有するように変更される。
「レート」が圧縮画像の記憶必要量を指す場合に、このオペレーションは、圧縮画像の「レート」を削減する。
したがって、このオペレーションは、画像エンコーダの圧縮効率またはレート効率を増大させる。
したがって、ステップ230において、変更可能ピクセルの値を変更して、非ゼロの量子化係数の個数を減少させることができる。
変更可能ピクセルは、変更されたブロックを量子化フォワード変換したものが、選択されたブロックを量子化フォワード変換したものよりも多くの個数のゼロの値を有するように変更される。
「レート」が圧縮画像の記憶必要量を指す場合に、このオペレーションは、圧縮画像の「レート」を削減する。
したがって、このオペレーションは、画像エンコーダの圧縮効率またはレート効率を増大させる。
ピクセルを変更する方法は、圧縮アルゴリズムの仕様に依存する。
ジョイントフォトグラフィックエキスパートグループおよびモーションピクチャエキスパートグループ(MPEG)は、それぞれ、スペクトルの内容を操作してデータ圧縮を行う、よく知られている奨励された画像圧縮/符号化アーキテクチャを有する。
JPEG圧縮は、ファクシミリの用途や標準的な印刷の用途で生じる画像など、静的な画像に多く使用される。
MPEGフォーマットは、動的な画像または映画に使用される。
基本的なプロセスは、JPEGによって公表されており、今日、広範囲で使用されている。
JPEGは、離散コサイン変換(DCT)を利用するが、フォワード変換、量子化、およびエントロピー符号化ブロックの具体的な実施は、実施者に任せられている。
ジョイントフォトグラフィックエキスパートグループおよびモーションピクチャエキスパートグループ(MPEG)は、それぞれ、スペクトルの内容を操作してデータ圧縮を行う、よく知られている奨励された画像圧縮/符号化アーキテクチャを有する。
JPEG圧縮は、ファクシミリの用途や標準的な印刷の用途で生じる画像など、静的な画像に多く使用される。
MPEGフォーマットは、動的な画像または映画に使用される。
基本的なプロセスは、JPEGによって公表されており、今日、広範囲で使用されている。
JPEGは、離散コサイン変換(DCT)を利用するが、フォワード変換、量子化、およびエントロピー符号化ブロックの具体的な実施は、実施者に任せられている。
図3は、画像を圧縮するブロックベースのプロセスの一実施の形態をより詳細に示している。
画像エンコーダ320は、離散化されたソース画像310を処理して、圧縮画像データ390を生成する。
画像エンコーダ320は、離散化されたソース画像310を処理して、圧縮画像データ390を生成する。
エンコーダ320は、複数の8×8ソースブロックとしてソース画像310を処理する。
フォワード変換は、各8×8ソースブロックに対して実行される。
各8×8ソースブロックは、xおよびyの2次元空間関数である64点離散信号である。
DCTは、信号を基底関数の線形結合として表すのに使用できる多くの変換の1つである。
DCTが、JPEG圧縮用に選択された変換であるが、フーリエ変換や離散サイン変換(DST)などの他の線形フォワード変換を使用することもできる。
フォワード変換は、各8×8ソースブロックに対して実行される。
各8×8ソースブロックは、xおよびyの2次元空間関数である64点離散信号である。
DCTは、信号を基底関数の線形結合として表すのに使用できる多くの変換の1つである。
DCTが、JPEG圧縮用に選択された変換であるが、フーリエ変換や離散サイン変換(DST)などの他の線形フォワード変換を使用することもできる。
フォワードDCTは、64点離散信号を64個の直交基底信号に変換する調和分析器である。
各直交基底信号は、8×8ソースブロックのスペクトルを形成する2次元空間周波数を表す。
フォワードDCTの出力は、これらの直交基底信号のそれぞれの振幅を特定する係数ブロックである。
これらの振幅は、DCT係数と呼ばれ、その値は、離散的な64点入力信号によって決定される。
各直交基底信号は、8×8ソースブロックのスペクトルを形成する2次元空間周波数を表す。
フォワードDCTの出力は、これらの直交基底信号のそれぞれの振幅を特定する係数ブロックである。
これらの振幅は、DCT係数と呼ばれ、その値は、離散的な64点入力信号によって決定される。
ソース画像は、離散値s(x,y)の2次元配列としてサンプリングされる。
2次元フォワード変換を実行すると、s(x,y)を基底関数の線形結合として表現できるように、基底係数c(u,v)を計算することを伴う。
一実施の形態(DCT)では、フォワード変換は、以下のようにc(u,v)を計算することを含む。
2次元フォワード変換を実行すると、s(x,y)を基底関数の線形結合として表現できるように、基底係数c(u,v)を計算することを伴う。
一実施の形態(DCT)では、フォワード変換は、以下のようにc(u,v)を計算することを含む。
DCTの一実施の形態では、係数c(u,v)は、次のように計算される。
2次元DCT変換は、画像を集合的に構成する1組の基底関数の係数を特定することを含む。
図3を再び参照して、量子化器340は、量子化テーブル342に従ってDCT係数を量子化する。
量子化テーブル342によって特定されるように、さまざまな量子をさまざまな空間周波数と共に使用することができる。
量子化されたc(u,v)は、次のように計算することができる。
量子化テーブル342によって特定されるように、さまざまな量子をさまざまな空間周波数と共に使用することができる。
量子化されたc(u,v)は、次のように計算することができる。
上記方程式において、「INT」は、結果が整数となることを確保するための整数関数である。
量子化テーブルは、異なる基底関数に対して異なるステップサイズを許容している。
したがって、量子化テーブルは、64要素テーブルであり、各空間周波数に対して1つの要素が対応する。
一般に、周波数の高い基底関数のステップサイズは、周波数の低い基底関数のステップサイズよりも大きい。
ステップサイズは、通常、対応するコサイン基底関数の視覚的寄与の知覚閾値で選ばれる。
知覚閾値は、ソース画像の特性、表示特性、観察距離などの関数である。
したがって、量子化テーブルの選択は、用途に依存し得る。
したがって、量子化テーブルは、64要素テーブルであり、各空間周波数に対して1つの要素が対応する。
一般に、周波数の高い基底関数のステップサイズは、周波数の低い基底関数のステップサイズよりも大きい。
ステップサイズは、通常、対応するコサイン基底関数の視覚的寄与の知覚閾値で選ばれる。
知覚閾値は、ソース画像の特性、表示特性、観察距離などの関数である。
したがって、量子化テーブルの選択は、用途に依存し得る。
量子化の後、エントロピー符号化が使用されて、量子化係数が効率的に表現される。
エントロピーエンコーダ350は、エントロピー符号化テーブル352を使用して、圧縮画像データ390を生成する。
エントロピーエンコーダ350は、エントロピー符号化テーブル352を使用して、圧縮画像データ390を生成する。
簡単に言えば、前のゼロの個数と、現時点の量子化係数の値を表すのに必要なビットとが、ペアを形成する。
各ペアには、可変長符号を通じてそれ自身の符号語が割り当てられる。
ハフマン符号化、シャノン−ファノ符号化、および算術符号化が、一般に使用される可変長コーダの例である。
所与の要素が多く生起するほど、その対応するコードに使用されるビット数は少なくなる。
JPEGエンコーダは、ペアの符号語を出力し、次いで、現時点の量子化係数の(可変長コーダによっても割り当てられた)符号語を出力する。
各ペアには、可変長符号を通じてそれ自身の符号語が割り当てられる。
ハフマン符号化、シャノン−ファノ符号化、および算術符号化が、一般に使用される可変長コーダの例である。
所与の要素が多く生起するほど、その対応するコードに使用されるビット数は少なくなる。
JPEGエンコーダは、ペアの符号語を出力し、次いで、現時点の量子化係数の(可変長コーダによっても割り当てられた)符号語を出力する。
量子化DCT係数のブロックを処理した後、JPEGエンコーダは、ブロック列の一意のエンドを書き込み、次いで、次のブロックに移る。
すべてのブロックが終了した後、JPEGエンコーダは、エンドオブファイルマーカを書き込む。
テーブル352および342は、復元を容易にするために、圧縮画像データ内に組み込むことができる。
すべてのブロックが終了した後、JPEGエンコーダは、エンドオブファイルマーカを書き込む。
テーブル352および342は、復元を容易にするために、圧縮画像データ内に組み込むことができる。
量子化の結果は、DCT係数の多くがゼロに縮小されたものとなる。
特に、周波数の高いコサイン基底関数に対応する係数ほど、ゼロになる傾向がある。
量子化DCT係数を配列して、ゼロ値要素のより長い列を得ることにより、エントロピーエンコーダのレート効率が改善され、特に、残りの符号化対象のあらゆる量子化DCT係数がすべてゼロである箇所でレート効率が改善される。
したがって、エントロピーエンコーダは、図4に示すように、周波数の低い基底関数に関連した量子化係数から周波数の高い基底関数に関連した量子化係数に進むジグザグ形式で、量子化DCT係数ブロックを符号化する。
特に、周波数の高いコサイン基底関数に対応する係数ほど、ゼロになる傾向がある。
量子化DCT係数を配列して、ゼロ値要素のより長い列を得ることにより、エントロピーエンコーダのレート効率が改善され、特に、残りの符号化対象のあらゆる量子化DCT係数がすべてゼロである箇所でレート効率が改善される。
したがって、エントロピーエンコーダは、図4に示すように、周波数の低い基底関数に関連した量子化係数から周波数の高い基底関数に関連した量子化係数に進むジグザグ形式で、量子化DCT係数ブロックを符号化する。
ブロック410の左上のコーナは、DC項(u,v=0)に対応する。
このDC項は、個々の符号化ブロック全体にわたって差分符号化(differentially encoded)される。
残りのAC項は、右下のコーナに向かって進むほど周波数が高くなるコサイン基底関数を表す。
JPEGエントロピーエンコーダは、ブロックエンドを書き込む前に、最高周波数の非ゼロの量子化係数までを符号化することのみ必要とされる。
他のあらゆる係数は、ゼロと仮定される。
このDC項は、個々の符号化ブロック全体にわたって差分符号化(differentially encoded)される。
残りのAC項は、右下のコーナに向かって進むほど周波数が高くなるコサイン基底関数を表す。
JPEGエントロピーエンコーダは、ブロックエンドを書き込む前に、最高周波数の非ゼロの量子化係数までを符号化することのみ必要とされる。
他のあらゆる係数は、ゼロと仮定される。
このジグザグスキャンの順序は、符号化対象の要素列の一方の端に多数の非ゼロの要素をグループ化する傾向がある。
周波数の高い基底係数がゼロである場合に、このジグザグスキャンの順序は、符号化される量子化係数の列の端にゼロの要素をグループ化する。
したがって、エントロピーエンコーダのレート効率が改善される。
JPEGエンコーダは、このスキャンの順序で最後の非ゼロの量子化係数を越えて符号化を行う必要はない。
高位の周波数ほどゼロになる確率が高いことから、このジグザグスキャンの順序は、このように、JPEGエンコーダの圧縮効率を増大させる。
周波数の高い基底係数がゼロである場合に、このジグザグスキャンの順序は、符号化される量子化係数の列の端にゼロの要素をグループ化する。
したがって、エントロピーエンコーダのレート効率が改善される。
JPEGエンコーダは、このスキャンの順序で最後の非ゼロの量子化係数を越えて符号化を行う必要はない。
高位の周波数ほどゼロになる確率が高いことから、このジグザグスキャンの順序は、このように、JPEGエンコーダの圧縮効率を増大させる。
図5は、圧縮画像データ510から復元ソース画像590を生成するデコーダ520を示している。
エントロピーデコーダ530およびエントロピーデコーダテーブル532が使用されて、量子化DCT係数が元に戻される。
逆量子化器540は、逆量子化器テーブル542を使用して、逆量子化DCT係数を生成する。
一実施の形態では、逆量子化器テーブル542は、量子化器テーブル342と同じである。
逆量子化係数に対して、逆変換が実行されて、復元ソース画像が生成される。
JPEGが適用される場合、ブロック550が、逆量子化DCT係数に対して逆DCT変換を実行し、復元ソース画像590が得られる。
エントロピーデコーダ530およびエントロピーデコーダテーブル532が使用されて、量子化DCT係数が元に戻される。
逆量子化器540は、逆量子化器テーブル542を使用して、逆量子化DCT係数を生成する。
一実施の形態では、逆量子化器テーブル542は、量子化器テーブル342と同じである。
逆量子化係数に対して、逆変換が実行されて、復元ソース画像が生成される。
JPEGが適用される場合、ブロック550が、逆量子化DCT係数に対して逆DCT変換を実行し、復元ソース画像590が得られる。
基本スペクトル操作符号化プロセスを変更して、ソース画像の復元に無関係であるが、レート効率に大きな影響を及ぼし得るピクセル値の変更を許容することができる。
ブロックの64個のピクセルを、ベクトルzと表記する。
このベクトルは、
z T={y T,x T}
となるような、より小さな2つのベクトルyおよびxから構成される。
ここで、yは、Ny個の関係ピクセルの集合であり、xは、64−Ny個の無関係ピクセルの集合である。
このベクトルの64×64の2DのDCT変換行列は、係数の集合cがc=Tzによって与えられるようなTで表記される。
このベクトルは、
z T={y T,x T}
となるような、より小さな2つのベクトルyおよびxから構成される。
ここで、yは、Ny個の関係ピクセルの集合であり、xは、64−Ny個の無関係ピクセルの集合である。
このベクトルの64×64の2DのDCT変換行列は、係数の集合cがc=Tzによって与えられるようなTで表記される。
1つの手法として、既知のベクトルyに影響を及ぼさずに、AC係数のエネルギーを最小にするベクトルzのベクトルxについて解くものを挙げることができる。
次いで、最小にすべきコスト関数が、以下の方程式によって与えられる。
次いで、最小にすべきコスト関数が、以下の方程式によって与えられる。
2DのDCTのDC係数は、以下の方程式によって与えられる。
J(x)が、xの各要素xiに関して部分的に導出され、ゼロと同等をみなされると、各要素は、以下の方程式によって与えられる同じ最適値を生成するように求められる。
したがって、AC係数のエネルギーを最小にする観点からの変更可能ピクセルの最適な補間は、すべての変更可能ピクセルの値を変更不能ピクセルの平均に設定する解となる。
この手法は、良い開始点とはなり得るが、差分DC符号化の影響およびブロック圧縮アルゴリズムエントロピーエンコーダの詳細を無視する。
この手法は、良い開始点とはなり得るが、差分DC符号化の影響およびブロック圧縮アルゴリズムエントロピーエンコーダの詳細を無視する。
目的は、他の制約条件を満たしつつ、逆のジグザグスキャンパスに沿ったゼロの連続を最大にすることにより、レートを最小にするzを求めることである。
例えば、いずれの変更可能なziにも、実現可能な範囲内のピクセル値を割り当てなければならず、変更不能ピクセルのziは、以下の方程式で与えられるように、変更されるべきではない。
zi=yi i={0,1,…,Ny−1}
0≦zi≦255 i={Ny,…,63}
例えば、いずれの変更可能なziにも、実現可能な範囲内のピクセル値を割り当てなければならず、変更不能ピクセルのziは、以下の方程式で与えられるように、変更されるべきではない。
zi=yi i={0,1,…,Ny−1}
0≦zi≦255 i={Ny,…,63}
変更されたブロックのDCT係数について考察する。
いくつかの係数は、ゼロに量子化される一方、それ以外の係数は、非ゼロの値に量子化される。
ゼロに量子化できる係数の位置(すなわちインデックス)は、以下のような集合Izeroを形成する。
いくつかの係数は、ゼロに量子化される一方、それ以外の係数は、非ゼロの値に量子化される。
ゼロに量子化できる係数の位置(すなわちインデックス)は、以下のような集合Izeroを形成する。
係数は、逆のジグザグスキャンの順序でスキャンされ、ゼロに量子化されない最初の係数cjが検出される。
他の制約条件に違反することなく、その係数をゼロに「プッシュ(push)」することが可能な場合には、上記制約条件
zi=yi i={0,1,…,Ny−1}
0≦zi≦255 i={Ny,…,63}
に加えて、Izero集合から得られる以下の制約を満たす解zが存在する。
他の制約条件に違反することなく、その係数をゼロに「プッシュ(push)」することが可能な場合には、上記制約条件
zi=yi i={0,1,…,Ny−1}
0≦zi≦255 i={Ny,…,63}
に加えて、Izero集合から得られる以下の制約を満たす解zが存在する。
(すなわち、以下の制約条件をも満たす場合に、ゼロに量子化されるどの係数も、非ゼロに量子化することはできない。)
項t i は、DCT行列Tの第i行を表す。
それぞれのゼロ量子化の制約条件は、1次不等式の制約条件である。
実現可能な解の存在は、シンプレックス法などの技法を使用して容易に解くことができるフェーズ1線形計画問題である。
係数値の変更は、このような変更を制限する等式制約条件の結果として、関係ピクセルの値に影響を与えるものではない。
選択されたブロックの関係ピクセルは、変更された係数ブロックを逆変換したものの対応するピクセルと同じ値を有することになる。
変更された係数ブロックを逆変換したものは、選択されたブロックを変更したものである。
それぞれのゼロ量子化の制約条件は、1次不等式の制約条件である。
実現可能な解の存在は、シンプレックス法などの技法を使用して容易に解くことができるフェーズ1線形計画問題である。
係数値の変更は、このような変更を制限する等式制約条件の結果として、関係ピクセルの値に影響を与えるものではない。
選択されたブロックの関係ピクセルは、変更された係数ブロックを逆変換したものの対応するピクセルと同じ値を有することになる。
変更された係数ブロックを逆変換したものは、選択されたブロックを変更したものである。
解が存在すると、新たなゼロの量子化係数のインデックスが、Izero集合に加えられ、zは、実現可能な解に更新される。
cjがゼロに量子化できない場合には、この方法は、逆のジグザグの順序で進んだ次の非ゼロの係数に進む。
このプロセスは、すべての非ゼロの量子化係数が検査されるまで繰り返すことができる。
cjがゼロに量子化できない場合には、この方法は、逆のジグザグの順序で進んだ次の非ゼロの係数に進む。
このプロセスは、すべての非ゼロの量子化係数が検査されるまで繰り返すことができる。
その結果生成された解は、すべての制約条件を満たすものではあるが、この解は、係数のエネルギーを最小にするという意味で最適でないことがある。
ゼロの連続の長さまたは個数を最大にすることに加えて、非ゼロの量子化係数のエネルギーを最小にして、最も低いレートに到達すべきである。
各段階における最小エネルギーの解は、以下のものを最小にする。
ゼロの連続の長さまたは個数を最大にすることに加えて、非ゼロの量子化係数のエネルギーを最小にして、最も低いレートに到達すべきである。
各段階における最小エネルギーの解は、以下のものを最小にする。
これは、上記に規定した以下の制約条件に従う。
DC値は、関係ピクセル値の平均に関して差動的であるとみなされる。
上記問題は、一連の1次等式および1次不等式の制約条件に従う2次コスト関数となる。
解を特定するために、2次計画法を適用することができる。
この2次解法は、一連のフェーズ1線形計画法の後にのみ起動する必要がある。
上記問題は、一連の1次等式および1次不等式の制約条件に従う2次コスト関数となる。
解を特定するために、2次計画法を適用することができる。
この2次解法は、一連のフェーズ1線形計画法の後にのみ起動する必要がある。
一連の線形計画法は、ゼロの量子化係数の個数を増加させるが、残りのDCT係数のエネルギーが、補間された最適な平均ブロックのものより高くなることがある解を生成する。
エネルギーがあまり増加しすぎると、ゼロの連続が最大になった場合であっても、レートは増加することがある。
エネルギーがあまり増加しすぎると、ゼロの連続が最大になった場合であっても、レートは増加することがある。
この結果を回避するために、2次計画法を、実現可能な解が求められた後の各段階で起動することができる。
この場合、2次計画法は、補間された平均ブロックの係数エネルギーに対する変更された最も新しいブロックの係数エネルギーの比に基づいた停止判断基準を使用する。
選択されたブロックを変更したもののエネルギーEが、補間された平均ブロックのエネルギーE0の所定の比TE(TE>1)を越える場合には、最適化は終了して、レートが高くなることが回避される。
この場合、2次計画法は、補間された平均ブロックの係数エネルギーに対する変更された最も新しいブロックの係数エネルギーの比に基づいた停止判断基準を使用する。
選択されたブロックを変更したもののエネルギーEが、補間された平均ブロックのエネルギーE0の所定の比TE(TE>1)を越える場合には、最適化は終了して、レートが高くなることが回避される。
図6および図7は、このプロセスを図の形で示している。
ステップ610において、ソース画像の少なくとも一部を含むピクセルブロックが選択される。
この選択されたブロックのピクセルは、ステップ620において、関係ピクセルまたは無関係ピクセルとして分類される。
ステップ610において、ソース画像の少なくとも一部を含むピクセルブロックが選択される。
この選択されたブロックのピクセルは、ステップ620において、関係ピクセルまたは無関係ピクセルとして分類される。
ステップ630によって判断されるように、ブロックが、関係ピクセルおよび無関係ピクセルを混合したものを含む場合には、標準的なブロック圧縮アルゴリズム(例えばJPEG)がステップ670において適用される前に、図7の最適化プロセスが、ステップ650において起動される。
ステップ650によって判断されるように、ブロックが無関係ピクセルのみから成る場合には、ステップ670において処理される前に、ステップ660において、0などの共通の所定値、または、前のブロックからの関係ピクセルの平均をすべてのピクセルに割り当てることにより、ブロックは変更される。
ブロックが関係ピクセル(すなわち変更不能)のみから成る場合には、選択されたブロックを変更することなく、標準的なブロック圧縮アルゴリズムが、ステップ670において適用される。
ステップ650によって判断されるように、ブロックが無関係ピクセルのみから成る場合には、ステップ670において処理される前に、ステップ660において、0などの共通の所定値、または、前のブロックからの関係ピクセルの平均をすべてのピクセルに割り当てることにより、ブロックは変更される。
ブロックが関係ピクセル(すなわち変更不能)のみから成る場合には、選択されたブロックを変更することなく、標準的なブロック圧縮アルゴリズムが、ステップ670において適用される。
図7は、関係ピクセルおよび無関係ピクセルの混合したものを有するブロックの圧縮前の最適化プロセスを示している。
ステップ710において、無関係ピクセルが初期化される。
一実施の形態では、無関係ピクセルは、選択されたブロックの関係ピクセルの平均ピクセル値に対応する値に設定される。
ステップ712において、選択されたブロックのエネルギー(初期化後)が、E0として計算される。
ステップ710において、無関係ピクセルが初期化される。
一実施の形態では、無関係ピクセルは、選択されたブロックの関係ピクセルの平均ピクセル値に対応する値に設定される。
ステップ712において、選択されたブロックのエネルギー(初期化後)が、E0として計算される。
ステップ720において、選択されたブロックに対してフォワード変換を適用することにより、係数ブロックが生成される。
ステップ730において、すべてのゼロの量子化係数の位置が、配列Izeroに記憶される。
ステップ730において、すべてのゼロの量子化係数の位置が、配列Izeroに記憶される。
逆のジグザグの順序で進んで、選択された非ゼロの量子化係数の位置が、ステップ740において特定される。
ステップ750において、選択された係数の値が、現時点のz用に計算される。
ステップ750において、選択された係数の値が、現時点のz用に計算される。
ステップ752は、選択された係数がゼロに量子化されるかどうかを判断する。
ゼロに量子化される場合には、ステップ770において、その係数の位置が、他のゼロの量子化係数からなるIzero集合に追加される。
ゼロに量子化される場合には、ステップ770において、その係数の位置が、他のゼロの量子化係数からなるIzero集合に追加される。
選択された係数がゼロに量子化されない場合には、ステップ754は、上記で特定した制約条件に従って、量子化係数がゼロとなる実現可能な解が存在するかどうかを判断する。
一実施の形態では、フェーズ1線形計画法が使用されて、このような実現可能な解が特定される。
一実施の形態では、シンプレックス法が使用されて、実現可能な解が特定される。
実現可能な解が存在しない場合には、処理は、ステップ780に続く。
一実施の形態では、フェーズ1線形計画法が使用されて、このような実現可能な解が特定される。
一実施の形態では、シンプレックス法が使用されて、実現可能な解が特定される。
実現可能な解が存在しない場合には、処理は、ステップ780に続く。
実現可能な解が存在する場合には、ステップ760において、2次計画法が使用されて、zの極小エネルギー解が特定される。
この新たなzは、ステップ762において計算される関連したエネルギーEを有する。
この新たなzは、ステップ762において計算される関連したエネルギーEを有する。
ステップ764は、E/E0>TEであるかどうかを判断する。
ここで、TEは、E0に対するEの比の許容可能な閾値である。
E/E0≦TEである場合には、ステップ770において、その係数の位置が、他のゼロの量子化係数からなるIzero集合に追加され、処理は、ステップ780に続く。
ここで、TEは、E0に対するEの比の許容可能な閾値である。
E/E0≦TEである場合には、ステップ770において、その係数の位置が、他のゼロの量子化係数からなるIzero集合に追加され、処理は、ステップ780に続く。
ステップ754またはステップ770のいずれかから進んで、ステップ780において、処理すべき係数がさらに存在するかどうかを判断するチェックが行われる。
存在しない場合には、係数ブロックの変更プロセスは、ステップ790において完了する。
存在する場合には、プロセスは、ステップ740に戻ることによって、次の非ゼロの量子化係数で継続される。
存在しない場合には、係数ブロックの変更プロセスは、ステップ790において完了する。
存在する場合には、プロセスは、ステップ740に戻ることによって、次の非ゼロの量子化係数で継続される。
この最適化プロセスは、すべての非ゼロの量子化係数が処理されるまで、または、結果のエネルギーが所定の閾値を越えるまで、ステップ740〜780を繰り返す。
上記プロセスは、関係ピクセルの平均値を無関係ピクセルのすべてに割り当てることによってブロックが初期化される場合の基本的な方法を説明しているが、変換領域(translated domain)で動作する場合に、これらの計算の複雑さを減少させることができる。
以下の並進変換(translational transformation)を使用することによって、2次コスト関数を簡単なエネルギー関数に変換することができる。
以下の並進変換(translational transformation)を使用することによって、2次コスト関数を簡単なエネルギー関数に変換することができる。
他の制約条件のすべても、同様にして、関係ピクセルの平均値分だけ適切にシフトしなければならない。
例えば、無関係ピクセルは、ゼロに初期化される。
例えば、無関係ピクセルは、ゼロに初期化される。
一実施の形態では、このプロセスは、処理すべき係数がさらに残っているかどうかにかかわらず、最初に実現可能な解を求めることができない時に停止する。
この手法は、ゼロについて最後に連続したものの長さを最大にする。
最後に連続したものは、エントロピーエンコーダのオペレーションの原理により、JPEGエンコーダの符号化レートに最も大きな影響を及ぼす。
この手法は、ゼロについて最後に連続したものの長さを最大にする。
最後に連続したものは、エントロピーエンコーダのオペレーションの原理により、JPEGエンコーダの符号化レートに最も大きな影響を及ぼす。
図8は、図7の方法の代替的な実施の形態を示している。
この代替的な実施の形態は、実現可能なゼロの量子化解が存在しない係数に遭遇した後に、非ゼロの量子化係数をさらに探索することを停止するものである。
図7と図8とを比較すると、実現可能な解が存在しないとステップ854が判断すると、プロセスは、ステップ880において後続の非ゼロの量子化係数を処理する準備をするのではなく、ステップ890において終了する。
この代替的な実施の形態は、実現可能なゼロの量子化解が存在しない係数に遭遇した後に、非ゼロの量子化係数をさらに探索することを停止するものである。
図7と図8とを比較すると、実現可能な解が存在しないとステップ854が判断すると、プロセスは、ステップ880において後続の非ゼロの量子化係数を処理する準備をするのではなく、ステップ890において終了する。
図9は、2次計画法が、終了段階(すなわち、すべての係数が処理された後)においてのみ実行される別の変形を示している。
したがって、実現可能な解が存在するとステップ954が判断すると、上記同様に、ステップ970において、その係数の位置がIzeroに追加される。
しかしながら、ステップ980によって判断されるように、処理すべき係数がもはや存在しなくなった後にのみ、2次計画法が、ステップ960において適用される。
次いで、プロセスは、ステップ990において完了する。
したがって、実現可能な解が存在するとステップ954が判断すると、上記同様に、ステップ970において、その係数の位置がIzeroに追加される。
しかしながら、ステップ980によって判断されるように、処理すべき係数がもはや存在しなくなった後にのみ、2次計画法が、ステップ960において適用される。
次いで、プロセスは、ステップ990において完了する。
このスペクトル内容操作の方法は、1)ゼロの量子化係数の個数を増加させる傾向を有し、2)周波数の高い基底関数に関連した連続するゼロの量子化係数の個数を増加させることを優先する傾向を有する。
このエントロピーエンコーダの特異性を考えると、これにより、JPEGエンコーダは、ブロックエンドを発行する前に、より少ないデータを使用して関係画像を表現することができる。
このエントロピーエンコーダの特異性を考えると、これにより、JPEGエンコーダは、ブロックエンドを発行する前に、より少ないデータを使用して関係画像を表現することができる。
この改良されたプロセスの1つの特定の利点は、デコーダに変更を行う必要がないということである。
したがって、圧縮画像データの生成には、計算資源がより多く必要となることはあるが、圧縮データの復号には、資源を追加する必要はない。
さらに、関係ピクセルは保存されるので、ピクセル操作を伴わない圧縮から復元された画像と、ピクセル操作を伴った圧縮から復元された画像との該当する部分には、相違は存在しない。
したがって、圧縮画像データの生成には、計算資源がより多く必要となることはあるが、圧縮データの復号には、資源を追加する必要はない。
さらに、関係ピクセルは保存されるので、ピクセル操作を伴わない圧縮から復元された画像と、ピクセル操作を伴った圧縮から復元された画像との該当する部分には、相違は存在しない。
上記詳細な説明では、本発明を、その特定の例示の実施の形態に関して説明している。
特許請求項に記載される本発明のより広い精神および範囲から逸脱することなく、さまざまな変更および変形をそれらの実施の形態に対して行うことができる。
したがって、明細書および図面は、限定する意味ではなく、例示の意味で考慮されるべきである。
特許請求項に記載される本発明のより広い精神および範囲から逸脱することなく、さまざまな変更および変形をそれらの実施の形態に対して行うことができる。
したがって、明細書および図面は、限定する意味ではなく、例示の意味で考慮されるべきである。
310・・・ソース画像、
330・・・フォワード離散コサイン変換(FDCT)、
340・・・量子化器、
342、352・・・テーブル、
350・・・エントロピーエンコーダ、
390・・・圧縮画像データ、
510・・・ソース画像、
530・・・フォワード離散コサイン変換(FDCT)、
540・・・量子化器、
542,552・・・テーブル、
550・・・エントロピーエンコーダ、
590・・・圧縮画像データ、
330・・・フォワード離散コサイン変換(FDCT)、
340・・・量子化器、
342、352・・・テーブル、
350・・・エントロピーエンコーダ、
390・・・圧縮画像データ、
510・・・ソース画像、
530・・・フォワード離散コサイン変換(FDCT)、
540・・・量子化器、
542,552・・・テーブル、
550・・・エントロピーエンコーダ、
590・・・圧縮画像データ、
Claims (10)
- 圧縮するピクセルブロックのスペクトルの内容を操作する方法であって、
a)選択されたピクセルブロック(110)内の各ピクセルを関係ピクセルまたは無関係ピクセルとして分類するステップ(620)と、
b)前記選択されたブロックのフォワード変換を表す係数ブロックを生成するステップ(720)と、
c)係数値を変更するステップ(754)であって、それによって、前記関係ピクセルが、変更された係数ブロックを逆変換したものにおいて、前記選択されたブロックにおける値と同じ値を有するという制約条件を含む1組の所定の制約条件に従って、前記変更された係数ブロックを生成する、変更するステップ(754)と
を含む方法。 - d)ソース画像のすべてのピクセルブロックに対して、前記ステップa)〜c)を繰り返すステップ
をさらに含む請求項1に記載の方法。 - 前記ステップc)は、
i)逆のジグザグの順序で前記係数ブロックから係数を選択するステップ(740)であって、該選択した係数は非ゼロの値を有する、選択するステップ(740)と、
ii)前記所定の制約条件に従って、選択した係数をゼロに量子化可能とする実現可能な解を求めるステップと
を含む
請求項1に記載の方法。 - 前記逆のジグザグの順序で前記選択した係数に先行するゼロに量子化可能な任意の係数は、非ゼロに量子化可能になることが許容されないという制約条件に従って変更される
請求項3に記載の方法。 - d)前記係数ブロックをエントロピー符号化するステップ(550)であって、前記選択されたブロックに対応する圧縮データを生成するステップ
をさらに含む請求項1に記載の方法。 - マスク(130)の個々の要素の値は、前記選択されたブロック内の対応する位置のピクセルを関係ピクセルまたは無関係ピクセルとして分類する
請求項1に記載の方法。 - 前記選択されたブロック(110)は、
オブジェクトに関連した関係ピクセル(114)と、
オブジェクトに関連しない無関係ピクセル(112)とを含む
請求項1に記載の圧縮方法。 - d)前記変更された係数ブロックをブロック圧縮プロセスに提供するステップ(670)
をさらに含む請求項1に記載の方法。 - 前記ステップd)は、
線形計画法を適用するステップであって、前記制約条件に従って係数をゼロに量子化可能とする実現可能な解を特定するステップ
をさらに含む
請求項1に記載の方法。 - 2次計画法を適用するステップ(760)であって、極小のエネルギーを有する選択されたブロックを変更したものを生成するステップ
をさらに含む請求項9に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/036,985 US6862371B2 (en) | 2001-12-31 | 2001-12-31 | Method of compressing images of arbitrarily shaped objects |
PCT/US2002/040947 WO2003058975A2 (en) | 2001-12-31 | 2002-12-18 | Method of compressing images of arbitrarily shaped objects |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006502604A true JP2006502604A (ja) | 2006-01-19 |
Family
ID=21891809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003559158A Withdrawn JP2006502604A (ja) | 2001-12-31 | 2002-12-18 | 任意形状オブジェクトの画像圧縮方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6862371B2 (ja) |
EP (1) | EP1464181A2 (ja) |
JP (1) | JP2006502604A (ja) |
AU (1) | AU2002364092A1 (ja) |
WO (1) | WO2003058975A2 (ja) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7073505B2 (en) * | 2002-09-06 | 2006-07-11 | Apneon, Inc. | Systems and methods for moving and/or restraining tissue in the oral cavity |
US7116840B2 (en) | 2002-10-31 | 2006-10-03 | Microsoft Corporation | Decoding and error correction in 2-D arrays |
US7133563B2 (en) * | 2002-10-31 | 2006-11-07 | Microsoft Corporation | Passive embedded interaction code |
GB0227329D0 (en) * | 2002-11-22 | 2002-12-31 | Electrosonic Ltd | Image scanning |
JP2004180064A (ja) * | 2002-11-28 | 2004-06-24 | Ricoh Co Ltd | 情報圧縮装置および方法、ならびにそのプログラム |
US7302107B2 (en) * | 2003-12-23 | 2007-11-27 | Lexmark International, Inc. | JPEG encoding for document images using pixel classification |
US7583842B2 (en) * | 2004-01-06 | 2009-09-01 | Microsoft Corporation | Enhanced approach of m-array decoding and error correction |
US7263224B2 (en) * | 2004-01-16 | 2007-08-28 | Microsoft Corporation | Strokes localization by m-array decoding and fast image matching |
US8311127B2 (en) * | 2004-03-04 | 2012-11-13 | Nvidia Corporation | Method and apparatus to check for wrongly decoded macroblocks in streaming multimedia applications |
US7574055B2 (en) * | 2004-09-07 | 2009-08-11 | Lexmark International, Inc. | Encoding documents using pixel classification-based preprocessing and JPEG encoding |
US8437403B2 (en) * | 2005-01-05 | 2013-05-07 | Jean-Yves Babonneau | Device and method for analysing images by calculating the variance for each pixel of a high-frequency image |
US7607076B2 (en) | 2005-02-18 | 2009-10-20 | Microsoft Corporation | Embedded interaction code document |
US7826074B1 (en) | 2005-02-25 | 2010-11-02 | Microsoft Corporation | Fast embedded interaction code printing with custom postscript commands |
US20060215913A1 (en) * | 2005-03-24 | 2006-09-28 | Microsoft Corporation | Maze pattern analysis with image matching |
US20060242562A1 (en) * | 2005-04-22 | 2006-10-26 | Microsoft Corporation | Embedded method for embedded interaction code array |
US7421439B2 (en) | 2005-04-22 | 2008-09-02 | Microsoft Corporation | Global metadata embedding and decoding |
US7599560B2 (en) | 2005-04-22 | 2009-10-06 | Microsoft Corporation | Embedded interaction code recognition |
US7400777B2 (en) * | 2005-05-25 | 2008-07-15 | Microsoft Corporation | Preprocessing for information pattern analysis |
US7729539B2 (en) * | 2005-05-31 | 2010-06-01 | Microsoft Corporation | Fast error-correcting of embedded interaction codes |
US7580576B2 (en) * | 2005-06-02 | 2009-08-25 | Microsoft Corporation | Stroke localization and binding to electronic document |
US7619607B2 (en) | 2005-06-30 | 2009-11-17 | Microsoft Corporation | Embedding a pattern design onto a liquid crystal display |
US7817816B2 (en) * | 2005-08-17 | 2010-10-19 | Microsoft Corporation | Embedded interaction code enabled surface type identification |
US7622182B2 (en) | 2005-08-17 | 2009-11-24 | Microsoft Corporation | Embedded interaction code enabled display |
JP4816328B2 (ja) * | 2006-08-24 | 2011-11-16 | 富士ゼロックス株式会社 | 画像処理システム、画像圧縮システム、画像編集システム、画像処理プログラムおよび画像処理装置 |
US20110052087A1 (en) * | 2009-08-27 | 2011-03-03 | Debargha Mukherjee | Method and system for coding images |
US8381101B2 (en) * | 2009-11-16 | 2013-02-19 | Apple Inc. | Supporting platform-independent typesetting for documents |
GB2491687B (en) | 2011-05-05 | 2014-08-27 | Advanced Risc Mach Ltd | Method of and apparatus for encoding and decoding data |
US9177415B2 (en) | 2013-01-30 | 2015-11-03 | Arm Limited | Methods of and apparatus for encoding and decoding data |
US10547872B2 (en) | 2015-09-10 | 2020-01-28 | Samsung Electronics Co., Ltd. | Encoding device, decoding device, and encoding method and decoding method thereof |
WO2024020465A1 (en) * | 2022-07-21 | 2024-01-25 | Kbr Wyle Services Llc | Systems and methods for transmitting information using an electronic media |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8700092D0 (en) * | 1987-01-05 | 1987-02-11 | Crosfield Electronics Ltd | Image processing |
US5107348A (en) * | 1990-07-11 | 1992-04-21 | Zenith Electronics Corporation | Temporal decorrelation of block artifacts |
US5422963A (en) | 1993-10-15 | 1995-06-06 | At&T Corp. | Block transform coder for arbitrarily shaped image segments |
ES2180934T3 (es) * | 1996-03-28 | 2003-02-16 | Koninkl Philips Electronics Nv | Metodo y disposicion para codificar y decodificar imagenes. |
-
2001
- 2001-12-31 US US10/036,985 patent/US6862371B2/en not_active Expired - Lifetime
-
2002
- 2002-12-18 EP EP02798563A patent/EP1464181A2/en not_active Withdrawn
- 2002-12-18 WO PCT/US2002/040947 patent/WO2003058975A2/en not_active Application Discontinuation
- 2002-12-18 AU AU2002364092A patent/AU2002364092A1/en not_active Abandoned
- 2002-12-18 JP JP2003559158A patent/JP2006502604A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US6862371B2 (en) | 2005-03-01 |
EP1464181A2 (en) | 2004-10-06 |
WO2003058975A3 (en) | 2004-02-19 |
AU2002364092A1 (en) | 2003-07-24 |
US20030123740A1 (en) | 2003-07-03 |
WO2003058975A2 (en) | 2003-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006502604A (ja) | 任意形状オブジェクトの画像圧縮方法 | |
JP3976876B2 (ja) | 画像圧縮方法 | |
JP3973104B2 (ja) | 再構成方法及び装置 | |
JP4906855B2 (ja) | 変換ブロックの効率的なコーディングおよびデコーディング | |
JP3693988B2 (ja) | 通信管理システム及び通信管理方法 | |
US6879727B2 (en) | Decoding bit-plane-encoded data using different image quality for display | |
JP4025847B2 (ja) | 符号化装置 | |
RU2567988C2 (ru) | Кодер, способ кодирования данных, декодер, способ декодирования данных, система передачи данных, способ передачи данных и программный продукт | |
JP4365957B2 (ja) | 画像処理方法及びその装置及び記憶媒体 | |
JP2005516553A (ja) | 複合文書の圧縮のためのコーダに整合したレイヤ分離 | |
US9245353B2 (en) | Encoder, decoder and method | |
Kountchev et al. | Inverse pyramidal decomposition with multiple DCT | |
Siddeq et al. | A novel 2D image compression algorithm based on two levels DWT and DCT transforms with enhanced minimize-matrix-size algorithm for high resolution structured light 3D surface reconstruction | |
KR20020008133A (ko) | 유한 알파벳 데이터의 비손실 적응 인코딩 | |
Padmavati et al. | DCT combined with fractal quadtree decomposition and Huffman coding for image compression | |
Poolakkachalil et al. | Comparative analysis of lossless compression techniques in efficient DCT-based image compression system based on Laplacian Transparent Composite Model and An Innovative Lossless Compression Method for Discrete-Color Images | |
Kumari et al. | Image quality estimation by entropy and redundancy calculation for various wavelet families | |
Kamatar et al. | Two phase image compression algorithm Using diagonal pixels of image blocks | |
Pancholi et al. | Tutorial review on existing image compression techniques | |
Kaur et al. | IMAGE COMPRESSION USING DECISION TREE TECHNIQUE. | |
Vijayarani et al. | Image Compression Techniques–An Overview | |
Kadim et al. | Lossless Biometric Signal Compression. | |
Hilles et al. | Image coding techniques in networking | |
Singh et al. | A Review on Recent Developments in Image Compression Techniques | |
KR0183150B1 (ko) | 반복적용이 필요없는 가변블럭 크기의 프렉탈 부호화 장치및방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20060215 |