JP5590133B2 - 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム - Google Patents
動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム Download PDFInfo
- Publication number
- JP5590133B2 JP5590133B2 JP2012536091A JP2012536091A JP5590133B2 JP 5590133 B2 JP5590133 B2 JP 5590133B2 JP 2012536091 A JP2012536091 A JP 2012536091A JP 2012536091 A JP2012536091 A JP 2012536091A JP 5590133 B2 JP5590133 B2 JP 5590133B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- frequency
- unit
- sign
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 123
- 238000004590 computer program Methods 0.000 title claims description 18
- 238000013139 quantization Methods 0.000 claims description 473
- 230000003044 adaptive effect Effects 0.000 claims description 222
- 238000012937 correction Methods 0.000 claims description 114
- 230000001131 transforming effect Effects 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 4
- 230000001172 regenerating effect Effects 0.000 claims 2
- 240000006890 Erythroxylum coca Species 0.000 claims 1
- 235000008957 cocaer Nutrition 0.000 claims 1
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 claims 1
- 230000033001 locomotion Effects 0.000 description 72
- 230000008569 process Effects 0.000 description 61
- 238000010586 diagram Methods 0.000 description 41
- 230000010354 integration Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 19
- 239000013598 vector Substances 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 11
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
代表的な動画像の符号化標準として、International Standardization Organization/International Electrotechnical Commission(ISO/IEC)で策定されたMoving Picture Experts Group phase 2(MPEG-2)、MPEG-4、あるいはH.264 MPEG-4 Advanced Video Coding(MPEG-4 AVC/H.264)が広く利用されている。
このような符号化標準では、予測符号化方式が採用されている。予測符号化方式では、符号化対象のピクチャが複数のブロックに分割される。そして複数のブロックのうちの符号化対象ブロックと、そのブロックの予測画像間の画素ごとの誤差を表す予測誤差画像が算出される。予測誤差画像は直交変換されて各周波数の成分を表す周波数係数が求められる。そして、その周波数係数を量子化した量子化係数がエントロピー符号化される。このような量子化及びエントロピー符号化を行うことにより、動画像のデータ量が削減される。
また、Llord-Maxアルゴリズムを用いて、任意の確率分布を持つシンボルを量子化するための量子化代表値を最適化する技術も提案されている(例えば、非特許文献2を参照)。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を制限するものではないことを理解されたい。
そこで、発明者は、予測誤差画像について求めた周波数係数を直接符号化する代わりに、確率分布に偏りがある情報を符号化することを検討した。その結果、発明者は、予測誤差画像の周波数係数の正負の符号と、その周波数係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数係数の正負の符号との一致、不一致を表す符号一致情報の確率分布に偏りがあることを見出した。
そこで、以下に説明する動画像符号化装置は、予測誤差画像を直交変換するだけでなく、予測画像も直交変換する。そして動画像符号化装置は、予測誤差画像を直交変換することにより求められた周波数係数と、予測画像を直交変換することにより求められた、対応する周波数係数の正負の符号とに基づいて求めた符号一致情報を用いて予測誤差画像の周波数係数を符号化する。
なお、以下では、符号化された動画像データに含まれる各情報に割り当てられた符号と正負の符号とを区別するために、正負の符号をサインと呼ぶ。
また、符号化された動画像は、カラー動画像であってもよく、あるいは、モノクロ動画像であってもよい。
動画像符号化装置1が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置1が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置1に実装されてもよい。さらに、動画像符号化装置1が有するこれらの各部は、動画像符号化装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
あるいは、予測モード判定部11は、符号化対象マクロブロックが含まれる符号化対象ピクチャの種別に応じて、予測符号化モードを決定してもよい。例えば、符号化対象ピクチャがイントラ予測符号化されるIピクチャであれば、予測モード判定部11は、予測符号化モードとしてイントラ予測符号化モードを選択する。また、符号化対象ピクチャがインター予測符号化されるBピクチャまたはPピクチャであれば、予測モード判定部11は、予測符号化モードとしてインター予測符号化モードを選択する。
イントラ予測部12は、生成された予測画像をセレクタ14へ渡す。
動き補償部13は、符号化対象ブロックと、参照ピクチャとのブロックマッチングを実行することにより、符号化対象ブロックと最も一致する参照ピクチャ及びその参照ピクチャ上の領域の位置を決定する。
動き補償部13は、画像メモリ22から得た参照ピクチャ中の符号化対象ブロックと最も一致する参照ピクチャ上の領域を動きベクトルに基づいて動き補償することにより予測画像を生成する。なお、動き補償は、動きベクトルで表された、符号化対象ブロックとそれに対して最も類似する参照ピクチャ上の領域の位置ずれ量を相殺するように、その最も類似する参照ピクチャ上の領域の位置を移動する処理である。
(1)式から明らかなように、注目画素xの値は、参照ピクチャに対してローパスフィルタリングを行って得られた値である。従って、一般に、インター予測により作成される予測画像の高周波数成分は、参照ピクチャの対応する領域の高周波数成分よりも小さくなる。
予測誤差直交変換部16は、各予測誤差画像について得られた複数の周波数係数を周波数係数適応符号化部19へ出力する。
予測画像直交変換部17は、各予測画像の複数の周波数係数を符号判定部18へ出力する。
一方、符号判定部18は、注目する周波数係数のサインが負である場合、'-1'を適応量子化/逆量子化部191へ出力し、'1'を適応量子化係数符号化部192へ出力する。
なお、所定の順序は、適応量子化/逆量子化部191及び適応量子化係数符号化部192が予測誤差画像の各周波数係数を量子化及びエントロピー符号化する順序と同じ順序であり、例えば、MPEG-4 AVC/H.264に規定された順序とすることができる。
一般に、予測誤差画像及び予測画像に関して、低い周波数成分に対応する周波数係数ほど、大きな絶対値となる傾向がある。逆に、右下端に近い画素、すなわち、高い周波数成分に対応する周波数係数の絶対値は相対的に小さな値となる。その結果、予測誤差画像の周波数係数が量子化されると、右下端に近い画素は量子化係数'0'となる可能性が高い。そして、特定のシンボルが連続するデータは、効率良く符号化できる。そこで、本実施形態では、符号判定部18は、矢印201で示されるように、左上端画素に近い方から順に各周波数係数のサインを判定する。なお、予測画像及び予測誤差画像が他のサイズ、例えば、8×8画素を有している場合も、符号判定部18は、同様に、最も低い周波数成分に対応する画素から順に各周波数係数のサインを判定する。
図3は、符号化対象ピクチャの符号化対象ブロックのパワースペクトルと、符号化対象ブロックに対する予測画像のパワースペクトルの関係を示す図である。この図において、横軸は周波数を表し、縦軸はパワースペクトル密度を表す。そしてグラフ300は、符号化対象ブロックのパワースペクトルを表し、一方、グラフ301は、予測画像のパワースペクトルを表す。
したがって、図3に示されるように、各周波数において、予測画像のパワースペクトルは、符号化対象ブロックのパワースペクトルよりも小さくなる。その結果、例えば、周波数ωiに対応する予測画像のi番目の周波数係数の絶対値|Coefpred(i)|は、符号化対象ブロックを直接直交変換して得られたi番目の周波数係数の絶対値|Coeforg(i)|よりも小さくなる可能性が高い。
上述したように、各周波数において、予測画像の周波数係数の絶対値|Coefpred(i)|は、符号化対象ブロックの周波数係数の絶対値|Coeforg(i)|よりも小さくなる可能性が高い。そのため、図4に示されるように、{|Coeforg(i)|- |Coefpred(i)|}が正となる確率は、{|Coeforg(i)|- |Coefpred(i)|}が負となる確率よりも高くなる。
また、予測画像は、符号化対象ブロックと類似するように作成されたものであるため、符号化対象ブロックの各周波数係数の符号sign(Coeforg(i))は、予測画像の対応する周波数係数の符号sign(Coefpred(i))と同一である可能性が高い。
したがって、(3)式において、sign(Coeforg(i))をsign(Coefpred(i))で置換し、かつ(4)式を適用することにより次式が得られる。
上記のように、補正周波数係数sign(Coefpred(i))Coefdiff(i)が正となる確率密度は、補正周波数係数sign(Coefpred(i))Coefdiff(i)が負となる確率密度よりも高い。その結果、補正周波数係数sign(Coefpred(i))Coefdiff(i)の確率分布は、周波数'0'に対して非対称な、偏りのある分布となっている。一方、予測誤差画像の周波数係数Coefdiff(i)の確率分布は、正の値と負の値の確率密度がほぼ等しい分布である。
したがって、補正周波数係数sign(Coefpred(i))Coefdiff(i)の情報量は、予測誤差画像の周波数係数Coefdiff(i)の情報量よりも小さい。そこで動画像符号化装置1は、補正周波数係数sign(Coefpred(i))Coefdiff(i)を符号化することにより、符号化効率を向上できる。
適応量子化/逆量子化部191は、符号化対象マクロブロック内の各ブロックについての予測誤差画像の補正周波数係数を算出し、その補正周波数係数を量子化する。そのために、適応量子化/逆量子化部191は、3個の乗算器1911〜1913と、非線形量子化部1914と、非線形逆量子化部1915とを有する。
乗算器1911は、各予測誤差画像についてそれぞれ求めた複数の補正周波数係数を非線形量子化部1914へ出力する。
図7は、補正周波数係数の確率密度分布と量子化スケールの関係の一例を表す図である。図7において、横軸は補正周波数係数を表し、縦軸は確率密度を表す。そしてグラフ700は、補正周波数係数の確率密度分布を表す。なお、このグラフ700は、図5における、sign(Coefpred(i))Coefdiff(i)の確率分布500に対応する。また、QP1、QP2は、それぞれ、補正周波数係数が'正'、'負'の値を有する場合の量子化スケールである。そしてlevelは、補正量子化係数である。またq(i)は、level(i)に対応する量子化代表値である。ここでは、量子化代表値は、補正周波数係数を量子化した場合の補正周波数係数の代表値である。そして補正量子化係数は、対応する量子化代表値のインデックス値である。
上記のように、補正周波数係数、すなわち、sign(Coefpred(i))Coefdiff(i)が正となる確率密度は、sign(Coefpred(i))Coefdiff(i)が負となる確率密度よりも高い。その結果、グラフ700に表されるように、補正周波数係数sign(Coefpred(i))Coefdiff(i)の確率分布は、'0'に対して非対称な、偏りのある分布となっている。
そこで、非線形量子化部1914は、補正周波数係数が'負'の値を有する場合の量子化スケールQP2を、補正周波数係数が'正'の値を有する場合の量子化スケールQP1よりも大きくする。これにより、非線形量子化部1914は、出現確率の高い、正の値を持つ補正周波数係数は正確に再現されるように量子化しつつ、出現確率の低い、負の値を持つ補正周波数係数の情報を削減できる。
例えば、非線形量子化部1914は、次式に従って補正周波数係数を量子化することにより、補正量子化係数を算出する。
まず、量子化スケールの初期値QP及び定数αが設定される。このQP及びαを用いて、QP1及びQP2は次式のように表される。
例えば、M. D .Paez, T. H. Glisson, “Minimum Mean-Squared-Error Quantization in Speech PCM and DPCM Systems”, IEEE TRANSACTIONS ON COMMUNICATIONS, 1972年4月, pp.225-230には、確率密度分布がラプラシアン分布に従う場合の量子化代表値が示されている。ラプラシアン分布に従う確率分布PDF(x)は、一般には、aを任意の定数とし、xをシンボルの値として、以下の式で表される。
PDF(x) = a/2・exp|-a・x|
そして、xの値が大きいほど、確率分布PDF(x)の値は指数関数的に0に近づく。そして上記の文献には、量子化代表値の数Nが2、4、8、16、32の場合の量子化代表値が示されている。例えば、量子化代表値の数Nが8であり、yiが(i=1,2,3,4)が、それぞれ0に近い順、かつ正負対称な、各量子化代表値とする。この場合、第一の量子化代表値y1=±0.222、第二の量子化代表値y2=±0.785、第三の量子化代表値y3=±1.576、第四の量子化代表値y4=±2.994、となる。よって、それぞれ、隣接する量子化代表値の間隔は、y2-y1=0.563、y3-y2=0.791、y4-y3=1.418となる。すなわち、シンボルの値が大きくなり、かつそのシンボルの値に対する確率が小さくなるほど、量子化代表値の間隔が広がっていることが分かる。
本実施形態では、補正周波数係数の絶対値が同一であれば、正の値を持つ補正周波数係数の出現確率は、負の値を持つ補正周波数係数の出現確率よりも高くなる。したがって、各量子化代表値は、補正周波数係数の絶対値が同一であれば、隣接する二つの負の値を持つ補正周波数係数に対する量子化代表値間の間隔が、隣接する二つの正の値を持つ補正周波数係数に対する量子化代表値間の間隔よりも広くなるよう設定される。そのために、補正周波数係数に対する各量子化代表値は、例えば、テスト用動画像シーケンスに対して求めた補正周波数係数の出現確率分布に基づいて、Llord-Max法に従って決定されてもよい。そして各量子化代表値は、例えば、非線形量子化部1914が有するメモリに予め記憶される。
この場合、非線形量子化部1914は、各補正周波数係数を量子化する際、複数の量子化代表値のうちの補正周波数係数に最も近い量子化代表値を求め、その量子化代表値に対応する補正量子化係数を出力する。
上記のように、補正周波数係数、すなわち、sign(Coefpred(i))Coefdiff(i)が正となる確率密度は、sign(Coefpred(i))Coefdiff(i)が負となる確率密度よりも高い。その結果、絶対値が等しい補正量子化係数に対応する量子化代表値間の間隔は、負の値を持つ量子化代表値よりも正の値を持つ量子化代表値に対して広くなるように設定される。例えば、補正量子化係数'-1'に対応する量子化代表値q(-1)と補正量子化係数'-2'に対応する量子化代表値q(-2)との間隔801は、補正量子化係数'1'に対応する量子化代表値q(1)と補正量子化係数'2'に対応する量子化代表値q(2)との間隔802よりも広い。
乗算器1912から出力された各量子化係数は、適応量子化係数符号化部192へ入力される。
例えば、非線形逆量子化部1915は、次式に従って各補正量子化係数を逆量子化する。
あるいは、量子化代表値間の間隔が、補正周波数係数の絶対値に応じて変化するように設定されている場合、非線形逆量子化部1915は、例えば、補正量子化係数と量子化代表値との対応関係を表す参照テーブルを内蔵するメモリに予め記憶しておく。そして非線形逆量子化部1915は、その参照テーブルを参照して、補正量子化係数に対応する量子化代表値を、再生される補正周波数係数として求める。
非線形逆量子化部1915は、再生した各補正周波数係数を乗算器1913へ出力する。
乗算器1913から出力された、再生された各周波数係数は、逆変換部20へ入力される。
表910は、画像900に対応する有効係数位置情報、有効係数絶対値情報及び有効係数符号情報を表す。表900において、行911は、各有効係数の識別番号を表す。この識別番号は、量子化係数の参照順序に従って、最初に検出された有効係数から順に1ずつ大きくなるように付される。
また行912は、有効係数位置情報を表す。有効係数位置情報は、有効係数が含まれる画素の参照順序に従った番号を含み、この例では、有効係数の識別番号'1'から順に、1、2、3、4、5、7、9、10となる。
さらに、行914は、有効係数符号情報を表す。本実施形態では、有効係数符号情報は、有効係数のサインが'正'である場合、その有効係数のサインを'0'で表し、一方、有効係数のサインが'負'である場合、その有効係数のサインを'1'で表す。この例では、5番目に参照される画素についてのみ、有効係数が負の値を持つ。そのため、有効係数の識別番号'5'に対応する有効係数符号情報のみが'1'となり、その他の識別番号に対応する有効係数符号情報は'0'となっている。
有効係数位置情報符号化部1922は、エントロピー符号化された有効係数位置情報を図示しない統合部へ出力する。
有効係数絶対値情報符号化部1923は、エントロピー符号化された有効係数絶対値情報を図示しない統合部へ出力する。
本実施形態では、有効係数のサインが'正'である場合、有効係数符号情報が表す値は'0'であり、有効係数のサインが'負'である場合、有効係数符号情報が表す値は'1'である。一方、予測画像の周波数係数のサインが'正'である場合、符号判定部18から受け取る値は'0'であり、予測画像の周波数係数のサインが'負'である場合、符号判定部18から受け取る値は'1'である。したがって、有効係数のサインと予測画像の対応する周波数係数のサインが一致する場合、符号一致予測値は'0'となり、一方、有効係数のサインと予測画像の対応する周波数係数のサインが一致しない場合、符号一致予測値は'1'となる。
排他的論理和部1924は、各有効係数に対応する符号一致予測値を含む符号一致予測情報を有効係数符号情報予測符号化部1925へ出力する。
表1010において行1011〜1014は、それぞれ、各有効係数の識別番号、有効係数位置情報、有効係数絶対値情報及び有効係数符号情報を表す。また行1015は、有効係数に対応する予測画像の周波数係数の値を表す。この例では、最初に参照される有効係数に対応する画像1000の左上端の画素値は'227.25'であるため、有効係数の識別番号'1'に対応する行1015中の欄の値も、'227.25'となっている。
そして行1017は、符号一致予測値を表す。この例では、識別番号'2'と'7'に対応する有効係数のサインと予測画像の周波数係数のサインが一致するので、識別番号'2'及び'7'の符号一致予測値は'1'となる。
これに対し、予測誤差画像の各周波数係数の値が'正'となる確率と'負'となる確率は略等しいため、従来技術では、一つの有効係数のサインに対して1ビット割り当てる必要があった。したがって、本実施形態による動画像符号化装置1は、従来技術よりも少ない情報量で、有効係数のサインに関する情報を符号化できる。
あるいは、有効係数符号情報予測符号化部1925がCABACのような適応型の算術符号化方式を用いる場合には、周波数係数ごとに別個に符号一致予測値の出現確率を調べることで、周波数係数ごとに符号一致予測値に割り当てるエントロピー符号を決定してもよい。
一方、予測画像の画素値の分散が小さい場合には、予測画像内に含まれる高周波数成分は少ない。このような場合、符号化対象ブロックに写っている像が予測画像に写っている像に対して変形していても、符号化対象ブロックと予測画像との間で一致しない画素が少なくなる。そのため、予測誤差画像の周波数係数のサインと予測画像の対応する周波数係数のサインも一致する確率が高くなる。その結果として、符号一致予測値の偏り度合いは大きくなる。
有効係数符号情報予測符号化部1925は、予測画像をセレクタ14から受け取って予測画像の分散を求め、その分散に応じて適用するエントロピー符号を切り替える。あるいは、有効係数符号情報予測符号化部1925がCABACのような適応型の算術符号化方式を用いる場合には、分散ごとに別個に符号一致予測値の出現確率を調べることで、分散ごとに符号一致予測値に割り当てるエントロピー符号を決定してもよい。
この場合、各量子化代表値の出現確率は、例えば、テスト用動画像シーケンスに対して求めた補正周波数係数の出現確率分布に基づいて、Llord-Max法により決定される。このようなエントロピー符号は、例えば、ハフマン符号あるいは算術符号とすることができる。これにより、例えば、ハフマン符号が適用される場合、出現確率の高い量子化代表値に対応する量子化係数ほど、符号長の短いエントロピー符号が割り当てられる。また算術符号が適用される場合も、量子化代表値の出現確率に応じてその量子化代表値に対応する量子化係数に割り当てられるエントロピー符号が最適化される。その結果、周波数係数適応符号化部19は、より効率よく量子化係数を符号化できる。
そして逆変換部20は、再生された予測誤差画像を加算器21へ出力する。
さらに、加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って結合することにより、その後に符号化されるピクチャに対する予測画像を生成するために利用される参照ピクチャを生成する。
加算器21は、得られた参照ピクチャを画像メモリ22に記憶させる。
動画像符号化装置1は、予測符号化モードに応じて、符号化対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS102)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測誤差画像生成部15、予測画像直交変換部17及び加算器21へ出力する。
一方、予測画像直交変換部17は、予測画像を直交変換することにより予測画像の複数の周波数係数を算出する(ステップS105)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
非線形量子化部1914は、各補正周波数係数に対して、正の補正周波数係数に対する隣接量子化代表値間の間隔よりも負の補正周波数係数に対する隣接量子化代表値間の間隔が広くなるように定められた量子化代表値のうちの最も近い量子化代表値を求める。そして非線形量子化部1914は、量子化代表値に対応する補正量子化係数を求める(ステップS108)。非線形量子化部1914から出力された補正量子化係数は、適応量子化/逆量子化部191の非線形逆量子化部1915へ入力される。また非線形量子化部1914から出力された補正量子化係数は、乗算器1912により予測誤差画像の対応する周波数のサインと一致するよう、予測画像の対応する周波数のサインが乗じられて各量子化係数が算出される。その後、各量子化係数は、適応量子化係数符号化部192に入力される。
有効係数位置情報符号化部1922は、有効係数の位置情報をエントロピー符号化する。また有効係数絶対値情報符号化部1923は、有効係数の絶対値をエントロピー符号化する(ステップS110)。有効係数位置情報符号化部1922及び有効係数絶対値情報符号化部1923は、それぞれ、エントロピー符号化された有効係数の位置情報及び有効係数の絶対値情報を図示しない統合部へ出力する。
有効係数符号情報予測符号化部1925は、符号一致予測情報をエントロピー符号化する(ステップS112)。そして有効係数符号情報予測符号化部1925は、エントロピー符号化された符号一致予測情報を統合部へ出力する。
また、サイド情報符号化部23は、動きベクトルなどのサイド情報を符号化する(ステップS113)。そしてサイド情報符号化部23は、符号化されたサイド情報を統合部へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS115)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して符号化対象マクロブロック内の、その予測画像及び予測誤差画像に対応するブロックを再生する(ステップS116)。そして加算器21は、再生されたブロックを所定の順序に従って結合することにより、符号化対象マクロブロックを再生する。さらに加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って順次結合することにより、参照ピクチャを作成する。そして加算器21は、参照ピクチャを画像メモリ22に記憶させる。
なお、ステップS102〜S116の処理は、符号化対象マクロブロック内の各ブロックについて実行される。
また、動画像符号化装置1は、ステップS109〜S112の処理の代わりに、各量子化係数に対応する量子化代表値の出現確率に応じたエントロピー符号を各量子化係数に割り当てることで、各量子化係数をエントロピー符号化する処理を実行してもよい。
図13は、第2の実施形態による動画像復号装置の概略構成図である。図13に示されるように、動画像復号装置2は、周波数係数適応復号部24と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測画像直交変換部17と、符号判定部18と、逆変換部20と、加算器21と、画像メモリ22とを有する。
動画像復号装置2が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置2が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置2に実装されてもよい。さらに、動画像復号装置2が有するこれらの各部は、動画像復号装置2が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図13において、動画像復号装置2の各部には、図1に示された動画像符号化装置1の対応する各部の参照番号と同一の参照番号を付した。
動画像復号装置2のイントラ予測部12、動き補償部13、セレクタ14、予測画像直交変換部17、符号判定部18、逆変換部20、加算器21及び画像メモリ22は、それぞれ、動画像符号化装置1の対応する構成要素と同一の構成及び機能を有する。そのため、イントラ予測部12、動き補償部13、セレクタ14、予測画像直交変換部17、符号判定部18、逆変換部20、加算器21及び画像メモリ22の詳細については、動画像符号化装置1の関連する部分の説明を参照されたい。
図14は、予測誤差画像の複数の周波数係数の再生に関する、周波数係数適応復号部24の概略構成図である。
周波数係数適応復号部24は、適応量子化係数復号部241と、適応逆量子化部242とを有する。
また有効係数絶対値情報復号部2412は、動画像符号化装置1の有効係数絶対値情報符号化部1923により用いられたエントロピー符号化方式に従って、エントロピー符号化されている有効係数絶対値情報を復号する。そして有効係数絶対値情報復号部2412は、復号した有効係数絶対値情報を有効係数情報再生部2415へ出力する。
排他的論理和部2414は、符号判定部18から、各有効係数が表す周波数成分と同じ周波数成分を表す予測画像の周波数係数のサインを表す値を受け取る。なお、このサインを表す値は、例えば、第1の実施形態による動画像符号化装置1の排他的論理和部1924が受け取る値と同じ値である。
排他的論理和部2414は、有効係数符号情報予測復号部2413から受け取った符号一致予測情報に含まれる、各有効係数の符号一致予測値と、その有効係数に対応する予測画像の周波数係数のサインを表す値との排他的論理和演算を行う。なお、符号一致予測値は、有効係数の符号情報が表す値と予測画像の対応する周波数係数との排他的論理和である。そのため、符号一致予測値と予測画像の対応する周波数係数との排他的論理和を求めることにより、各有効係数の符号情報が復号される。
排他的論理和部2414は、各有効係数の符号情報を有効係数情報再生部2415へ出力する。
有効係数情報再生部2415は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
そして周波数係数適応複合部24は、再生した各量子化係数を適応逆量子化部242へ出力する。
非線形逆量子化部2423は、動画像符号化装置1の非線形逆量子化部1915と同様に、各補正量子化係数を逆量子化することにより、補正周波数係数を再生する。本実施形態では、非線形逆量子化部2423は、動画像符号化装置1の非線形量子化部1914にて用いられた、補正量子化係数のサインに応じて異なる量子化スケールを用いて逆量子化する。例えば、非線形逆量子化部2423は、(8)式に従って各補正量子化係数を逆量子化する。
あるいは、量子化代表値間の間隔が、補正周波数係数の絶対値に応じて変化するように設定されている場合、非線形逆量子化部2423は、例えば、補正量子化係数と量子化代表値との対応関係を表す参照テーブルを内蔵するメモリに予め記憶しておく。そして非線形逆量子化部2423は、その参照テーブルを参照して、補正量子化係数に対応する量子化代表値を、再生される補正周波数係数として求める。
非線形逆量子化部2423は、再生した各補正周波数係数を乗算器2422へ出力する。
乗算器2422から出力された、再生された各周波数係数は、逆変換部20へ入力される。
なお、動画像符号化装置1と同様に、再生された各周波数係数が逆変換部20にて逆直交変換されることにより、予測誤差画像が再生される。そして加算器21が、その予測誤差画像の各画素の値に、対応する予測画像の画素の値を加算することで、復号対象ブロックが再生される。
周波数係数適応復号部24は、エントロピー符号化された動きベクトルなどのサイド情報を復号する(ステップS201)。そして周波数係数適応復号部24は、イントラ予測部12、動き補償部13及びセレクタ14に対して、サイド情報に含まれる情報のうち、それらの各部で使用される予測符号化モード、動きベクトルなどの情報を出力する。そして動画像復号装置2は、予測符号化モードに応じて、復号対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS202)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測画像直交変換部17及び加算器21へ出力する。
有効係数情報再生部2415は、有効係数の位置情報、絶対値情報及び符号情報に基づいて予測誤差画像の複数の量子化係数を再生する(ステップS208)。そして有効係数情報再生部2415は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
非線形逆量子化部2423は、正の値と負の値とで隣接する量子化代表値間の間隔が異なるように定められた量子化代表値のうち、補正量子化係数に対応する量子化代表値を求めることで各補正量子化係数を逆量子化する。これにより、非線形逆量子化部2423は各補正周波数係数を再生する(ステップS210)。そして非線形逆量子化部2423は、再生した各補正周波数係数を適応逆量子化部242の乗算器2422へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS212)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して復号対象ブロックを再生する(ステップS213)。そして加算器21は、再生された復号対象ブロックを所定の順序に従って結合することにより、復号対象マクロブロックを再生する。さらに加算器21は、再生された復号対象マクロブロックを所定の符号化順序に従って順次結合することにより、ピクチャを再生する。そして加算器21は、再生されたピクチャを出力するとともに、その再生されたピクチャを参照ピクチャとして画像メモリ22に記憶させる。
なお、ステップS202〜S213の処理は、復号対象マクロブロック内の各ブロックについて実行される。
その後、動画像復号装置2は、動画像復号処理を終了する。なお、動画像復号装置2は、ステップS205の処理とステップS206及びS207の処理の順序を入れ換えてもよい。
また、動画像符号化装置1について説明したように、補正量子化係数の量子化代表値の出現確率に応じたエントロピー符号が各量子化係数に割り当てられるよう、各量子化係数がエントロピー符号化されていてもよい。この場合、動画像復号装置2は、ステップS204〜S208の処理の代わりに、適用されたエントロピー符号化方式に従って各量子化係数を復号してもよい。
動画像符号化装置3が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置3が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置3に実装されてもよい。さらに、動画像符号化装置3が有するこれらの各部は、動画像符号化装置3が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
第3の実施形態による動画像符号化装置3は、第1の実施形態による動画像符号化装置1と比較して、周波数係数適応符号化部31のみが異なる。そのため、以下では、周波数係数適応符号化部31について説明する。動画像符号化装置3のその他の各部の詳細については、動画像符号化装置1の関連する部分の説明を参照されたい。
量子化部311は、符号化対象マクロブロック内の各ブロックについての予測誤差画像の複数の周波数係数をそれぞれ量子化する。この場合、上記のように、周波数係数の正の値の出現確率と、周波数係数の負の値の出現確率は略等しい。そこで量子化部311は、周波数係数の符号によらずに決定された量子化代表値を用いて、各周波数係数を量子化する。量子化代表値は、例えば、M. D .Paez, T. H. Glisson, “Minimum Mean-Squared-Error Quantization in Speech PCM and DPCM Systems”, IEEE TRANSACTIONS ON COMMUNICATIONS, 1972年4月, pp.225-230に開示された方法に従って決定される。そして量子化部311は、周波数係数に最も近い量子化代表値を求め、その量子化代表値に対応する量子化係数を、その周波数係数に対する量子化係数として求める。
あるいは、水平方向及び垂直方向の周波数成分のそれぞれに対応する量子化スケールを規定する量子化マトリクスが、予め複数準備され、量子化部311が有するメモリに記憶される。そして量子化部311は、量子化パラメータにしたがって、それら量子化マトリクスのうちの特定の量子化マトリクスを選択する。そして量子化部311は、選択された量子化マトリクスを参照して、周波数信号の各周波数成分に対する量子化スケールを決定してもよい。
逆量子化部312は、再生された予測誤差画像の複数の周波数係数を逆変換部20へ出力する。そして再生された予測誤差画像の各周波数係数は、第1の実施形態による動画像符号化装置1と同様に、参照ピクチャまたは参照ブロックを作成するために利用される。
適応量子化係数符号化部192は、エントロピー符号化された有効係数の位置情報及び絶対値情報とエントロピー符号化された符号一致予測情報とを図示しない統合部へ出力する。そして統合部により、これらのエントロピー符号化された情報とエントロピー符号化されたサイド情報とが所定のフォーマットに従ってデータストリームに格納される。
一方、予測画像直交変換部17は、予測画像を直交変換することにより予測画像の周波数係数の組を算出する(ステップS305)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
有効係数位置情報符号化部1922は、有効係数の位置情報をエントロピー符号化する。また有効係数絶対値情報符号化部1923は、有効係数の絶対値をエントロピー符号化する(ステップS309)。有効係数位置情報符号化部1922及び有効係数絶対値情報符号化部1923は、それぞれ、エントロピー符号化された有効係数の位置情報及び有効係数の絶対値情報を図示しない統合部へ出力する。
有効係数符号情報予測符号化部1925は、符号一致予測情報をエントロピー符号化する(ステップS311)。そして有効係数符号情報予測符号化部1925は、エントロピー符号化された符号一致予測情報を統合部へ出力する。
また、サイド情報符号化部23は、動きベクトルなどのサイド情報を符号化する(ステップS312)。そしてサイド情報符号化部23は、符号化されたサイド情報を統合部へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS314)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して符号化対象マクロブロック内の、その予測画像及び予測誤差画像に対応するブロックを再生する(ステップS315)。そして加算器21は、再生されたブロックを所定の順序に従って結合することにより、符号化対象マクロブロックを再生する。さらに加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って順次結合することにより、参照ピクチャを作成する。そして加算器21は、参照ピクチャを画像メモリ22に記憶させる。
なお、ステップS302〜S315の処理は、符号化対象マクロブロック内の各ブロックについて実行される。
図21は、第4の実施形態による動画像復号装置の概略構成図である。図21に示されるように、動画像復号装置4は、周波数係数適応復号部41と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測画像直交変換部17と、符号判定部18と、逆変換部20と、加算器21と、画像メモリ22とを有する。
動画像復号装置4が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置4が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置4に実装されてもよい。さらに、動画像復号装置4が有するこれらの各部は、動画像復号装置4が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図21において、動画像復号装置4の各部には、図13に示された動画像復号装置2の対応する各部の参照番号と同一の参照番号を付した。
第4の実施形態による動画像復号装置4は、第2の実施形態による動画像復号装置2と比較して、周波数係数適応復号部41のみが異なる。そのため、以下では、周波数係数適応符号化部41について説明する。
適応量子化係数復号部241の有効係数位置情報復号部2411と、有効係数絶対値情報復号部2412は、それぞれ、エントロピー符号化されている有効係数位置情報、有効係数絶対値情報を復号する。また適応量子化係数復号部241の有効係数符号情報予測復号部2413は、エントロピー符号化されている符号一致予測情報を復号する。そして適応量子化係数復号部241の排他的論理和部2414は符号一致予測情報に含まれる有効係数の符号一致予測値と、判定部18から受け取った予測画像の対応する周波数のサインを表す値との排他的論理和演算を行って、有効係数の符号情報を再生する。
そして適応量子化係数復号部241の有効係数情報再生部2415は、有効係数位置情報、有効係数絶対値情報及び有効係数符号情報に基づいて、複数の量子化係数を再生する。適応量子化係数復号部241は、再生した量子化係数を逆量子化部411へ出力する。
あるいは、逆量子化部411は、量子化代表値と量子化係数との関係を表す参照テーブルを参照して、量子化係数に対応する量子化代表値を、再生される周波数係数として求めてもよい。
逆量子化部411は、再生された予測誤差画像の複数の周波数係数を逆変換部20へ出力する。
そして動画像復号装置2と同様に、再生された各周波数係数が逆変換部20にて逆直交変換されることにより、予測誤差画像が再生される。そして加算器21が、その予測誤差画像の各画素の値に、対応する予測画像の画素の値を加算することで、復号対象ブロックが再生される。
周波数係数適応復号部41は、エントロピー符号化された動きベクトルなどのサイド情報を復号する(ステップS401)。そして周波数係数適応復号部41は、イントラ予測部12、動き補償部13及びセレクタ14に対して、サイド情報に含まれる情報のうち、それらの各部で使用される予測符号化モード、動きベクトルなどの情報を出力する。そして動画像復号装置2は、予測符号化モードに応じて、復号対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS402)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測画像直交変換部17及び加算器21へ出力する。
また、適応量子化係数復号部241の有効係数符号情報予測復号部2413は、符号一致予測情報をエントロピー復号する(ステップS406)。そして有効係数符号情報予測復号部2413は、復号された符号一致予測情報を適応量子化係数復号部241の排他的論理和部2414へ出力する。そして排他的論理和部2414は、符号一致予測情報に含まれる各符号一致予測値と予測画像の対応する周波数のサインとの排他的論理和を求めることにより、有効係数の符号情報を再生する(ステップS407)。排他的論理和部2414は、有効係数の符号情報を有効係数情報再生部2415へ出力する。
有効係数情報再生部2415は、有効係数の位置情報、絶対値情報及び符号情報に基づいて予測誤差画像の複数の量子化係数を再生する(ステップS408)。そして有効係数情報再生部2415は、再生した予測誤差画像の複数の量子化係数を周波数係数適応復号部41の逆量子化部413へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS410)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して復号対象ブロックを再生する(ステップS411)。そして加算器21は、再生された復号対象ブロックを所定の順序に従って結合することにより、復号対象マクロブロックを再生する。さらに加算器21は、再生された復号対象マクロブロックを所定の符号化順序に従って順次結合することにより、ピクチャを再生する。そして加算器21は、再生されたピクチャを出力するとともに、その再生されたピクチャを参照ピクチャとして画像メモリ22に記憶させる。
なお、ステップS402〜S411の処理は、復号対象マクロブロック内の各ブロックについて実行される。
その後、動画像復号装置4は、動画像復号処理を終了する。なお、動画像復号装置2は、ステップS405の処理とステップS406及びS407の処理の順序を入れ換えてもよい。
動画像符号化装置5が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置5が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置5に実装されてもよい。さらに、動画像符号化装置5が有するこれらの各部は、動画像符号化装置5が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
第5の実施形態による動画像符号化装置5は、第1の実施形態による動画像符号化装置1と比較して、周波数係数適応符号化部51のみが異なる。そのため、以下では、周波数係数適応符号化部51について説明する。動画像符号化装置5のその他の各部の詳細については、動画像符号化装置1の関連する部分の説明を参照されたい。
適応量子化/逆量子化部191は、さらに、補正量子化係数に、予測画像の対応する周波数係数のサインを乗じて、補正量子化係数のサインを予測誤差画像の対応する周波数係数のサインと一致させることで、予測誤差画像の周波数係数に対する量子化係数とする。そして適応量子化/逆量子化部191は、各量子化係数を量子化係数符号化部511へ出力する。
有効係数位置情報符号化部5112は、エントロピー符号化された有効係数位置情報を図示しない統合部へ出力する。
有効係数絶対値情報符号化部5113は、エントロピー符号化された有効係数絶対値情報を図示しない統合部へ出力する。
有効係数符号情報符号化部5114は、符号化された有効係数符号情報を図示しない統合部へ出力する。
動画像符号化装置5は、予測符号化モードに応じて、符号化対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS502)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測誤差画像生成部15、予測画像直交変換部17及び加算器21へ出力する。
一方、予測画像直交変換部17は、予測画像を直交変換することにより予測画像の複数の周波数係数を算出する(ステップS505)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
非線形量子化部1914は、各補正周波数係数に対して、正の補正周波数係数に対する隣接量子化代表値間の間隔よりも負の補正周波数係数に対する隣接量子化代表値間の間隔が広くなるように定められた量子化代表値のうちの最も近い量子化代表値を求める。そして非線形量子化部1914は、量子化代表値に対応する補正量子化係数を求める(ステップS508)。そして非線形量子化部1914から出力された補正量子化係数は、適応量子化/逆量子化部191の非線形逆量子化部1915へ入力される。また非線形量子化部1914から出力された補正量子化係数は、乗算器1912により予測誤差画像の対応する周波数のサインと一致するよう、予測画像の対応する周波数のサインが乗じられて各量子化係数が算出される。その後、各量子化係数は、量子化係数符号化部511に入力される。
有効係数位置情報符号化部5112は、有効係数の位置情報をエントロピー符号化する。また有効係数絶対値情報符号化部5113は、有効係数の絶対値をエントロピー符号化する(ステップS510)。有効係数位置情報符号化部5112及び有効係数絶対値情報符号化部5113は、それぞれ、エントロピー符号化された有効係数の位置情報及び有効係数の絶対値情報を図示しない統合部へ出力する。
また、サイド情報符号化部23は、動きベクトルなどのサイド情報を符号化する(ステップS512)。そしてサイド情報符号化部23は、符号化されたサイド情報を統合部へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS514)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して、符号化対象マクロブロック内のその予測画像及び予測誤差画像に対応するブロックを再生する(ステップS515)。そして加算器21は、再生されたブロックを所定の順序に従って結合することにより、符号化対象マクロブロックを再生する。さらに加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って順次結合することにより、参照ピクチャを作成する。そして加算器21は、参照ピクチャを画像メモリ22に記憶させる。
なお、ステップS502〜S515の処理は、符号化対象マクロブロック内の各ブロックについて実行される。
図29は、第6の実施形態による動画像復号装置の概略構成図である。図29に示されるように、動画像復号装置6は、周波数係数適応復号部61と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測画像直交変換部17と、判定部18と、逆変換部20と、加算器21と、画像メモリ22とを有する。
動画像復号装置6が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置6が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置6に実装されてもよい。さらに、動画像復号装置6が有するこれらの各部は、動画像復号装置6が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図29において、動画像復号装置6の各部には、図13に示された動画像復号装置2の対応する各部の参照番号と同一の参照番号を付した。
第6の実施形態による動画像復号装置6は、第2の実施形態による動画像復号装置2と比較して、周波数係数適応復号部61のみが異なる。そのため、以下では、周波数係数適応符号化部61について説明する。
また有効係数絶対値情報復号部6112は、動画像符号化装置5の有効係数絶対値情報符号化部5113により用いられたエントロピー符号化方式に従って、エントロピー符号化されている有効係数絶対値情報を復号する。そして有効係数絶対値情報復号部6112は、復号した有効係数絶対値情報を有効係数情報再生部6114へ出力する。
有効係数情報再生部6114は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
適応逆量子化部242は、予測誤差画像の量子化係数の組に基づいて、予測誤差画像の複数の周波数係数を再生する。適応逆量子化部242は、予測誤差画像の各量子化係数に、予測画像の対応する周波数係数のサインを乗じることで、補正量子化係数を再生する。そして適応逆量子化部242は、補正量子化係数に対して、正の値と負の値とで異なる量子化スケールの値を用い、(8)式に従って逆量子化することにより各補正周波数係数を再生する。
あるいは、量子化代表値間の間隔が、補正周波数係数の絶対値に応じて変化するように設定されている場合、適応逆量子化部242は、例えば、補正量子化係数と量子化代表値との対応関係を表す参照テーブルを参照する。そして適応逆量子化部242は、補正量子化係数に対応する量子化代表値を、再生される補正周波数係数として求めてもよい。
さらに適応逆量子化部242は、再生された各補正周波数係数に、予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の各周波数係数を再生する。
再生された各周波数係数は、逆変換部20へ入力される。
なお、動画像符号化装置1と同様に、再生された各周波数係数が逆変換部20にて逆直交変換されることにより、予測誤差画像が再生される。そして加算器21が、その予測誤差画像の各画素の値に、対応する予測画像の画素の値を加算することで、復号対象ブロックが再生される。
周波数係数適応復号部61は、エントロピー符号化された動きベクトルなどのサイド情報を復号する(ステップS601)。そして周波数係数適応復号部61は、イントラ予測部12、動き補償部13及びセレクタ14に対して、サイド情報に含まれる情報のうち、それらの各部で使用される予測符号化モード、動きベクトルなどの情報を出力する。そして動画像復号装置6は、予測符号化モードに応じて、復号対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS602)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測画像直交変換部17及び加算器21へ出力する。
また、量子化係数復号部611の有効係数符号情報復号部6113は、有効係数のサインを表すビットを参照して有効係数のサインを求める(ステップS606)。そして有効係数符号情報復号部6113は、有効係数のサインを有効係数情報再生部6114へ出力する。
有効係数情報再生部6114は、有効係数の位置情報、絶対値情報及び符号情報に基づいて予測誤差画像の複数の量子化係数を再生する(ステップS607)。そして有効係数情報再生部6114は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
非線形逆量子化部2423は、正の値と負の値とで隣接する量子化代表値間の間隔が異なるように定められた量子化代表値のうち、補正量子化係数に対応する量子化代表値を求めることで各補正量子化係数を逆量子化する。これにより、非線形逆量子化部2423は各補正周波数係数を再生する(ステップS609)。そして非線形逆量子化部2423は、再生した各補正周波数係数を適応逆量子化部242の乗算器2422へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS611)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して復号対象ブロックを再生する(ステップS612)。そして加算器21は、再生された復号対象ブロックを所定の順序に従って結合することにより、復号対象マクロブロックを再生する。さらに加算器21は、再生された復号対象マクロブロックを所定の符号化順序に従って順次結合することにより、ピクチャを再生する。そして加算器21は、再生されたピクチャを出力するとともに、その再生されたピクチャを参照ピクチャとして画像メモリ22に記憶させる。
なお、ステップS602〜S612の処理は、復号対象マクロブロック内の各ブロックについて実行される。
その後、動画像復号装置6は、動画像復号処理を終了する。なお、動画像復号装置6は、ステップS605の処理とステップS606の処理の順序を入れ換えてもよい。
コンピュータ100が有するこれらの各部は、データ及び制御信号を伝送するためのバス108を介して相互に接続されている。
通信インターフェース102は、例えば、コンピュータ100を通信ネットワークへ接続するためのインターフェース回路を有する。そして通信インターフェース102は、通信ネットワーク(図示せず)を介して他の機器から符号化対象の動画像データまたは復号対象の符号化された動画像データを取得し、それらのデータをプロセッサ106へ渡す。あるいは、通信インターフェース102は、符号化された動画像データまたは復号された動画像データをプロセッサ106から受け取り、それらのデータを通信ネットワークを介して他の機器へ出力する。
可搬記録媒体駆動装置104は、光記録媒体またはメモリカードといった持ち運び可能な可搬記録媒体109を駆動するための駆動装置である。そして可搬記録媒体駆動装置104は、例えば、可搬記録媒体109に記録された、上記の実施形態の何れかによる動画像符号化方法または動画像復号方法をコンピュータに実行させるためのコンピュータプログラムを読み込む。そして可搬記録媒体駆動装置104は、そのコンピュータプログラムをプロセッサ106に渡す。あるいは可搬記録媒体駆動装置104は、可搬記録媒体109に記録された符号化対象の動画像データまたは復号対象の符号化された動画像データを読み込み、それらのデータをプロセッサ106へ渡してもよい。さらに、可搬記録媒体駆動装置104は、符号化された動画像データまたは復号された動画像データをプロセッサ106から受け取り、それらのデータを可搬記録媒体109に書き込んでもよい。
外部記憶装置105は、例えば、ハードディスク装置といった磁気記憶装置である。そして外部記憶装置105は、例えば、上記の実施形態の何れかによる動画像符号化方法または動画像復号方法をコンピュータに実行させるためのコンピュータプログラムを記憶する。あるいは、外部記憶装置105は、符号化対象の動画像データまたは復号対象の符号化された動画像データを記憶する。
またプロセッサ106は、動画像データまたは符号化された動画像データを、通信インターフェース102または可搬記録媒体駆動装置104から受け取り、そのデータをメモリ103に一時的に記憶させたり、あるいは、外部記憶装置105に記憶させる。
さらにプロセッサ106は、符号化した動画像データまたは復号した動画像データを通信インターフェース102、可搬記録媒体駆動装置104、外部記憶装置105または出力装置107へ出力する。
出力装置107は、例えば、液晶ディスプレイを有する。そして出力装置107は、復号された動画像データをプロセッサ106から受け取って、その動画像データに含まれる各ピクチャを表示する。
2、4、6 動画像復号装置
11 予測モード判定部
12 イントラ予測部
13 動き補償部
14 セレクタ
15 予測誤差画像生成部
16 予測誤差直交変換部
17 予測画像直交変換部
18 符号判定部
19、31、51 周波数係数適応符号化部
20 逆変換部
21 加算器
22 画像メモリ
23 サイド情報符号化部
191 適応量子化/逆量子化部
1911〜1913 乗算器
1914 非線形量子化部
1915 非線形逆量子化部
192 適応量子化係数符号化部
1921 有効係数情報生成部
1922 有効係数位置情報符号化部
1923 有効係数絶対値情報符号化部
1924 排他的論理和部
1925 有効係数符号情報予測符号化部
24、41、61 周波数係数適応復号部
241 適応量子化係数復号部
2411 有効係数位置情報復号部
2412 有効係数絶対値情報復号部
2413 有効係数符号情報予測復号部
2414 排他的論理和部
2415 有効係数情報再生部
242 適応逆量子化部
2421、2422 乗算器
2423 非線形逆量子化部
311 量子化部
312 逆量子化部
411 逆量子化部
511 量子化係数符号化部
5111 有効係数情報生成部
5112 有効係数位置情報符号化部
5113 有効係数絶対値情報符号化部
5114 有効係数符号情報符号化部
611 量子化係数復号部
6111 有効係数位置情報復号部
6112 有効係数絶対値情報復号部
6113 有効係数符号情報復号部
6114 有効係数情報再生部
100 コンピュータ
101 入力装置
102 通信インターフェース
103 メモリ
104 可搬記録媒体駆動装置
105 外部記憶装置
106 プロセッサ
107 出力装置
108 バス
109 可搬記録媒体
Claims (15)
- 動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、該符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成する予測画像生成部と、
前記符号化対象ブロックと前記予測画像間で差分演算することにより前記符号化対象ブロックの予測誤差画像を生成する予測誤差画像生成部と、
前記予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出する予測誤差直交変換部と、
前記予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、
前記複数の第2の周波数係数のそれぞれの正負の符号を判定する符号判定部と、
前記複数の第1の周波数係数のそれぞれの正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を符号化する適応符号化部と、
を有する動画像符号化装置。 - 前記適応符号化部は、前記複数の第1の周波数係数のそれぞれについて、当該第1の周波数係数の正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該第1の周波数係数の絶対値と同一の絶対値を持つ補正周波数係数を前記符号一致情報として算出し、前記補正周波数係数を、複数の量子化代表値のうちの当該補正周波数係数に最も近い量子化代表値に対応する量子化係数を求めることで量子化し、かつ、前記複数の量子化代表値は、出現確率の低い前記補正周波数係数の値に対応する量子化代表値ほど、隣接する量子化代表値間の間隔が広くなるように設定される適応量子化部を有する請求項1に記載の動画像符号化装置。
- 前記適応符号化部は、前記量子化係数に対して、当該量子化係数に対応する前記量子化代表値の出現確率に応じたエントロピー符号を割り当てることで前記量子化係数をエントロピー符号化する適応量子化係数符号化部をさらに有する、請求項2に記載の動画像符号化装置。
- 前記適応符号化部は、前記複数の第1の周波数係数のそれぞれについて、当該第1の周波数係数の正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該第1の周波数係数の絶対値と同一の絶対値を持つ補正周波数係数を前記符号一致情報として算出し、前記第1の周波数係数の正負の符号が前記第2の周波数係数の正負の符号と一致する場合、前記補正周波数係数を第1の量子化スケールを用いて量子化し、一方、前記第1の周波数係数の正負の符号が前記第2の周波数係数の正負の符号と一致しない場合、前記補正周波数係数を前記第1の量子化スケールよりも大きい第2の量子化スケールを用いて量子化する適応量子化部を有する請求項1に記載の動画像符号化装置。
- 前記適応符号化部は、
前記複数の第1の周波数係数のそれぞれを所定の量子化スケールを用いて量子化することにより複数の量子化係数を算出する量子化部と、
前記複数の量子化係数のうち、0でない値を持つ量子化係数である有効係数の正負の符号と、前記複数の第2の周波数係数のうち、当該有効係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致予測情報を前記符号一致情報として算出し、前記符号一致予測情報をエントロピー符号化する適応量子化係数符号化部と、
を有する請求項1または2に記載の動画像符号化装置。 - 符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、該復号対象ピクチャの復号対象ブロックに対する予測画像を生成する予測画像生成部と、
前記予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、
前記複数の第2の周波数係数のそれぞれの正負の符号を判定する符号判定部と、
前記復号対象ブロックと前記予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表し、前記符号化された動画像データに含まれる符号一致情報を用いて前記複数の第1の周波数係数を復号する適応復号部と、
前記複数の第1の周波数係数を逆直交変換することにより前記予測誤差画像を再生する逆変換部と、
前記予測誤差画像の各画素の値に前記予測画像の対応する画素の値を加算することにより、前記復号対象ブロックを再生する加算器と、
を有する動画像復号装置。 - 前記適応復号部は、
前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数について、当該量子化係数の正負の符号と、前記複数の第2の周波数係数のうちの当該量子化係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該量子化係数の絶対値と同一の絶対値を持つ補正量子化係数を前記符号一致情報を用いて算出し、
前記補正量子化係数を、複数の量子化代表値のうちの当該補正量子化係数に対応する量子化代表値を求めることで逆量子化し、かつ、前記複数の量子化代表値は、出現確率の低い前記補正量子化係数の値に対応する量子化代表値ほど、隣接する量子化代表値間の間隔が広くなるように設定される適応逆量子化部を有する請求項6に記載の動画像復号装置。 - 前記複数の量子化係数のそれぞれは、当該量子化係数に対応する前記量子化代表値の出現確率に応じたエントロピー符号に符号化されており、
前記適応復号部は、前記エントロピー符号に対応する量子化係数を求めることにより、前記量子化係数をエントロピー復号する適応量子化係数復号部をさらに有する、請求項7に記載の動画像復号装置。 - 前記適応復号部は、
前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数について、当該量子化係数の正負の符号と、前記複数の第2の周波数係数のうちの当該量子化係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該量子化係数の絶対値と同一の絶対値を持つ補正量子化係数を前記符号一致情報を用いて算出し、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致する場合、前記補正量子化係数を第1の量子化スケールを用いて逆量子化し、一方、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致しない場合、前記補正量子化係数を前記第1の量子化スケールよりも大きい第2の量子化スケールを用いて逆量子化することにより、前記複数の第1の周波数係数を復号する適応逆量子化部を有する請求項6に記載の動画像復号装置。 - 前記適応復号部は、
前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数のうち、0でない値を持つ量子化係数である有効係数の正負の符号と、前記複数の第2の周波数係数のうち、当該有効係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す、前記符号一致情報である符号一致予測情報をエントロピー復号し、当該符号一致予測情報に基づいて前記有効係数の正負の符号を求めることで前記複数の量子化係数を再生する適応量子化係数復号部と、
前記複数の量子化係数のそれぞれを所定の量子化スケールを用いて逆量子化することにより前記複数の第1の周波数係数を復号する逆量子化部と、
を有する請求項6または7に記載の動画像復号装置。 - 前記適応復号部は、
前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数のうち、0でない値を持つ量子化係数である有効係数の正負の符号と、前記複数の第2の周波数係数のうち、当該有効係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す、前記符号一致情報である符号一致予測情報をエントロピー復号し、当該符号一致予測情報に基づいて前記有効係数の正負の符号を求めることで前記複数の量子化係数を再生する適応量子化係数復号部と、
前記複数の量子化係数のそれぞれについて、当該量子化係数の正負の符号と、前記複数の第2の周波数係数のうちの当該量子化係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該量子化係数の絶対値と同一の絶対値を持つ補正量子化係数を前記符号一致情報を用いて算出し、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致する場合、前記補正量子化係数を第1の量子化スケールを用いて逆量子化し、一方、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致しない場合、前記補正量子化係数を前記第1の量子化スケールよりも大きい第2の量子化スケールを用いて逆量子化することにより、前記複数の第1の周波数係数を復号する適応逆量子化部と、
を有する請求項6に記載の動画像復号装置。 - 動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、該符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成し、
前記符号化対象ブロックと前記予測画像間で差分演算することにより前記符号化対象ブロックの予測誤差画像を生成し、
前記予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出し、
前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
前記複数の第1の周波数係数のそれぞれの正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を符号化する、
ことを含む動画像符号化方法。 - 符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、該復号対象ピクチャの復号対象ブロックに対する予測画像を生成し、
前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
前記復号対象ブロックと前記予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表し、前記符号化された動画像データに含まれる符号一致情報を用いて前記複数の第1の周波数係数を復号し、
前記複数の第1の周波数係数を逆直交変換することにより前記予測誤差画像を再生し、
前記予測誤差画像の各画素の値に前記予測画像の対応する画素の値を加算することにより、前記復号対象ブロックを再生する、
ことを含む動画像復号方法。 - 動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、該符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成し、
前記符号化対象ブロックと前記予測画像間で差分演算することにより前記符号化対象ブロックの予測誤差画像を生成し、
前記予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出し、
前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
前記複数の第1の周波数係数のそれぞれの正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を符号化する、
ことをコンピュータに実行させる動画像符号化用コンピュータプログラム。 - 符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、該復号対象ピクチャの復号対象ブロックに対する予測画像を生成し、
前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
前記復号対象ブロックと前記予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表し、前記符号化された動画像データに含まれる符号一致情報を用いて前記複数の第1の周波数係数を復号し、
前記複数の第1の周波数係数を逆直交変換することにより前記予測誤差画像を再生し、
前記予測誤差画像の各画素の値に前記予測画像の対応する画素の値を加算することにより、前記復号対象ブロックを再生する、
ことをコンピュータに実行させる動画像復号用コンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/067135 WO2012042646A1 (ja) | 2010-09-30 | 2010-09-30 | 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012042646A1 JPWO2012042646A1 (ja) | 2014-02-03 |
JP5590133B2 true JP5590133B2 (ja) | 2014-09-17 |
Family
ID=45892150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012536091A Active JP5590133B2 (ja) | 2010-09-30 | 2010-09-30 | 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9509988B2 (ja) |
JP (1) | JP5590133B2 (ja) |
CN (1) | CN103141101B (ja) |
WO (1) | WO2012042646A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8958604B2 (en) * | 2013-03-25 | 2015-02-17 | Schlumberger Technology Corporation | LWD real-time borehole image transmission |
KR101641523B1 (ko) * | 2013-03-26 | 2016-07-21 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 다층 vdr 코딩에서의 지각적으로-양자화된 비디오 콘텐트의 인코딩 |
FR3012714A1 (fr) * | 2013-10-25 | 2015-05-01 | Orange | Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants |
FR3014278A1 (fr) * | 2013-11-29 | 2015-06-05 | Orange | Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants |
DE102014101307A1 (de) * | 2014-02-03 | 2015-08-06 | Osram Opto Semiconductors Gmbh | Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren |
FR3023112A1 (fr) * | 2014-06-27 | 2016-01-01 | Bcom | Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes |
FR3046321B1 (fr) * | 2015-12-29 | 2018-01-26 | B<>Com | Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes |
US10657674B2 (en) * | 2016-06-17 | 2020-05-19 | Immersive Robotics Pty Ltd. | Image compression method and apparatus |
CN106231318B (zh) * | 2016-09-30 | 2020-04-28 | 浙江宇视科技有限公司 | 一种基于量化变换系数的视频加扰方法及装置 |
US10666937B2 (en) * | 2016-12-21 | 2020-05-26 | Qualcomm Incorporated | Low-complexity sign prediction for video coding |
CN110495107A (zh) | 2017-02-08 | 2019-11-22 | 因默希弗机器人私人有限公司 | 用于移动设备通信的天线控制 |
AU2018280337B2 (en) | 2017-06-05 | 2023-01-19 | Immersive Robotics Pty Ltd | Digital content stream compression |
CN107689950B (zh) | 2017-06-23 | 2019-01-29 | 平安科技(深圳)有限公司 | 数据发布方法、装置、服务器和存储介质 |
EP3714602A4 (en) | 2017-11-21 | 2021-07-28 | Immersive Robotics Pty Ltd | DIGITAL REALITY IMAGE COMPRESSION |
US11553187B2 (en) | 2017-11-21 | 2023-01-10 | Immersive Robotics Pty Ltd | Frequency component selection for image compression |
WO2019150411A1 (ja) * | 2018-01-30 | 2019-08-08 | 富士通株式会社 | 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム |
CN111819852B (zh) * | 2018-03-07 | 2023-06-02 | 华为技术有限公司 | 用于变换域中残差符号预测的方法及装置 |
CN108460288B (zh) * | 2018-04-02 | 2022-02-08 | 惠州学院 | 大数据安全加密方法、装置、存储介质及移动终端 |
CN109379508B (zh) * | 2018-09-18 | 2019-09-06 | 湖北工程学院 | 一种联合加密与压缩的图像保护方法、存储介质 |
CN112019701B (zh) * | 2020-09-08 | 2021-09-21 | 中国人民解放军海军航空大学 | 一种采用非线性低通滤波实现图像加密的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001016588A (ja) * | 1999-06-28 | 2001-01-19 | Toshikazu Akama | 信号処理システム |
JP2002314428A (ja) * | 2001-04-09 | 2002-10-25 | Ntt Docomo Inc | 信号符号化方法及び装置並びに復号方法及び装置 |
JP2007116695A (ja) * | 2005-10-19 | 2007-05-10 | Samsung Electronics Co Ltd | ある階層のフラグを階層間の連関性を用いて符号化する方法、前記符号化されたフラグを復号化する方法、及び装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4343120B2 (ja) * | 2005-01-21 | 2009-10-14 | ソニー株式会社 | 画像検索装置及び方法、並びにプログラム及びプログラム記録媒体 |
KR100714706B1 (ko) * | 2005-09-26 | 2007-05-04 | 삼성전자주식회사 | 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치 |
KR100750138B1 (ko) * | 2005-11-16 | 2007-08-21 | 삼성전자주식회사 | 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치 |
ATE515889T1 (de) * | 2007-03-14 | 2011-07-15 | Nippon Telegraph & Telephone | Vorrichtung und verfahren zur schätzung von codemengen, programm und aufzeichnungsmedium dafür |
JP5219089B2 (ja) * | 2009-04-30 | 2013-06-26 | 株式会社メガチップス | 画像データの生成方法 |
US8675726B2 (en) * | 2010-02-18 | 2014-03-18 | Blackberry Limited | Method and encoder for constrained soft-decision quantization in data compression |
-
2010
- 2010-09-30 WO PCT/JP2010/067135 patent/WO2012042646A1/ja active Application Filing
- 2010-09-30 CN CN201080069302.4A patent/CN103141101B/zh active Active
- 2010-09-30 JP JP2012536091A patent/JP5590133B2/ja active Active
-
2013
- 2013-03-21 US US13/848,288 patent/US9509988B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001016588A (ja) * | 1999-06-28 | 2001-01-19 | Toshikazu Akama | 信号処理システム |
JP2002314428A (ja) * | 2001-04-09 | 2002-10-25 | Ntt Docomo Inc | 信号符号化方法及び装置並びに復号方法及び装置 |
JP2007116695A (ja) * | 2005-10-19 | 2007-05-10 | Samsung Electronics Co Ltd | ある階層のフラグを階層間の連関性を用いて符号化する方法、前記符号化されたフラグを復号化する方法、及び装置 |
Also Published As
Publication number | Publication date |
---|---|
US9509988B2 (en) | 2016-11-29 |
CN103141101A (zh) | 2013-06-05 |
WO2012042646A1 (ja) | 2012-04-05 |
CN103141101B (zh) | 2016-05-11 |
US20130215961A1 (en) | 2013-08-22 |
JPWO2012042646A1 (ja) | 2014-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5590133B2 (ja) | 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム | |
US9392282B2 (en) | Moving-picture encoding apparatus and moving-picture decoding apparatus | |
JP5957561B2 (ja) | 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置 | |
EP2678944B1 (en) | Methods and devices for data compression using offset-based adaptive reconstruction levels | |
RU2527751C2 (ru) | Устройство и способ обработки изображений | |
US20070110153A1 (en) | Method, medium, and apparatus encoding and/or decoding an image using the same coding mode across components | |
JP7283024B2 (ja) | 画像の符号化方法、復号化方法、エンコーダ、およびデコーダ | |
WO2008004768A1 (en) | Image encoding/decoding method and apparatus | |
CN102077595A (zh) | 图像处理装置和方法 | |
US11812021B2 (en) | Coding of quantization matrices using parametric models | |
CN105850124B (zh) | 使用量化误差的额外的控制编码、解码视频信号的方法和装置 | |
JP2015170994A (ja) | 画像処理装置および方法、画像符号化装置および方法、並びに、画像復号装置および方法 | |
JP2016213615A (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
KR101596085B1 (ko) | 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법 | |
WO2022195409A1 (en) | Method, apparatus and computer program product for end-to-end learned predictive coding of media frames | |
KR20110048004A (ko) | 움직임 벡터 해상도 제한을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
KR101911587B1 (ko) | 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법 | |
CN111587575B (zh) | 基于高频归零确定变换系数扫描顺序的方法及其设备 | |
KR102020953B1 (ko) | 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템 | |
JP6402520B2 (ja) | 符号化装置、方法、プログラム及び機器 | |
Shen | High efficiency image/video coding techniques | |
EP3533225A1 (en) | Method and apparatus for encoding and decoding a picture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5590133 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |