[go: up one dir, main page]

JP2005515729A - ビデオ符号化方法 - Google Patents

ビデオ符号化方法 Download PDF

Info

Publication number
JP2005515729A
JP2005515729A JP2003561251A JP2003561251A JP2005515729A JP 2005515729 A JP2005515729 A JP 2005515729A JP 2003561251 A JP2003561251 A JP 2003561251A JP 2003561251 A JP2003561251 A JP 2003561251A JP 2005515729 A JP2005515729 A JP 2005515729A
Authority
JP
Japan
Prior art keywords
gof
motion
cof
encoding method
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003561251A
Other languages
English (en)
Inventor
ベネティエール,マリオン
ボトロー,ヴァンサン
ポワソン,ニコラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005515729A publication Critical patent/JP2005515729A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本発明はビデオシーケンスに適用される符号化方法で、前記ビデオシーケンスは連続するフレームのグループ(GOF)に分割され、さらに前記GOFは参照フレーム及び現フレームを有する連続するフレームの対(COF)に分割されるようなビデオシーケンスに適用される符号化方法であって、各フレームの対(COF)に適用する動き予測工程、分解を時空サブバンドによって定義するために各GOFに対して動きベクトル場に基づく動き補償時間的解析及び空間ウェーブレット変換を適用する動き補償3次元(3D)サブバンド動き補償分解工程、時空サブバンドを量子化し符号化するための符号化工程、及び制御工程を有する符号化方法に関する。本発明によると、処理対象となるGOFにおける連続するCOFに対する動き補償工程の方向は所定の方式によって決定され、好適にはこの方式は連続するCOFに対して動き補償工程の方向を交互に変更する方式あるいは動き予測及び補償処理がエネルギー条件に基づいて選択される限られた数のCOFに集中されるように設定される任意変更方式に相当する。

Description

本発明は一般にデータ圧縮の分野に関し、特にビデオシーケンスに適用される符号化方法で、このビデオシーケンスは連続するフレームのグループ(GOF:Groups of Frames)に分割され、さらにこのGOFは参照フレーム及び現フレームを有する連続するフレームの対(COF:Couple of Frames)に分割されるようなビデオシーケンスに適用される符号化方法であって、
(A) 各GOFにおける各フレームの対(COF)の参照フレームと現フレームとの間の動きベクトル場を定義するために前記各COFに適用する動き予測工程、
(B) 分解を時空サブバンドによって定義するために各GOFに対して前記動きベクトル場に基づく動き補償時間的解析及び空間ウェーブレット変換を適用する動き補償3次元(3D)サブバンド動き補償分解工程、
(C) 前記時空サブバンドを量子化し符号化するための符号化工程、及び
(D) 前記符号化工程の出力で観測されるバッファーステータスに基づいて前記動きベクトル場と前記時空サブバンドとの間で共用されるビットレート配分を定義するための制御工程を有する符号化方法に関する。
デジタル機器のネットワーク帯域幅及び記憶容量は著しく増加しているものの、これに優るマルチメディアコンテンツの大きさの増大によりビデオ圧縮技術は現在においても重要な役割を担う。さらに多くのアプリケーションは高い圧縮効率だけでなく高い柔軟性を必要とする。例えば異質のネットワーク間においてビデオを伝送する場合SNR拡張性が要され、それぞれの演算能力や、表示能力、記憶容量などに応じて復号化を実行する各種デジタル端末によって復号されることが可能な圧縮ビデオビットストリームを生成するためには空間的/時間的拡張性が要される。
現在MPEG−4などの規格は、予測DCTベースのフレームワークにおいて高価なレイヤを付加して限られた拡張性を実現する。最近ではより効率的な対策として、静止画像の符号化技術をビデオ符号化技術に拡張して3Dウェーブレット分解を実行した後時空ツリーの階層符号化を実行する方法が提案されている。3D空間としてみなされるフレームのシーケンスの3D(又は2D+t)ウェーブレット分解は、自然な空間分解能及びフレーム率拡張性を提供し、階層ツリーにおいて生成された係数の深さ方向スキャニング(ウェーブレット変換により得られる係数は階層的ピラミッドを構成し、ここにおいて時空関係はこれら係数間の親子関係を示す3次元方向性ツリーによって定義される)及びプログレッシブ・ビットプレーン符号化技術によって所望の拡張性が得られる。よって符号化効率に関して比較的低いコストでより高い柔軟性が得られる。
従来技術において上記のようなアプローチを適用するいくつかの例がある。このような例では、一般的に入力ビデオシーケンスはGOF(Groups of Frames)に分割され、それぞれのGOFはさらに連続するフレームの対(これはいわゆるMCTF(Motion−Compensated Temporal Filtering)モジュールのための入力の数だけある)に分割される。具体的には各GOFは図1に示されるようにまず動き補償処理(MC)され、時間フィルタリング処理(TF)される。これによって得られる第1時間分解レベルにおける低周波数(L)時間サブバンドはさらに時間フィルタリング処理(TF)され、この処理は低周波数サブバンドが2つだけになった時点で終了する(根元時間サブバンドが得られるまで)。この2つのサブバンドはそれぞれGOFを半々に分けたときの第1部分及び第2部分の時間的近似値を表す。図1の例では、GOFのフレームはそれぞれF1〜F8とされ、点線の矢印はハイパス時間的フィルタリング処理を示し、一方で実線矢印はローパス時間的フィルタリング処理を示す。ここでは3段階の分解が示される(LとH=第1段階、LLとLH=第2段階、LLLとLLH=第3段階)。また、この例で示される8フレームからなるGOFの各時間分解レベルでは動きベクトル場が生成される(第1段階ではMV4、第2段階ではMV3、第3段階ではMV2)。
時間分解にハールのマルチ分解能解析が適用される場合、各時間分解レベルにおいて2つのフレームごとに1つの動きベクトル場が生成されるため、生成される動きベクトル場の数は時間サブバンド内のフレームの数の半分に等しくなる。よってこの例では動きベクトル場は第1レベルでは4つ、第2レベルでは2つ、第3レベルでは1つ生成される。動き予測(ME:Motion Estimation)及び動き補償(MC:Motion Compensation)は入力シーケンスにおける2つのフレームごとについて実施され、時間ツリー全体についてのMCTF処理において要されるME/MC処理の数はおおよそ予測方式におけるこの数と同様である。このような単純なフィルタを用いて低周波数の時間サブバンドは入力フレーム対の時間的平均を表し、高周波数のサブバンドはMCTF工程後の残差を含む。
このような3Dビデオ符号化方法では、ME/MC処理は一般には前向き方向に行われる。すなわちフレームの対(i,i+1)に動き補償を行う際、iはi+1の動き方向に変位される。図1に示されるように、8フレームを含む入力GOFについて3つの時間フィルタ処理を連続して行った場合、時間フィルタ処理は参照フレーム及び現フレーム(例えばフレームF1及びF2)を入力として取り込み、低周波数(L)サブバンド及び高周波数(H)サブバンドを提供する。上述のようにハール・フィルタを用いることにより、低周波数のサブバンドは入力フレーム対の時間平均を含み、高周波数のサブバンドは動き補償工程から得られる残差を含む。この処理は次の2つのフレームの対についても繰り返され、このようにして各フレーム対が処理され、4つの低周波数時間サブバンドが得られる。そして次の時間レベルにおいてもこれと同様の時間的フィルタリング処理が低周波数サブバンドの対に実施される。この処理が繰り返され、最低の時間分解能レベルに達するとそれぞれGOFの片半分ずつを表す2つの低周波数サブバンドが得られる。しかし実際には時間的フィルタリング処理が行われる結果得られる時間的平均は参照フレームにずれる傾向にあり、低周波数サブバンドは現フレームよりも参照フレームについての情報をより多く含む。ここではME/MC処理は前方向に行われるため、同様のずれが各時間分解レベルを影響し、これがGOFの半分ずつを表す2つのフレームにも反映される。
この現象は以下の時間的フィルタリング等式(1)及び(2)によって説明されうる。等式(1)及び(2)はそれぞれ低周波数サブバンド及び高周波数サブバンドのMCTF等式を示し、ここでは参照フレームと低周波数サブバンドとの両方から動きベクトル場が減算されている(A=参照フレーム、B=現フレーム)
Figure 2005515729
Figure 2005515729
予測エラー値がゼロであると仮定すると、
Figure 2005515729
が得られる。したがって低周波数のサブバンドは参照フレームに非常に似ている。よって不完全な復元の場合、これらのMCTF等式は必ず現フレームよりも参照フレームをより忠実に復元することになる。
図2はMCTF処理とブロックマッチングME処理を合わせて実行する場合を示す。この図においてブロック境界(BBY)は横線によって示される。参照フレームAにおいて一致するブロックは隣接するブロックと重複することが可能である。この場合この参照フレームAのサブセットだけが現フレームBのMC処理において用いられる。すなわちピクセルによって1回以上フィルタリングされるものもあり、全くフィルタリングされないものもあり、このようなピクセルはそれぞれ重複接続ピクセル及び非接続ピクセルと呼ばれる。動き補償処理されたフィルタ出力だけが符号化され伝送される場合、非接続ピクセルが残される可能性があり(典型的にはピクセル全体の3〜5%)これは符号化処理全体の符号化ゲイン及び主観的ビデオ画質を大きく影響しうる。この非接続ピクセルの問題を低減するために非特許文献1においては低周波数サブバンドを参照フレームの位置に置き、高周波数のサブバンドを現フレームにおける対応位置に置く(等式(1)、(2)参照)方法が提案される。これにより高周波数サブバンドはできる限り小さなエネルギーを有し、非接続ピクセルのDFD(Displaced Frame Difference)値に対応する(非接続ピクセルのMCTFに対応する等式(3)及び(4)参照)。
Figure 2005515729
Figure 2005515729
しかしこの処理は完全にこの非接続ピクセルの問題を解決することはできず、例えばビデオビットストリームが一部だけ復号化されている場合これらの非接続ピクセルは時空ツリーの復元において混乱を招く可能性がある。
そこである低周波数サブバンド及び高周波数サブバンドの対について、高周波数サブバンドに伝送されるウェーブレット係数がなかったと仮定すると(H=0)、フレームA(参照フレーム)及びフレームB(現フレーム)の復元等式
Figure 2005515729
Figure 2005515729
は、以下のような等式によって表されることができる。
Figure 2005515729
Figure 2005515729
これらの等式はそれぞれ復号された高周波数サブバンドが係数を含まないような復元参照フレーム及び現フレームに対応する。そしてこれに対応する復元は以下の等式(9)及び(10)によって表される。
Figure 2005515729
Figure 2005515729
ここでεは、予測エラーを表す。上記からこのエラーはフレームAとフレームBとの間で均等に分布されていることがわかる。
しかし非接続ピクセルについては、上記と同様の結果は得られない。すなわち以下に示される復元等式(11)及び(12):
Figure 2005515729
Figure 2005515729
は、H=0のとき
Figure 2005515729
Figure 2005515729
になり、これによって復号された高周波数サブバンドが係数を含まないような参照フレーム及び現フレームの非接続ピクセルの復元エラーは、以下の式(15)及び(16)によって示される。
Figure 2005515729
Figure 2005515729
この場合エラーはすべて現フレームに置かれる。カスケード状態の前方向ME/MC処理によりこのエラーは時間的ツリーにおいて深さ方向に増殖し、よってGOFのそれぞれ半分ずつを表すサブバンドにおける画質の低下が生じ、目障りなビジュアル効果が発生しうる。
このようなずれは特に(2D+t)ビデオ符号化方式において問題となる。というのはこのような符号化方式においては均等な時間的分解がウェーブレット係数の効率的な符号化の必要条件となる(根元サブバンドの係数は最も高いレベルでのオフスプリングを有し、データ圧縮においては同じ線の係数は同様な動きを有すると仮定される)。
また、3Dサブバンド符号化アプローチにおいては、参照フレームと現フレームとの間の時間的距離((参照,現)対)は時間レベルが深くなるにつれて増大する。例えばある連続する2つのフレーム間の時間的距離が1であるとすると、別の2つのフレームの間に1つのフレームを挿入しうる場合はこの2つのフレーム間の時間的距離は2である。上述のように低周波数の時間的サブバンドは入力参照フレームに非常に近似するため、低周波数の時間的サブバンドは対応する参照フレームと同一の時点に位置するとされる。よって上記の時間的距離の概念は低周波数の時間的サブバンドにも拡張される。これにより、各時間的分解能レベルでフレーム間(又はサブバンド間)の時間的距離を求めることが可能である。この動き補償処理の前方向方式が適用された場合、図3に示されるように時間レベルn≧1では、フレーム間の時間的距離は2に等しい。動き補償処理において画質を左右する要素は数多く存在するが、そのうちの最も重要な要素の1つがフレーム間の時間的距離である。この距離が小さい場合、この距離によって離間される2つのフレームはより似通っていると予想され、ME/MC処理はより効率的である。一方動き補償処理の対象となるフレームがその参照フレームから非常に離れている場合、残画像(高周波数サブバンド)のエラーエネルギーは高く、この残画像の係数の復号は手痛い。例えば完全な復元が得られる前にこの符号化処理が停止された場合(これはあらゆるビットレートが対象となるスケーラブル方式では頻繁に起きる)高周波数サブバンドは何らかのアーチファクトを含む可能性が高く、よって復元されるビデオは劣化する。
“Motion-compensation 3D subband coding of video”, S.J. Choi and J.W. Woods, IEEE Transactions on Image Processing, vol.8, n°2, February 1999, pp.155-167
したがって本発明は上記のようなアーチファクトの発生を招くズレが少なくとも低減されるようなビデオ符号化方法を提供することを目的とする。
上記目的を達成するために、本発明は上述のようなビデオ符号化方法において、動き補償工程の方向が、処理対象とするGOFにおけるCOFに応じて変更されることを特徴とする。
本発明の好ましい一実施形態として、処理対象とされるGOFにおける連続する各COFに対する動き補償工程の方向は後方向と前方向と交互に変更される。
この方法によると、深い時間的分解レベルにおいてME/MC処理の対象となる参照フレームと現フレームとの対がより接近した状態となり、また、各分解能レベルにおいてより均等でバランスの取れたGOFの時間的近似値が得られる。よって時間的サブバンド間におけるビット予算のより均等な再分布が実現され、GOF全体についてのグローバルな符号化効率が改善されうる。特に低ビットレートでは、復元されたビデオシーケンスの全体的な画質が改善される。
本発明のまた別の好適な実施形態としては、処理対象とされるGOFにおける連続する各COFに対する動き補償工程の方向は任意変更方式により決定され、動き予測及び補償処理はエネルギー条件に応じて選択される限られた数のCOFに集中されることを特徴とする。
この方法では、GOF内における一定のフレームを優先し、他のフレームを犠牲にすることにより、特に時間的領域において改善された符号化効率が得られる。
図3を参照して説明される3Dビデオ符号化方式においては、ME/MC処理が前方向に実行されるのに対して、本発明は動き予測処理の方向を処理対象のフレームの対(COF)によって変更することを提案する。例えば本発明による第1実施形態においては、図4に示すようにGOF内の連続するフレームの対(COF)に対する動き予測処理の方向は後方向から始まって、前方向と後方向と交互に変更されることが提案される。この方法により、さらに深い時間レベル(n>1)において処理されるフレームの対(COF)が相互により接近した状態となる。つまり時間レベルn=1では、対をなす2つのフレーム間の時間的距離が従来では2であるのに対して1に低減される。また、時間レベルn=2では、この距離が従来では4であるのに対して本実施例では3となる。このようにしてフレーム間の時間的距離が低減されうる。より一般的には、動き予測処理の方向を交互に変更させる方法は以下の式によって実現されうる。
Figure 2005515729
Figure 2005515729
Figure 2005515729
ここでnは時間的分解レベルを表し、dintraはGOF内のフレーム間の時間的距離又は(参照、現)対の距離を表し、dinterは連続するフレーム対間の時間的距離を表す。
この方法により、最低周波数の時間的サブバンドはGOFの中央側にずらされ、よりバランスの取れた時間的分解が実現される。ここでは、非接続ピクセルに起因する画質の劣化はあるものの従来例のように時間レベルの進行とともにこれが累積することはない。3Dサブバンドビデオ圧縮方式においてこのように改造されたME/MCを適用することにより、図5に示されるように低いビットレートでは符号化効率の著しい向上が実現される。図5は本発明を適用した場合(PAの場合)のGOFにおけるフレームインデックスFIに対するPSNR(ピーク信号/ノイズ比)の発展の典型(平均)プロフィール(周知のフォーマン・シーケンスによってテスト済み)と、前方向MCのみを適用した場合(PBの場合)における同様のPSNRプロフィールとを対比させて示す。本発明の場合においては、画質についての平均ゲインは1dB程度であり、ここでは前方向のMCのみを適用する場合に比べて画質がGOFにおいてより均等に分布される。なお、最高画質のフレームは次の時間レベルで低周波数サブバンドが参照フレームとして再利用されるようなフレームである。これは復号処理がビットストリームの最後まで実行される前に停止された場合は高周波数のサブバンド/フレームに比べて参照サブバンド/フレームのほうががより正確に復元されることから驚くことではない。この改造されたME/MC方式によると、各時間レベルにおいて最も高品質の参照フレーム/サブバンドが利用されることが保障される。
しかし例えばフレーム・シーケンスの抽出において第1部分(例えば第1GOF)が多くの動きを含むのに対して(例えばカメラ・パンニングなどから)、この抽出の第2部分(例えば第2GOF)がほとんど動きを含まない場合、以下のような現象が見受けられる。まず、低ビットレートでは、抽出の第1部分(第1GOF)には多くの動きが含まれることから正確に符号化されることが不可能である。すなわち視覚的には、復元されたビデオは、ブロックマッチングME及び低能なエラー符号化によって発生する目障りなブロック・アーチファクトを多く含むことになる(このようなアーチファクトは高いビットレートでのみ排除することが可能である)。そこでコンテンツの動きに応じて動き予測処理の方向を変更することが提案される。しかし、処理対象とされるシーケンスが従来の前方向ME方式あるいは上記改造されたME方式を用いて符号化された場合、第1GOFの終端(この第1GOFは多くの動きを含むが、この動きは同GOFの終端側では停止するため同終端は静止状態に近い)は、第2GOFにおける同様のフレーム(これは完全な静止画像である)に比べて低画質である。この第1GOFの終端における静止画像の問題点は、これらが多くの動きを含むその前のフレームと一緒のGOFにまとめられてしまうことにある。
そこで、エネルギー条件に基づいて、ME及びMC処理をこの第1GOFの終端で(静止しているため)似通っている連続フレームに集中し、真ん中のフレームは結局高画質で符号化することができないため(許容される最高ビットレートが十分でないため)、これらのフレームを犠牲にしてしまう方法が提案される。この方法の適用が図6において示される。この方法と前述の方法とを比べると(あるいは各場合における復元されたフレームの質を比較すると)この方法では実際に第1GOFにおける真ん中のフレームが犠牲にされ、第1GOFの静止フレームにおける質の向上がされる。このようなコンテンツベースのME/MC処理の方向付け方式を適用することにより符号化効率及び視覚上の観点から改善が実現される。したがって現GOFについてどのME/MC方式が適切であるかを見極めることが求められる。このような評価を行うためエネルギー基準を設定することが可能である。より具体的には例えば分解処理において得られる時間的フィルタリング処理された高周波数サブバンドに含まれるエネルギーの量に基づく判断基準などを設定することが可能である。
動き補償が適用される時間サブバンド分解を示す図である。 重複接続ピクセルと非接続ピクセルとの問題を示す図である。 GOFにおける動き補償処理の一般的な実行方法を示す図である。 本発明の一実施例による改善された動き補償の実行方法を示す図である。 図3及び図4の方法を対比する図である。 本発明の第2実施例による改善された動き補償の実行方法を示す図である。

Claims (3)

  1. ビデオシーケンスに適用される符号化方法で、前記ビデオシーケンスは連続するフレームのグループ(GOF)に分割され、さらに前記GOFは参照フレーム及び現フレームを有する連続するフレームの対(COF)に分割されるようなビデオシーケンスに適用される符号化方法であって、
    各GOFにおける各フレームの対(COF)の参照フレームと現フレームとの間の動きベクトル場を定義するために前記各COFに適用する動き予測工程、
    分解を時空サブバンドによって定義するために各GOFに対して前記動きベクトル場に基づく動き補償時間的解析及び空間ウェーブレット変換を適用する動き補償3次元(3D)サブバンド動き補償分解工程、
    前記時空サブバンドを量子化し符号化するための符号化工程、及び
    前記符号化工程の出力で観測されるバッファーステータスに基づいて前記動きベクトル場と前記時空サブバンドとの間で共用されるビットレート配分を定義するための制御工程を有する符号化方法において、
    前記動き補償工程の方向は処理対象とされるGOFにおけるCOFに応じて変更されることを特徴とする符号化方法。
  2. 前記動き補償工程の方向は、処理対象となるGOFにおける連続する各COFに対して後方向と前方向と交互に変更されることを特徴とする請求項1記載の符号化方法。
  3. 前記処理対象となるGOFにおける連続する各COFに対する前記動き予測工程の方向は、任意変更方式によって決定され、前記動き予測及び補償処理は、エネルギー条件に基づいて選択される限られた数のCOFに集中されることを特徴とする請求項1記載の符号化方法。
JP2003561251A 2001-12-28 2002-12-20 ビデオ符号化方法 Withdrawn JP2005515729A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP01403384 2001-12-28
EP02291984 2002-08-07
PCT/IB2002/005669 WO2003061294A2 (en) 2001-12-28 2002-12-20 Video encoding method

Publications (1)

Publication Number Publication Date
JP2005515729A true JP2005515729A (ja) 2005-05-26

Family

ID=26077278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003561251A Withdrawn JP2005515729A (ja) 2001-12-28 2002-12-20 ビデオ符号化方法

Country Status (7)

Country Link
US (1) US20050084010A1 (ja)
EP (1) EP1461955A2 (ja)
JP (1) JP2005515729A (ja)
KR (1) KR20040069209A (ja)
CN (1) CN1276664C (ja)
AU (1) AU2002358231A1 (ja)
WO (1) WO2003061294A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007509542A (ja) * 2003-10-17 2007-04-12 レンセラー・ポリテクニック・インスティチュート Mctfスケーラブルビデオコーダでの可変サイズブロックの重複ブロック動き補償

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10340407A1 (de) * 2003-09-02 2005-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Codieren einer Gruppe von aufeinanderfolgenden Bildern und Vorrichtung und Verfahren zum Decodieren eines codierten Bildsignals
BRPI0417162A (pt) * 2003-12-01 2007-03-06 Samsung Electronics Co Ltd para codificação de vìdeo, codidicador de vìdeo, método para decodificar vìdeo, decodificador de vìdeo, e meio de armazenamento
EP1599046A1 (en) * 2004-05-19 2005-11-23 THOMSON Licensing Method for coding video data of a sequence of pictures
US8442108B2 (en) * 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
WO2006043772A1 (en) * 2004-10-18 2006-04-27 Electronics And Telecommunications Research Institute Method for encoding/decoding video sequence based on mctf using adaptively-adjusted gop structure
WO2006043754A1 (en) * 2004-10-21 2006-04-27 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting temporal scalability
KR100763179B1 (ko) * 2005-04-01 2007-10-04 삼성전자주식회사 비동기 픽쳐의 모션 벡터를 압축/복원하는 방법 및 그방법을 이용한 장치
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
CN101662676B (zh) * 2009-09-30 2011-09-28 四川长虹电器股份有限公司 流媒体缓冲的处理方法
WO2015195463A1 (en) * 2014-06-18 2015-12-23 Arris Enterprises, Inc. Trick-play streams for adaptive bitrate streaming
CN107483949A (zh) * 2017-07-26 2017-12-15 千目聚云数码科技(上海)有限公司 增加svac svc实用性的方法及系统
CN113259662B (zh) * 2021-04-16 2022-07-05 西安邮电大学 基于三维小波视频编码的码率控制方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241383A (en) * 1992-05-13 1993-08-31 Bell Communications Research, Inc. Pseudo-constant bit rate video coding with quantization parameter adjustment
US6674911B1 (en) * 1995-09-14 2004-01-06 William A. Pearlman N-dimensional data compression using set partitioning in hierarchical trees
US6690833B1 (en) * 1997-07-14 2004-02-10 Sarnoff Corporation Apparatus and method for macroblock based rate control in a coding system
US6404814B1 (en) * 2000-04-28 2002-06-11 Hewlett-Packard Company Transcoding method and transcoder for transcoding a predictively-coded object-based picture signal to a predictively-coded block-based picture signal
US7023922B1 (en) * 2000-06-21 2006-04-04 Microsoft Corporation Video coding system and method using 3-D discrete wavelet transform and entropy coding with motion information
US7062445B2 (en) * 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007509542A (ja) * 2003-10-17 2007-04-12 レンセラー・ポリテクニック・インスティチュート Mctfスケーラブルビデオコーダでの可変サイズブロックの重複ブロック動き補償

Also Published As

Publication number Publication date
KR20040069209A (ko) 2004-08-04
CN1611079A (zh) 2005-04-27
AU2002358231A1 (en) 2003-07-30
CN1276664C (zh) 2006-09-20
EP1461955A2 (en) 2004-09-29
US20050084010A1 (en) 2005-04-21
WO2003061294A3 (en) 2003-11-06
WO2003061294A2 (en) 2003-07-24

Similar Documents

Publication Publication Date Title
KR100597402B1 (ko) 스케일러블 비디오 코딩 및 디코딩 방법, 이를 위한 장치
KR100664928B1 (ko) 비디오 코딩 방법 및 장치
JP5014989B2 (ja) 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体
JP4763548B2 (ja) スケーラブルビデオコーディング及びデコーディング方法と装置
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
JP4685849B2 (ja) スケーラブルビデオコーディング及びデコーディング方法、並びにその装置
US20070217513A1 (en) Method for coding video data of a sequence of pictures
US8781004B1 (en) System and method for encoding video using variable loop filter
US7042946B2 (en) Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
JP2007520149A (ja) エンコーダ部からスケーラビリティを提供するスケーラブルビデオコーディング装置および方法
JP2005515729A (ja) ビデオ符号化方法
KR20040106417A (ko) 다중 참조 프레임들에 기초하여 움직임 보상 시간필터링을 사용하는 스케일링 가능 웨이블릿 기반 코딩
JP4794147B2 (ja) フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
JP2006501750A (ja) ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム
Bhojani et al. Hybrid video compression standard
Nayan et al. Baseline JPEG-like DWT CODEC for disparity compensated residual coding of stereo images
Akujuobi Application of Wavelets to Video Compression
Esakkirajan et al. Adaptive vector quantization based video compression scheme
KR100577364B1 (ko) 적응형 프레임간 비디오 코딩방법, 상기 방법을 위한 컴퓨터로 읽을 수 있는 기록매체, 및 장치
Ilgin et al. Image and Video Compression Artifact Reduction at Low Bit Rates Using Local Cosine Transform in Conjunction with Significance Map Coding
Al-Asmari An adaptive hybrid coding scheme for HDTV and digital video sequences
Al-Asmari Compression Algorithm Using 3-D Discrete Wavelet Decomposition
Nayan et al. Two Novel Wavelet-block based Stereo Image Compression Algorithms
Gao et al. Adaptive in-band motion compensated temporal filtering based on motion mismatch detection in the highpass subbands

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051219

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060922