[go: up one dir, main page]

JP2015526026A - ビデオコーディングのための長期参照ピクチャをシグナリングすること - Google Patents

ビデオコーディングのための長期参照ピクチャをシグナリングすること Download PDF

Info

Publication number
JP2015526026A
JP2015526026A JP2015520368A JP2015520368A JP2015526026A JP 2015526026 A JP2015526026 A JP 2015526026A JP 2015520368 A JP2015520368 A JP 2015520368A JP 2015520368 A JP2015520368 A JP 2015520368A JP 2015526026 A JP2015526026 A JP 2015526026A
Authority
JP
Japan
Prior art keywords
value
msb
long
term reference
poc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015520368A
Other languages
English (en)
Other versions
JP6239609B2 (ja
JP2015526026A5 (ja
Inventor
ラマスブラモニアン、アダルシュ・クリシュナン
ワン、イェ−クイ
ジョシ、ラジャン・ラクスマン
チェン、イン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015526026A publication Critical patent/JP2015526026A/ja
Publication of JP2015526026A5 publication Critical patent/JP2015526026A5/ja
Application granted granted Critical
Publication of JP6239609B2 publication Critical patent/JP6239609B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ビデオデコーダが、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット値を有する、第1の長期参照ピクチャと第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号することとを行うように構成され得る。

Description

[0001] 本出願は、その内容全体が参照により本明細書に組み込まれる、2012年6月28日に出願された米国仮出願第61/665,784号の利益を主張する。
[0002] 本開示は、ビデオコーディングに関する。
[0003] デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末(PDA)、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダー、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、MPEG−2、MPEG−4、ITU−T H.263、ITU−T H.264/MPEG−4,Part10、アドバンストビデオコーディング(AVC:Advanced Video Coding)、現在開発中の高効率ビデオコーディング(HEVC:High Efficiency Video Coding)規格によって定義された規格、およびそのような規格の拡張に記載されているビデオコーディング技法など、ビデオコーディング技法を実装する。「HEVC Working Draft 7」または「WD7」と呼ばれる今度のHEVC規格の最近のドラフトは、2013年5月13日在、http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v22.zipからダウンロード可能である、文書JCTVC−I1003、Brossら、「High efficiency video coding (HEVC) Text Specification Draft 7」、ITU−T SG16 WP3とISO/IEC JTC1/SC29/WG11とのJoint Collaborative Team on Video Coding(JCT−VC)、9th Meeting:San Jose、California、USA、2012年4月27日〜5月7日に記載されている。ビデオコーディングデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および/または記憶し得る。
[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するために空間的(イントラピクチャ)予測および/または時間的(インターピクチャ)予測を含む。ブロックベースのビデオコーディングでは、ビデオスライス(たとえば、ビデオフレームまたはビデオフレームの一部分)が、ツリーブロック、コーディングユニット(CU:coding unit)および/またはコーディングノードと呼ばれることもある、ビデオブロックに区分され得る。ピクチャのイントラコード化(I)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック内の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコード化(PまたはB)スライス中のビデオブロックは、同じピクチャ中の隣接ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。
[0005] 空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコード化ブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトルと、コード化ブロックと予測ブロックとの間の差分を示す残差データとに従って符号化される。イントラコード化ブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて、残差変換係数が得られ得、その残差変換係数は、次いで量子化され得る。量子化変換係数は、最初は2次元アレイで構成され、変換係数の1次元ベクトルを生成するために走査され得、なお一層の圧縮を達成するために、エントロピーコーディングが適用され得る。
[0006] 概して、本開示では、ビデオコーディングのための長期参照ピクチャをシグナリングするための技法について説明する。参照ピクチャは、概して、他のピクチャのデータの時間的予測コーディングのための参照のために使用され得るピクチャに対応する。概して、長期参照ピクチャは、他の参照ピクチャ、たとえば、短期参照ピクチャよりも長い復号ピクチャバッファに記憶される。本開示では、長期参照ピクチャに関係するシグナリング、たとえば、ピクチャのスライスのスライスヘッダ中で長期参照ピクチャをシグナリングすることに関係する様々な技法について説明する。本開示の技法は、たとえば、効率および/または適用可能性に関する、スライスヘッダ中での長期参照ピクチャのシグナリング方法のための改善を提供し得る。
[0007] 一例では、方法が、ビデオデータの現在ピクチャのピクチャ順序カウント(POC:picture order count)値のベース最上位ビット(MSB:most significant bit)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB:least significant bit)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号することとを含む。
[0008] 別の例では、ビデオデータを復号するためのデバイスが、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号することとを行うように構成されたビデオデコーダを含む。
[0009] 別の例では、デバイスが、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号するための手段と、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号するための手段と、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号するための手段とを含む。
[0010] 別の例では、コンピュータ可読記憶媒体が、実行されたとき、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号することとをプロセッサに行わせる命令を記憶している。
[0011] 別の例では、ビデオデータを符号化する方法が、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する現在ピクチャの少なくとも第2の部分とを符号化することと、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、を含む。
[0012] 別の例では、ビデオデータを符号化するためのデバイスが、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する現在ピクチャの少なくとも第2の部分とを符号化することと、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、を行うように構成されたビデオエンコーダを含む。
[0013] 別の例では、ビデオデータを符号化するためのデバイスは、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する現在ピクチャの少なくとも第2の部分とを符号化するための手段と、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化するための手段と、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を符号化するための手段と、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、を含む。
[0014] 別の例では、コンピュータ可読記憶媒体は、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する現在ピクチャの少なくとも第2の部分とを符号化することと、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、をプロセッサに行わせる命令を記憶している。
[0015] 1つまたは複数の例の詳細を添付の図面および以下の説明に記載する。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。
[0016] スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0017] スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0018] スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を実装し得るビデオデコーダの一例を示すブロック図。 [0019] コード化ビデオピクチャのシーケンスを示す概念図。 [0020] 本開示の技法による、長期参照ピクチャのためのピクチャ順序カウント(POC)値を符号化するための例示的な方法を示すフローチャート。 [0021] 本開示の技法による、長期参照ピクチャのためのPOC値を復号するための例示的な方法を示すフローチャート。
[0022] 概して、ビデオデータは、高速に連続してキャプチャまたは表示されるピクチャのシーケンスによって表される。いくつかの例では、キャプチャされるのではなく(またはそれに加えて)、たとえば、コンピュータグラフィックスを使用して、ピクチャまたはピクチャの一部分が生成され得ることを理解されたい。(概して、ピクチャがキャプチャまたは生成される順序と同じであり得る)ピクチャが表示されるべきである順序は、ピクチャがコーディングされる順序とは異なり得る。ピクチャの表示順序は、概して、ピクチャ順序カウント(POC)値によって表され、ピクチャのコーディング順序は、概して、フレーム番号(frame_num)値によって表される。
[0023] ピクチャのコーディングは、概して、ピクチャ中で生じる冗長データを利用することを伴う。たとえば、イントラ予測コーディングとも呼ばれる空間コーディングは、共通ピクチャのピクセル値の空間的に隣接するブロック間に生じる冗長性を利用する。別の例として、インター予測コーディングとも呼ばれる時間コーディングは、異なる時間インスタンスにおいてキャプチャ、生成、または表示される異なるピクチャ間に生じる冗長性を利用する。より詳細には、ピクチャは、イントラ予測またはインター予測のために指定され得るスライスに分割され得る。さらに、各スライスはブロック(たとえば、最大コーディングユニット(LCU:largest coding unit))に分割され得、ブロックの各々は、対応するスライスがイントラ予測のために指定されているか、インター予測のために指定されているかに基づいて、さらに区分されるか、またはコーディングされ得るかのいずれかである。
[0024] インター予測コーディングの例に関して、(「現在ピクチャ」とも呼ばれる)現在コーディングされているピクチャのブロックは参照ピクチャから予測され得る。WD7は、「参照ピクチャ」を、1に等しいnal_ref_flagをもつピクチャとして定義する。nal_ref_flagは、ネットワークアブストラクションレイヤ(NAL:network abstraction layer)ユニット中に含まれるデータが参照ピクチャとして扱われるべきであるかどうかを示す、NALユニットのシンタックス要素である。WD7はまた、参照ピクチャが、復号順序での後続のピクチャの復号プロセスにおけるインター予測のために使用され得るサンプル(すなわち、ピクセル値)を含んでいることを規定する。
[0025] さらに、WD7は長期参照ピクチャを短期参照ピクチャと区別する。たとえば、WD7は、長期参照ピクチャを、「長期参照のために使用される」とマークされた参照ピクチャとして定義する。WD7は、長期参照ピクチャがコード化ビデオシーケンスのためにすべてにおいてシグナリングされるかどうかをシーケンスパラメータセット(SPS:sequence parameter set)中のフラグが示すことを規定する。WD7に従って、ビデオコーダは、スライスのスライスヘッダ中で長期参照ピクチャのPOC値の最下位ビット(LSB)をシグナリングする。LSBをシグナリングすることは、完全POC値をシグナリングすることに対して、ビット節約を生じ得る。長期参照ピクチャと同じLSBビットを有する2つ以上の参照ピクチャが復号ピクチャバッファ(DPB:decoded picture buffer)中にある場合、ビデオコーダは、WD7に従って、長期参照ピクチャのPOC値の最上位ビット(MSB)をシグナリングし得る。さらに、WD7に従って、ビデオコーダは、フラグを使用して、シグナリングされた長期参照ピクチャが参照のために現在ピクチャによって使用され得るかどうかを示し得る。
[0026] ビデオコーダは、本明細書では「ベースMSB値」と呼ぶ、現在ピクチャのMSBを維持し、ベースMSB値に対するオフセット値を使用して、たとえば、ピクチャiのためのシンタックス要素delta_poc_msb_cycle_lt[i]を使用して長期参照ピクチャiのMSBをシグナリングし得る。このシンタックス要素を、以下で「MSBサイクル」値と呼ぶ。言い換えれば、特定のピクチャのためのPOC値を計算するために、ビデオコーダは、(ピクチャのためのLSB)と連結された(ピクチャのためのベースMSB+MSBサイクル)を計算し得る。
[0027] WD7では、MSBサイクル値は、ベースMSB値と、MSBサイクルがシグナリングされていたピクチャ、すなわち、ピクチャiのためのMSBとの間の差としてコーディングされた。同じLSB値をもつ2つ以上の長期参照ピクチャがシグナリングされたときのみ、第1のそのような長期参照ピクチャのMSBサイクルはそのようなものとしてシグナリングされることになり、長期参照ピクチャの残りについてのMSBサイクル値は、互いに相対的オフセットとしてシグナリングされた。しかしながら、WD7に従う、長期参照ピクチャのこのシグナリングは、1つまたは複数の欠陥に遭遇し得る。たとえば、異なるLSB値をもつ2つの長期参照ピクチャがあるが、両方がdelta_poc_msb_cycle_lt[i]をシグナリングされる場合、現在シンタックスは、上記で説明したように、すなわち、ベースMSB値に対するオフセットとしてdelta_poc_msb_cycle_lt[i]をシグナリングすることになる。しかしながら、本開示では、ピクチャのためのMSBサイクル値間の差をシグナリングすることがより効率的であり得ることを認識する。
[0028] WD7に従う、スライスヘッダ中での長期参照ピクチャのための識別データのシグナリングは、1つまたは複数の欠陥に遭遇し得る。たとえば、現在ピクチャが、MaxPicOrderCntLsb*N−1に等しいPOC値を有し、MaxPicOrderCntLsb*Nに等しいPOC値を有するピクチャが、delta_poc_msb_cycle_lt[i]がシグナリングされる第1の長期参照ピクチャである場合、WD7は、delta_poc_msb_cycle_lt[i]をシグナリングするための技法を提供しない。この場合、delta_poc_msb_cycle_lt[i]の値は−1(負値)であるべきであるが、そうはなり得ない。
[0029] 別の例として、異なるLSB値をもつ2つの長期参照ピクチャがあるが、両方がdelta_poc_msb_cycle_lt[i]をシグナリングされる場合、現在シンタックスは、そのようなものとしてdelta_poc_msb_cycle_lt[i]をシグナリングすることになる。しかしながら、本開示では、ピクチャのうちの1つについての差をシグナリングすることがより効率的であるだろうことを認識する。
[0030] 別の例として、長期参照ピクチャのLSBと同じLSBをシグナリングされる2つ以上の参照ピクチャがDPB中にあるとき、WD7は、LTRPのMSBサイクルもdelta_poc_msb_cycle_lt[i]シンタックス要素を使用してシグナリングされることを規定する。しかしながら、本開示では、現在ピクチャによって短期参照ピクチャとしてマークされるピクチャがDPB中にある場合、長期参照ピクチャの候補セット中に短期参照ピクチャを含むことにより、結局、必要とされるよりも多くのMSBビットをシグナリングすることになり得ることを認識する。
[0031] 別の例として、poc_lsb_lt[i]に等しいPOC LSBを有するn個の参照ピクチャがDPB中にあるとき、およびkがnよりも小さいかまたはそれに等しいk個の長期参照ピクチャが、poc_lsb_lt[i]に等しいLSBを有する現在ピクチャ中でシグナリングされた場合、WD7において定義されたシンタックスは、すべてのk個のピクチャが、delta_poc_msb_present_flag[i]を1に設定されることを規定する。ただし、k=nの場合、本開示では、ビデオコーダが、長期参照ピクチャのすべてのkについてdelta_poc_msb_present_flag[i]を1と設定する必要はなく、ただ、n−1個のピクチャについてdelta_poc_msb_present_flag[i]を1と設定することで十分であろうことを認識する。本開示の技法は、以下の図に関してより詳細に説明するように、これらの欠陥のいずれかまたはすべてを克服し得る。概して、本開示はで、スライスヘッダ中での長期参照ピクチャのためのシグナリングを改善し得る様々な技法について説明する。
[0032] 図1は、スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を利用し得る例示的なビデオ符号化および復号システム10を示すブロック図である。図1に示すように、システム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを与えるソースデバイス12を含む。特に、ソースデバイス12は、コンピュータ可読媒体16を介してビデオデータを宛先デバイス14に与える。ソースデバイス12および宛先デバイス14は、デスクトップコンピュータ、ノートブック(すなわち、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォン、いわゆる「スマート」パッドなどの電話ハンドセット、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0033] 宛先デバイス14は、コンピュータ可読媒体16を介して復号されるべき符号化ビデオデータを受信し得る。コンピュータ可読媒体16は、符号化ビデオデータをソースデバイス12から宛先デバイス14に移動することが可能な任意のタイプの媒体またはデバイスを備え得る。一例では、コンピュータ可読媒体16は、ソースデバイス12が、符号化ビデオデータを宛先デバイス14にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス12から宛先デバイス14への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。
[0034] いくつかの例では、符号化データは、出力インターフェース22からストレージデバイスに出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイスからアクセスされ得る。ストレージデバイスは、ハードドライブ、Blu−ray(登録商標)ディスク、DVD、CD−ROM、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイスは、ソースデバイス12によって生成された符号化ビデオを記憶し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。
[0035] 宛先デバイス14は、ストリーミングまたはダウンロードを介してストレージデバイスから、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス14に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバとしては、(たとえば、ウェブサイトのための)ウェブサーバ、FTPサーバ、ネットワーク接続ストレージ(NAS)デバイス、またはローカルディスクドライブがある。宛先デバイス14は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適である、ワイヤレスチャネル(たとえば、Wi−Fi(登録商標)接続)、ワイヤード接続(たとえば、DSL、ケーブルモデムなど)、または両方の組合せを含み得る。ストレージデバイスからの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、またはそれらの組合せであり得る。
[0036] 本開示の技法はワイヤレス適用例または設定に限定されない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、動的適応ストリーミングオーバーHTTP(DASH:dynamic adaptive streaming over HTTP)などのインターネットストリーミングビデオ送信、データ記憶媒体上に符号化されたデジタルビデオ、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例など、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム10は、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および/またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。
[0037] 図1の例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。本開示によれば、ソースデバイス12のビデオエンコーダ20は、スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を適用するように構成され得る。他の例では、ソースデバイスおよび宛先デバイスは他の構成要素または構成を含み得る。たとえば、ソースデバイス12は、外部カメラなど、外部ビデオソース18からビデオデータを受信し得る。同様に、宛先デバイス14は、内蔵ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。
[0038] 図1の図示のシステム10は一例にすぎない。スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法は、任意のデジタルビデオ符号化および/または復号デバイスによって実行され得る。概して、本開示の技法はビデオ符号化デバイスによって実行されるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ/デコーダによっても実行され得る。その上、本開示の技法はまた、ビデオプリプロセッサによって実行され得る。ソースデバイス12および宛先デバイス14は、ソースデバイス12が宛先デバイス14に送信するためのコード化ビデオデータを生成するような、コーディングデバイスの例にすぎない。いくつかの例では、デバイス12、14は、デバイス12、14の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。したがって、システム10は、たとえば、ビデオストリーミング、ビデオ再生、ビデオブロードキャスト、またはビデオテレフォニーのためのビデオデバイス12とビデオデバイス14との間の一方向または双方向のビデオ送信をサポートし得る。
[0039] ソースデバイス12のビデオソース18は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、および/またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース18は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、いわゆるカメラフォンまたはビデオフォンを形成し得る。ただし、上述のように、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。各場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ20によって符号化され得る。符号化されたビデオ情報は、次いで、出力インターフェース22によってコンピュータ可読媒体16上に出力され得る。
[0040] コンピュータ可読媒体16は、ワイヤレスブロードキャストまたはワイヤードネットワーク送信などの一時媒体、あるいはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Blu−rayディスク、または他のコンピュータ可読媒体などの記憶媒体(すなわち、非一時的記憶媒体)を含み得る。いくつかの例では、ネットワークサーバ(図示せず)は、ソースデバイス12から符号化ビデオデータを受信し、たとえば、ネットワーク送信を介して、その符号化ビデオデータを宛先デバイス14に与え得る。同様に、ディスクスタンピング設備など、媒体製造設備のコンピューティングデバイスは、ソースデバイス12から符号化ビデオデータを受信し、その符号化ビデオデータを含んでいるディスクを生成し得る。したがって、コンピュータ可読媒体16は、様々な例において、様々な形態の1つまたは複数のコンピュータ可読媒体を含むことが理解されよう。
[0041] 宛先デバイス14の入力インターフェース28は、コンピュータ可読媒体16から情報を受信する。コンピュータ可読媒体16の情報は、ビデオエンコーダ20によって定義され、またビデオデコーダ30によって使用される、ブロックおよび他のコード化ユニット、たとえば、GOPの特性および/または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス32は、復号されたビデオデータをユーザに対して表示し、陰極線管(CRT)、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
[0042] ビデオエンコーダ20およびビデオデコーダ30は、現在開発中の高効率ビデオコーディング(HEVC)規格などのビデオコーディング規格に従って動作し得、HEVCテストモデル(HM)に準拠し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4,Part 10、アドバンストビデオコーディング(AVC)と呼ばれるITU−T H.264規格など、他のプロプライエタリ規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオコーディング規格の他の例としては、MPEG−2およびITU−T H.263がある。図1には示されていないが、いくつかの態様では、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびデコーダと統合され得、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理し得る。適用可能な場合、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0043] ITU−T H.264/MPEG−4(AVC)規格は、Joint Video Team(JVT)として知られる共同パートナーシップの成果としてISO/IEC Moving Picture Experts Group(MPEG)とともにITU−T Video Coding Experts Group(VCEG)によって策定された。いくつかの態様では、本開示で説明する技法は、H.264規格に概して準拠するデバイスに適用され得る。H.264規格は、ITU−T Study Groupによる2005年3月付けのITU−T勧告H.264「Advanced Video Coding for generic audiovisual services」に記載されており、本明細書ではH.264規格またはH.264仕様、あるいはH.264/AVC規格または仕様と呼ぶことがある。Joint Video Team(JVT)はH.264/MPEG−4 AVCへの拡張に取り組み続けている。
[0044] ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダ(コーデック)の一部として統合され得る。
[0045] JCT−VCは、HEVC規格の開発に取り組んでいる。HEVC規格化の取り組みは、HEVCテストモデル(HM)と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。HMは、たとえば、ITU−T H.264/AVCに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。たとえば、H.264は9つのイントラ予測符号化モードを与えるが、HMは33個ものイントラ予測符号化モードを与え得る。
[0046] 概して、HMの作業モデルは、ビデオフレームまたはピクチャが、ルーマサンプルとクロマサンプルの両方を含む一連のツリーブロックまたは最大コーディングユニット(LCU)に分割され得ることを記述する。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大コーディングユニットであるLCUのサイズを定義し得る。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、1つまたは複数のスライスに区分され得る。各ツリーブロックは、4分木に従ってコーディングユニット(CU)に分割され得る。概して、4分木データ構造はCUごとに1つのノードを含み、ルートノードがツリーブロックに対応する。CUが4つのサブCUに分割された場合、CUに対応するノードは4つのリーフノードを含み、リーフノードの各々はサブCUのうちの1つに対応する。
[0047] 4分木データ構造の各ノードは、対応するCUのシンタックスデータを与え得る。たとえば、4分木のノードは、そのノードに対応するCUがサブCUに分割されるかどうかを示す分割フラグを含み得る。CUのシンタックス要素は、再帰的に定義され得、CUがサブCUに分割されるかどうかに依存し得る。CUがさらに分割されない場合、そのCUはリーフCUと呼ばれる。本開示では、元のリーフCUの明示的分割が存在しない場合でも、リーフCUの4つのサブCUをリーフCUとも呼ぶ。たとえば、16×16サイズのCUがさらに分割されない場合、この16×16CUが決して分割されなくても、4つの8×8サブCUをリーフCUとも呼ぶ。
[0048] CUは、CUがサイズ差異を有さないことを除いて、H.264規格のマクロブロックと同様の目的を有する。たとえば、ツリーブロックは、(サブCUとも呼ばれる)4つの子ノードに分割され得、各子ノードは、今度は親ノードとなり、別の4つの子ノードに分割され得る。4分木のリーフノードと呼ばれる、最終的な分割されていない子ノードは、コーディングノードを備え、リーフCUとも呼ばれる。コード化ビットストリームに関連するシンタックスデータは、最大CU深度と呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズをも定義し得る。それに応じて、ビットストリームは最小コーディングユニット(SCU:smallest coding unit)をも定義し得る。本開示では、HEVCのコンテキストにおけるCU、PU、またはTU、あるいは他の規格のコンテキストにおける同様のデータ構造(たとえば、H.264/AVCにおけるマクロブロックおよびそれのサブブロック)のいずれかを指すために「ブロック」という用語を使用する。
[0049] CUは、コーディングノードと、コーディングノードに関連する予測ユニット(PU:prediction unit)および変換ユニット(TU:transform unit)とを含む。CUのサイズは、コーディングノードのサイズに対応し、形状が方形でなければならない。CUのサイズは、8×8のピクセルから最大64×64以上のピクセルをもつツリーブロックのサイズまでに及び得る。各CUは、1つまたは複数のPUと、1つまたは複数のTUとを含んでいることがある。CUに関連するシンタックスデータは、たとえば、CUを1つまたは複数のPUに区分することを記述し得る。区分モードは、CUが、スキップモード符号化またはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、あるいはインター予測モード符号化されるかの間で異なり得る。PUは、形状が非方形になるように区分され得る。CUに関連するシンタックスデータは、たとえば、4分木に従ってCUを1つまたは複数のTUに区分することも記述し得る。TUは、形状が方形または非方形(たとえば、矩形)であり得る。
[0050] HEVC規格は、CUごとに異なり得るTUに従う変換を可能にする。TUは、一般に、区分されたLCUについて定義された所与のCU内のPUのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。TUは、一般にPUと同じサイズであるかまたはPUよりも小さい。いくつかの例では、CUに対応する残差サンプルは、「残差4分木」(RQT:residual quad tree)として知られる4分木構造を使用してより小さいユニットに再分割され得る。RQTのリーフノードは変換ユニット(TU)と呼ばれることがある。TUに関連するピクセル差分値は、変換されて変換係数が生成され得、その変換係数は量子化され得る。
[0051] リーフCUは、1つまたは複数の予測ユニット(PU)を含み得る。概して、PUは、対応するCUの全部または一部分に対応する空間的エリアを表し、そのPUの参照サンプルを取り出すためのデータを含み得る。その上、PUは、予測に関係するデータを含む。たとえば、PUがイントラモード符号化されるとき、PUのデータは、PUに対応するTUのイントラ予測モードを記述するデータを含み得る残差4分木(RQT)中に含まれ得る。別の例として、PUがインターモード符号化されるとき、PUは、PUのための1つまたは複数の動きベクトルを定義するデータを含み得る。PUのための動きベクトルを定義するデータは、たとえば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度(たとえば、1/4ピクセル精度または1/8ピクセル精度)、動きベクトルが指す参照ピクチャ、および/または動きベクトルの参照ピクチャリスト(たとえば、リスト0、リスト1、またはリストC)を記述し得る。
[0052] 1つまたは複数のPUを有するリーフCUは、1つまたは複数の変換ユニット(TU)をも含み得る。変換ユニットは、上記で説明したように、(TU4分木構造とも呼ばれる)RQTを使用して指定され得る。たとえば、分割フラグは、リーフCUが4つの変換ユニットに分割されるかどうかを示し得る。次いで、各変換ユニットは、さらに、さらなるサブTUに分割され得る。TUがさらに分割されないとき、そのTUはリーフTUと呼ばれることがある。概して、イントラコーディングの場合、リーフCUに属するすべてのリーフTUは同じイントラ予測モードを共有する。すなわち、概して、リーフCUのすべてのTUの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングの場合、ビデオエンコーダは、イントラ予測モードを使用して各リーフTUの残差値を、TUに対応するCUの一部と元のブロックとの間の差分として計算し得る。TUは、必ずしもPUのサイズに制限されるとは限らない。したがって、TUは、PUよりも大きいことも小さいこともある。イントラコーディングの場合、PUは、同じCUについて対応するリーフTUとコロケートされ得る。いくつかの例では、リーフTUの最大サイズは、対応するリーフCUのサイズに対応し得る。
[0053] その上、リーフCUのTUはまた、残差4分木(RQT)と呼ばれる、それぞれの4分木データ構造に関連付けられ得る。すなわち、リーフCUは、リーフCUがどのようにTUに区分されるかを示す4分木を含み得る。TU4分木のルートノードは概してリーフCUに対応し、CU4分木のルートノードは概してツリーブロック(またはLCU)に対応する。分割されないRQTのTUはリーフTUと呼ばれる。概して、本開示では、特に明記しない限り、リーフCUおよびリーフTUに言及するためにそれぞれCUおよびTUという用語を使用する。
[0054] ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ(GOP)は、概して、ビデオピクチャのうちの一連の1つまたは複数を備える。GOPは、GOP中に含まれるいくつかのピクチャを記述するシンタックスデータを、GOPのヘッダ中、ピクチャのうちの1つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、それぞれのスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ20は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックはCU内のコーディングノードに対応し得る。ビデオブロックは、固定サイズまたは可変サイズを有し得、指定のコーディング規格に応じてサイズが異なり得る。
[0055] 一例として、HMは、様々なPUサイズでの予測をサポートする。特定のCUのサイズが2N×2Nであると仮定すると、HMは、2N×2NまたはN×NのPUサイズでのイントラ予測をサポートし、2N×2N、2N×N、N×2N、またはN×Nの対称的なPUサイズでのインター予測をサポートする。HMはまた、2N×nU、2N×nD、nL×2N、およびnR×2NのPUサイズでのインター予測のための非対称区分をサポートする。非対称区分では、CUの一方向は区分されないが、他の方向は25%と75%とに区分される。25%の区分に対応するCUの部分は、「n」とその後ろに付く「Up」、「Down」、「Left」、または「Right」という表示によって示される。したがって、たとえば、「2N×nU」は、上部の2N×0.5N PUと下部の2N×1.5N PUとで水平方向に区分された2N×2N CUを指す。
[0056] 本開示では、「N×N(NxN)」および「N×N(N by N)」は、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、たとえば、16×16(16x16)ピクセルまたは16×16(16 by 16)ピクセルを指すために互換的に使用され得る。概して、16×16ブロックは、垂直方向に16ピクセルを有し(y=16)、水平方向に16ピクセルを有する(x=16)。同様に、N×Nブロックは、概して、垂直方向にNピクセルを有し、水平方向にNピクセルを有し、ただし、Nは非負整数値を表す。ブロック中のピクセルは行と列に構成され得る。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。たとえば、ブロックはN×Mピクセルを備え得、ただし、Mは必ずしもNに等しいとは限らない。
[0057] CUのPUを使用したイントラ予測コーディングまたはインター予測コーディングの後に、ビデオエンコーダ20は、CUのTUのための残差データを計算し得る。PUは、(ピクセル領域とも呼ばれる)空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備え得、TUは、変換、たとえば、残差ビデオデータへの離散コサイン変換(DCT)、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、PUに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ20は、CUのための残差データを含むTUを形成し、次いで、TUを変換して、CUの変換係数を生成し得る。
[0058] 変換係数を生成するための任意の変換の後に、ビデオエンコーダ20は、変換係数の量子化を実行し得る。量子化は、一般に、係数を表すために使用されるデータの量をできるだけ低減するために変換係数が量子化され、さらなる圧縮を行うプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。たとえば、量子化中にnビット値がmビット値に切り捨てられ得、ただし、nはmよりも大きい。
[0059] 量子化の後に、ビデオエンコーダは、変換係数を走査して、量子化変換係数を含む2次元行列から1次元ベクトルを生成し得る。走査は、より高いエネルギー(したがってより低い周波数)の係数をアレイの前方に配置し、より低いエネルギー(したがってより高い周波数)の係数をアレイの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ20は、量子化変換係数を走査して、エントロピー符号化され得るシリアル化ベクトルを生成するために、あらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ20は適応走査を実行し得る。量子化変換係数を走査して1次元ベクトルを形成した後に、ビデオエンコーダ20は、たとえば、コンテキスト適応型可変長コーディング(CAVLC:context-adaptive variable length coding)、コンテキスト適応型バイナリ算術コーディング(CABAC:context-adaptive binary arithmetic coding)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC:syntax-based context-adaptive binary arithmetic coding)、確率間隔区分エントロピー(PIPE:Probability Interval Partitioning Entropy)コーディング、または別のエントロピー符号化方法に従って1次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ20はまた、ビデオデータを復号する際にビデオデコーダ30が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。
[0060] CABACを実行するために、ビデオエンコーダ20は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、たとえば、シンボルの隣接値が非0であるか否かに関係し得る。CAVLCを実行するために、ビデオエンコーダ20は、送信されるべきシンボルのための可変長コードを選択し得る。VLCにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、VLCの使用は、たとえば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられたコンテキストに基づき得る。
[0061] 本開示の技法によれば、ビデオエンコーダ20およびビデオデコーダ30は、たとえば、スライスヘッダ、(ピクチャパラメータセット(PPS:picture parameter set)とシーケンスパラメータセット(SPS)とを含む)パラメータセットなどの中で長期参照ピクチャを識別するためのデータをシグナリングするための改善された技法を利用するように構成され得る。概して、ビデオエンコーダ20およびビデオデコーダ30は、本開示の技法のいずれかまたはすべてを、単独でまたは任意の組合せで実行するように構成され得る。いくつかの例では、ビデオエンコーダ20およびビデオデコーダ30は、長期参照ピクチャのためのデルタPOC MSBサイクルの負値をシグナリングするための方法を実行するように構成され得る。いくつかの例では、ビデオエンコーダ20およびビデオデコーダ30は、差分コーディングを使用して、異なるLSB値をもつ長期参照ピクチャのためのデルタPOC MSBサイクル値のより効率的なシグナリングのための方法を実行するように構成され得る。
[0062] いくつかの例では、現在ピクチャのための短期referneceピクチャとしてシグナリングされる(または現在ピクチャの短期参照ピクチャセット中に含まれる)参照ピクチャは、不要なデルタPOC MSBサイクル値を送ることを回避するために、長期参照ピクチャのためのデルタPOC MSBサイクル値を送るべきかどうかを決定する際に利用される参照ピクチャから除外され得る。いくつかの例では、poc_lsb_lt[i]に等しいPOC LSBを有する(短期参照ピクチャを含むかまたは除外する)n個の参照ピクチャがDPB中にあるとき、およびpoc_lsb_lt[i]に等しいLSB値を有するn個の長期参照ピクチャが現在ピクチャ中でシグナリングされたとき、ビデオエンコーダ20はn−1個の長期参照ピクチャのためのデルタPOC MSBサイクル値のみを送り得、ビデオデコーダ30はそれのみを受信し得るが、このデータは、すべてのn個の長期参照ピクチャのために送られることが可能である。
[0063] 上記の様々な技法のいずれかまたはすべては、以下の例示的な実装形態に従って実装され得る。以下に示すように、長期参照ピクチャのMSBサイクルを記述するWD7のシンタックス要素が変更され得る。本開示では、アレイDeltaPocMSBCycleLt[]を導出するための例示的な方法についても説明する。本開示では、参照ピクチャセットのための例示的な復号プロセスについてさらに説明する。さらに、本開示では、シンタックス要素delta_poc_msb_present_flag[i]およびpoc_lsb_lt[i]のセマンティクスについて説明する。WD7の他のシンタックス要素のシンタックスおよびセマンティクスは不変のままであり得る。
[0064] 表1に、スライスヘッダについてのシンタックスの例示的なセットを表す。下線付きのテキストは、WD7に対するスライスヘッダシンタックスの変更を表す。変更されたシンタックス要素のセマンティクス、ならびに他のシンタックス要素の変更されたセマンティクスについて以下で説明する。
[0065] 表1の例では、スライスヘッダシンタックスは追加の要素delta_poc_msb_cycle_lt_plus1[i]を含む。このシンタックス要素のセマンティクスについて以下で説明する。いくつかの例では、poc_lsb_lt[i]は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャのピクチャ順序カウント値の最下位ビットの値を指定し得る。poc_lsb_lt[i]シンタックス要素の長さはlog2_max_pic_order_cnt_lsb_minus4+4ビットであり得る。
[0066] いくつかの例では、1に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt_plus1[i]が存在することを指定し得る。0に等しいdelta_poc_msb_present_flag[i]は、delta_poc_msb_cycle_lt_plus1[i]が存在しないことを指定し得る。poc_lsb_lt[i]に等しいピクチャ順序カウント値の最下位ビットをもつ、現在ピクチャによって「短期参照のために使用される」とマークされたピクチャを除いて、j個の参照ピクチャが復号ピクチャバッファ中にあり、ただし、jは1よりも大きい整数値であるとき、およびi番目の長期参照ピクチャが、現在ピクチャによってシグナリングされるpoc_lsb_lt[i]に等しいピクチャ順序カウント値の最下位ビットをもつj番目の長期参照ピクチャでないとき、delta_poc_msb_present_flag[i]は1に等しく設定され得る。
[0067] いくつかの例では、delta_poc_msb_cycle_lt_plus1[i]は、現在ピクチャの長期参照ピクチャセット中に含まれるi番目の長期参照ピクチャのピクチャ順序カウント値の最上位ビットの値を判断するために使用され得る。シグナリングされないとき、delta_poc_msb_cycle_lt_plus1[i]は値1を取り得る。
[0068] 変数DeltaPocMSBCycleLt[i]は、以下のアルゴリズムに従って導出され得、ここで、(7−37)は、HEVCのセクション、すなわち、WD7に対する変更されたセクションを指す。以下の例示的な導出は、MSBサイクルがそれらの値の昇順に送られることを暗示することに留意されたい。
[0069] DeltaPocMSBCycleLt[i]*MaxPicOrderCntLsb+pic_order_cnt_lsb−poc_lsb_lt[i]の値は、両端値を含む1から224−1の範囲内にあり得る。代替的に、MSBサイクルは、delta_poc_msb_cycle_lt_plus1[i]の代わりに、ue(v)として(すなわち、最初に左ビットをもつ符号なし整数指数ゴロムコード化(Exp-Golomb-coded)シンタックス要素として)delta_poc_msb_cycle_lt_plusN[i]をシグナリングすることによって送られ得、ただし、Nは1よりも大きい値である。代替的に、MSBサイクルは、delta_poc_msb_cycle_lt_plus1[i]の代わりに、se(v)として(すなわち、最初に左ビットをもつ符号付き整数指数ゴロムコード化シンタックス要素として)delta_poc_msb_cycle_lt[i]をシグナリングすることによって送られ得る。
[0070] 言い換えれば、本開示の技法によれば、ベースMSB値に対してではなく、前にコーディングされた長期参照ピクチャ、たとえば、ピクチャi−1のMSBサイクルに対して、ピクチャiのためのMSBサイクルを表す値(たとえば、ビットストリーム中で実際にシグナリングされるdelta_poc_msb_cycle_lt_plus1[i])が計算され得る。これは、ピクチャiのためのMSBサイクルを表す値が、(ピクチャiのためのMSBとベースMSBとの間の差である)ピクチャiのための真のMSBサイクル値を表すためにピクチャi−1のためのMSBサイクル値に最終的に加算されると仮定すると、この値を、ピクチャiのためのPOC値のMSBとピクチャi−1のためのPOC値のMSBとの間の差として計算することに数学的に等価である。これは、連続MSBサイクル値間の差を表す値が長期参照ピクチャのMSBとベースMSBとの間の差よりも小さくなり得るので、ビットストリーム中でビット節約を達成し得る。
[0071] いくつかの例では、ビデオエンコーダ20およびビデオデコーダ30は、以下の順序付きステップに従って参照ピクチャセットのための導出プロセスおよびピクチャマーキングを実行し得、ここで、DPBは、WD7の付属書類Cに記載されている復号ピクチャバッファを指す。以下の例における短期参照ピクチャサブセット導出と長期参照ピクチャサブセット導出との順序は、WD7における順序に対してスワップされることに留意されたい。右マージンの近くの括孤付きの参照符号はWD7のセクションを指すものとする。WD7のアルゴリズムに対するこのおよび他の変更は、以下の例において下線付きのテキストを使用して示されている。
1.以下が適用される。
2.RefPicSetStCurrBefore、RefPicSetStCurrAfterおよびRefPicSetStFoll中に含まれるすべての参照ピクチャが「短期参照のために使用される」とマークされる。
3.以下が適用される。
4.RefPicSetLtCUrrおよびRefPicSetLtFoll中に含まれるすべての参照ピクチャが「長期参照のために使用される」とマークされる。
5.RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfterまたはRefPicSetStFoll中に含まれない、復号ピクチャバッファ中のすべての参照ピクチャが「参照のために使用されない」とマークされる。
[0072] 参照ピクチャセット中に含まれるが復号ピクチャバッファ中に存在しない、1つまたは複数の参照ピクチャがあり得る。「参照ピクチャなし」に等しいRefPicSetStFollまたはRefPicSetLtFoll中のエントリは無視されるべきである。a)ビットストリーム中の第1のコード化ピクチャがCRAピクチャであり、現在コード化ピクチャが、ビットストリーム中の第1のコード化ピクチャに関連するTFDピクチャであり、b)復号順序で現在コード化ピクチャに先行する前のRAPピクチャがBLAピクチャであり、現在コード化ピクチャが、BLAピクチャに関連するTFDピクチャであるという2つの状態のうちのいずれかが真でない限り、「参照ピクチャなし」に等しいRefPicSetStCurrBefore、RefPicSetStCurrAfterおよびRefPicSetLtCurr中の各エントリについて、偶発的ピクチャ損失が推測されるべきである。
[0073] したがって、本開示の技法によれば、ビデオコーダ(たとえば、ビデオエンコーダ20および/またはビデオデコーダ30)は、差分コーディングを使用して、異なるLSB値を有するピクチャのためのMSBサイクル値を計算し得る。さらに、ビデオコーダは、MSBサイクルを表す値を使用して、長期参照ピクチャのうちの1つ、たとえば、ピクチャi−1またはピクチャiに対する現在ピクチャをコーディングし得る。たとえば、ビデオコーダは、上記で説明した式(式7−37)および/または上記で説明したアルゴリズムを使用して参照ピクチャのためのPOC値を判断し得る。
[0074] したがって、ビデオエンコーダ20およびビデオデコーダ30は、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値をコーディングすることと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値をコーディングすることと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分をコーディングすることとを行うように構成されたビデオコーダの例を表す。
[0075] たとえば、ビデオエンコーダ20は、長期参照ピクチャが異なるLSB値を有するときでも、現在ピクチャのための、(MSB値とも呼ばれる)MSBサイクル値がシグナリングされるべきである2つ以上の長期参照ピクチャがあるかどうかを判断し得る。異なるLSB値を有するが、MSBサイクル値がシグナリングされるべきである、2つの(またはそれ以上の)長期参照ピクチャがある場合、ビデオエンコーダ20は、第1の長期参照ピクチャのためのMSBサイクル値に対する差(またはデルタ)として第2の長期参照ピクチャのためのMSBサイクル値を表すデータを符号化し得る。同様に、ビデオエンコーダ20は、現在ピクチャのためのPOC値のベースMSB値に対する差として第1の長期参照ピクチャのためのMSBサイクル値を表すデータを符号化し得る。ビデオエンコーダ20は、第1の長期参照ピクチャと第2の長期参照ピクチャとのうちの少なくとも1つに対する現在ピクチャの少なくとも一部分(たとえば、1つまたは複数のブロック)をさらに符号化し得る。
[0076] したがって、ビデオデコーダ30が長期参照ピクチャのためのMSBサイクル値を示すデータを受信したとき、ビデオデコーダ30は、第1の長期参照ピクチャのためのPOC値のベースMSB間の差を表す値を復号し、その値をベースMSBに加算することによって第1の長期参照ピクチャのためのPOC値のMSBを計算し得る。ビデオデコーダ30はまた、第2の長期参照ピクチャのためのPOC値のMSBと第1の長期参照ピクチャのためのPOC値のMSBとの間の差を表す値を復号し、その値を第1の長期参照ピクチャのためのPOC値のMSBに加算することによって第2の長期参照ピクチャのためのPOC値のMSBを計算し得る。同様に、ビデオデコーダ30は、長期参照ピクチャのためのPOC値のMSBを使用して、第1の長期参照ピクチャと第2の長期参照ピクチャとのうちの少なくとも1つに対する現在ピクチャの少なくとも一部分を復号し得る。
[0077] ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、適用可能なとき、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダまたはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも複合ビデオエンコーダ/デコーダ(コーデック)の一部として統合され得る。ビデオエンコーダ20および/またはビデオデコーダ30を含むデバイスは、集積回路、マイクロプロセッサ、および/またはセルラー電話などのワイヤレス通信デバイスを備え得る。
[0078] 図2は、スライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を実装し得るビデオエンコーダ20の一例を示すブロック図である。ビデオエンコーダ20は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを実行し得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード(Iモード)は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測(Pモード)または双方向予測(Bモード)などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。
[0079] 図2に示すように、ビデオエンコーダ20は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図2の例では、ビデオエンコーダ20は、モード選択ユニット40と、参照ピクチャメモリ64と、加算器50と、変換処理ユニット52と、量子化ユニット54と、エントロピー符号化ユニット56とを含む。モード選択ユニット40は、今度は、動き補償ユニット44と、動き推定ユニット42と、イントラ予測ユニット46と、パーティションユニット48とを含む。ビデオブロック再構成のために、ビデオエンコーダ20はまた、逆量子化ユニット58と、逆変換ユニット60と、加算器62とを含む。再構成されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタ処理するデブロッキングフィルタ(図2に図示せず)も含まれ得る。所望される場合、デブロッキングフィルタは、一般に、加算器62の出力をフィルタ処理することになる。追加のループフィルタ(ループ内またはループ後)もデブロッキングフィルタに加えて使用され得る。そのようなフィルタは、簡潔のために示されていないが、所望される場合、(ループ内フィルタとして)加算器50の出力をフィルタ処理し得る。
[0080] 符号化プロセス中に、ビデオエンコーダ20はコーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット42および動き補償ユニット44は、時間的予測を行うために、1つまたは複数の参照フレーム中の1つまたは複数のブロックに対して、受信されたビデオブロックのインター予測コーディングを実行する。イントラ予測ユニット46は、代替的に、空間的予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の1つまたは複数の隣接ブロックに対して、受信されたビデオブロックのイントラ予測コーディングを実行し得る。ビデオエンコーダ20は、たとえば、ビデオデータの各ブロックに適切なコーディングモードを選択するために、複数のコーディングパスを実行し得る。
[0081] さらに、パーティションユニット48は、前のコーディングパスにおける前の区分方式の評価に基づいてビデオデータのブロックをサブブロックに区分し得る。たとえば、パーティションユニット48は、初めにフレームまたはスライスをLCUに区分し、レートひずみ分析(たとえば、レートひずみ最適化)に基づいてLCUの各々をサブCUに区分し得る。モード選択ユニット40は、LCUをサブCUに区分することを示す4分木データ構造をさらに生成し得る。4分木のリーフノードCUは、1つまたは複数のPUと、1つまたは複数のTUとを含み得る。
[0082] モード選択ユニット40は、たとえば、誤差結果に基づいてコーディングモード、すなわち、イントラまたはインターのうちの1つを選択し、残差ブロックデータを生成するために、得られたイントラコード化ブロックまたはインターコード化ブロックを加算器50に与え、参照フレームとして使用するための符号化ブロックを再構成するために、得られたイントラコード化ブロックまたはインターコード化ブロックを加算器62に与え得る。モード選択ユニット40はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報など、シンタックス要素をエントロピー符号化ユニット56に与える。本開示の技法によれば、モード選択ユニット40は、参照ピクチャが、長期参照ピクチャまたは短期参照ピクチャ、ならびに長期参照ピクチャのためのピクチャ順序カウント(POC)値の最下位ビット(LSB)として扱われるべきかどうかなどの参照ピクチャ識別情報をエントロピー符号化ユニット56に与え得る。本開示の技法によれば、エントロピー符号化ユニット56、またはビデオエンコーダ20の別のユニットは、スライスのスライスヘッダ中にそのような参照ピクチャ識別情報を含み得る。代替的に、エントロピー符号化ユニット56は、ピクチャパラメータセット(PPS)またはシーケンスパラメータセット(SPS)など、パラメータセット中に(たとえば、どの参照ピクチャが長期参照ピクチャであるかを示すための)参照ピクチャ識別情報を含み得る。
[0083] 上記で説明したように、長期参照ピクチャは、長期参照ピクチャのためのPOC値のLSBを使用してシグナリングされ得る。たとえば、エントロピー符号化ユニット56は、スライスヘッダ、PPS、またはSPS中で参照ピクチャのためのPOC値のLSBをシグナリングすることによって、参照ピクチャが長期参照ピクチャであることを示し得る。このようにしてシグナリングされない他の参照ピクチャは短期参照ピクチャとして扱われ得る。
[0084] 長期参照ピクチャのための識別情報をシグナリングすることによって、エントロピー符号化ユニット56は、どの参照ピクチャが、比較的長期時間期間の間、ビデオデコーダ(たとえば、ビデオデコーダ30)の復号ピクチャバッファ(DPB)に記憶されるべきであり、どの参照ピクチャがより早く復号ピクチャバッファから除去され得るかを示すデータを与える。概して、長期参照ピクチャは、比較的遅い復号順序時間を有するピクチャをコーディングするための参照ピクチャとして使用され得る。したがって、長期参照ピクチャのための識別情報をシグナリングすることは、参照ピクチャがそれ自体のDPBから廃棄され得るか否かをビデオデコーダが判断することができるように、ビデオデコーダ、たとえば、ビデオデコーダ30に情報を与える。
[0085] 動き推定ユニット42と動き補償ユニット44とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット42によって実行される動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、たとえば、現在フレーム(または他のコード化ユニット)内でコーディングされている現在ブロックに対する参照フレーム(または他のコード化ユニット)内の予測ブロックに対する現在ビデオフレームまたはピクチャ内のビデオブロックのPUの変位を示し得る。予測ブロックは、絶対値差分和(SAD:sum of absolute difference)、2乗差分和(SSD:sum of square difference)、または他の差分メトリックによって判断され得るピクセル差分に関して、コーディングされるべきブロックにぴったり一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ20は、参照ピクチャメモリ64に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。たとえば、ビデオエンコーダ20は、参照ピクチャの1/4ピクセル位置、1/8ピクセル位置、または他の分数ピクセル位置の値を補間し得る。したがって、動き推定ユニット42は、フルピクセル位置と分数ピクセル位置とに対する動き探索を実行し、分数ピクセル精度で動きベクトルを出力し得る。
[0086] 動き推定ユニット42は、PUの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライスにおけるビデオブロックのPUのための動きベクトルを計算する。参照ピクチャは、第1の参照ピクチャリスト(リスト0)または第2の参照ピクチャリスト(リスト1)から選択され得、それらの参照ピクチャリストの各々は、参照ピクチャメモリ64に記憶された1つまたは複数の参照ピクチャを識別する。参照ピクチャメモリ64は長期参照ピクチャと短期参照ピクチャの両方を記憶し得る。動き推定ユニット42は、計算された動きベクトルをエントロピー符号化ユニット56と動き補償ユニット44とに送る。
[0087] 動き補償ユニット44によって実行される動き補償は、動き推定ユニット42によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することを伴い得る。この場合も、いくつかの例では、動き推定ユニット42と動き補償ユニット44とは機能的に統合され得る。現在ビデオブロックのPUのための動きベクトルを受信すると、動き補償ユニット44は、参照ピクチャリストのうちの1つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器50は、以下で説明するように、コーディングされている現在ビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット42はルーマ成分に対して動き推定を実行し、動き補償ユニット44は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。
[0088] モード選択ユニット40はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ30が使用するための、ビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。たとえば、ビデオデータのブロックのための動きベクトルを計算した後(動きベクトルは参照ピクチャ中の参照ブロックを指す)、モード選択ユニット40は、参照ピクチャが記憶された参照ピクチャリスト、および参照ピクチャリスト中の参照ピクチャの位置に対応する参照ピクチャリストへのインデックスなど、動きパラメータの値を生成し得る。これらおよび他の動きパラメータは、動きベクトルコーディングモードに基づいてコーディングされ得る。たとえば、高度動きベクトル予測(AMVP:advanced motion vector prediction)を使用して、エントロピー符号化ユニット56は、(現在ブロックへの空間ネイバーまたは時間ネイバーに対応する)動きベクトル予測子を識別し、参照ピクチャリストと、参照ピクチャインデックスと、水平および垂直動きベクトル差分値とを明示的にシグナリングし得る。別の例として、マージモードを使用して、エントロピー符号化ユニット56は、マージインデックスを使用して動きベクトル予測子を識別し得、参照ピクチャリストおよび参照インデックスは、動きベクトル予測子から継承され得る(たとえば、隣接ブロックの動き情報、空間ネイバーであるか、時間ネイバーであるか)。
[0089] ビデオエンコーダ20は、参照ピクチャがDPBから廃棄されるべきでないことを示すとともに、参照ピクチャリスト構成プロセス中に使用され得る情報を与えるために、これらのどのピクチャが長期参照ピクチャであるかを示す情報をシグナリングする。このようにして、ビデオデコーダ30などのビデオデコーダは、インター予測されたブロックのための動き情報として使用される参照インデックスが正しい参照ピクチャを正確に指すように、参照ピクチャリストを正確に再生することが可能であり得る。
[0090] 上記のように、長期参照ピクチャは、長期参照ピクチャのPOC値を使用してシグナリングされ得る。POC値は、概して、必ずしも(ビットストリーム順序とも呼ばれる)復号順序と同じであるとは限らない、ピクチャの(出力順序とも呼ばれる)表示順序を示すデータに対応する。長期参照ピクチャのためのPOC値は、最下位ビット(LSB)のみを使用してシグナリングされ得る。MSBを表すデータは、時々、たとえば、2つ以上の長期参照ピクチャが同じLSBを有するとき、シグナリングされ得る。いくつかの事例では、ビデオエンコーダ20は、MSBデータがシグナリングされるピクチャのうちの少なくとも2つが異なるLSBを有するときでも、2つの(またはそれ以上の)ピクチャのためのMSBを表すデータがシグナリングされる必要があると判断し得る。
[0091] 本開示の技法によれば、ビデオエンコーダ20は、MSBを表すデータを、差、たとえば、MSBの1つのセットとMSBの別のセットとの間の差としてシグナリングし得る。たとえば、表1に関して上記で説明したように、ビデオエンコーダ20は、ベースMSB値と長期参照ピクチャのためのMSB値との間の差を計算し得る。エントロピー符号化ユニット56は、この差を、長期参照ピクチャのためのMSBを表す値としてシグナリングし得る。ベースMSB値は現在ピクチャのPOC値のMSBに対応し得る。代替的に、ベースMSB値は、瞬時デコーダリフレッシュ(IDR:instantaneous decoder refresh)ピクチャなど、別のピクチャのPOC値のMSBに対応し得る。
[0092] 1つの長期参照ピクチャのための差分値を符号化した後、エントロピー符号化ユニット56は、別の長期参照ピクチャのためのPOC値のMSBと以前の長期参照ピクチャのためのPOC値のMSBとの間の差を計算し得る。同様に、エントロピー符号化ユニット56は、ビデオデコーダ30などのビデオデコーダが後続の長期参照ピクチャのためのPOC値のMSBを再構成することができるように、後続の長期参照ピクチャのためのこの第2の差分値をシグナリングし得る。このようにして、ビデオエンコーダ20は、たとえば、ベースMSB値に対する、または他の長期参照ピクチャのPOC値のための前に符号化されたMSBに対する差分値として、長期参照ピクチャのためのPOC値のMSBを表すデータを符号化するように構成され得る。さらに、ビデオエンコーダ20は、POC値のLSBが異なるときでも、これらの差分値をシグナリングし得る。
[0093] 上記で説明したように、いくつかの例では、ビデオエンコーダ20は、1つまたは複数の長期参照ピクチャのためのPOC値のMSBとベースMSB値(または他の参照MSB)との間の差を表す差分値の負整数値を符号化するように構成され得る。たとえば、エントロピー符号化ユニット56(またはビデオエンコーダ20の別のユニット)が、現在ピクチャがMaxPicOrderCntLsb*N−1に等しいPOC値を有し、MaxPicOrderCntLsb*Nに等しいPOC値を有するピクチャが、delta_poc_msb_cycle_lt[i]がシグナリングされる第1のLTRPであると判断したとき、エントロピー符号化ユニット56はLTRPのPOC値のMSBのための−1の値をコーディングし得る。
[0094] さらに、または代替として、ビデオエンコーダ20は、参照ピクチャセット(または復号ピクチャバッファ)に現在記憶されている参照ピクチャの総数および/または参照ピクチャセット(または復号ピクチャバッファ)に現在記憶されている短期参照ピクチャの数に少なくとも部分的に基づいて、長期参照ピクチャのためのPOC値を表すデータを符号化するように構成され得る。たとえば、ビデオエンコーダ20は、長期参照ピクチャと同じPOC LSB値を有する任意の他の長期参照ピクチャが参照ピクチャセット(または復号ピクチャバッファ)中にあるかどうかに基づいて長期参照ピクチャのためのPOC MSBサイクル値をシグナリングすべきかどうかを判断するように構成され得る。したがって、長期参照ピクチャと同じPOC LSBを有する1つまたは複数の短期参照ピクチャのみが参照ピクチャセット中にあるとき、ビデオエンコーダ20は、長期参照ピクチャのためのPOC MSBサイクル値を符号化することを回避し得る。
[0095] さらに、または代替として、ビデオエンコーダ20は、長期参照ピクチャのためのPOC値と同じLSBを有するN個の長期参照ピクチャが復号ピクチャバッファ中にあるとき、およびビデオエンコーダ20が長期参照ピクチャのN−1個のためのデルタPOC MSBサイクル値をすでに符号化したとき、長期参照ピクチャのためのデルタPOC MSBサイクル値をコーディングしないと判断し得る。
[0096] イントラ予測ユニット46は、上記で説明したように、動き推定ユニット42と動き補償ユニット44とによって実行されるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測ユニット46は、現在ブロックを符号化するために使用すべきイントラ予測モードを判断し得る。いくつかの例では、イントラ予測ユニット46は、たとえば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測ユニット46(または、いくつかの例では、モード選択ユニット40)は、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。
[0097] たとえば、イントラ予測ユニット46は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ(または誤差)の量、ならびに符号化ブロックを生成するために使用されるビットレート(すなわち、ビット数)を判断する。イントラ予測ユニット46は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比を計算し得る。
[0098] ブロックのためのイントラ予測モードを選択した後に、イントラ予測ユニット46は、ブロックのための選択されたイントラ予測モードを示す情報をエントロピー符号化ユニット56に与え得る。エントロピー符号化ユニット56は、選択されたイントラ予測モードを示す情報を符号化し得る。ビデオエンコーダ20は、複数のイントラ予測モードインデックステーブルおよび複数の変更されたイントラ予測モードインデックステーブル(コードワードマッピングテーブルとも呼ばれる)と、様々なブロックの符号化コンテキストの定義と、コンテキストの各々について使用すべき、最確イントラ予測モード、イントラ予測モードインデックステーブル、および変更されたイントラ予測モードインデックステーブルの指示とを含み得る構成データを送信ビットストリーム中に含め得る。
[0099] ビデオエンコーダ20は、コーディングされている元のビデオブロックから、モード選択ユニット40からの予測データを減算することによって残差ビデオブロックを形成する。加算器50は、この減算演算を実行する1つまたは複数の構成要素を表す。変換処理ユニット52は、離散コサイン変換(DCT)または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット52は、概念的にDCTと同様である他の変換を実行し得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット52は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット52は、得られた変換係数を量子化ユニット54に送り得る。量子化ユニット54は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット54は、次いで、量子化変換係数を含む行列の走査を実行し得る。代替的に、エントロピー符号化ユニット56が走査を実行し得る。
[0100] 量子化の後に、エントロピー符号化ユニット56は、量子化変換係数をエントロピーコーディングする。たとえば、エントロピー符号化ユニット56は、コンテキスト適応型可変長コーディング(CAVLC)、コンテキスト適応型バイナリ算術コーディング(CABAC)、シンタックスベースコンテキスト適応型バイナリ算術コーディング(SBAC)、確率間隔区分エントロピー(PIPE)コーディングまたは別のエントロピーコーディング技法を実行し得る。コンテキストベースエントロピーコーディングの場合、コンテキストは隣接ブロックに基づき得る。エントロピー符号化ユニット56によるエントロピーコーディングの後に、符号化ビットストリームは、別のデバイス(たとえば、ビデオデコーダ30)に送信されるか、あるいは後で送信するかまたは取り出すためにアーカイブされ得る。
[0101] 逆量子化ユニット58および逆変換ユニット60は、それぞれ逆量子化および逆変換を適用して、たとえば、参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット44は、残差ブロックを参照ピクチャメモリ64のフレームのうちの1つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット44はまた、再構成された残差ブロックに1つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器62は、再構成された残差ブロックを、動き補償ユニット44によって生成された動き補償予測ブロックに加算して、参照ピクチャメモリ64に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット42および動き補償ユニット44によって参照ブロックとして使用され得る。
[0102] 図2のビデオエンコーダ20は、ビデオデータの現在ピクチャのためのデータをコーディングすることと、ここにおいて、コーディングされたデータが、現在ピクチャのための長期参照ピクチャのためのピクチャ順序カウント(POC)最上位ビット(MSB)サイクルのための負整数値を表す、MSBサイクルのための負整数値に少なくとも部分的に基づいて長期参照ピクチャに対する現在ピクチャの少なくとも一部分をコーディングすることとを行うように構成され得るビデオエンコーダの一例を表す。
[0103] 図2のビデオエンコーダ20はまた、追加または代替として、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する現在ピクチャの少なくとも第2の部分とを符号化することと、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、を行うように構成され得るビデオエンコーダの一例を表す。
[0104] 図2のビデオエンコーダ20はまた、追加または代替として、利用可能な参照ピクチャの総数のうち、現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数を判断することと、参照ピクチャの総数と短期参照ピクチャとしてマークされた参照ピクチャの数とに基づいて現在ピクチャのための長期参照ピクチャのための最上位ビット(MSB)値をコーディングすることと、利用可能な参照ピクチャのうちの少なくとも1つに対する現在ピクチャの少なくとも一部分をコーディングすることとを行うように構成され得るビデオエンコーダの一例を表す。
[0105] 図2のビデオエンコーダ20はまた、追加または代替として、等しい最下位ビット(LSB)値をもつピクチャ順序カウント(POC)値を有する、現在ピクチャのための参照ピクチャの数Nを判断することと、現在ピクチャの参照ピクチャセットがN個の長期参照ピクチャを含み得ると判断することと、それらの判断に基づいて、長期参照ピクチャのうちの多くともN−1個のためのデルタPOC最上位ビット(MSB)サイクル値をコーディングすることとを行うように構成され得るビデオエンコーダの一例を表す。
[0106] 図3は、ライスヘッダ中での長期参照ピクチャの改善されたシグナリングのための技法を実装し得るビデオデコーダ30の一例を示すブロック図である。図3の例では、ビデオデコーダ30は、エントロピー復号ユニット70と、動き補償ユニット72と、イントラ予測ユニット74と、逆量子化ユニット76と、逆変換ユニット78と、参照ピクチャメモリ82と、加算器80とを含む。ビデオデコーダ30は、いくつかの例では、ビデオエンコーダ20(図2)に関して説明した符号化パスとは概して逆の復号パスを実行し得る。動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルに基づいて予測データを生成し得、イントラ予測ユニット74は、エントロピー復号ユニット70から受信されたイントラ予測モードインジケータに基づいて予測データを生成し得る。
[0107] 復号プロセス中に、ビデオデコーダ30は、ビデオエンコーダ20から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ30のエントロピー復号ユニット70は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット70は、動きベクトルと他の予測シンタックス要素とを動き補償ユニット72に転送する。ビデオデコーダ30は、ビデオスライスレベルおよび/またはビデオブロックレベルでシンタックス要素を受信し得る。
[0108] ビデオスライスがイントラコード化(I)スライスとしてコーディングされたとき、イントラ予測ユニット74は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコード化(すなわち、B、PまたはGPB)スライスとしてコーディングされたとき、動き補償ユニット72は、エントロピー復号ユニット70から受信された動きベクトルと他のシンタックス要素とに基づいて、現在ビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストのうちの1つ内の参照ピクチャのうちの1つから生成され得る。ビデオデコーダ30は、参照ピクチャメモリ82に記憶された参照ピクチャに基づいて、デフォルト構成技法を使用して、参照ピクチャリスト、リスト0およびリスト1を構成し得る。
[0109] ビデオデコーダ30は、ビデオデコーダ30がそこから参照ピクチャリストを構成する参照ピクチャセットを判断し得る。いくつかの例では、たとえば、ビデオデコーダ30がHEVCに準拠するとき、ビデオデコーダ30は、HEVC WD7のセクション8.3.3に従って参照ピクチャリストを構成し得る。参照ピクチャセットは、概して、復号ピクチャバッファに、たとえば、参照ピクチャメモリ82内に現在記憶されている参照ピクチャに対応する。参照ピクチャセットのいくつかの参照ピクチャは短期参照ピクチャとしてマークされ得、参照ピクチャセットの他の参照ピクチャは長期参照ピクチャとしてマークされ得る。概して、長期参照ピクチャは、たとえば、参照ピクチャのためのコード化ビデオデータをカプセル化するNALユニットのネットワークアブストラクションレイヤ(NAL)ユニットヘッダ中で「長期参照のために使用される」とマークされる。
[0110] 本開示の技法によれば、ビデオデコーダ30は、差分コーディングを使用して長期参照ピクチャのための識別子を復号するように構成され得る。たとえば、第1の長期参照ピクチャ(たとえば、ピクチャのシーケンス中に0のインデックス値を有する長期参照ピクチャ)の場合、ビデオデコーダ30は、長期参照ピクチャのためのPOC MSBと現在ピクチャのためのPOC MSBとの間の差を示す差分値を復号し得る。現在ピクチャのためのPOC MSBは「ベースMSB」と呼ばれることがある。他の長期参照ピクチャ(たとえば、ピクチャのシーケンス中に0よりも大きいインデックス値を有する長期参照ピクチャ)の場合、ビデオデコーダ30は、長期参照ピクチャのためのPOC MSBと前の長期参照ピクチャのためのPOC MSBとの間の差を示す差分値を復号し得る。それについてのPOC MSBが現在判断されている長期参照ピクチャがiのインデックス値を有すると仮定すると、ビデオデコーダ30は、POC MSBを判断するために、両端値を含む0とi−1との間の任意の値のインデックス値を有する長期参照ピクチャのPOC MSBを指し得る。すなわち、ビデオデコーダ30は、jのインデックス値を有する長期参照ピクチャのPOC MSBを指し得、ただし、jは、両端値を含む0とi−1との間である。いくつかの事例では、差分値は負整数値を有し得る。
[0111] 長期参照ピクチャのためのPOC MSB間の差を表す差分値を受信した後、ビデオデコーダ30は、差分値が適用される(すなわち、差分値が、長期参照ピクチャのためのPOC MSBを再構成するために加算されるべきである)POC MSB値を判断し得る。たとえば、長期参照ピクチャが、(長期参照ピクチャがピクチャのシーケンス中の順序の第1の長期参照ピクチャであることを示す)0のインデックス値を有する場合、ビデオデコーダ30は、現在ピクチャのPOC MSB値をベースMSB値として使用し、ベースMSB値に、長期参照ピクチャのためにシグナリングされた差分値を加算し得る。別の例として、長期参照ピクチャが、(長期参照ピクチャがピクチャのシーケンス中の順序の第1の長期参照ピクチャでないことを示す)0よりも大きいインデックス値を有する場合、インデックス値がiであると仮定すると、ビデオデコーダ30は、シグナリングされた差分値を、インデックス値i−1を有する長期参照ピクチャのためのPOC MSBに加算し得る。
[0112] このようにして、ビデオデコーダ30は、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号し、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号し得、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する。同様に、ビデオデコーダ30は、第1の値(すなわち、第1の差分値)を使用して、第1の長期参照ピクチャのための第1のMSBサイクル値をDeltaPocMSBCycleLt[i−1]として計算し、第2の長期参照ピクチャのための第2のMSBサイクル値をDeltaPocMSBCycleLt[i]として計算し得、ここにおいて、第2のMSBサイクル値を計算することが、DeltaPocMSBCycleLt[i−1]と第2の値(すなわち、第2の差分値)とに基づいてDeltaPocMSBCycleLt[i]を計算することを備える。
[0113] さらに、ビデオデコーダ30は、長期参照ピクチャのPOC値のためのLSBを復号し得る。LSBは、現在ピクチャのためのスライスのスライスヘッダ中、現在ピクチャを含むシーケンスのためのシーケンスパラメータセット(SPS)中、現在ピクチャのためのピクチャパラメータセット(PPS)中、または他の場所でシグナリングされ得る。ビデオデコーダ30は、長期参照ピクチャの完全POC値を判断するために、長期参照ピクチャのPOC値のためのMSBとLSBとを連結し得る。次いで、ビデオデコーダ30は、POC値によって識別された長期参照ピクチャを含む参照ピクチャリストをアセンブルし得る。このようにして、ビデオデコーダ30は、動き情報(たとえば、参照ピクチャリストと参照インデックスとを識別するデータ)を使用して、インター予測を実行することができる。たとえば、以下で説明するように、動き補償ユニット72は、参照ピクチャリストのうちの1つ中のピクチャのうちの1つに対応する、参照ピクチャを識別する動き情報に少なくとも部分的に基づいて、現在ピクチャのブロックのための参照ブロックを判断し得る。参照ピクチャは、長期参照ピクチャのうちの1つに、または短期参照ピクチャに対応し得る。
[0114] 動き補償ユニット72は、動きベクトルと他のシンタックス要素とをパースすることによって現在ビデオスライスのビデオブロックのための予測情報を判断し、その予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。たとえば、動き補償ユニット72は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード(たとえば、イントラまたはインター予測)と、インター予測スライスタイプ(たとえば、Bスライス、Pスライス、またはGPBスライス)と、スライスの参照ピクチャリストのうちの1つまたは複数のための構成情報と、スライスの各インター符号化ビデオブロックのための動きベクトルと、スライスの各インターコード化ビデオブロックのためのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。
[0115] 動き補償ユニット72はまた、補間フィルタに基づいて補間を実行し得る。動き補償ユニット72は、ビデオブロックの符号化中にビデオエンコーダ20によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット72は、受信されたシンタックス要素からビデオエンコーダ20によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。
[0116] 逆量子化ユニット76は、ビットストリーム中で与えられ、エントロピー復号ユニット70によって復号された量子化変換係数を逆量子化(inverse quantize)、すなわち、逆量子化(de-quantize)する。逆量子化プロセスは、量子化の程度を判断し、同様に、適用されるべき逆量子化の程度を判断するための、ビデオスライス中の各ビデオブロックについてビデオデコーダ30によって計算される量子化パラメータQPYの使用を含み得る。逆変換ユニット78は、ピクセル領域において残差ブロックを生成するために、逆変換、たとえば、逆DCT、逆整数変換、または概念的に同様の逆変換プロセスを変換係数に適用する。
[0117] 動き補償ユニット72が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後、ビデオデコーダ30は、逆変換ユニット78からの残差ブロックを動き補償ユニット72によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器80は、この加算演算を実行する1つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するために、または場合によってはビデオ品質を改善するために、他のループフィルタも(コーディングループ中またはコーディングループ後のいずれかで)使用され得る。所与のフレームまたはピクチャ中の復号ビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照ピクチャメモリ82に記憶される。参照ピクチャメモリ82はまた、図1のディスプレイデバイス32などのディスプレイデバイス上での後の表示のための、復号ビデオを記憶する。
[0118] このようにして、図3のビデオデコーダ30は、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号することとを行うように構成され得るビデオデコーダの一例を表す。
[0119] 図3のビデオデコーダ30はまた、追加または代替として、ビデオデータの現在ピクチャのためのデータを復号することと、ここにおいて、復号データが、現在ピクチャのための長期参照ピクチャ関係詞のためのピクチャ順序カウント(POC)最上位ビット(MSB)サイクルのための負整数値を表す、MSBサイクルのための負整数値に少なくとも部分的に基づいて長期参照ピクチャに対する現在ピクチャの少なくとも一部分を復号することとを行うように構成され得るビデオデコーダの一例を表す。
[0120] 図3のビデオデコーダ30はまた、追加または代替として、利用可能な参照ピクチャの総数のうち、現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数を判断することと、参照ピクチャの総数と短期参照ピクチャとしてマークされた参照ピクチャの数とに基づいて現在ピクチャのための長期参照ピクチャのための最上位ビット(MSB)値を復号することと、利用可能な参照ピクチャのうちの少なくとも1つに対する現在ピクチャの少なくとも一部分を復号することとを行うように構成され得るビデオデコーダの一例を表す。
[0121] 図3のビデオデコーダ30はまた、追加または代替として、等しい最下位ビット(LSB)値をもつピクチャ順序カウント(POC)値を有する、現在ピクチャのための参照ピクチャの数Nを判断することと、参照ピクチャセットがN個の長期参照ピクチャを含み得ると判断することと、それらの判断に基づいて、長期参照ピクチャのうちの多くともN−1個のためのデルタPOC最上位ビット(MSB)サイクル値を復号することとを行うように構成され得るビデオデコーダの一例を表す。
[0122] 図4は、コード化ビデオピクチャ100〜132のシーケンスを示す概念図である。ピクチャは、階層予測構造内の位置を示すために異なる陰影を付けられている。たとえば、ピクチャ100、116、および132は、ピクチャ100、116、132が階層予測構造の最上位にあることを表すために黒の陰影を付けられている。ピクチャ100、116、132は、たとえば、単一の方向にある他のピクチャ(たとえば、Pピクチャ)から予測されるイントラコード化ピクチャまたはインターコード化ピクチャを備え得る。イントラコード化の場合、ピクチャ100、116、132は同じピクチャ内のデータからのみ予測される。インターコード化の場合、ピクチャ116は、たとえば、ピクチャ116からピクチャ100への破線矢印で示すように、ピクチャ100のデータに対してコーディングされ得る。ピクチャ116、132は、それぞれ、ピクチャグループ(GOP)134、136のキーピクチャを形成する。
[0123] ピクチャ108、124は、それらが、符号化階層においてピクチャ100、116、および132の次であることを示すために暗い陰影を付けられている。ピクチャ108、124は、双方向、インターモード予測符号化ピクチャを備え得る。たとえば、ピクチャ108はピクチャ100および116のデータから予測され得、ピクチャ124はピクチャ116および132から予測され得る。ピクチャ104、112、120、および128は、それらが、符号化階層においてピクチャ108および124の次であることを示すために、明るい陰影を付けられている。ピクチャ104、112、120、および128はまた、双方向、インターモード予測符号化ピクチャを備え得る。たとえば、ピクチャ104はピクチャ100および108から予測され得、ピクチャ112はピクチャ108および116から予測され得、ピクチャ120はピクチャ116および124から予測され得、ピクチャ128はピクチャ124および132から予測され得る。概して、参照ピクチャが依然として復号ピクチャバッファ中でバッファされると仮定し、参照ピクチャが現在コーディングされているピクチャよりも早くコーディングされたと仮定すると、階層においてより低いピクチャは、階層においてより高い参照ピクチャから符号化され得る。
[0124] 最後に、ピクチャ102、106、110、114、118、122、126、および130は、これらのピクチャが符号化階層において最下位であることを示すために白い陰影を付けられている。ピクチャ102、106、110、114、118、122、126、および130はまた、双方向、インターモード予測符号化ピクチャであり得る。ピクチャ102はピクチャ100および104から予測され得、ピクチャ106はピクチャ104および108から予測され得、ピクチャ110はピクチャ108および112から予測され得、ピクチャ114はピクチャ112および116から予測され得、ピクチャ118はピクチャ116および120から予測され得、ピクチャ122はピクチャ120および124から予測され得、ピクチャ126はピクチャ124および128から予測され得、ピクチャ130はピクチャ128および132から予測され得る。この場合も、コーディング階層においてより低いピクチャが、コーディング階層においてより高い他のピクチャからコーディングされ得ることを理解されたい。さらにまたは代替として、たとえば、ピクチャ102、106、110、または114のいずれかまたはすべては、ピクチャ100、116、または108のうちのいずれかに対して予測され得る。
[0125] ピクチャ100〜132は表示順序で示されている。すなわち、復号に続き、ピクチャ100はピクチャ102の前に表示され、ピクチャ102はピクチャ104の前に表示され、以下同様である。上記のように、POC値は、概して、未加工ピクチャが、符号化される前にキャプチャまたは生成された順序と実質的に同じでもあるピクチャの表示順序を記述する。しかしながら、符号化階層により、ピクチャ100〜132は異なる順序で復号され得る。さらに、符号化された後、ピクチャ100〜132は、ピクチャ100〜132のための符号化データを含むビットストリーム中に復号順序で構成され得る。たとえば、ピクチャ116は、GOP134のピクチャのうち最後に表示され得る。しかしながら、符号化階層により、ピクチャ116はGOP134のうち最初に復号され得る。すなわち、ピクチャ108を適切に復号するために、たとえば、ピクチャ116は、ピクチャ108のための参照ピクチャとして働くために、最初に復号される必要があり得る。同様に、ピクチャ108はピクチャ104、106、110、および112のための参照フレームとして働き得、したがって、ピクチャ104、106、110、および112の前に復号される必要があり得る。
[0126] さらに、いくつかのピクチャは長期参照ピクチャとして扱われ得、他のピクチャは短期参照ピクチャとして扱われ得る。たとえば、ピクチャ100および116は長期参照ピクチャを表し、ピクチャ108、104、および112は短期参照ピクチャを表すと仮定する。この例では、ピクチャ102および106が、ピクチャ100、116、108、または104のうちのいずれかに対して予測され得るが、ピクチャ110および114が、ピクチャ100、116、108、または112のうちのいずれかに対して予測され得る場合であり得る。言い換えれば、ピクチャ104は、ピクチャ110および114をコーディングするときに参照のために利用可能でないことがある。別の例として、ピクチャ100および116が長期参照ピクチャを表し、ピクチャ108、104、および112が短期参照ピクチャを表すと仮定すると、ピクチャ108、104、および112は、ピクチャ118、122、126、および130をコーディングするときに参照のために利用可能でないことがある。
[0127] 本開示の技法によれば、長期参照ピクチャに関するデータは、ピクチャ100〜132のいずれかまたはすべてのためのスライスのスライスヘッダ中でシグナリングされ得る。代替的に、データは、PPS、SPS、または他のデータ構造中でシグナリングされ得る。
[0128] この場合も、ピクチャ100および116が長期参照ピクチャを表すと仮定すると、ビデオエンコーダ20は、ピクチャ100のためのPOC MSBを、ベースMSB値、たとえば、ピクチャ102などの現在ピクチャのPOC MSBに対する差として符号化し得る。すなわち、ビデオエンコーダ20は、ピクチャ100のためのPOC MSBとピクチャ102のためのPOC MSBとの間の差を計算し、ピクチャ100のための差分値を符号化し得る。同様に、ビデオエンコーダ20は、ピクチャ116のためのPOC MSBとピクチャ100のためのPOC MSBとの間の差を計算し、ピクチャ116のための差分値を符号化し得る。ビデオエンコーダ20はまた、ピクチャ100のためのLSB値とピクチャ116のためのLSB値とを符号化し得る。
[0129] したがって、ビデオデコーダ30は、ピクチャ100のための差分値を復号し、差分値をピクチャ102のためのベースMSB値に加算することによって、ピクチャ100のためのPOC値とピクチャ116のためのPOC値とを再構成し得る。同様に、ビデオデコーダ30は、ピクチャ116のための差分値を復号し、差分値をピクチャ100のためのPOC MSBに加算し得る。ビデオデコーダ30はまた、ピクチャ100のためのPOC LSB値とピクチャ116のためのPOC LSB値を復号し得る。ビデオデコーダ30は、ピクチャ100のためのPOC値を再生するために、ピクチャ100のためのPOC MSBをピクチャ100のためのPOC LSBと連結し得る。同様に、ビデオデコーダ30は、ピクチャ116のためのPOC値を再生するために、ピクチャ116のためのPOC MSBをピクチャ116のためのPOC LSBと連結し得る。
[0130] このようにして、ビデオエンコーダ20とビデオデコーダ30の両方は、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値をコーディングすることと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値をコーディングすることと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分をコーディングすることとを行うように構成され得る。
[0131] より詳細には、ビデオエンコーダ20は、現在ピクチャ、たとえば、ピクチャ102のための参照ピクチャリスト中に含まれるべき長期参照ピクチャのためのPOC値を表すデータを符号化し得る。概して、ビデオエンコーダ20は、現在ピクチャの少なくとも一部分が参照ピクチャに対して符号化されたとき、参照ピクチャが参照ピクチャリスト中に含まれるべきであることを示し得る。ピクチャのブロックが、ブロックのための動きベクトルが参照ピクチャの参照ブロックを指すように、参照ピクチャに対してインター符号化されたとき、ピクチャの一部分は参照ピクチャに対して符号化されたと見なされ得る。ブロックのための動き情報は、参照ピクチャリスト識別子(たとえば、リスト0またはリスト1)、ならびに参照ピクチャリスト識別子によって識別された参照ピクチャリスト中の参照ピクチャに対応する参照インデックスを含み得る。
[0132] したがって、ビデオエンコーダ20は、ピクチャ100の参照ブロックに対してピクチャ102のブロックを符号化し得る。すなわち、ビデオエンコーダ20は、ブロックのための動き探索を実行し、他の参照ブロックに対して、ピクチャ100の参照ブロックが許容誤差値を生成すると判断し得る。同様に、ビデオエンコーダ20は、ピクチャ116の参照ブロックに対してピクチャ102の異なるブロックを符号化し得る。
[0133] 図5は、本開示の技法による、長期参照ピクチャのためのPOC値を符号化するための例示的な方法を示すフローチャートである。説明のために、図5の方法について、図1および図2のビデオエンコーダ20ならびにそれの構成要素に関して説明する。ただし、他のビデオ符号化デバイスが図5の方法を実行するように構成され得ることを理解されたい。
[0134] 初めに、ビデオエンコーダ20は、1つまたは複数の参照ピクチャを使用して現在ピクチャのデータを符号化する(150)。ビデオエンコーダ20は、次いで、現在ピクチャを符号化するために使用された参照ピクチャを判断する(152)。より詳細には、ビデオエンコーダ20は、現在ピクチャを符号化するとき、利用可能な参照ピクチャのセット中のどの参照ピクチャが参照のために実際に使用されるかを判断し得る。いくつかの例では、ステップ150とステップ152とは統合され、実質的に同時に実行され得る。利用可能な参照ピクチャは長期参照ピクチャ(LTRP)と短期参照ピクチャ(STRP)とを含み得る。ビデオエンコーダ20は、いくつかの様々な試行コーディングパスを介して得られたコーディング結果に基づいて、参照ピクチャを長期参照ピクチャとして設定すべきか、短期参照ピクチャとして設定すべきかを判断し得る。たとえば、コーディング結果(たとえば、レートひずみ最適化(RDO:rate-distortion optimization)メトリック)が、概して、特定の参照ピクチャが長期参照ピクチャとして扱われる(参照ピクチャを長期間記憶するために消費されるメモリの量によって潜在的にオフセットされる)ときにより良好であるとき、ビデオエンコーダ20は、その参照ピクチャを長期参照ピクチャとして扱い得る。
[0135] いずれの場合も、参照ピクチャのセットと長期参照ピクチャとして扱われるべきであるそれらの参照ピクチャとを判断した後に、ビデオエンコーダ20は、どのピクチャが長期参照ピクチャとして現在ピクチャのための参照ピクチャリスト中に含まれるべきであるかを示す情報を符号化し得る。符号化された情報は、長期参照ピクチャのためのPOC値を表すデータを備え得る。ビデオエンコーダ20は、現在ピクチャのスライスのスライスヘッダ中、現在ピクチャに対応するPPS中、現在ピクチャを含むシーケンスのためのSPS中、または他の場所でこの情報を符号化し得る。
[0136] ビデオエンコーダ20は、順序の第1の長期参照ピクチャのためのPOC値のMSBを示すデータ、ならびに順序の第1の長期参照ピクチャのためのPOC値のLSBを示すデータを符号化する(154)。MSBを符号化するために、ビデオエンコーダ20は、第1の長期参照ピクチャのためのPOC値のMSBと現在ピクチャのためのPOC値のMSBとの間の差を計算し、この計算された差分値を符号化し得る。
[0137] ビデオエンコーダ20は、次いで、後続のLTRPのためのPOC値のLSBが現在ピクチャのための別の参照ピクチャのためのPOC値のLSBに等しいかどうかを判断する(156)。後続のLTRPのためのPOC値のLSBが現在ピクチャのための別の参照のためのPOC値のLSBに等しいとビデオエンコーダ20が判断したとき(156の「YES」分岐)、ビデオエンコーダ20は、後続のLTRPのためのPOC値のMSBと前のLTRP(すなわち、POC MSB情報が符号化された直近のLTRP)のためのPOC値のMSBとの間の差を表すデータを符号化する(158)。直近のLTRPのためのPOC値のLSBは、必ずしも、現在符号化されているLTRPのためのPOC値のLSBと同じであるとは限らない。上記で説明したように、差分値を計算するために、後続のLTRPがiのインデックス値を有すると仮定すると、ビデオエンコーダ20は、LTRPjが、POC MSB情報がコーディングされた前のLTRPであった場合、LTRPiのためのPOC値のMSBとLTRPjのためのPOC値のMSBとの間の差を計算し得る。ビデオエンコーダ20は、次いで、差分値を符号化し得る。この差分値は、delta_poc_msb_cycle_lt[i](またはdelta_poc_msb_cycle_lt_plus1[i])に対応し得る。
[0138] 差分値を符号化した後、または次のLTRPのためのPOC値のLSBが別の参照ピクチャのLSBに等しくないとき(156の「NO」分岐)、ビデオエンコーダ20はLTRPのためのPOC値のLSBをコーディングする(160)。ビデオエンコーダ20は、次いで、現在ピクチャのためのさらなるLTRPがあるかどうかを判断する(162)。現在ピクチャのためのさらなるLTRPがあるとき(162の「YES」分岐)、ビデオエンコーダ20は、残りのLTRPのためのPOC値のLSBを符号化し、必要な場合に、上記で説明した差分コーディングを使用してMSBを符号化することに進む。しかしながら、現在ピクチャのためのさらなるLTRPがないとき(162の「NO」分岐)、ビデオエンコーダ20は、符号化データを出力し(164)、符号化データは、現在ピクチャのための符号化ブロック、(LSB、およびLSBが一意でないとき、MSBのための差分値を含んだ)現在ピクチャのための長期参照ピクチャのための符号化されたPOC値などを含み得る。
[0139] このようにして、図5の方法は、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する現在ピクチャの少なくとも第2の部分とを符号化することと、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、を含む方法の一例を表す。
[0140] 図6は、本開示の技法による、長期参照ピクチャのためのPOC値を復号するための例示的な方法を示すフローチャートである。説明のために、図6の方法について、図1および図3のビデオデコーダ30ならびにそれの構成要素に関して説明する。ただし、他のビデオ復号デバイスが図6の方法を実行するように構成され得ることを理解されたい。
[0141] 初めに、ビデオデコーダ30は、現在ピクチャの順序の第1の長期参照ピクチャ(LTRP)のためのPOC値のMSBとLSBとを復号する(200)。たとえば、ビデオデコーダ30は、第1のLTRPのためのPOC値のMSBと現在ピクチャのためのPOC値のMSBとの間の差を表す差分値を復号し得る。ビデオデコーダ30は、次いで、第1のLTRPのMSBを取得するために、差分値を現在ピクチャのためのPOC値のMSBに加算し得る。ビデオデコーダ30はまた、LTRPのためのPOC値を再生するために、第1のLTRPのためのPOC値のLSBを復号し、第1のLTRPのためのPOC値のMSBとLSBとを連結し得る。ビデオデコーダ30はまた、MSBが送られないとき、第1のLTRPのみのためのPOC値のLSBを復号し得、LSB値のみを使用して、同じPOC LSB値をもつ他の参照ピクチャがない場合に識別することができる。
[0142] ビデオデコーダ30は、次いで、次のLTRPのためのPOC値のLSBを復号する(202)。図6の例では、ビデオデコーダ30は、次のLTRPのためのPOC値のLSBが現在ピクチャのための別のLTRPのLSBに等しいかどうかを判断する(204)。他の例では、たとえば、表1に関して上記で説明したように、ビデオデコーダ30は、MSBが次のLTRPのPOC値のためにシグナリングされることをフラグ値が示すかどうかを判断し得る。いずれの場合も、ビデオデコーダ30は、MSBが次のLTRPのPOC値のためにシグナリングされるかどうかを判断し得る。MSBが次のLTRPのPOC値のためにシグナリングされたとき(たとえば、次のLTRPのためのPOC値のLSBが別の参照ピクチャのLSBに等しいとき(204の「YES」分岐))、ビデオデコーダ30は、前のLTRPのためのPOC値のMSBに対するMSB差分値を復号する(206)。すなわち、ビデオデコーダ30は、LTRPiのためにシグナリングされた差分値を復号し、差分値をLTRPjのためのPOC値のMSBに加算し得、ただし、LTRPjは、MSB情報が復号された前のLTRPであった。ビデオデコーダ30は、さらに、(計算されたか、暗黙的に判断されたかにかかわらず)MSBを次のLTRPのためのLSBと連結することによって次のLTRPのPOC値を再アセンブルし得る。
[0143] 次のLTRPのためのPOC値のLSBが別の参照ピクチャのLSBに等しくないと判断した後に(204の「NO」分岐)、または次のLTRPのMSBのための差分値を復号した後に、ビデオデコーダ30は、現在ピクチャのためのさらなるLTRPがあるかどうかを判断する(210)。現在ピクチャのためのさらなるLTRPがある場合(210の「YES」分岐)、ビデオデコーダ30は、たとえば、上記で説明したように、後続のLTRPのためのPOC値を復号することに進む。現在ピクチャのためのさらなるLTRPがないと(210の「NO」分岐)、ビデオデコーダ30は、シグナリングされたLTRPを含む1つまたは複数の参照ピクチャリストをアセンブルする(212)。ビデオデコーダ30は、次いで、(1つまたは複数の)参照ピクチャリストを使用して現在ピクチャを復号する(214)。
[0144] たとえば、ブロックがインター予測されたとき、ブロックは、参照ピクチャリストと、ブロックのための参照ピクチャを示す、参照ピクチャリストへの参照インデックスとの指示を含み得る。ブロックは、ブロックのための動きベクトルを再構成するためのデータをさらに含み得る。したがって、ビデオデコーダ30は、動きベクトルを使用して参照ピクチャから参照ブロックを取り出し得る。ビデオデコーダ30は、たとえば、ブロックのための変換係数を復号し、逆量子化し、逆変換することによって、ブロックの誤差値をさらに復号し得る。ビデオデコーダ30は、次いで、ブロックを復号するために、参照ブロックを、再構成された残差ブロックと組み合わせ得る。
[0145] このようにして、図6の方法は、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値とビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、第1のPOC値と第2のPOC値が異なる最下位ビット(LSB)値を有する、第1の値を使用した第1の長期参照ピクチャと、第1の値と第2の値とを使用した第2の長期参照ピクチャとのうちの少なくとも1つに対するビデオデータの現在ピクチャの少なくとも一部分を復号することとを含む方法の一例を表す。
[0146] 例によっては、本明細書で説明した技法のうちいずれかの、いくつかの作用またはイベントは、異なるシーケンスで実行され得、追加、マージ、または完全に除外され得る(たとえば、すべての説明した作用またはイベントが、本技法の実施のために必要であるとは限らない)ことを認識されたい。さらに、いくつかの例では、行為またはイベントは、連続してではなくむしろ、同時に、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通して実行され得る。
[0147] 1つまたは複数の例では、説明した機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、データ記憶媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得、または、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む通信媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび/またはデータ構造を取り出すために1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0148] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu−rayディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
[0149] 命令は、1つまたは複数のデジタル信号プロセッサ(DSP)などの1つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。したがって、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明した技法の実装に好適な他の構造のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のハードウェアおよび/またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素中に十分に実装され得る。
[0150] 本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。
[0151] 様々な例について説明した。これらおよび他の例は以下の特許請求の範囲内に入る。

Claims (30)

  1. ビデオデータを復号する方法であって、前記方法は、
    ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値と前記ビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、
    前記ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と前記第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、前記第1のPOC値と前記第2のPOC値が異なる最下位ビット(LSB)値を有する、
    前記第1の値を使用した前記第1の長期参照ピクチャと、前記第1の値と前記第2の値とを使用した前記第2の長期参照ピクチャとのうちの少なくとも1つに対する前記ビデオデータの現在ピクチャの少なくとも一部分を復号することと
    を備える、方法。
  2. 前記第1の値を使用して、前記第1の長期参照ピクチャのための第1のMSBサイクル値をDeltaPocMSBCycleLt[i−1]として計算することと、
    前記第2の長期参照ピクチャのための第2のMSBサイクル値をDeltaPocMSBCycleLt[i]として計算することと、ここにおいて、前記第2のMSBサイクル値を計算することが、DeltaPocMSBCycleLt[i−1]と前記第2の値とに基づいてDeltaPocMSBCycleLt[i]を計算することを備える、
    をさらに備える、請求項1に記載の方法。
  3. 前記第1の長期参照ピクチャがjのインデックスに対応し、ここにおいて、前記第2の長期参照ピクチャがiのインデックスに対応し、ここにおいて、前記第1の値がdelta_poc_msb_cycle_lt_plus1[j]を備え、ここにおいて、前記第2の値がdelta_poc_msb_cycle_lt_plus1[i]を備え、ここにおいて、jが、両端値を含む0からi−1までの範囲内である、請求項1に記載の方法。
  4. 前記第1の値と前記第2の値とのうちの少なくとも1つが負整数値を備える、請求項1に記載の方法。
  5. 前記現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数に少なくとも部分的に基づいて前記第1のPOC値と前記第2のPOC値とのうちの少なくとも1つを判断することをさらに備える、請求項1に記載の方法。
  6. ビデオデータを復号するためのデバイスであって、前記デバイスは、ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値と前記ビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、前記ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と前記第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、前記第1のPOC値と前記第2のPOC値が異なる最下位ビット(LSB)値を有する、前記第1の値を使用した前記第1の長期参照ピクチャと、前記第1の値と前記第2の値とを使用した前記第2の長期参照ピクチャとのうちの少なくとも1つに対する前記ビデオデータの現在ピクチャの少なくとも一部分を復号することとを行うように構成されたビデオデコーダを備える、デバイス。
  7. 前記ビデオデコーダは、前記第1の値を使用して、前記第1の長期参照ピクチャのための第1のMSBサイクル値をDeltaPocMSBCycleLt[i−1]として計算することと、前記第2の長期参照ピクチャのための第2のMSBサイクル値をDeltaPocMSBCycleLt[i]として計算することと、ここにおいて、前記第2のMSBサイクル値を計算することが、DeltaPocMSBCycleLt[i−1]と前記第2の値とに基づいてDeltaPocMSBCycleLt[i]を計算することを備える、を行うようにさらに構成された、請求項6に記載のデバイス。
  8. 前記第1の長期参照ピクチャがi−1のインデックスに対応し、ここにおいて、前記第2の長期参照ピクチャがiのインデックスに対応し、ここにおいて、前記第1の値がdelta_poc_msb_cycle_lt_plus1[i−1]を備え、ここにおいて、前記第2の値がdelta_poc_msb_cycle_lt_plus1[i]を備える、請求項6に記載のデバイス。
  9. 前記第1の値と前記第2の値とのうちの少なくとも1つが負整数値を備える、請求項6に記載のデバイス。
  10. 前記ビデオデコーダが、前記現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数に少なくとも部分的に基づいて前記第1のPOC値と前記第2のPOC値とのうちの少なくとも1つを判断するようにさらに構成された、請求項6に記載のデバイス。
  11. ビデオデータを復号するためのデバイスであって、前記デバイスは、
    ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値と前記ビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号するための手段と、
    前記ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と前記第1のMSB値との間の差を表す第2の値を復号するための手段と、ここにおいて、前記第1のPOC値と前記第2のPOC値が異なる最下位ビット(LSB)値を有する、
    前記第1の値を使用した前記第1の長期参照ピクチャと、前記第1の値と前記第2の値とを使用した前記第2の長期参照ピクチャとのうちの少なくとも1つに対する前記ビデオデータの現在ピクチャの少なくとも一部分を復号するための手段と
    を備える、デバイス。
  12. 前記第1の値を使用して、前記第1の長期参照ピクチャのための第1のMSBサイクル値をDeltaPocMSBCycleLt[i−1]として計算するための手段と、
    前記第2の長期参照ピクチャのための第2のMSBサイクル値をDeltaPocMSBCycleLt[i]として計算するための手段と、ここにおいて、前記第2のMSBサイクル値を計算することが、DeltaPocMSBCycleLt[i−1]と前記第2の値とに基づいてDeltaPocMSBCycleLt[i]を計算することを備える、
    をさらに備える、請求項11に記載のデバイス。
  13. 前記第1の長期参照ピクチャがjのインデックスに対応し、ここにおいて、前記第2の長期参照ピクチャがiのインデックスに対応し、ここにおいて、前記第1の値がdelta_poc_msb_cycle_lt_plus1[j]を備え、ここにおいて、前記第2の値がdelta_poc_msb_cycle_lt_plus1[i]を備え、ここにおいて、jが、両端値を含む0からi−1までの範囲内である、請求項11に記載のデバイス。
  14. 前記第1の値と前記第2の値とのうちの少なくとも1つが負整数値を備える、請求項11に記載のデバイス。
  15. 前記現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数に少なくとも部分的に基づいて前記第1のPOC値と前記第2のPOC値とのうちの少なくとも1つを判断するための手段をさらに備える、請求項11に記載のデバイス。
  16. 実行されたとき、
    ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値と前記ビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を復号することと、
    前記ビデオデータの第2の長期参照ピクチャの第2のPOC値の第2のMSB値と前記第1のMSB値との間の差を表す第2の値を復号することと、ここにおいて、前記第1のPOC値と前記第2のPOC値が異なる最下位ビット(LSB)値を有する、
    前記第1の値を使用した前記第1の長期参照ピクチャと、前記第1の値と前記第2の値とを使用した前記第2の長期参照ピクチャとのうちの少なくとも1つに対する前記ビデオデータの現在ピクチャの少なくとも一部分を復号することと
    をプロセッサに行わせる命令を記憶したコンピュータ可読記憶媒体。
  17. 前記第1の値を使用して、前記第1の長期参照ピクチャのための第1のMSBサイクル値をDeltaPocMSBCycleLt[i−1]として計算することと、
    前記第2の長期参照ピクチャのための第2のMSBサイクル値をDeltaPocMSBCycleLt[i]として計算することと、ここにおいて、前記第2のMSBサイクル値を計算することが、DeltaPocMSBCycleLt[i−1]と前記第2の値とに基づいてDeltaPocMSBCycleLt[i]を計算することを備える、
    を前記プロセッサに行わせる命令をさらに備える、請求項16に記載のコンピュータ可読記憶媒体。
  18. 前記第1の長期参照ピクチャがjのインデックスに対応し、ここにおいて、前記第2の長期参照ピクチャがiのインデックスに対応し、ここにおいて、前記第1の値がdelta_poc_msb_cycle_lt_plus1[j]を備え、ここにおいて、前記第2の値がdelta_poc_msb_cycle_lt_plus1[i]を備え、ここにおいて、jが、両端値を含む0からi−1までの範囲内である、請求項16に記載のコンピュータ可読記憶媒体。
  19. 前記第1の値と前記第2の値とのうちの少なくとも1つが負整数値を備える、請求項16に記載のコンピュータ可読記憶媒体。
  20. 前記現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数に少なくとも部分的に基づいて前記第1のPOC値と前記第2のPOC値とのうちの少なくとも1つを判断することを前記プロセッサに行わせる命令をさらに備える、請求項16に記載のコンピュータ可読記憶媒体。
  21. ビデオデータを符号化する方法であって、前記方法は、
    第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する前記現在ピクチャの少なくとも第2の部分とを符号化することと、
    前記ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値と前記ビデオデータの前記第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、
    前記ビデオデータの前記第2の長期参照ピクチャの第2のPOC値の第2のMSB値と前記第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、前記第1のPOC値と前記第2のPOC値が異なる最下位ビット(LSB)値を有する、
    を備える、方法。
  22. 前記第1の値を、DeltaPocMSBCycleLt[i−1]としての前記第1の長期参照ピクチャのための第1のMSBサイクル値と前記ベースMSB値との間の差として計算することと、
    前記第2の値を、DeltaPocMSBCycleLt[i]としての前記第2の長期参照ピクチャのための第2のMSBサイクル値と前記第1のMSB値との間の差として計算することと
    をさらに備える、請求項21に記載の方法。
  23. 前記第1の長期参照ピクチャがjのインデックスに対応し、ここにおいて、前記第2の長期参照ピクチャがiのインデックスに対応し、ここにおいて、前記第1の値がdelta_poc_msb_cycle_lt_plus1[j]を備え、ここにおいて、前記第2の値がdelta_poc_msb_cycle_lt_plus1[i]を備え、ここにおいて、jが、両端値を含む0からi−1までの範囲内である、請求項21に記載の方法。
  24. 前記第1の値と前記第2の値とのうちの少なくとも1つが負整数値を備える、請求項21に記載の方法。
  25. 前記第1の値を符号化することと、前記第2の値を符号化することとが、前記現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数に少なくとも部分的に基づいて前記第1の値を符号化することと、前記第2の値を符号化することとを備える、請求項21に記載の方法。
  26. ビデオデータを符号化するためのデバイスであって、前記デバイスは、第1の長期参照ピクチャに対するビデオデータの現在ピクチャの少なくとも第1の部分と第2の長期参照ピクチャに対する前記現在ピクチャの少なくとも第2の部分とを符号化することと、前記ビデオデータの現在ピクチャのピクチャ順序カウント(POC)値のベース最上位ビット(MSB)値と前記ビデオデータの第1の長期参照ピクチャの第1のPOC値の第1のMSB値との間の差を表す第1の値を符号化することと、前記ビデオデータの前記第2の長期参照ピクチャの第2のPOC値の第2のMSB値と前記第1のMSB値との間の差を表す第2の値を符号化することと、ここにおいて、前記第1のPOC値と前記第2のPOC値が異なる最下位ビット(LSB)値を有する、を行うように構成されたビデオエンコーダを備える、デバイス。
  27. 前記ビデオエンコーダが、前記第1の値を、DeltaPocMSBCycleLt[i−1]としての前記第1の長期参照ピクチャのための第1のMSBサイクル値と前記ベースMSB値との間の差として計算することと、前記第2の値を、DeltaPocMSBCycleLt[i]としての前記第2の長期参照ピクチャのための第2のMSBサイクル値と前記第1のMSB値との間の差として計算することとを行うように構成された、請求項26に記載のデバイス。
  28. 前記第1の長期参照ピクチャがjのインデックスに対応し、ここにおいて、前記第2の長期参照ピクチャがiのインデックスに対応し、ここにおいて、前記第1の値がdelta_poc_msb_cycle_lt_plus1[j]を備え、ここにおいて、前記第2の値がdelta_poc_msb_cycle_lt_plus1[i]を備え、ここにおいて、jが、両端値を含む0からi−1までの範囲内である、請求項26に記載のデバイス。
  29. 前記第1の値と前記第2の値とのうちの少なくとも1つが負整数値を備える、請求項26に記載のデバイス。
  30. 前記第1の値と前記第2の値とを符号化するために、前記ビデオエンコーダが、前記現在ピクチャのための短期参照ピクチャとしてマークされた参照ピクチャの数に少なくとも部分的に基づいて前記第1の値と前記第2の値とを符号化するように構成された、請求項26に記載のデバイス。
JP2015520368A 2012-06-28 2013-06-24 ビデオコーディングのための長期参照ピクチャをシグナリングすること Active JP6239609B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261665784P 2012-06-28 2012-06-28
US61/665,784 2012-06-28
US13/924,016 US9332255B2 (en) 2012-06-28 2013-06-21 Signaling long-term reference pictures for video coding
US13/924,016 2013-06-21
PCT/US2013/047367 WO2014004391A1 (en) 2012-06-28 2013-06-24 Signaling long-term reference pictures for video coding

Publications (3)

Publication Number Publication Date
JP2015526026A true JP2015526026A (ja) 2015-09-07
JP2015526026A5 JP2015526026A5 (ja) 2016-10-20
JP6239609B2 JP6239609B2 (ja) 2017-11-29

Family

ID=49778158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015520368A Active JP6239609B2 (ja) 2012-06-28 2013-06-24 ビデオコーディングのための長期参照ピクチャをシグナリングすること

Country Status (24)

Country Link
US (1) US9332255B2 (ja)
EP (1) EP2868081B1 (ja)
JP (1) JP6239609B2 (ja)
KR (1) KR101719930B1 (ja)
CN (1) CN104412599B (ja)
AR (1) AR093754A1 (ja)
AU (1) AU2013280659B2 (ja)
BR (1) BR112014032473B1 (ja)
CA (1) CA2875713C (ja)
DK (1) DK2868081T3 (ja)
ES (1) ES2736312T3 (ja)
HU (1) HUE044918T2 (ja)
IL (1) IL235969A (ja)
MY (1) MY181793A (ja)
PH (1) PH12014502731B1 (ja)
PL (1) PL2868081T3 (ja)
PT (1) PT2868081T (ja)
RU (1) RU2642361C2 (ja)
SG (1) SG11201408111UA (ja)
SI (1) SI2868081T1 (ja)
TW (1) TWI558179B (ja)
UA (1) UA116214C2 (ja)
WO (1) WO2014004391A1 (ja)
ZA (1) ZA201500618B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022524917A (ja) * 2019-01-28 2022-05-11 オーピー ソリューションズ, エルエルシー 延長された長期参照ピクチャ保持の明示的信号伝達

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130188709A1 (en) 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
US9979959B2 (en) 2012-04-20 2018-05-22 Qualcomm Incorporated Video coding with enhanced support for stream adaptation and splicing
US9479776B2 (en) * 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
US10194146B2 (en) 2013-03-26 2019-01-29 Qualcomm Incorporated Device and method for scalable coding of video information
US10356426B2 (en) * 2013-06-27 2019-07-16 Google Llc Advanced motion estimation
US9510001B2 (en) 2013-07-09 2016-11-29 Electronics And Telecommunications Research Institute Video decoding method and apparatus using the same
US9848199B2 (en) * 2014-03-17 2017-12-19 Qualcomm Incorporated Device and method for scalable coding of video information
US11985318B2 (en) * 2015-12-24 2024-05-14 OP Solultions, LLC Encoding video with extended long term reference picture retention
US11595652B2 (en) * 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
US11736687B2 (en) * 2017-09-26 2023-08-22 Qualcomm Incorporated Adaptive GOP structure with future reference frame in random access configuration for video coding
MX2021001745A (es) * 2018-08-17 2021-07-16 Huawei Tech Co Ltd Gestión de imágenes de referencia en codificación de video.
WO2020112488A1 (en) * 2018-11-30 2020-06-04 Futurewei Technologies, Inc. Signaling of reference picture lists in video coding
US10904545B2 (en) 2018-12-26 2021-01-26 Tencent America LLC Method for syntax controlled decoded picture buffer management
EP3918801A4 (en) * 2019-01-28 2022-06-15 OP Solutions, LLC ONLINE AND OFFLINE CHOICE OF EXTENDED LONG-TERM REFERENCE IMAGE STORAGE
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
US20240146994A1 (en) * 2022-11-01 2024-05-02 Qualcomm Incorporated Identifying and marking video data units for network transport of video data

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001086960A2 (en) 2000-05-10 2001-11-15 Picturetel Corporation Video coding using multiple buffers
TWI249356B (en) * 2002-11-06 2006-02-11 Nokia Corp Picture buffering for prediction references and display
US20050008240A1 (en) * 2003-05-02 2005-01-13 Ashish Banerji Stitching of video for continuous presence multipoint video conferencing
FR2874292B1 (fr) 2004-08-10 2007-01-26 Thales Sa Procede de mise en forme de trames d'une sequence video
CN102761744B (zh) 2006-10-13 2015-10-28 汤姆逊许可公司 用于多视点视频编码的参考图像列表管理语法
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
US9210480B2 (en) 2007-12-20 2015-12-08 Broadcom Corporation Video processing system with layered video coding and methods for use therewith
US9237355B2 (en) * 2010-02-19 2016-01-12 Qualcomm Incorporated Adaptive motion resolution for video coding
US20120269275A1 (en) 2010-10-20 2012-10-25 Nokia Corporation Method and device for video coding and decoding
KR101631774B1 (ko) * 2011-06-30 2016-06-24 텔레폰악티에볼라겟엘엠에릭슨(펍) 절대 또는 명확한 레퍼러스 픽처 시그널링
CN102256125B (zh) * 2011-07-14 2013-06-05 北京工业大学 面向高效视频编码hevc基于上下文的自适应算数编码方法
US9648321B2 (en) * 2011-12-02 2017-05-09 Qualcomm Incorporated Coding picture order count values identifying long-term reference frames

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS(外4名): "High efficiency video coding (HEVC) text specification draft 7", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6016036431, 12 June 2012 (2012-06-12), US, pages p.31-41,79-103 *
JUNPEI KOYAMA(外3名): "Cyclic POC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 JCTVC, JPN6016036432, 7 May 2012 (2012-05-07), US, pages 1 - 4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022524917A (ja) * 2019-01-28 2022-05-11 オーピー ソリューションズ, エルエルシー 延長された長期参照ピクチャ保持の明示的信号伝達
JP7498502B2 (ja) 2019-01-28 2024-06-12 オーピー ソリューションズ, エルエルシー 延長された長期参照ピクチャ保持の明示的信号伝達

Also Published As

Publication number Publication date
SI2868081T1 (sl) 2019-06-28
PH12014502731B1 (en) 2018-04-13
HK1204185A1 (en) 2015-11-06
US9332255B2 (en) 2016-05-03
PT2868081T (pt) 2019-07-23
EP2868081A1 (en) 2015-05-06
IL235969A0 (en) 2015-01-29
SG11201408111UA (en) 2015-01-29
JP6239609B2 (ja) 2017-11-29
TWI558179B (zh) 2016-11-11
KR101719930B1 (ko) 2017-03-24
MY181793A (en) 2021-01-07
AU2013280659A1 (en) 2015-01-15
UA116214C2 (uk) 2018-02-26
AR093754A1 (es) 2015-06-24
IL235969A (en) 2017-04-30
TW201408082A (zh) 2014-02-16
RU2642361C2 (ru) 2018-01-24
US20140003538A1 (en) 2014-01-02
CN104412599B (zh) 2018-02-06
WO2014004391A1 (en) 2014-01-03
PH12014502731A1 (en) 2015-02-02
EP2868081B1 (en) 2019-04-17
CA2875713A1 (en) 2014-01-03
DK2868081T3 (da) 2019-07-22
ES2736312T3 (es) 2019-12-27
HUE044918T2 (hu) 2019-11-28
CA2875713C (en) 2019-09-24
ZA201500618B (en) 2017-01-25
RU2015102618A (ru) 2016-08-20
BR112014032473A2 (pt) 2017-06-27
KR20150036218A (ko) 2015-04-07
CN104412599A (zh) 2015-03-11
BR112014032473B1 (pt) 2023-04-25
AU2013280659B2 (en) 2017-10-05
PL2868081T3 (pl) 2019-10-31

Similar Documents

Publication Publication Date Title
JP6239609B2 (ja) ビデオコーディングのための長期参照ピクチャをシグナリングすること
JP6162228B2 (ja) ビデオコード化のための長期参照ピクチャについてのデータの信号伝達
JP5869108B2 (ja) メモリ効率的コンテキストモデリング
KR102352638B1 (ko) 비디오 코딩 프로세스에서의 계수 레벨 코딩
JP5869008B2 (ja) ビデオコーディングにおける変換
JP6169689B2 (ja) ビデオコーディングにおける長期参照ピクチャのランダムアクセスおよびシグナリング
JP6151446B2 (ja) ビデオコーディングのための高精度明示的重み付け予測
US9479776B2 (en) Signaling of long-term reference pictures for video coding
JP6158422B2 (ja) アラインされていないirapピクチャを含み得るマルチレイヤビットストリームのクロスレイヤpocアラインメント
JP2018530246A (ja) ビデオコーディングのために位置依存の予測組合せを使用する改善されたビデオイントラ予測
JP2018537908A (ja) ビデオデータの符号情報をコーディングすること
JP2018509035A (ja) 適応型成分間残差予測
JP2017523685A (ja) イントラブロックコピーイングのためのブロックベクトルコーディング
JP2015532554A (ja) ビデオプロパティの指示
JP2017522799A (ja) ビットストリームパーティションのためのhrdパラメータを信号伝達すること
JP2015529065A (ja) スケーラブルビデオコーディングおよび3dビデオコーディングのための多重仮説動き補償
JP2016507956A (ja) ビデオコーディングにおける時間スケーラビリティを伴うプログレッシブ精緻化
US9532046B2 (en) Reference picture set prediction for video coding
JP2015511472A (ja) ビデオコード化におけるコードブックを使用したループフィルタパラメータのコード化
JP2015533462A (ja) ビデオコーディングのための参照ピクチャステータス
CN111149361B (zh) 具有在用于视频译码的随机存取配置中的未来参考帧的自适应图片群组结构
JP2015531570A (ja) ビデオコーダの動作点のためのレイヤ識別子の向上したシグナリング
JP2016509436A (ja) レイヤ間シンタックス予測制御
JP2017501655A (ja) マルチレイヤビデオコーディングのためのpoc値設計
HK1204185B (en) Signaling long-term reference pictures for video coding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160530

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160901

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160901

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161004

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170418

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171101

R150 Certificate of patent or registration of utility model

Ref document number: 6239609

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250