JP6174152B2

JP6174152B2 - ビデオコーディングにおける動作点用のシグナリングレイヤ識別子

Info

Publication number: JP6174152B2
Application number: JP2015534524A
Authority: JP
Inventors: ワン、イェ−クイ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-09-28
Filing date: 2013-09-11
Publication date: 2017-08-02
Anticipated expiration: 2033-09-11
Also published as: SG11201501640UA; AR093770A1; KR102148548B1; HK1209936A1; RU2635892C2; JP2015531567A; US9973782B2; TW201424403A; KR20150063099A; BR112015006839B1; AU2013324090B2; IL237917A; US20160316227A1; BR112015006839A2; PH12015500614B1; CN104685887B; CA2884422A1; EP2901679A1; CN104685887A; PH12015500614A1

Description

関連出願

[0001] 本出願は、２０１２年９月２８日に出願された米国仮出願第６１／７０７，４８６号、および２０１２年１０月１日に出願された米国仮出願第６１／７０８，４０４号の優先権を主張するもので、その全内容が参照により本明細書に組み込まれる。

[0002] 本開示は一般にビデオデータを処理することに関し、より詳細には、ビデオデータにおいて使用される動作点を処理することに関する。

[0003] デジタルビデオ機能は、デジタルテレビジョン、デジタルダイレクトブロードキャストシステム、ワイヤレスブロードキャストシステム、携帯情報端末（ＰＤＡ）、ラップトップまたはデスクトップコンピュータ、タブレットコンピュータ、電子ブックリーダ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラーまたは衛星無線電話、いわゆる「スマートフォン」、ビデオ遠隔会議デバイス、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスに組み込まれ得る。デジタルビデオデバイスは、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ：Advanced Video Coding）、現在開発中の高効率ビデオコーディング（ＨＥＶＣ：High Efficiency Video Coding）規格によって定義された規格、およびこうした規格の拡張に記載されるビデオコーディング技法のような、ビデオコーディング技法を実装する。ビデオデバイスは、そのようなビデオコーディング技法を実装することによって、デジタルビデオ情報をより効率的に送信、受信、符号化、復号、および／または記憶し得る。

[0004] ビデオコーディング技法は、ビデオシーケンスに固有の冗長性を低減または除去するための空間的（イントラピクチャ）予測および／または時間的（インターピクチャ）予測を含む。ブロックベースのビデオコーディングの場合、ビデオスライス（例えば、ビデオフレームまたはビデオフレームの一部分）が、ツリーブロック、コーディングユニット（ＣＵ）および／またはコーディングノードと呼ばれることもあるビデオブロックに区分され得る。ピクチャのイントラコーディングされた（Ｉ）スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測を使用して符号化される。ピクチャのインターコーディングされた（ＰまたはＢ）スライス中のビデオブロックは、同じピクチャ中の近隣ブロック中の参照サンプルに対する空間的予測、または他の参照ピクチャ中の参照サンプルに対する時間的予測を使用し得る。ピクチャはフレームと呼ばれることがあり、参照ピクチャは参照フレームと呼ばれることがある。

[0005] 空間的予測または時間的予測は、コーディングされるべきブロックの予測ブロックを生じる。残差データは、コーディングされるべき元のブロックと予測ブロックとの間のピクセル差分を表す。インターコーディングブロックは、予測ブロックを形成する参照サンプルのブロックを指す動きベクトル、およびコーディングブロックと予測ブロックとの間の差分を示す残差データに従って符号化される。イントラコーディングブロックは、イントラコーディングモードと残差データとに従って符号化される。さらなる圧縮のために、残差データは、ピクセル領域から変換領域に変換されて残差変換係数をもたらすことができ、その残差変換係数は、次いで量子化できる。量子化変換係数は、最初に２次元アレイで構成され、変換係数の１次元ベクトルを生成するために走査することができ、なお一層の圧縮を達成するためにエントロピーコーディングを適用できる。

[0006] 一般に、本開示は、ビデオコーディングにおける動作点用のシグナリングレイヤ識別子のための技法について説明する。本技法は、準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ：video parameter set）における動作点の少なくとも１つまたは動作点に関連する仮想参照デコーダ（ＨＲＤ：hypothetical reference decoder）パラメータ情報に関する複製コンテンツのコーディングを拒否することによって動作点に関連するシグナリング情報の効率の改善を提供する。本技法によれば、準拠するビットストリームは、第２の動作点のコンテンツとして第１の動作点に関連するレイヤ識別子の組を複製する、ＶＰＳにおけるシンタックス要素を含まない可能性がある。加えて、本技法によれば、準拠するビットストリームは、第２の動作点のコンテンツとして第１の動作点のＨＲＤパラメータ情報に関連するＨＲＤパラメータの組を複製する、ＶＰＳにおけるシンタックス要素を含まない可能性がある。このように、レイヤ識別子の組およびＨＲＤパラメータの組は、ＶＰＳにおける第１の動作点に対して一意である。

[0007] 一例では、本開示で説明する技法が、ビデオデータを復号するための方法に関する。本方法は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素を復号することを含む。本方法は、存在する場合、第１の動作点に関するコンテンツの第２の組を有する仮想参照デコーダ(ＨＲＤ)パラメータ情報を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号することをさらに含んでおり、準拠するビットストリームは、第２の動作点に関するコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、シンタックス要素を復号することは、準拠するビットストリーム内のみの第１の動作点およびＨＲＤパラメータ情報を示すシンタックス要素を復号することを備える。

[0008] 別の例では、本開示で説明する技法は、ビデオデータを符号化するための方法に関する。本方法は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化することを含む。本方法は、第１の動作点に関するコンテンツの第２の組を有するＨＲＤパラメータ情報を示す準拠するビットストリームにおけるＶＰＳ内のシンタックス要素を符号化することをさらに含んでおり、準拠するビットストリームは、第２の動作点に関するコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、シンタックス要素を符号化することは、準拠するビットストリームのみからの第１の動作点およびＨＲＤパラメータ情報を示すシンタックス要素を符号化することを備える。

[0009] 別の例では、本開示で説明する技法は、ビデオコーディングデバイスに関する。ビデオコーディングデバイスは、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をコーディングするように構成される。ビデオコーディングデバイスは、存在する場合、第１の動作点に関するコンテンツの第２の組を有するＨＲＤパラメータ情報を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をコーディングするようにさらに構成されており、準拠するビットストリームは、第２の動作点に関するコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、ビデオコーダは、準拠するビットストリーム内のみの第１の動作点およびＨＲＤパラメータ情報を示すシンタックス要素をコーディングするように構成される。

[0010] また別の例では、本明細書で説明する技法は、コンピュータ可読記憶媒体に関する。コンピュータ可読記憶媒体は、実行されるとき、ビデオデータをコーディングするためのデバイスのプロセッサに、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をコーディングさせる命令をその上に記憶する。本命令は、実行されるとき、プロセッサに、存在する場合、第１の動作点に関するコンテンツの第２の組を有するＨＲＤパラメータ情報を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をさらにコーディングさせ、準拠するビットストリームは、第２の動作点に関するコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、プロセッサは、準拠するビットストリーム内のみの第１の動作点およびＨＲＤパラメータ情報を示すシンタックス要素をコーディングするように構成される。

[0011] 本明細書で説明する技法はまた、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をコーディングするための手段を含むビデオコーディングデバイスの一例を含む。ビデオコーディングデバイスは、存在する場合、第１の動作点に関するコンテンツの第２の組を有するＨＲＤパラメータ情報を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をコーディングするための手段をさらに含んでおり、準拠するビットストリームは、第２の動作点に関するコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、ビデオコーディングデバイスは、準拠するビットストリーム内のみの第１の動作点およびＨＲＤパラメータ情報を示すシンタックス要素をコーディングするように構成される。

[0012] １つまたは複数の例の詳細は、添付の図面および以下の説明に記載されている。他の特徴、目的、および利点は、その説明および図面、ならびに特許請求の範囲から明らかになろう。

本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。本開示で説明する技法を実装し得る例示的なビデオエンコーダを示すブロック図。本開示で説明する技法を実装し得る例示的なビデオデコーダを示すブロック図。ネットワークの一部を形成するデバイスの例示的な組を示すブロック図。本開示で説明する技法による、ビデオデータに使用される動作点を復号するための例示的な方法を示すフローチャート。本開示で説明する技法による、ビデオデータに使用される動作点を符号化するための例示的な方法を示すフローチャート。

詳細な説明
[0019] 一般に、本開示は、ビデオコーディングにおいて動作点に関するレイヤ識別子をシグナリングするための技法について説明する。動作点は、時間的におよび／または複数のレイヤもしくはビューに関して拡張性のある元のビットストリームから抽出され得るサブビットストリームを指す。サブビットストリームは、レイヤ識別子およびビットストリームの動作点を識別する時間的サブレイヤ識別子の値に基づいてビットストリームから抽出され得る。動作点は、ビットストリーム内のビデオパラメータセット（ＶＰＳ）においてシグナリングされる。動作点の各々では、動作点シンタックス構造が、所与の動作点のサブビットストリームに属する、ビットストリーム内のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別するために使用されるレイヤ識別子の組を指定する。このように、所与の動作点のサブビットストリームを構成するＮＡＬユニットは、ＮＡＬユニットのレイヤ識別子に基づいて元のビットストリームから抽出され得る。

[0020] いくつかの場合には、動作点のうちの１つまたは複数に関連する仮想参照デコーダ(ＨＲＤ)パラメータが存在する可能性がある。この場合、ＨＲＤパラメータ情報は、ＶＰＳにおいてシグナリングされる。ＨＲＤパラメータを有する１つまたは複数の動作点の各々では、ＨＲＤパラメータシンタックス構造が、所与の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義するＨＲＤパラメータの組を指定する。

[0021] 本開示で説明する技法は、準拠するビットストリーム内のＶＰＳにおいて動作点のうちの少なくとも１つまたは動作点に関連するＨＲＤパラメータ情報に関する複製コンテンツを拒否することを含む。準拠するビットストリームは、第１の動作点に関するレイヤ識別子の組を含み得るコンテンツの第１の組を有する第１の動作点を示す、ＶＰＳにおけるシンタックス要素を含み得る。準拠するビットストリームは、第１の動作点に関するＨＲＤパラメータの組を含み得るコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、ＶＰＳにおけるシンタックス要素も含み得る。準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない可能性がある。

[0022] 本技法によれば、ビデオエンコーダは、準拠するビットストリームのみを符号化するように構成され、ビデオデコーダは、準拠するビットストリームのみを復号するように構成される。一例では、１つのＶＰＳにおいてシグナリングされる様々な動作点に関するレイヤ識別子の複製した組が、準拠するビットストリームにおいて拒否される。別の例では、１つのＶＰＳにおいてシグナリングされる様々な動作点に関するＨＤＰパラメータ情報におけるＨＲＤパラメータの複製した組が、準拠するビットストリームにおいて拒否される。このように、レイヤ識別子の所与の組およびＨＲＤパラメータの所与の組は、ＶＰＳにおける第１の動作点に対して一意である。別の例として、本技法は、ビットストリームに関するＨＲＤパラメータをコーディングすることを含み、ＨＲＤパラメータシンタックス構造の各コピーは、異なるコンテンツを含む。

[0023] 本開示の技法は、準拠するビットストリームにおける動作点に関するレイヤ識別子をシグナリングする効率を改善する。例えば、本技法は、準拠するビットストリーム内の単一のＶＰＳにおける動作点および動作点に関連するＨＲＤパラメータ情報に関するコンテンツの一意の組のみをコーディングすることによって、また単一のＶＰＳにおける様々な動作点に関する複製コンテンツのコーディングを拒否することによって効率を改善し得る。

[0024] ビデオコーディング規格としては、ＩＴＵ−ＴＨ．２６１、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、およびＩＴＵ−ＴＨ．２６４（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られている）がある。ビデオコーディング規格としては、さらに、ＩＴＵ−ＴＨ．２６４のスケーラブルビデオコーディング（ＳＶＣ）およびマルチビュービデオコーディング（ＭＶＣ）の拡張がある。

[0025] 加えて、ＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）とＩＳＯ／ＩＥＣＭｏｔｉｏｎＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とのＪｏｉｎｔＣｏｌｌａｂｏｒａｔｉｏｎＴｅａｍｏｎＶｉｄｅｏＣｏｄｉｎｇ（ＪＣＴ−ＶＣ）によって開発されている新しいビデオコーディング規格、すなわち、ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）がある。ＨＥＶＣの最近のワーキングドラフト（ＷＤ）は、ＷｏｒｋｉｎｇＤｒａｆｔ８であり、以下でＨＥＶＣＷＤ８と呼ぶ。ｈｔｔｐ：／／ｐｈｅｎｉｘ．ｉｎｔ−ｅｖｒｙ．ｆｒ／ｊｃｔ／ｄｏｃ＿ｅｎｄ＿ｕｓｅｒ／ｄｏｃｕｍｅｎｔｓ／１０＿Ｓｔｏｃｋｈｏｌｍ／ｗｇ１１／ＪＣＴＶＣ−Ｊ１００３−ｖ８．ｚｉｐからの、２０１３年５月１４日時点で入手可能な、Ｂｒｏｓｓら、ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ）ＴｅｘｔＳｐｅｃｉｆｉｃａｔｉｏｎＤｒａｆｔ８、２０１２年７月、Ｓｔｏｃｋｈｏｌｍ。本開示で説明する技法は、ＨＥＶＣ規格に関して説明されるが、本開示の態様は、そのように限定されず、他のビデオコーディング規格および所有権を主張できるビデオコーディング技法に拡張され得る。

[0026] 図１は、本開示で説明する技法を利用し得る例示的なビデオ符号化および復号システム１０を示すブロック図である。図１に示すように、システム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを生成するソースデバイス１２を含む。ソースデバイス１２および宛先デバイス１４は、デスクトップコンピュータ、ノートブック（例えば、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。場合によっては、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信のために装備され得る。

[0027] 図１の例では、ソースデバイス１２が、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。他の例では、ソースデバイス１２および宛先デバイス１４が、他のコンポーネントまたは構成を含み得る。例えば、ソースデバイス１２は、外部カメラなどの外部ビデオソース１８からビデオデータを受信し得る。同様に、宛先デバイス１４は、内蔵ディスプレイデバイスを含むのではなく、外部ディスプレイデバイスとインターフェースし得る。

[0028] 図１の図示のシステム１０は一例にすぎない。本開示の技法は、任意のデジタルビデオ符号化および／または復号デバイスによって行われ得る。概して、本技法はビデオ符号化デバイスまたはビデオ復号デバイスによって行われるが、本技法は、一般に「コーデック」と呼ばれるビデオエンコーダ／デコーダによっても行われ得る。さらに、本開示の技法は、ビデオプリプロセッサによっても行われ得る。ソースデバイス１２および宛先デバイス１４は、ソースデバイス１２が宛先デバイス１４に送信するためのコード化ビデオデータを生成するようなコーディングデバイスの例にすぎない。いくつかの例では、デバイス１２、１４が、デバイス１２、１４の各々がビデオ符号化構成要素とビデオ復号構成要素とを含むように、実質的に対称的に動作し得る。従って、システム１０は、例えば、ビデオストリーミング、ビデオ再生、ビデオブロードキャストまたはビデオ電話のための、ビデオデバイス１２とビデオデバイス１４との間の一方向または双方向のビデオ送信をサポートできる。

[0029] ソースデバイス１２のビデオソース１８は、ビデオカメラなどのビデオキャプチャデバイス、以前にキャプチャされたビデオを含むビデオアーカイブ、および／またはビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェースを含み得る。さらなる代替として、ビデオソース１８は、ソースビデオとしてのコンピュータグラフィックスベースのデータ、またはライブビデオとアーカイブビデオとコンピュータ生成ビデオとの組合せを生成し得る。場合によっては、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、いわゆるカメラ付き携帯電話またはビデオ電話を形成できる。ただし、上述のように、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。

[0030] 各場合において、キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成ビデオは、ビデオエンコーダ２０によって符号化され得る。符号化ビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に直接送信され得る。符号化ビデオデータは、さらに（または代替として）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのためにストレージデバイス上に記憶され得る。

[0031] リンク１６は、ワイヤレスブロードキャストもしくはワイヤードネットワーク送信などの一時的媒体、またはハードディスク、フラッシュドライブ、コンパクトディスク、デジタルビデオディスク、Ｂｌｕ−ｒａｙ（登録商標）ディスク、または他のコンピュータ可読媒体などの記憶媒体（すなわち、非一時的記憶媒体）を含み得る。いくつかの例では、ネットワークサーバが、ソースデバイス１２から符号化ビデオデータを受信し、例えば、ネットワーク送信を介して、その符号化ビデオデータを宛先デバイス１４に与え得る。同様に、ディスクスタンピング設備などの媒体製造設備のコンピューティングデバイスは、ソースデバイス１２から符号化ビデオデータを受信し、その符号化ビデオデータを含むディスクを生成し得る。従って、様々な例では、リンク１６が、様々な形態の１つまたは複数のコンピュータ可読媒体を含むと理解され得る。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを動かすことが可能な任意のタイプの媒体またはデバイスを備え得る。一例で、リンク１６は、ソースデバイス１２が、符号化ビデオデータを宛先デバイス１４にリアルタイムで直接送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得るルータ、スイッチ、基地局、または任意の他の機器を含み得る。

[0032] 宛先デバイス１４の入力インターフェース２８は、コンピュータ可読媒体であり得るリンク１６から情報を受信する。リンク１６からの情報は、ビデオエンコーダ２０によって定義され、またビデオデコーダ３０によって使用される、ブロックおよび他のコード化ユニット、例えば、ＧＯＰの特性および／または処理を記述するシンタックス要素を含む、シンタックス情報を含み得る。ディスプレイデバイス３２は、宛先デバイス１４と一体化されるか、またはその外部にあり得る。ディスプレイデバイス３２は、復号ビデオデータをユーザに対して表示し、陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなどの、様々なディスプレイデバイスのいずれかを備え得る。

[0033] 代替的に、いくつかの例では、符号化データが、出力インターフェース２２からストレージデバイス３４に出力され得る。同様に、符号化データは、入力インターフェースによってストレージデバイス３４からアクセスされ得る。ストレージデバイス３４は、ハードドライブ、ブルーレイ（登録商標）ディスク、ＤＶＤ、ＣＤ−ＲＯＭ、フラッシュメモリ、揮発性または不揮発性メモリ、あるいは符号化ビデオデータを記憶するための任意の他の好適なデジタル記憶媒体など、様々な分散されたまたはローカルにアクセスされるデータ記憶媒体のいずれかを含み得る。さらなる一例では、ストレージデバイス３４が、ソースデバイス１２によって生成された符号化ビデオを保持し得るファイルサーバまたは別の中間ストレージデバイスに対応し得る。宛先デバイス１４は、ストリーミングまたはダウンロードを介してストレージデバイス３４から、記憶されたビデオデータにアクセスし得る。ファイルサーバは、符号化ビデオデータを記憶し、その符号化ビデオデータを宛先デバイス１４に送信することが可能な任意のタイプのサーバであり得る。例示的なファイルサーバは、（例えば、ウェブサイトのための）ウェブサーバ、ＦＴＰサーバ、ネットワーク接続ストレージ（ＮＡＳ）デバイス、またはローカルディスクドライブを含む。宛先デバイス１４は、インターネット接続を含む、任意の標準のデータ接続を介して符号化ビデオデータにアクセスし得る。これは、ファイルサーバに記憶された符号化ビデオデータにアクセスするのに好適であるワイヤレスチャネル（例えば、Ｗｉ−Ｆｉ（登録商標）接続）、ワイヤード接続（例えば、ＤＳＬ、ケーブルモデムなど）、または両方の組合せを含み得る。ストレージデバイス３４からの符号化ビデオデータの送信は、ストリーミング送信、ダウンロード送信、または両方の組合せであり得る。

[0034] 本開示の技法は、必ずしもワイヤレス適用例または設定に限定されるとは限らない。本技法は、オーバージエアテレビジョン放送、ケーブルテレビジョン送信、衛星テレビジョン送信、ストリーミングビデオ送信（例えば、インターネットを介して）、ストレージ用デジタルビデオのデータ記憶媒体上への符号化、データ記憶媒体に記憶されたデジタルビデオの復号、または他の適用例などの、様々なマルチメディア適用例のいずれかをサポートするビデオコーディングに適用され得る。いくつかの例では、システム１０が、ビデオストリーミング、ビデオ再生、ビデオブロードキャスティング、および／またはビデオテレフォニーなどの適用例をサポートするために、一方向または双方向のビデオ送信をサポートするように構成され得る。

[0035] ビデオエンコーダ２０およびビデオデコーダ３０は、現在開発中のＨＥＶＣ規格などのビデオコーディング規格に従って動作し得、ＨＥＶＣテストモデル（ＨＭ）に準拠し得る。代替的に、ビデオエンコーダ２０およびビデオデコーダ３０は、代替的にＭＰＥＧ−４、Ｐａｒｔ１０、アドバンストビデオコーディング（ＡＶＣ）と呼ばれるＩＴＵ−ＴＨ．２６４規格などの、他のプロプライエタリ規格または業界規格、あるいはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオコーディング規格の他の例には、ＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。いくつかの態様では、ビデオエンコーダ２０およびビデオデコーダ３０が、それぞれオーディオエンコーダおよびオーディオデコーダと統合され得、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含んで、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理できる。適用可能な場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠できる。

[0036] ＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４（ＡＶＣ）規格は、ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）として知られる共同パートナーシップの成果として、ＩＳＯ／ＩＥＣＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）とともにＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）によって策定された。いくつかの態様では、本開示で説明する技法が、一般にＨ．２６４規格に準拠するデバイスに適用できる。Ｈ．２６４規格は、ＩＴＵ−Ｔ研究グループによる２００５年３月付けのＩＴＵ−Ｔ勧告Ｈ．２６４「ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇｆｏｒｇｅｎｅｒｉｃａｕｄｉｏｖｉｓｕａｌｓｅｒｖｉｃｅｓ」に記載されており、本明細書ではＨ．２６４規格またはＨ．２６４仕様、あるいはＨ．２６４／ＡＶＣ規格または仕様と呼ぶ。ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）はＨ．２６４／ＭＰＥＧ−４ＡＶＣへの拡張に取り組み続けている。

[0037] ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理回路、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダまたはデコーダ回路のいずれか、あるいはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアのための複数の命令を記憶し、本開示の技法を行うために１つまたは複数のプロセッサを使用したハードウェアでこれら命令を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、該当のデバイスにおいて複合エンコーダ／デコーダ（コーデック）の一部として統合され得る。ビデオエンコーダ２０および／またはビデオデコーダ３０を含むデバイスは、集積回路、マイクロプロセッサ、および／またはセルラー電話などのワイヤレス通信デバイスを備え得る。

[0038] ＪＣＴ−ＶＣは、ＨＥＶＣ規格の開発に取り組んでいる。ＨＥＶＣ規格化の取り組みは、ＨＥＶＣテストモデル（ＨＭ）と呼ばれるビデオコーディングデバイスの発展的モデルに基づく。ＨＭは、例えば、ＩＴＵ−ＴＨ．２６４／ＡＶＣに従う既存のデバイスに対してビデオコーディングデバイスのいくつかの追加の能力を仮定する。例えば、Ｈ．２６４は９つのイントラ予測符号化モードを提供するが、ＨＭは３３個ものイントラ予測符号化モードを提供し得る。

[0039] 一般に、ＨＭの作業モデルは、ビデオフレームまたはピクチャが、ルーマとクロマの両方のサンプルを含む一連のツリーブロックまたは最大コーディングユニット（ＬＣＵ）に分割され得ることを記載する。ビットストリーム内のシンタックスデータが、ピクセルの数に関して最大コーディングユニットであるＬＣＵのサイズを定義し得る。スライスは、コーディング順序でいくつかの連続するツリーブロックを含む。ビデオフレームまたはピクチャは、１つまたは複数のスライスに区分され得る。各ツリーブロックは、４分木に従ってコーディングユニット（ＣＵ）に分割され得る。一般に、４分木データ構造はＣＵごとに１つのノードを含み、ルートノードはツリーブロックに対応する。ＣＵが４つのサブＣＵに分割された場合、ＣＵに対応するノードは４つのリーフノードを含み、リーフノードの各々はサブＣＵのうちの１つに対応する。

[0040] ４分木データ構造の各ノードは、対応するＣＵのシンタックスデータを与え得る。例えば、４分木のノードは、そのノードに対応するＣＵがサブＣＵに分割されるかどうかを示す分割フラグを含み得る。ＣＵのシンタックス要素は、再帰的に定義され得、ＣＵがサブＣＵに分割されるかどうかに依存し得る。ＣＵがさらに分割されない場合、そのＣＵはリーフＣＵと呼ばれる。本開示では、元のリーフＣＵの明示的分割が存在しない場合でも、リーフＣＵの４つのサブＣＵをリーフＣＵとも呼ぶ。例えば、１６×１６サイズのＣＵがさらに分割されない場合、この１６×１６ＣＵが決して分割されなくても、４つの８×８サブＣＵをリーフＣＵとも呼ぶ。

[0041] ＣＵは、ＣＵがサイズ差異を有さないことを除いて、Ｈ．２６４規格のマクロブロックと同様の目的を有する。例えば、ツリーブロックは、４つの子ノード（サブＣＵとも呼ばれる）に分割され得、各子ノードは、今度は親ノードとなり、別の４つの子ノードに分割され得る。４分木のリーフノードと呼ばれる、最後の分割されていない子ノードは、リーフＣＵとも呼ばれるコーディングノードを備える。コーディングビットストリームに関連するシンタックスデータは、最大ＣＵ深さと呼ばれる、ツリーブロックが分割され得る最大回数を定義し得、コーディングノードの最小サイズも定義し得る。それに応じて、ビットストリームは最小コーディングユニット（ＳＣＵ：smallest coding unit）をも定義し得る。本開示では、ＨＥＶＣのコンテキストにおけるＣＵ、ＰＵ、またはＴＵ、あるいは他の規格のコンテキストにおける同様のデータ構造（例えば、Ｈ．２６４／ＡＶＣにおけるマクロブロックおよびそれのサブブロック）のいずれかを指すために「ブロック」という用語を使用する。

[0042] ＣＵは、コーディングノードと、コーディングノードに関連する予測ユニット（ＰＵ：prediction unit）および変換ユニット（ＴＵ：transform unit）とを含む。ＣＵのサイズは、コーディングノードのサイズに対応し、形状が方形でなければならない。ＣＵのサイズは、８×８ピクセルから最大６４×６４以上のピクセルを有するツリーブロックのサイズまでに及び得る。各ＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含み得る。ＣＵに関連するシンタックスデータは、例えば、ＣＵを１つまたは複数のＰＵに区分することを記述し得る。区分モードは、ＣＵが、スキップモード符号化またはダイレクトモード符号化されるか、イントラ予測モード符号化されるか、あるいはインター予測モード符号化されるかによって異なり得る。ＰＵは、形状が非方形になるように区分され得る。ＣＵに関連するシンタックスデータは、例えば、４分木に従って、ＣＵを１つまたは複数のＴＵに区分することも記述し得る。ＴＵは、形状が正方形または非正方形（例えば、矩形）であり得る。

[0043] ＨＥＶＣ規格は、ＣＵごとに異なり得るＴＵに従った変換を可能にする。ＴＵは、一般に、区分されたＬＣＵについて定義された所与のＣＵ内のＰＵのサイズに基づいてサイズ決定されるが、常にそうであるとは限らない。ＴＵは、一般にＰＵと同じサイズであるかまたはＰＵよりも小さい。いくつかの例では、ＣＵに対応する残差サンプルが、「残差４分木」（ＲＱＴ：residual quad tree）として知られる４分木構造を使用して、より小さいユニットに再分割され得る。ＲＱＴのリーフノードは変換ユニット（ＴＵ）と呼ばれることがある。ＴＵに関連するピクセル差分値は、量子化され得る変換係数を生成するために変換され得る。

[0044] リーフＣＵは、１つまたは複数の予測ユニット（ＰＵ）を含むことができる。一般に、ＰＵは、対応するＣＵの全部または一部に対応する空間的エリアを表し、そのＰＵ用の参照サンプルを取り出すためのデータを含むことができる。その上、ＰＵは、予測に関係するデータを含む。例えば、ＰＵがイントラモード符号化されるとき、ＰＵのデータは、ＰＵに対応するＴＵのイントラ予測モードを記述するデータを含み得る、残差４分木（ＲＱＴ）中に含まれ得る。別の例として、ＰＵがインターモード符号化されるとき、ＰＵは、ＰＵのための１つまたは複数の動きベクトルを定義するデータを含み得る。ＰＵの動きベクトルを定義するデータは、例えば、動きベクトルの水平成分、動きベクトルの垂直成分、動きベクトルの解像度（例えば、１／４ピクセル精度もしくは１／８ピクセル精度）、動きベクトルが指す参照ピクチャ、および／または動きベクトルの参照ピクチャリスト（例えば、リスト０、リスト１、もしくはリストＣ）を記述し得る。

[0045] １つまたは複数のＰＵを有するリーフＣＵはまた、１つまたは複数の変換ユニット（ＴＵ）を含み得る。変換ユニットは、上記で説明したように、（ＴＵ４分木構造とも呼ばれる）ＲＱＴを使用して指定され得る。例えば、分割フラグは、リーフＣＵが４つの変換ユニットに分割されるかどうかを示し得る。次いで、各変換ユニットは、さらに、さらなるサブＴＵに分割され得る。ＴＵがさらに分割されないとき、そのＴＵはリーフＴＵと呼ばれ得る。概して、イントラコーディングの場合、リーフＣＵに属するすべてのリーフＴＵは同じイントラ予測モードを共有する。すなわち、概して、リーフＣＵのすべてのＴＵの予測値を計算するために同じイントラ予測モードが適用される。イントラコーディングの場合、ビデオエンコーダは、イントラ予測モードを使用して各リーフＴＵの残差値を、ＴＵに対応するＣＵの一部と元のブロックとの間の差分として計算し得る。ＴＵは、必ずしもＰＵのサイズに制限されるとは限らない。従って、ＴＵはＰＵよりも大きくまたは小さくなり得る。イントラコーディングの場合、ＰＵは、同じＣＵについて対応するリーフＴＵとコロケートされ得る。いくつかの例では、リーフＴＵの最大サイズが、対応するリーフＣＵのサイズに対応し得る。

[0046] さらに、リーフＣＵのＴＵはまた、残差４分木（ＲＱＴ）と呼ばれる、該当の４分木データ構造に関連付けられ得る。すなわち、リーフＣＵは、リーフＣＵがどのようにＴＵに区分されるかを示す４分木を含み得る。ＴＵ４分木のルートノードは概してリーフＣＵに対応し、ＣＵ４分木のルートノードは概してツリーブロック（またはＬＣＵ）に対応する。分割されないＲＱＴのＴＵはリーフＴＵと呼ばれる。概して、本開示では、特に明記しない限り、リーフＣＵおよびリーフＴＵに言及するためにそれぞれＣＵおよびＴＵという用語を使用する。

[0047] ビデオシーケンスは、一般に、一連のビデオフレームまたはピクチャを含む。ピクチャグループ（ＧＯＰ）は、概して、ビデオピクチャのうちの一連の１つまたは複数を備える。ＧＯＰは、ＧＯＰ中に含まれるいくつかのピクチャを記述するシンタックスデータを、ＧＯＰのヘッダ中、ピクチャのうちの１つまたは複数のヘッダ中、または他の場所に含み得る。ピクチャの各スライスは、該当のスライスの符号化モードを記述するスライスシンタックスデータを含み得る。ビデオエンコーダ２０は、一般に、ビデオデータを符号化するために個々のビデオスライス内のビデオブロックに対して動作する。ビデオブロックは、ＣＵ内のコーディングノードに対応し得る。ビデオブロックは、サイズを固定することも変更することもでき、指定のコーディング規格に応じてサイズが異なることがある。

[0048] 一例として、ＨＭは、様々なＰＵサイズでの予測をサポートする。特定のＣＵのサイズが２Ｎ×２Ｎであると仮定すると、ＨＭは、２Ｎ×２ＮまたはＮ×ＮのＰＵサイズでのイントラ予測をサポートし、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、またはＮ×Ｎの対称的なＰＵサイズでのインター予測をサポートする。ＨＭはまた、２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、およびｎＲ×２ＮのＰＵサイズでのインター予測のための非対称区分をサポートする。非対称区分では、ＣＵの一方向が区分されないが、他の方向は２５％と７５％とに区分される。２５％の区分に対応するＣＵの部分は、「ｎ」とその後ろに付く「Ｕｐ」、「Ｄｏｗｎ」、「Ｌｅｆｔ」、または「Ｒｉｇｈｔ」という表示によって示される。従って、例えば、「２Ｎ×ｎＵ」は、上部の２Ｎ×０．５ＮＰＵと下部の２Ｎ×１．５ＮＰＵとで水平方向に区分された２Ｎ×２ＮＣＵを指す。

[0049] 本開示では、「Ｎ×Ｎ（NxN）」および「Ｎ×Ｎ（N by N）」が、垂直寸法および水平寸法に関するビデオブロックのピクセル寸法、例えば、１６×１６（16x16）ピクセルまたは１６×１６（16 by 16）ピクセルを指すために互換的に使用され得る。一般に、１６×１６ブロックは、垂直方向に１６ピクセルを有し（ｙ＝１６）、水平方向に１６ピクセルを有する（ｘ＝１６）。同様に、Ｎ×Ｎブロックは、一般に、垂直方向にＮピクセルを有し、水平方向にＮピクセルを有し、ここでＮは非負整数値を表す。ブロック内のピクセルは行と列で構成できる。その上、ブロックは、必ずしも、水平方向において垂直方向と同じ数のピクセルを有する必要があるとは限らない。例えば、ブロックはＮ×Ｍピクセルを備えてよく、ただし、Ｍは必ずしもＮに等しいとは限らない。

[0050] ＣＵのＰＵを使用したイントラ予測コーディングまたはインター予測コーディングの後、ビデオエンコーダ２０は、ＣＵのＴＵのための残差データを計算し得る。ＰＵは、（ピクセル領域とも呼ばれる）空間領域において予測ピクセルデータを生成する方法またはモードを記述するシンタックスデータを備え得、ＴＵは、変換、例えば、残差ビデオデータへの離散コサイン変換（ＤＣＴ）、整数変換、ウェーブレット変換、または概念的に同様の変換の適用後に、変換領域において係数を備え得る。残差データは、符号化されていないピクチャのピクセルと、ＰＵに対応する予測値との間のピクセル差分に対応し得る。ビデオエンコーダ２０は、ＣＵのための残差データを含むＴＵを形成し、次いで、ＴＵを変換して、ＣＵの変換係数を生成し得る。

[0051] 変換係数を生成するための任意の変換の後に、ビデオエンコーダ２０は、変換係数の量子化を行い得る。量子化は、概して、さらなる圧縮を提供する、係数を表すために使用されるデータの量をできるだけ低減するために変換係数を量子化するプロセスを指す。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。例えば、量子化中にｎビット値がｍビット値に切り捨てられ得、ただし、ｎはｍよりも大きい。

[0052] 量子化の後に、ビデオエンコーダは、変換係数を走査して、量子化変換係数を含む２次元行列から１次元ベクトルを生成し得る。走査は、より高いエネルギー（従ってより低い周波数）の係数をアレイの前方に配置し、より低いエネルギー（従ってより高い周波数）の係数をアレイの後方に配置するように設計され得る。いくつかの例では、ビデオエンコーダ２０が、エントロピー符号化され得るシリアル化ベクトルを生成するために、量子化変換係数を走査するためにあらかじめ定義された走査順序を利用し得る。他の例では、ビデオエンコーダ２０が適応走査を行い得る。量子化変換係数を走査して１次元ベクトルを形成した後に、ビデオエンコーダ２０は、例えば、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ：context-adaptive variable length coding）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ：context-adaptive binary arithmetic coding）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ：syntax-based context-adaptive binary arithmetic coding）、確率間隔区分エントロピー（ＰＩＰＥ：Probability Interval Partitioning Entropy）コーディング、または別のエントロピー符号化方法に従って１次元ベクトルをエントロピー符号化し得る。ビデオエンコーダ２０はまた、ビデオデータを復号する際にビデオデコーダ３０が使用するための符号化ビデオデータに関連するシンタックス要素をエントロピー符号化し得る。

[0053] ＣＡＢＡＣを行うために、ビデオエンコーダ２０は、送信されるべきシンボルに、コンテキストモデル内のコンテキストを割り当て得る。コンテキストは、例えば、シンボルの隣接値が非０であるか否かに関係し得る。ＣＡＶＬＣを行うために、ビデオエンコーダ２０は、送信されるべきシンボルのための可変長コードを選択し得る。ＶＬＣにおけるコードワードは、比較的短いコードが優勢シンボルに対応し、より長いコードが劣勢シンボルに対応するように構成され得る。このようにして、ＶＬＣの使用は、例えば、送信されるべき各シンボルのために等長コードワードを使用するよりも、ビット節約を達成し得る。確率判断は、シンボルに割り当てられるコンテキストに基づき得る。

[0054] ビデオエンコーダ２０は、さらに、ブロックベースのシンタックスデータ、フレームベースのシンタックスデータ、およびＧＯＰベースのシンタックスデータなどのシンタックスデータを、例えば、フレームヘッダ、ブロックヘッダ、スライスヘッダ、またはＧＯＰヘッダ中でビデオデコーダ３０に送り得る。ＧＯＰシンタックスデータは、該当のＧＯＰ中のいくつかのフレームを記述し得、フレームシンタックスデータは、対応するフレームを符号化するために使用される符号化／予測モードを示し得る。

[0055] ＨＥＶＣＷＤ８は、「プロファイル」および「レベル」の手段によってシンタックスの限られた数のサブセットの規定も可能にする。ＨＥＶＣＷＤ８は、広範なアプリケーション、ビットレート、解像度、品質、およびサービスを提供するという意味で一般的であるように設計されている。アプリケーションは、とりわけ、デジタルストレージ媒体、テレビ放送、およびリアルタイム通信をカバーすべきである。ＨＥＶＣＷＤ８を作成する最中に、一般的なアプリケーションからの様々要件が考慮され、必要なアルゴリズム要素が開発され、これらは単一のシンタックスに組み込まれている。従って、ＨＥＶＣＷＤ８は、異なるアプリケーションの中のビデオデータ交換を容易にする。しかしながら、ＨＥＶＣＷＤ８の全シンタックスを実装する実用性を考慮して、プロファイルおよびレベルは、シンタックスの限られた数のサブセット用の手段を提供する。

[0056] 「プロファイル」は、ＨＥＶＣＷＤ８によって指定されたビットストリームシンタックス全体のサブセットとして定義される。所与のプロファイルのシンタックスによって課される限界内で、ビットストリーム内のシンタックス要素によってとられる値に応じて、エンコーダおよびデコーダのパフォーマンスの極めて大きい変動を必要とする可能性が依然としてある。例えば、復号ピクチャの指定サイズは、エンコーダおよびデコーダのパフォーマンスの極めて大きい変動を必要とし得る。多くの適用例において、現在、特定のプロファイル内でシンタックスのすべての仮定的使用を処理することが可能なデコーダを実装することは実用的でもなく、経済的でもない。

[0057] この問題に対処するために、各プロファイル内で「ティア」および「レベル」が指定される。ティアのレベルは、ビットストリーム内のシンタックス要素の値に課された制約条件の指定された組である。これらの制約条件は、値に関する単純な制限であり得る。あるいは、それらの制約条件は、値の演算の組合せ（例えば、ピクチャの幅×ピクチャの高さ×毎秒復号されるピクチャの数）に関する制約の形態をとり得る。下位ティアのために指定されたレベルは、上位ティアのために指定されたレベルよりも制約される。すべてのプロファイルに関してレベルの同じ組が定義され、各レベルの定義のほとんどの態様が、様々なプロファイルにわたって共通である。個々の実装形態は、指定された制約条件内で、各サポートされるプロファイルの異なるレベルをサポートし得る。異なるコンテキストでは、レベルが、スケーリングの前の変換係数の値である。プロファイルおよびレベルは、ＨＥＶＣＷＤ８の付属書類Ａにより詳細に記述されている。

[0058] ＨＥＶＣＷＤ８に準拠するコード化ビデオコンテンツは、共通のシンタックスを使用する。完全なシンタックスのサブセットを実現するために、ビットストリーム中に後に生じるシンタックス要素の有無をシグナリングする、フラグ、パラメータ、および他のシンタックス要素が、ビットストリーム中に含まれる。

[0059] ＨＥＶＣＷＤ８は、ＴｅｍｐｏｒａｌＩｄ変数の特定の値を有するビデオコーディングレイヤ（ＶＣＬ）ネットワークアブストラクションレイヤ（ＮＡＬ）ユニットと、関連する非ＶＣＬＮＡＬユニットとからなる時間的スケーラブルビットストリームの時間的スケーラブルレイヤとしてサブレイヤを定義する。ＨＥＶＣＷＤ８は、特定のサブレイヤおよび下位のサブレイヤのＮＡＬユニットからなるビットストリームのサブセットとしてサブレイヤ表現をさらに定義する。

[0060] ＨＥＶＣＷＤ８のサブクローズ１０．１は、ビットストリームサブセットと、サブビットストリームを生成するための抽出プロセスとを記述する。一般に、ＨＥＶＣＷＤ８は、レイヤ識別子およびビットストリームの動作点を識別する時間的サブレイヤ識別子の値に基づいてビットストリームからサブビットストリームを抽出することを記述する。

[0061] 動作点は、入力としての別のビットストリーム、ターゲット最上位ＴｅｍｐｏｒａｌＩｄ、およびターゲットレイヤ識別子リストを用いたサブビットストリーム抽出プロセスの動作によって別のビットストリームから作り出されたビットストリームである。動作点は、ＯｐＬａｙｅｒＩｄＳｅｔとして示されるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値と、ＯｐＴｉｄとして示されるＴｅｍｐｏｒａｌＩｄ値との組によって識別され、入力としてのＯｐＴｉｄおよびＯｐＬａｙｅｒＩｄＳｅｔを用いてＨＥＶＣＷＤ８中に指定されたサブビットストリーム抽出プロセスの出力として導出された関連のビットストリームサブセットは、独立して復号可能である。動作点のターゲット最上位ＴｅｍｐｏｒａｌＩｄが、ターゲットレイヤ識別子リストに関連するレイヤセット中のＴｅｍｐｏｒａｌＩｄの最大値に等しい場合、動作点は、レイヤセットと同一である。そうでない場合、動作点は、レイヤセットのサブセットである。

[0062] サブビットストリーム抽出プロセスは、ターゲット最上位ＴｅｍｐｏｒａｌＩｄおよびターゲットレイヤ識別子リストｌａｙｅｒＩｄＬｉｓｔＴａｒｇｅｔによって決定される、ターゲットセットに属さないビットストリーム内のＮＡＬユニットが、ターゲットセットに属するビットストリーム内のＮＡＬユニットからなる出力サブビットストリームを有するビットストリームから除去される、指定されたプロセスである。サブビットストリーム抽出プロセスへの入力は、変数ｔＩｄＴａｒｇｅｔおよびリストｔａｒｇｅｔＤｅｃＬａｙｅｒＩｄＳｅｔである。サブビットストリーム抽出プロセスの出力は、サブビットストリームである。サブビットストリームは、ｔａｒｇｅｔＤｅｃＬａｙｅｒＩｄＳｅｔ中の値のうちではなくｔＩｄＴａｒｇｅｔまたはｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓよりも大きいＴｅｍｐｏｒａｌＩｄを有するすべてのＮＡＬユニットをビットストリームから除去することによって導出される。

[0063] 両端値を含む０〜６の範囲の任意の値に等しいｔＩｄＴａｒｇｅｔと、値０を含むｔａｒｇｅｔＤｅｃＬａｙｅｒＩｄＳｅｔとを有する、ＨＥＶＣＷＤ８のサブクローズ１０．１中に指定されるサブビットストリーム抽出プロセスの出力に含まれる任意のサブビットストリームは、ＨＥＶＣＷＤ８に準拠する。ＨＥＶＣＷＤ８に準拠するビットストリームは、０に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓと、０に等しいＴｅｍｐｏｒａｌＩｄとを有する１つまたは複数のコード化スライスＮＡＬユニットを含み得る。

[0064] 現行のＨＥＶＣ設計は、以下の欠点を有する。第１に、コード化ビデオシーケンスの時間的サブセットは、コード化ビデオシーケンス全体の組とは異なる、プロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件の組をシグナリングすることが可能になる。しかしながら、時間的サブセットが異なるプロファイル空間を使用することは意味をなさず、時間的サブセットが、コード化ビデオシーケンス全体とは異なる他の値（ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件など）を有することが有益である明らかな使用の場合は存在しない。

[0065] 第２に、現在、各動作点のｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値（すなわち、レイヤＩＤ）の組は、第１の組を除いて、復号されるべきコード化ビデオシーケンスに含まれるレイヤＩＤの各々を明示的にシグナリングすることによってシグナリングされる。しかしながら、ほとんどのスケーラビリティコーディングシナリオでは、レイヤ従属関係が線形であり、ターゲットレイヤＩＤのみのシグナリングは十分であろう。さらに、複数のレイヤＩＤがシグナリングされるマルチビューコーディングシナリオには典型的な非線形レイヤ従属関係では、レイヤＩＤが、差分的にコーディングされ得る。レイヤＩＤを差分的にコーディングすることは、例えば、短期参照ピクチャセットシグナリングにおけるピクチャ順序カウント（ＰＯＣ）値のコーディングと同様に、簡単で効率的である。最後に、レイヤＩＤの複製した組がシグナリングされることが可能になる。

[0066] 第３に、現行のＨＥＶＣ設計は、同じコンテンツを有するｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を複製することが可能になるという点で欠点も有する。

[0067] 以下の技法は、上記の欠点に対処するために本開示に含まれる。第１に、時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のシグナリングに関するシンタックス要素は、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造から除去される。このように、時間的サブレイヤに関するこれらのシンタックス要素上で使用される必要のないビットは節約される。

[0068] 第２に、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ（すなわち、レイヤＩＤ）の１つの値のみがシグナリングされる必要がある、簡単な動作点モードが定義される。簡単な動作点モードを有する動作点に関するｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの１つの値のみのシグナリングを可能にするために、動作点のシグナリングが変更される。ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ（すなわち、レイヤＩＤ）の複数の値がシグナリングされるとき、それらの値は差分的にコーディングされる。動作点をシグナリングするこの方法は、線形レイヤ依存性により、任意のスケーラビリティコーディング、マルチビューおよび／または３ＤＶ（３次元ビデオ）コーディングシナリオには、より効率的である。さらに、本開示の技法によれば、１つのＶＰＳ内で、ＶＰＳにおける様々な動作点に関してシグナリングされるレイヤＩＤの複製した組が拒否される。このように、レイヤ識別子の所与の組は、ＶＰＳにおける所与の動作点に対して一意である。

[0069] 第３に、本開示の技法によれば、動作点に関連するｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造中にコーディングされたＨＲＤパラメータの複製した組は拒否される。このように、所与の動作点に関連するＨＲＤパラメータ情報中のＨＲＤパラメータの所与の組は、ＶＰＳにおける所与の動作点に対して一意である。

[0070] 例えば、ビデオエンコーダ２０は、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化する。これらのシンタックス要素は、コンテンツの第１の組を有する第１の動作点を示す。ビデオエンコーダ２０は、第１の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をさらに符号化する。準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない。このように、ビデオエンコーダ２０は、レイヤＩＤの様々な組などの、一意のコンテンツを有する各動作点を符号化する。さらなる例として、ビデオエンコーダ２０は、ビットストリームに関するＨＲＤパラメータを符号化することができ、ＨＲＤパラメータシンタックス構造の各コピーは、異なるコンテンツを含む。

[0071] 同様に、本開示で説明する技法によれば、ビデオデコーダ３０は、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号する。これらのシンタックス要素は、コンテンツの第１の組を有する第１の動作点を示す。いくつかの例では、ビデオデコーダ３０が、ビデオエンコーダ２０から符号化された準拠するビットストリームを受信する。ビデオデコーダ３０は、存在する場合、第１の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素をさらに復号する。準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない。このように、ビデオデコーダ３０は、レイヤＩＤの様々な組などの、一意のコンテンツを有する各動作点を復号する。さらなる例として、ビデオデコーダ３０は、ビットストリームに関するＨＲＤパラメータを復号することができ、ＨＲＤパラメータシンタックス構造の各コピーは、異なるコンテンツを含む。さらなる例では、コンテンツの第２の組が、第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、第１の動作点に関するＨＲＤパラメータの組を備える。

[0072] 第１の動作点を示すシンタックス要素は、準拠するビットストリーム内のＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を含み得る。さらに、ＨＲＤパラメータ情報を示すシンタックス要素は、準拠するビットストリーム内のＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を備え得る。

[0073] 上記の例では、準拠するビットストリームが、第２の動作点のコンテンツの第１の組を複製する、ＶＰＳにおけるシンタックス要素を含まない可能性があり、コンテンツの第１の組は、ＶＰＳにおける第１の動作点に対して一意である。さらに、準拠するビットストリームは、第２の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を複製する、ＶＰＳにおけるシンタックス要素を含まない可能性があり、コンテンツの第２の組は、ＶＰＳにおける第１の動作点に対して一意である。

[0074] いくつかの例では、ビデオエンコーダ２０が、ビットストリームの複数の動作点の各々に関して簡単な動作点モードが使用されるかどうかをさらに示すことができる。動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、ビデオエンコーダ２０は、特定の動作点に関する１つのターゲットレイヤ識別子のみを符号化し得る。別の例として、ビデオエンコーダ２０は、ビットストリームに関するプロファイル空間、ティア、互換性のあるプロファイル、および／またはプロファイル関連の制約条件を符号化できるが、ビットストリームの時間的サブレイヤに関する、別のプロファイル空間、ティア、互換性のあるプロファイル、またはプロファイル関連の制約条件を符号化することができない。

[0075] 同様に、ビデオデコーダ３０は、ビットストリームの複数の動作点の各々に関して簡単な動作点モードが使用されるかどうかの指示を受信し得る。動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、ビデオデコーダ３０は、特定の動作点に関する１つのターゲットレイヤ識別子のみを復号し得る。別の例として、ビデオデコーダ３０は、ビットストリームに関するプロファイル空間、ティア、互換性のあるプロファイル、および／またはプロファイル関連の制約条件を復号できるが、ビットストリームの時間的サブレイヤに関する、別のプロファイル空間、ティア、互換性のあるプロファイル、またはプロファイル関連の制約条件を復号することができない。

[0076] 図２は、本開示で説明する技法を実装し得るビデオエンコーダ２０の一例を示すブロック図である。ビデオエンコーダ２０は、ビデオスライス内のビデオブロックのイントラコーディングおよびインターコーディングを行い得る。イントラコーディングは、所与のビデオフレームまたはピクチャ内のビデオの空間的冗長性を低減または除去するために空間的予測に依拠する。インターコーディングは、ビデオシーケンスの隣接フレームまたはピクチャ内のビデオの時間的冗長性を低減または除去するために時間的予測に依拠する。イントラモード（Ｉモード）は、いくつかの空間ベースのコーディングモードのいずれかを指し得る。単方向予測（Ｐモード）または双方向予測（Ｂモード）などのインターモードは、いくつかの時間ベースのコーディングモードのいずれかを指し得る。

[0077] 図２に示されるように、ビデオエンコーダ２０は、符号化されるべきビデオフレーム内の現在のビデオブロックを受信する。図２の例では、ビデオエンコーダ２０が、モード選択ユニット４０と、参照フレームメモリ６４と、加算器５０と、変換処理ユニット５２と、量子化ユニット５４と、エントロピーコーディングユニット５６とを含む。モード選択ユニット４０は、今度は、動き補償ユニット４４と、動き推定ユニット４２と、イントラ予測処理ユニット４６と、区分ユニット４８とを含む。ビデオブロックの復元のために、ビデオエンコーダ２０はまた、逆量子化ユニット５８と、逆変換処理ユニット６０と、加算器６２とを含む。復元されたビデオからブロッキネスアーティファクトを除去するためにブロック境界をフィルタリングする、デブロッキングフィルタも含まれ得る。所望される場合、デブロッキングフィルタは一般に、加算器６２の出力をフィルタリングすることになる。また、デブロッキングフィルタに加えて追加のフィルタ（ループ内またはループ後）が使用され得る。そのようなフィルタは、簡潔のために示されていないが、所望される場合、（ループ内フィルタとして）加算器５０の出力をフィルタ処理し得る。

[0078] 符号化プロセス中に、ビデオエンコーダ２０はコーディングされるべきビデオフレームまたはスライスを受信する。フレームまたはスライスは複数のビデオブロックに分割され得る。動き推定ユニット４２および動き補償ユニット４４は、時間的な予測を行うために、１つまたは複数の参照フレーム中の１つまたは複数のブロックに対する受信されたビデオブロックのインター予測コーディングを行う。イントラ予測処理ユニット４６は代替的に、空間的な予測を行うために、コーディングされるべきブロックと同じフレームまたはスライス中の１つまたは複数の隣接ブロックに対して受信されたビデオブロックのイントラ予測コーディングを行い得る。ビデオエンコーダ２０は、例えば、ビデオデータのブロックごとに適切なコーディングモードを選択するために、複数のコーディングパスを行い得る。

[0079] その上、区分ユニット４８は、以前のコーディングパスにおける以前の区分方式の評価に基づいて、ビデオデータのブロックをサブブロックに区分し得る。例えば、区分ユニット４８は、初めにフレームまたはスライスをＬＣＵに区分し、レートひずみ分析（例えば、レートひずみ最適化）に基づいてＬＣＵの各々をサブＣＵに区分し得る。モード選択ユニット４０は、さらに、ＬＣＵをサブＣＵに区分することを示す４分木データ構造を生成し得る。４分木のリーフノードＣＵは、１つまたは複数のＰＵと、１つまたは複数のＴＵとを含み得る。

[0080] モード選択ユニット４０は、例えば、誤差結果に基づいて、コーディングモード、すなわち、イントラまたはインターのうちの１つを選択することができ、残差ブロックデータを生成するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器５０に与え、参照フレームとして使用するための符号化されたブロックを復元するために、得られたイントラコーディングされたブロックまたはインターコーディングされたブロックを加算器６２に与える。モード選択ユニット４０はまた、動きベクトル、イントラモードインジケータ、パーティション情報、および他のそのようなシンタックス情報などのシンタックス要素をエントロピーコーディングユニット５６に与える。

[0081] 動き推定ユニット４２と動き補償ユニット４４とは、高度に統合され得るが、概念的な目的のために別々に示してある。動き推定ユニット４２によって行われる動き推定は、ビデオブロックの動きを推定する動きベクトルを生成するプロセスである。動きベクトルは、例えば、現在のフレーム（または他のコード化ユニット）内でコーディングされている現在のブロックに対する参照フレーム（または他のコード化ユニット）内の予測ブロックに対する現在のビデオフレームまたはピクチャ内のビデオブロックのＰＵの変位を示し得る。予測ブロックは、絶対値差分和（ＳＡＤ）、２乗差分和（ＳＳＤ）、または他の差分尺度によって決定され得るピクセル差分に関して、コーディングされるブロックに精密に一致することがわかるブロックである。いくつかの例では、ビデオエンコーダ２０が、参照フレームメモリ６４に記憶された参照ピクチャのサブ整数ピクセル位置の値を計算し得る。例えば、ビデオエンコーダ２０は、参照ピクチャの１／４ピクセル位置、１／８ピクセル位置、または他の分数ピクセル位置の値を補間し得る。従って、動き推定ユニット４２は、フルピクセル位置と分数ピクセル位置とに対する動き探索を行い、分数ピクセル精度で動きベクトルを出力し得る。

[0082] 動き推定ユニット４２は、ＰＵの位置を参照ピクチャの予測ブロックの位置と比較することによって、インターコード化スライス中のビデオブロックのＰＵについての動きベクトルを計算する。参照ピクチャは、第１の参照ピクチャリスト（リスト０）または第２の参照ピクチャリスト（リスト１）から選択され得、それらの参照ピクチャリストの各々は、参照フレームメモリ６４に記憶された１つまたは複数の参照ピクチャを識別する。動き推定ユニット４２は、計算された動きベクトルをエントロピーコーディングユニット５６と動き補償ユニット４４とに送る。

[0083] 動き補償ユニット４４によって行われる動き補償は、動き推定ユニット４２によって判断された動きベクトルに基づいて予測ブロックをフェッチまたは生成することに関与し得る。この場合も、いくつかの例では、動き推定ユニット４２と動き補償ユニット４４とが機能的に統合され得る。現在のビデオブロックのＰＵのための動きベクトルを受信すると、動き補償ユニット４４は、参照ピクチャリストのうちの１つにおいて動きベクトルが指す予測ブロックの位置を特定し得る。加算器５０は、以下で説明するように、コーディングされている現在のビデオブロックのピクセル値から予測ブロックのピクセル値を減算し、ピクセル差分値を形成することによって、残差ビデオブロックを形成する。概して、動き推定ユニット４２はルーマ成分に対して動き推定を行い、動き補償ユニット４４は、クロマ成分とルーマ成分の両方のためにルーマ成分に基づいて計算された動きベクトルを使用する。モード選択ユニット４０はまた、ビデオスライスのビデオブロックを復号する際にビデオデコーダ３０が使用するためのビデオブロックとビデオスライスとに関連するシンタックス要素を生成し得る。

[0084] イントラ予測処理ユニット４６は、上記で説明したように、動き推定ユニット４２と動き補償ユニット４４とによって行われるインター予測の代替として、現在ブロックをイントラ予測し得る。特に、イントラ予測処理ユニット４６は、現在ブロックを符号化するために使用すべきイントラ予測モードを判断し得る。いくつかの例では、イントラ予測ユニット処理４６が、例えば、別個の符号化パス中に、様々なイントラ予測モードを使用して現在ブロックを符号化し得、イントラ予測ユニット処理４６（または、いくつかの例では、モード選択ユニット４０）が、テストされたモードから使用するのに適切なイントラ予測モードを選択し得る。

[0085] 例えば、イントラ予測処理ユニット４６は、様々なテストされたイントラ予測モードのためのレートひずみ分析を使用してレートひずみ値を計算し、テストされたモードの中で最良のレートひずみ特性を有するイントラ予測モードを選択し得る。レートひずみ分析は、概して、符号化ブロックと、符号化ブロックを生成するために符号化された元の符号化されていないブロックとの間のひずみ（または誤差）の量、ならびに符号化ブロックを生成するために使用されるビットレート（すなわち、ビット数）を判断する。イントラ予測処理ユニット４６は、どのイントラ予測モードがブロックについて最良のレートひずみ値を呈するかを判断するために、様々な符号化ブロックのひずみおよびレートから比率を計算し得る。

[0086] ブロック用のイントラ予測モードを選択した後、イントラ予測処理ユニット４６は、ブロック用に選択されたイントラ予測モードを示す情報を、エントロピーコーディングユニット５６に提供できる。エントロピーコーディングユニット５６は、選択されたイントラ予測モードを示す情報を符号化できる。ビデオエンコーダ２０は、（コードワードマッピングテーブルとも呼ばれる）複数のイントラ予測モードインデックステーブルおよび複数の修正されたイントラ予測モードインデックステーブルと、様々なブロック用の符号化コンテキストの定義と、最確イントラ予測モードの指示とを含む送信されたビットストリーム構成データの中に、コンテキストの各々について使用する、イントラ予測モードインデックステーブルと修正されたイントラ予測モードインデックステーブルとを含めることができる。

[0087] ビデオエンコーダ２０は、コーディングされている元のビデオブロックから、モード選択ユニット４０からの予測データを減算することによって、残差ビデオブロックを形成する。加算器５０は、この減算動作を行う１つまたは複数の構成要素を表す。変換処理ユニット５２は、離散コサイン変換（ＤＣＴ）または概念的に同様の変換などの変換を残差ブロックに適用し、残差変換係数値を備えるビデオブロックを生成する。変換処理ユニット５２は、ＤＣＴと概念的に同様である他の変換を行い得る。ウェーブレット変換、整数変換、サブバンド変換または他のタイプの変換も使用され得る。いずれの場合も、変換処理ユニット５２は、変換を残差ブロックに適用し、残差変換係数のブロックを生成する。変換は、残差情報をピクセル値領域から周波数領域などの変換領域に変換し得る。変換処理ユニット５２は、得られた変換係数を量子化ユニット５４に送り得る。

[0088] 量子化ユニット５４は、ビットレートをさらに低減するために変換係数を量子化する。量子化プロセスは、係数の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。いくつかの例では、量子化ユニット５４が、次いで、量子化変換係数を含む行列の走査を行い得る。代替的に、エントロピーコーディングユニット５６が走査を行い得る。

[0089] 量子化の後、エントロピーコーディングユニット５６は、量子化変換係数をエントロピーコーディングする。例えば、エントロピーコーディングユニット５６は、コンテキスト適応型可変長コーディング（ＣＡＶＬＣ）、コンテキスト適応型バイナリ算術コーディング（ＣＡＢＡＣ）、シンタックスベースコンテキスト適応型バイナリ算術コーディング（ＳＢＡＣ）、確率間隔区分エントロピー（ＰＩＰＥ）コーディングまたは別のエントロピーコーディング技法を行い得る。コンテキストベースエントロピーコーディングの場合、コンテキストは隣接ブロックに基づき得る。エントロピーコーディングユニット５６によるエントロピーコーディングの後、符号化ビットストリームは、別のデバイス（例えば、ビデオデコーダ３０）に送信されるか、または後で送信するかもしくは取り出すためにアーカイブできる。

[0090] 逆量子化ユニット５８および逆変換処理ユニット６０は、それぞれ逆量子化および逆変換を適用して、例えば参照ブロックとして後で使用するために、ピクセル領域中で残差ブロックを再構成する。動き補償ユニット４４は、残差ブロックを参照フレームメモリ６４のフレームのうちの１つの予測ブロックに加算することによって参照ブロックを計算し得る。動き補償ユニット４４はまた、再構成された残差ブロックに１つまたは複数の補間フィルタを適用して、動き推定において使用するサブ整数ピクセル値を計算し得る。加算器６２は、再構成された残差ブロックを、動き補償ユニット４４によって生成された動き補償予測ブロックに加算して、参照フレームメモリ６４に記憶するための再構成されたビデオブロックを生成する。再構成されたビデオブロックは、後続のビデオフレーム中のブロックをインターコーディングするために動き推定ユニット４２および動き補償ユニット４４によって参照ブロックとして使用され得る。

[0091] 図２のビデオエンコーダ２０は、本明細書で説明する技法のうちの１つまたは複数を実装するように構成されたビデオエンコーダの一例を表す。ビデオエンコーダ２０は、ビットストリームに関連するビデオパラメータセット（ＶＰＳ）における動作点をシグナリングする。動作点は、時間的におよび／または複数のレイヤもしくはビューに関して拡張性のある元のビットストリームから抽出され得るサブビットストリームを指す。ＨＥＶＣでは、動作点が、ＯＰＬａｙｅｒＩｄＳｅｔとして示されるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値と、ＯｐＴｉｄとして示されるＴｅｍｐｏｒａｌＩｄ値との組によって識別され得る。一例として、元のビットストリームは、異なる空間解像度の３つのレイヤまたはビューと、異なるフレームレートの２つの時間的スケーラブルレイヤとを含み得る。この例では、元のビットストリームが、いずれかのフレームレートで利用可能な３つの空間解像度の各々を有する６つの動作点を含む。

[0092] ビデオエンコーダ２０がビットストリームに関連するＶＰＳにおいてシグナリングする動作点の各々では、動作点シンタックス構造が、所与の動作点のサブビットストリームに属する、ビットストリーム内のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別するために使用されるレイヤ識別子（ＩＤ）の組を指定する。このように、所与の動作点のサブビットストリームを構成するＮＡＬユニットは、ＮＡＬユニットのレイヤ識別子に基づいて元のビットストリームから抽出され得る。

[0093] いくつかの場合には、ビデオエンコーダ２０は、動作点のうちの１つまたは複数に関連する仮想参照デコーダ(ＨＲＤ)パラメータをさらに符号化できる。この場合、ビデオエンコーダ２０は、ＶＰＳにおけるＨＲＤパラメータ情報をシグナリングする。ＨＲＤパラメータを有する１つまたは複数の動作点の各々では、ＨＲＤパラメータシンタックス構造が、所与の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義するＨＲＤパラメータの組を指定する。

[0094] 従来、ビデオコーディング規格は、ビットストリームがＶＰＳにおける動作点に関してシグナリングされるべきレイヤ識別子の複製した組を含むことを可能にする。このことは、２つ以上の動作点が、レイヤ識別子の同じ組を有し、従って、動作点のサブビットストリームを構成するための同じＮＡＬユニットを識別できることを意味する。このように、複数の動作点は、ビットストリームの同じコンテンツを指す可能性がある。同様に、ビデオコーディング規格は、ビットストリームがＶＰＳにおける動作点に関してシグナリングされるべきＨＲＤパラメータの複製した組を含むことを可能にする。このことは、ＨＲＤパラメータの２つ以上の組が、同じコンテンツを有し、従って、関連する動作点のサブビットストリームの準拠をチェックするために２つの同一のＨＲＤを定義できることを意味する。どちらの場合も、シグナリングは、冗長性があり、ビットの非効率な使用法である。

[0095] 本開示の技法は、準拠するビットストリーム内のＶＰＳにおける動作点または動作点に関連するＨＲＤパラメータのいずれかに関する複製コンテンツのシグナリングを拒否することによって動作点に関連するシグナリング情報の効率の改善を提供する。本開示の技法によれば、ビデオエンコーダ２０は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化し得る。ビデオエンコーダ２０は、存在する場合、第１の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素も符号化し得る。準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、ビデオエンコーダ２０は、準拠するビットストリームのみを符号化するように構成される。上述のように、コンテンツの第１の組は、第１の動作点に関するレイヤ識別子の組を備えることができ、コンテンツの第２の組は、第１の動作点に関するＨＲＤパラメータの組を備えることができる。

[0096] 一例では、ビデオエンコーダ２０が、レイヤ識別子の第１の組を有する第１の動作点を示すビットストリーム内のＶＰＳにおけるシンタックス要素を符号化した後、ビデオエンコーダ２０が、第２の動作点に関するレイヤ識別子の第１の組を複製する、ＶＰＳにおけるシンタックス要素を符号化しないように、準拠するビットストリームのみを符号化する。本開示の技法は、準拠するビットストリーム内の同じＶＰＳにおける動作点に関するレイヤ識別子の複製した組を拒否する。レイヤ識別子の第１の組は、ＶＰＳにおける第１の動作点に対して一意でなければならないか、または、ビットストリームは、非準拠である。すなわち、例えば、非準拠ビットストリームは、第１の動作点に関するレイヤ識別子の第１の組と、さらに第２の動作点に関するレイヤ識別子の第２の組とを含むことができ、第２の組は、第１の組と同じレイヤ識別子を含む。従って、ビデオエンコーダ２０は、第１の動作点および第２の動作点に関するレイヤ識別子の組を複製する、準拠するビットストリームのＶＰＳにおけるシンタックス要素を符号化すべきでない。

[0097] 別の例では、第１の動作点に関して、ＨＲＤパラメータが存在する可能性がある。この場合、第１の動作点に関するＨＲＤパラメータの第１の組を有するＨＲＤパラメータ情報を示す、ビットストリーム内のＶＰＳにおけるシンタックス要素を符号化した後、ビデオエンコーダ２０は、第２の動作点に関するＨＲＤパラメータの第１の組を複製する、ＶＰＳにおけるシンタックス要素を符号化しない。本開示の技法は、準拠するビットストリーム内の同じＶＰＳにおける動作点に関するＨＲＤパラメータの複製した組を拒否する。ＨＲＤパラメータの第１の組は、ＶＰＳにおける第１の動作点に対して一意でなければならないか、または、ビットストリームは、非準拠である。従って、ビデオエンコーダ２０は、第１の動作点および第２の動作点に関するＨＲＤパラメータの組を複製する、準拠するビットストリームのＶＰＳにおけるシンタックス要素を符号化すべきでない。

[0098] 別の例では、ビデオエンコーダ２０は、簡単な動作点モードがビットストリームの複数の動作点の各々に関して使用されるかどうかを示し、簡単な動作点モードが動作点のうちの特定の１つに関して使用されるとき、特定の動作点に関する１つのターゲットレイヤ識別子のみを符号化できる。簡単な動作点モードは、各動作点に関して、ＯｐＬａｙｅｒＩｄＳｅｔが、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの特定の値、およびｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの特定の値未満のｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの他のすべての値を含むモードであり、それらの値のみを含む。いくつかの例では、ビデオエンコーダ２０が、シグナリングされるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ（すなわち、レイヤＩＤ）の複数の値を符号化するとき、ビデオエンコーダ２０は、それらの値を差分的に符号化する。このように、動作点のシグナリングは、線形レイヤ依存性により、任意のスケーラビリティコーディング、マルチビューおよび／または３ＤＶコーディングシナリオには、より効率的である。上述のように、ビデオエンコーダ２０は、１つのＶＰＳ内のレイヤＩＤの複製した組を符号化しない。

[0099] 別の例として、ビデオエンコーダ２０は、ビットストリームに関するプロファイル空間、ティア、互換性のあるプロファイル、および／またはプロファイル関連の制約条件を符号化できるが、ビットストリームの時間的サブレイヤに関する、別のプロファイル空間、ティア、互換性のあるプロファイル、またはプロファイル関連の制約条件を符号化することができない。上述のように、ビデオエンコーダ２０は、ビットストリームに関するＨＲＤパラメータを符号化することができ、ＨＲＤパラメータシンタックス構造の各コピーは、異なるコンテンツを含む。

[0100] ビデオエンコーダ２０は、以下のシンタックスおよびセマンティクスを利用し得る。例示的なビデオパラメータセットローバイトシーケンスペイロード（ＲＢＳＰ）が次のように表１に定義される。

[0101] １に等しいフラグｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］は、簡単な動作点モードがｉ番目のｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ＿ｌａｙｅｒ＿ｉｄｓ（）シンタックス構造のために使用されることを指定する。ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］が０に等しいとき、このフラグは、簡単な動作点モードがｉ番目のｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造のために使用されないことを指定する。

[0102] ｉがｊに等しくない場合、シンタックス構造ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（ｉ、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）およびｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（ｊ、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）の任意の２つの例は、同じコンテンツを有するべきでない。このように、ビデオエンコーダ２０は、一意のＨＲＤパラメータのみを含むシンタックス構造を符号化する。

[0103] 表２は、例示的なプロファイル、ティア、ならびにレベルシンタックスおよびセマンティクスを提供する。

[0104] １に等しいフラグｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ＰｒｏｆｉｌｅＰｒｅｓｅｎｔＦｌａｇが１に等しいとき、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造中にプロファイル情報が存在することを指定する。０に等しいフラグｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造中にプロファイル情報が存在しないことを指定する。存在しないとき、ｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］の値は、０に等しいと推測される。

[0105]１に等しいフラグｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造中にレベル情報が存在することを指定する。０に等しいフラグｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造中にレベル情報が存在しないことを指定する。

[0106] シンタックス要素ｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］およびｓｕｂ＿ｌａｙｅｒ＿ｌｅｖｅｌ＿ｉｄｃ［ｉ］は、それぞれｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃおよびｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃと同じセマンティクスを有するが、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現に適用する。

[0107]例えば、ビデオエンコーダ２０は、ｉに等しいＴｅｍｐｏｒａｌＩｄを有するサブレイヤの表現のためのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造中にプロファイル情報が存在することを示すために、１に等しいｓｕｂ＿ｌａｙｅｒ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］を符号化し得る。ビデオエンコーダ２０は、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造中の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のシグナリングに関するシンタックス要素をシグナリングしない可能性がある。

[0108] 表３は、例示的な動作点シンタックスおよびセマンティクスを提供する。

[0109] ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0110] シンタックス要素ｏｐ＿ｆｉｒｓｔ＿ｐｒｅｓｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの第１の（すなわち、０番目の）値を指定する。ｏｐ＿ｆｉｒｓｔ＿ｐｒｅｓｅｎｔ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が１に等しいとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの最大値を指定する。

[0111] シンタックス要素ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］ｐｌｕｓ１は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の数を指定する。ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］の値は、６３以下であるべきである。

[0112] ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｄｅｌｔａ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］［ｉ］ｐｌｕｓ１は、ｖｐｓ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｏｐＩｄｘ］が０に等しいとき、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓのｉ番目の値と、ビデオパラメータセットにおけるｏｐＩｄｘ^th ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの（ｉ−１）番目の値との間の差を指定する。ｏｐ＿ｌａｙｅｒ＿ｉｄ＿ｄｅｌｔａ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］［ｉ］の値は、両端値を含む０〜６３の範囲内であるべきである。

[0113] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］は、次のように導出される。

ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［０］は、０に等しいと推測される。

[0114] 変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

ＯｐＬａｙｅｒＩｄ［０］［０］の値は、０に等しいと推測される。

[0115] ｉがｊに等しくなく、ｉとｊの両方が両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内であるとき、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］の値は、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｊ］に等しくなるべきでない。

[0116] 任意の２セットＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］およびＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］は、ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含むべきでない。

[0117] ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含むように設定され、それらの値のみを含む。

[0118] このように、ビデオエンコーダ２０は、本明細書で説明する技法を使用して、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化し得る。準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、ビデオデコーダは、準拠するビットストリームのみを復号するように構成される。例えば、ビデオエンコーダ２０は、第２の動作点のコンテンツの第１の組を複製する、ＶＰＳにおけるシンタックス要素をビデオエンコーダ２０が含まないように準拠するビットストリームを符号化し、コンテンツの第１の組は、ＶＰＳにおける第１の動作点に対して一意である。

[0119] 表４は、代替の例示的な動作点シンタックスおよびセマンティクスを提供する。

[0120] ｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（ｏｐＩｄｘ）シンタックス構造は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の組を指定する。

[0121] シンタックス要素ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］ｐｌｕｓ１は、ビデオパラメータセットにおけるｏｐＩｄｘ−ｔｈｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の数を指定する。ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］の値は、６３以下であるべきである。存在しないとき、ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］の値は、０に等しいと推測される。

[0122] 本明細書で説明する技法に準拠するビットストリームにおいて、ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］は、０に等しくなるべきである。いくつかの例では、ｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］の値が０に等しいことを必要とするが、ビデオデコーダ３０などのビデオデコーダは、他の値がｏｐ＿ｎｕｍ＿ｌａｙｅｒ＿ｉｄ＿ｖａｌｕｅｓ＿ｍｉｎｕｓ１［ｏｐＩｄｘ］シンタックスに現れることを可能にすべきである。

[0123] シンタックス要素ｏｐ＿ｌａｙｅｒ＿ｉｄ［ｏｐＩｄｘ］［ｉ］は、ビデオパラメータセットにおけるｏｐＩｄｘ^th ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔに含まれるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓのｉ番目の値を指定する。

[0124] 変数ＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］は、次のように導出される。

[0125] 変数ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］は、ｉが両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内である場合、次のように導出される。

[0126] ｉがｊに等しくなく、ｉとｊの両方が両端値を含む０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内であるとき、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］の値は、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｊ］に等しくなるべきでない。

[0127] 任意の２セットＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ１］およびＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ２］は、ｏｐＩｄｘ１がｏｐＩｄｘ２に等しくない場合、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値の同じ組を含むべきでない。

[0128] ビデオパラメータセットにおけるｏｐＩｄｘ^th ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造が適用される動作点のＯｐＬａｙｅｒＩｄＳｅｔは、ｉが０からＮｕｍＯｐＬａｙｅｒＩｄｓＭｉｎｕｓ１［ｏｐＩｄｘ］までの範囲内の場合、ＯｐＬａｙｅｒＩｄ［ｏｐＩｄｘ］［ｉ］に等しいｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ値を含むように設定され、それらの値のみを含む。

[0129] このように、本明細書で説明する技法によれば、ビデオエンコーダ２０は、ビットストリームの複数の動作点の各々に関して簡単な動作点モードが使用されるかどうかを示すことができる。動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、ビデオエンコーダ２０は、特定の動作点に関する１つのターゲットレイヤ識別子のみを符号化し得る。別の例として、ビデオエンコーダ２０は、ビットストリームに関するプロファイル空間、ティア、互換性のあるプロファイル、および／またはプロファイル関連の制約条件を符号化できるが、ビットストリームの時間的サブレイヤに関する、別のプロファイル空間、ティア、互換性のあるプロファイル、またはプロファイル関連の制約条件を符号化することができない。さらなる例として、ビデオエンコーダ２０は、ビットストリームに関するＨＲＤパラメータを符号化することができ、ＨＲＤパラメータシンタックス構造の各コピーは、異なるコンテンツを含む。

[0130] 図３は、本開示で説明する技法を実装し得るビデオデコーダ３０の一例を示すブロック図である。図３の例では、ビデオデコーダ３０が、エントロピー復号ユニット７０と、動き補償ユニット７２と、イントラ予測処理ユニット７４と、逆量子化ユニット７６と、逆変換処理ユニット７８と、参照フレームメモリ８２と、加算器８０とを含む。ビデオデコーダ３０は、いくつかの例では、図２に示すように、ビデオエンコーダ２０に関して説明した符号化パスとは概して逆の復号パスを行い得る。

[0131] 復号プロセス中に、ビデオデコーダ３０は、ビデオエンコーダ２０から、符号化ビデオスライスのビデオブロックと、関連するシンタックス要素とを表す符号化ビデオビットストリームを受信する。ビデオデコーダ３０は、ネットワークエンティティ２９から符号化ビデオビットストリームを受信できる。ネットワークエンティティ２９は、例えば、サーバ、メディアアウェアネットワーク要素（ＭＡＮＥ）、ビデオエディタ／スプライサ、または上述した技法のうちの１つもしくは複数を実装するように構成された他のそのようなデバイスであり得る。ネットワークエンティティ２９は、本開示の技法を行うように構成された外部手段を含み得る。上述のように、本開示で説明する技法のいくつかは、ネットワークエンティティ２９が符号化ビデオビットストリームをビデオデコーダ３０に送信する前にネットワークエンティティ２９によって実装され得る。いくつかのビデオ復号システムでは、ネットワークエンティティ２９およびビデオデコーダ３０が別個のデバイスの一部であり得るが、他の事例では、ネットワークエンティティ２９に関して説明する機能が、ビデオデコーダ３０を備える同じデバイスによって行われ得る。

[0132] ビデオデコーダ３０のエントロピー復号ユニット７０は、量子化係数、動きベクトルまたはイントラ予測モードインジケータ、および他のシンタックス要素を生成するためにビットストリームをエントロピー復号する。エントロピー復号ユニット７０は、動きベクトルと他の予測シンタックス要素とを動き補償ユニット７２に転送する。ビデオデコーダ３０は、ビデオスライスレベルおよび／またはビデオブロックレベルでシンタックス要素を受信し得る。

[0133] ビデオスライスがイントラコード化（Ｉ）スライスとしてコーディングされるとき、イントラ予測処理ユニット７４は、シグナリングされたイントラ予測モードと、現在フレームまたはピクチャの、前に復号されたブロックからのデータとに基づいて、現在ビデオスライスのビデオブロックのための予測データを生成し得る。ビデオフレームがインターコーディングされた（すなわち、Ｂ、ＰまたはＧＰＢ）スライスとしてコーディングされるとき、動き補償ユニット７２は、エントロピー復号ユニット７０から受信された動きベクトルと他のシンタックス要素とに基づいて、現在のビデオスライスのビデオブロックのための予測ブロックを生成する。予測ブロックは、参照ピクチャリストの１つの中の参照ピクチャの１つから生成され得る。ビデオデコーダ３０は、参照フレームメモリ８２に記憶された参照ピクチャに基づいて、デフォルトの構成技法を使用して、参照フレームリスト、すなわち、リスト０およびリスト１を構成し得る。

[0134] 動き補償ユニット７２は、動きベクトルと他のシンタックス要素とを解析することによって現在ビデオスライスのビデオブロックについての予測情報を判断し、予測情報を使用して、復号されている現在ビデオブロックのための予測ブロックを生成する。例えば、動き補償ユニット７２は、ビデオスライスのビデオブロックをコーディングするために使用される予測モード（例えば、イントラまたはインター予測）と、インター予測スライスタイプ（例えば、ＢスライスまたはＰスライス）と、スライスの参照ピクチャリストのうちの１つまたは複数についての構成情報と、スライスの各インター符号化ビデオブロックについての動きベクトルと、スライスの各インターコーディングビデオブロックについてのインター予測ステータスと、現在ビデオスライス中のビデオブロックを復号するための他の情報とを判断するために、受信されたシンタックス要素のいくつかを使用する。

[0135] 動き補償ユニット７２はまた、補間フィルタに基づいて補間を行い得る。動き補償ユニット７２は、ビデオブロックの符号化中にビデオエンコーダ２０によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルの補間値を計算し得る。この場合、動き補償ユニット７２は、受信されたシンタックス要素からビデオエンコーダ２０によって使用された補間フィルタを判断し、その補間フィルタを使用して予測ブロックを生成し得る。

[0136] 逆量子化ユニット７６は、ビットストリーム中で与えられ、エントロピー復号ユニット７０によって復号された量子化変換係数を逆量子化（inverse quantize）、すなわち、逆量子化（de-quantize）する。逆量子化プロセスは、ビデオスライス中の各ビデオブロックについてビデオデコーダ３０によって計算される量子化パラメータＱＰ_Yを使用して量子化の程度を判断し、同様に、適用すべき逆量子化の程度を判断することを含み得る。逆変換処理ユニット７８は、逆変換、例えば、逆ＤＣＴ、逆整数変換、または概念的に同様の逆変換処理を変換係数に適用して、ピクセル領域において残差ブロックを生成する。

[0137] 動き補償ユニット７２が、動きベクトルと他のシンタックス要素とに基づいて現在ビデオブロックのための予測ブロックを生成した後、ビデオデコーダ３０は、逆変換処理ユニット７８からの残差ブロックを動き補償ユニット７２によって生成された対応する予測ブロックと加算することによって、復号されたビデオブロックを形成する。加算器９０は、この加算動作を行う１つまたは複数の構成要素を表す。所望される場合、ブロッキネスアーティファクトを除去するために、復号ブロックをフィルタ処理するためにデブロッキングフィルタも適用され得る。ピクセル遷移を平滑化するか、またはさもなければビデオ品質を改善するために、（コーディングループ内またはコーディングループ後の）他のループフィルタも使用され得る。所与のフレームまたはピクチャの復号されたビデオブロックは、次いで、その後の動き補償のために使用される参照ピクチャを記憶する参照フレームメモリ８２に記憶される。参照フレームメモリ８２はまた、図１のディスプレイデバイス３２などのディスプレイデバイス上での後の表示のために、復号されたビデオを記憶する。

[0138] 図３のビデオデコーダ３０は、本明細書で説明する技法のうちの１つまたは複数を実装するように構成されたビデオデコーダの一例を表す。本開示の技法は、準拠するビットストリーム内のＶＰＳにおける動作点または動作点に関連するＨＲＤパラメータのいずれかに関する複製コンテンツのシグナリングを拒否することによって動作点に関連するシグナリング情報の効率の改善を提供する。本開示の技法によれば、ビデオデコーダ３０は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号し得る。加えて、ビデオデコーダ３０は、存在する場合、第１の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号し得る。準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まず、ビデオデコーダ３０は、準拠するビットストリームのみを復号するように構成される。上述のように、コンテンツの第１の組は、第１の動作点に関するレイヤ識別子の組を備えることができ、コンテンツの第２の組は、第１の動作点に関するＨＲＤパラメータの組を備えることができる。

[0139] 一例で、レイヤ識別子の第１の組を有する第１の動作点を示すビットストリーム内のＶＰＳにおけるシンタックス要素を復号した後、ビデオデコーダ３０は、ビットストリームが、第２の動作点に関するレイヤ識別子の第１の組を複製する、ＶＰＳにおけるシンタックス要素を含まない準拠するビットストリームである場合、復号し続けるだけである。本開示の技法は、準拠するビットストリーム内の同じＶＰＳにおける動作点に関するレイヤ識別子の複製した組を拒否する。レイヤ識別子の第１の組は、ＶＰＳにおける第１の動作点に対して一意でなければならないか、または、ビットストリームは、非準拠である。ビデオデコーダ３０は、第１の動作点および第２の動作点に関するレイヤ識別子の複製した組を含まない準拠するビットストリームのＶＰＳにおけるシンタックス要素を復号するだけである。ビデオデコーダ３０が非準拠ビットストリームを受信する場合、ビデオデコーダ３０は誤り状態に入り、ビットストリーム全体を破棄する可能性がある。

[0140] 別の例では、第１の動作点に関して、ＨＲＤパラメータが存在する可能性がある。この場合、第１の動作点に関するＨＲＤパラメータの第１の組を有するＨＲＤパラメータ情報を示す、ビットストリーム内のＶＰＳにおけるシンタックス要素をコーディングした後、ビデオデコーダ３０は、ビットストリームが、第２の動作点に関するＨＲＤパラメータの第１の組を複製する、ＶＰＳにおけるシンタックス要素を含まない準拠するビットストリームである場合、復号し続けるだけである。本開示の技法は、準拠するビットストリーム内の同じＶＰＳにおける動作点に関するＨＲＤパラメータの複製した組を拒否する。ＨＲＤパラメータの第１の組は、ＶＰＳにおける第１の動作点に対して一意でなければならないか、または、ビットストリームは、非準拠である。ビデオデコーダ３０は、第１の動作点および第２の動作点に関するＨＲＤパラメータの複製した組を含まない準拠するビットストリームのＶＰＳにおけるシンタックス要素を復号するだけである。ビデオデコーダ３０が非準拠ビットストリームを受信する場合、ビデオデコーダ３０は誤り状態に入り、ビットストリーム全体を破棄する可能性がある。

[0141] 別の例として、ビデオデコーダ３０は、ビットストリームの複数の動作点の各々に関して簡単な動作点モードが使用されるかどうかの指示を受信し得る。動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、ビデオデコーダ３０は、特定の動作点に関する１つのターゲットレイヤ識別子のみを復号し得る。別の例として、ビデオデコーダ３０は、ビットストリームに関するプロファイル空間、ティア、互換性のあるプロファイル、および／またはプロファイル関連の制約条件を復号できるが、ビットストリームの時間的サブレイヤに関する、別のプロファイル空間、ティア、互換性のあるプロファイル、またはプロファイル関連の制約条件を復号することができない。上述のように、ビデオデコーダ３０は、ビットストリームに関するＨＲＤパラメータを復号することができ、ＨＲＤパラメータシンタックス構造の各コピーは、異なるコンテンツを含む。

[0142] 図４は、ネットワーク１００の一部を形成するデバイスの例示的な組を示すブロック図である。この例では、ネットワーク１００が、ルーティングデバイス１０４Ａ、１０４Ｂ（ルーティングデバイス１０４）とトランスコーディングデバイス１０６とを含む。ルーティングデバイス１０４およびトランスコーディングデバイス１０６は、ネットワーク１００の一部を形成し得る少数のデバイスを表すことが意図される。スイッチ、ハブ、ゲートウェイ、ファイアウォール、ブリッジ、および他のそのようなデバイスなどの他のネットワークデバイスも、ネットワーク１００内に含まれ得る。さらに、サーバデバイス１０２とクライアントデバイス１０８との間にネットワーク経路に沿って追加のネットワークデバイスが提供され得る。いくつかの例では、サーバデバイス１０２がソースデバイス１２（図１）に対応し得るが、クライアントデバイス１０８は宛先デバイス１４（図１）に対応し得る。

[0143] 一般に、ルーティングデバイス１０４は、ネットワーク１００を介してネットワークデータを交換するための１つまたは複数のルーティングプロトコルを実装する。いくつかの例では、ルーティングデバイス１０４が、プロキシまたはキャッシュ動作を行うように構成され得る。従って、一部の例では、ルーティングデバイス１０４がプロキシデバイスと呼ばれ得る。概して、ルーティングデバイス１０４は、ネットワーク１００を介したルートを発見するためにルーティングプロトコルを実行する。そのようなルーティングプロトコルを実行することによって、ルーティングデバイス１０４Ｂは、それ自体からルーティングデバイス１０４Ａを介してサーバデバイス１０２へ至るネットワークルートを発見できる。

[0144] 本開示の技法は、ルーティングデバイス１０４およびトランスコーディングデバイス１０６などのネットワークデバイスによって実装され得るが、クライアントデバイス１０８によっても実装され得る。このように、ルーティングデバイス１０４、トランスコーディングデバイス１０６、およびクライアントデバイス１０８は、本開示の特許請求の範囲の部分に記載される技法を含めて、本開示の技法を行うように構成されたデバイスの例を表す。さらに、図１のデバイス、ならびに図２に示したエンコーダおよび図３に示したデコーダも、本開示の特許請求の範囲の部分に記載される技法を含めて、本開示の技法を行うように構成され得る例示的なデバイスである。

[0145] 本開示で説明するように、「ビデオコーダ」は、概して、ビデオ符号化デバイスとビデオ復号デバイスの両方を指すのに使用され得る。加えて、「ビデオコーディング」は、ビデオ符号化またはビデオ復号を指す可能性がある。

[0146] 図５は、本開示で説明する技法による、ビデオデータを復号する例示的な方法２００を示すフローチャートである。方法２００は、例えば、図１または図３のビデオデコーダ３０などの、ビデオデータを処理するように構成された任意のデバイス、システム、または装置によって行われ得る。

[0147] 方法２００は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素を復号すること（２０２）を含む。例えば、ビデオデコーダ３０は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号し得る。いくつかの例では、第１の動作点を示すシンタックス要素が、準拠するビットストリーム内のＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を有する。

[0148] 方法２００は、第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号すること（２０４）をさらに含む。本開示の技法によれば、準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない。例えば、ビデオデコーダ３０は、存在する場合、第１の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を復号する。ビデオデコーダ３０は、準拠するビットストリームのみを復号するように構成され、準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない。いくつかの例では、ＨＲＤパラメータ情報を示すシンタックス要素が、準拠するビットストリーム内のＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を有する。いくつかの例では、シンタックス要素を復号することが、準拠するビットストリーム内のみの第１の動作点およびＨＲＤパラメータ情報を示すシンタックス要素を復号することを含む。

[0149] 方法２００は、復号シンタックス要素に基づいて準拠するビットストリーム内のビデオデータを復号すること（２０６）をさらに含む。例えば、ビデオデコーダ３０は、コンテンツの第１の組を有する第１の動作点を示すシンタックス要素に少なくとも部分的に基づいて準拠するビットストリーム内のビデオデータを復号する。ビデオデコーダ３０は、存在する場合、第１の動作点のコンテンツの第２の組を有するＨＤＲパラメータ情報を示すシンタックス要素に少なくとも部分的に基づいて準拠するビットストリーム内のビデオデータをさらに復号する。

[0150] いくつかの例では、コンテンツの第１の組が、第１の動作点のサブビットストリームに属する準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、第１の動作点に関するレイヤ識別子の組を備える。いくつかの例では、コンテンツの第２の組が、第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、第１の動作点に関するＨＲＤパラメータの組を備える。他の例では、準拠するビットストリームが、第２の動作点のコンテンツの第１の組を複製する、ＶＰＳにおけるシンタックス要素を含まず、コンテンツの第１の組が、ＶＰＳにおける第１の動作点に対して一意である。さらなる例では、準拠するビットストリームが、第２の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を複製する、ＶＰＳにおけるシンタックス要素を含まず、コンテンツの第２の組は、ＶＰＳにおける第１の動作点に対して一意である。

[0151] いくつかの例では、第１の動作点に関するレイヤ識別子の組が２つ以上のレイヤ識別子を含むとき、方法２００が、２つ以上のレイヤ識別子を差分的に復号することをさらに備える。すなわち、ビデオデコーダ３０は、第１の動作点に関するレイヤ識別子の組が２つ以上のレイヤ識別子を含むとき、２つ以上のレイヤ識別子を差分的に復号する。

[0152] 別の例では、方法２００が、第１および第２の動作点に関して簡単な動作点モードが使用されるかどうかを示す準拠するビットストリーム内の１つまたは複数のシンタックス要素を復号することを含み得る。第１および第２の動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、方法２００は、特定の動作点に関するターゲットレイヤ識別子のみを復号することを含み得る。一例では、ビデオデコーダ３０が、第１および第２の動作点に関して簡単な動作点モードが使用されるかどうかを示す準拠するビットストリーム内の１つまたは複数のシンタックス要素を復号する。第１および第２の動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、ビデオデコーダ３０は、特定の動作点に関するターゲットレイヤ識別子のみを復号する。いくつかの例では、特定の動作点が、ターゲットレイヤ識別子と、準拠するビットストリームの時間的サブレイヤを示す時間的識別子とによって識別される。

[0153] 方法２００は、第１の動作点に関して簡単な動作点モードが使用されない指示に基づいて、第１の動作点に関するレイヤ識別子の組の各レイヤ識別子を明示的に復号することをさらに含み得る。例えば、ビデオデコーダ３０は、第１の動作点に関して簡単な動作点モードが使用されない指示に基づいて第１の動作点に関するレイヤ識別子の組のレイヤ識別子を復号する。方法２００は、動作点のうちの特定の１つに関して簡単な動作点モードが使用されないとき、特定の動作点に関する複数のターゲットレイヤ識別子を差分的に復号することをさらに含み得る。例えば、ビデオデコーダ３０は、動作点のうちの特定の１つに関して簡単な動作点モードが使用されないとき（例えば、ｖｓｐ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］がＶＰＳ内に存在しないか、またはゼロに等しいとき）、特定の動作点に関する複数のターゲットレイヤ識別子を差分的に復号する。

[0154] いくつかの例では、方法２００が、準拠するビットストリームの復号ビデオシーケンス全体、プロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を復号することをさらに含み、準拠するビットストリームは、復号ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない。例えば、ビデオデコーダ３０は、準拠するビットストリームの復号ビデオシーケンス全体、プロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を復号する。準拠するビットストリームは、復号ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない。

[0155] シンタックス要素は、時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数が、準拠するビットストリーム内のＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造から除去されることを示し得る。いくつかの例では、方法２００が、準拠するビットストリームの時間的サブレイヤの各々に関してプロファイル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を復号することをさらに含む。時間的サブレイヤのうちの特定の１つに関してプロファイル情報が存在するとき、方法２００は、特定の時間的サブレイヤに関するプロファイル情報を復号することをさらに含み得る。例えば、ビデオデコーダ３０は、準拠するビットストリームの時間的サブレイヤの各々に関してプロファイル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を復号し、時間的サブレイヤのうちの特定の１つに関してプロファイル情報が存在するとき、ビデオデコーダ３０は、特定の時間的サブレイヤに関するプロファイル情報を復号する。

[0156] 同様に、方法２００は、ビットストリームの時間的サブレイヤの各々に関してレベル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を復号することをさらに含む。時間的サブレイヤのうちの特定の１つに関してレベル情報が存在するとき、方法２００は、特定の時間的サブレイヤに関するレベル情報を復号することをさらに含む。例えば、ビデオデコーダ３０は、ビットストリームの時間的サブレイヤの各々に関してレベル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を復号し、時間的サブレイヤのうちの特定の１つに関してレベル情報が存在するとき、ビデオデコーダ３０は、特定の時間的サブレイヤに関するレベル情報を復号する。いくつかの例では、準拠するビットストリームの時間的サブレイヤが時間的識別子によって識別される。

[0157] 図６は、本開示で説明する技法による、ビデオデータを符号化する例示的な方法３００を示すフローチャートである。方法３００は、例えば、図１および図２のビデオエンコーダ２０などの、ビデオデータを処理するように構成された任意のデバイス、システム、または装置によって行われ得る。

[0158] 方法３００は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素を符号化すること（３０２）を含む。例えば、ビデオエンコーダ２０は、コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化し得る。いくつかの例では、第１の動作点を示すシンタックス要素が、準拠するビットストリーム内のＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を有する。

[0159] 方法３００は、第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化すること（２０４）をさらに含む。本開示の技法によれば、準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない。例えば、ビデオエンコーダ２０は、存在する場合、第１の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を示す、準拠するビットストリーム内のＶＰＳにおけるシンタックス要素を符号化する。ビデオエンコーダ２０は、準拠するビットストリームのみを符号化するように構成され、準拠するビットストリームは、第２の動作点のコンテンツの第１または第２の組のうちの少なくとも１つを複製する、ＶＰＳにおけるシンタックス要素を含まない。いくつかの例では、ＨＲＤパラメータ情報を示すシンタックス要素が、準拠するビットストリーム内のＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を有する。

[0160] 方法３００は、符号化シンタックス要素に基づいて準拠するビットストリーム内のビデオデータを符号化すること（３０６）をさらに含む。例えば、ビデオエンコーダ２０は、コンテンツの第１の組を有する第１の動作点を示すシンタックス要素に少なくとも部分的に基づいて準拠するビットストリーム内のビデオデータを符号化する。ビデオエンコーダ２０は、第１の動作点のコンテンツの第２の組を有するＨＤＲパラメータ情報を示すシンタックス要素に少なくとも部分的に基づいて準拠するビットストリーム内のビデオデータをさらに符号化する。

[0161] いくつかの例では、コンテンツの第１の組が、第１の動作点のサブビットストリームに属する準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、第１の動作点に関するレイヤ識別子の組を備える。いくつかの例では、コンテンツの第２の組が、第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、第１の動作点に関するＨＲＤパラメータの組を備える。他の例では、準拠するビットストリームが、第２の動作点のコンテンツの第１の組を複製する、ＶＰＳにおけるシンタックス要素を含まず、コンテンツの第１の組は、ＶＰＳにおける第１の動作点に対して一意である。さらなる例では、準拠するビットストリームが、第２の動作点のコンテンツの第２の組を有するＨＲＤパラメータ情報を複製する、ＶＰＳにおけるシンタックス要素を含まず、コンテンツの第２の組は、ＶＰＳにおける第１の動作点に対して一意である。

[0162] いくつかの例では、第１の動作点に関するレイヤ識別子の組が２つ以上のレイヤ識別子を含むとき、方法３００が、２つ以上のレイヤ識別子を差分的に符号化することをさらに備える。すなわち、ビデオエンコーダ２０は、第１の動作点に関するレイヤ識別子の組が２つ以上のレイヤ識別子を含むとき、２つ以上のレイヤ識別子を差分的に符号化する。

[0163] 別の例では、方法３００が、第１および第２の動作点に関して簡単な動作点モードが使用されるかどうかを示す準拠するビットストリーム内の１つまたは複数のシンタックス要素を符号化することを含み得る。第１および第２の動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、方法３００は、特定の動作点に関するターゲットレイヤ識別子のみを符号化することを含み得る。一例では、ビデオエンコーダ２０が、第１および第２の動作点に関して簡単な動作点モードが使用されるかどうかを示す準拠するビットストリーム内の１つまたは複数のシンタックス要素を符号化する。第１および第２の動作点のうちの特定の１つに関して簡単な動作点モードが使用されるとき、ビデオエンコーダ２０は、特定の動作点に関するターゲットレイヤ識別子のみを符号化する。いくつかの例では、特定の動作点が、ターゲットレイヤ識別子と、準拠するビットストリームの時間的サブレイヤを示す時間的識別子とによって識別される。

[0164] 方法３００は、第１の動作点に関して簡単な動作点モードが使用されない指示に基づいて、第１の動作点に関するレイヤ識別子の組の各レイヤ識別子を明示的に符号化することをさらに含み得る。例えば、ビデオエンコーダ２０は、第１の動作点に関して簡単な動作点モードが使用されない指示に基づいて第１の動作点に関するレイヤ識別子の組のレイヤ識別子を符号化する。方法３００は、動作点のうちの特定の１つに関して簡単な動作点モードが使用されないとき、特定の動作点に関する複数のターゲットレイヤ識別子を差分的に符号化することをさらに含み得る。例えば、ビデオエンコーダ２０は、動作点のうちの特定の１つに関して簡単な動作点モードが使用されないとき（例えば、ｖｓｐ＿ｓｉｍｐｌｅ＿ｏｐ＿ｍｏｄｅ＿ｆｌａｇ［ｉ］がＶＰＳ内に存在しないか、またはゼロに等しいとき）、特定の動作点に関する複数のターゲットレイヤ識別子を差分的に符号化する。

[0165] いくつかの例では、方法３００が、準拠するビットストリームの符号化ビデオシーケンス全体、プロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を符号化することをさらに含み、準拠するビットストリームは、符号化ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない。例えば、ビデオエンコーダ２０は、準拠するビットストリームの符号化ビデオシーケンス全体、プロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を符号化する。準拠するビットストリームは、復号ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない。

[0166] シンタックス要素は、時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数が、準拠するビットストリーム内のＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造から除去されることを示し得る。いくつかの例では、方法３００が、準拠するビットストリームの時間的サブレイヤの各々に関してプロファイル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を符号化することをさらに含む。時間的サブレイヤのうちの特定の１つに関してプロファイル情報が存在するとき、方法３００は、特定の時間的サブレイヤに関するプロファイル情報を符号化することをさらに含み得る。例えば、ビデオエンコーダ２０は、準拠するビットストリームの時間的サブレイヤの各々に関してプロファイル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を符号化し、時間的サブレイヤのうちの特定の１つに関してプロファイル情報が存在するとき、ビデオエンコーダ２０は、特定の時間的サブレイヤに関するプロファイル情報を符号化する。

[0167] 同様に、方法３００は、ビットストリームの時間的サブレイヤの各々に関してレベル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を符号化することをさらに含む。時間的サブレイヤのうちの特定の１つに関してレベル情報が存在するとき、方法３００は、特定の時間的サブレイヤに関するレベル情報を符号化することをさらに含む。例えば、ビデオエンコーダ２０は、ビットストリームの時間的サブレイヤの各々に関してレベル情報が存在するかどうかを示す１つまたは複数のシンタックス要素を符号化し、時間的サブレイヤのうちの特定の１つに関してレベル情報が存在するとき、ビデオエンコーダ２０は、特定の時間的サブレイヤに関するレベル情報を符号化する。いくつかの例では、準拠するビットストリームの時間的サブレイヤが、時間的識別子によって識別される。

[0168] 例によっては、本明細書で説明された技法のうちいずれかの、いくつかの行為またはイベントは、異なる順番で行われる可能性があり、追加され、統合され、または完全に除外され得る（例えば、すべての説明された行為またはイベントが、本技法の実施のために必要であるとは限らない）ことを認識されたい。さらに、いくつかの例では、行為またはイベントが、連続的にではなく、同時に、例えば、マルチスレッド処理、割込み処理、または複数のプロセッサを通じて行われ得る。

[0169] １つまたは複数の例では、説明された機能が、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、例えば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含むデータ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。このようにして、コンピュータ可読媒体は、概して、（１）非一時的である有形コンピュータ可読記憶媒体、あるいは（２）信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明した技法の実装のための命令、コードおよび／またはデータ構造を取り出すために１つまたは複数のコンピュータあるいは１つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品は、コンピュータ可読媒体を含み得る。

[0170] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時的媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピー（登録商標）ディスク（disk）およびブルーレイディスク（disc）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）は、データをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[0171] 命令は、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）などの１つまたは複数のプロセッサ、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、あるいは他の等価な集積回路またはディスクリート論理回路によって実行され得る。従って、本明細書で使用する「プロセッサ」という用語は、前述の構造、または本明細書で説明する技法の実装に好適な他の構造のいずれかを指す。さらに、いくつかの態様では、本明細書で説明した機能が、符号化および復号のために構成された専用のハードウェアおよび／またはソフトウェアモジュール内に与えられ得、あるいは複合コーデックに組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素中に十分に実装され得る。

[0172] 本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）、またはＩＣのセット（例えば、チップセット）を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示する技法を行うように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明したが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作ハードウェアユニットの集合によって与えられ得る。

[0173] 様々な例について説明してきた。これらおよび他の例は以下の特許請求の範囲内に入る。
以下に本願の当初の特許請求の範囲に記載された発明を付記する。
[Ｃ１] ビデオデータを復号する方法であって、
コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素を復号することと、
存在する場合、前記第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、前記準拠するビットストリーム内の前記ＶＰＳにおけるシンタックス要素を復号することとを備え、
前記準拠するビットストリームは、第２の動作点のコンテンツの前記第１または第２の組のうちの少なくとも１つを複製する、前記ＶＰＳにおけるシンタックス要素を含まず、シンタックス要素を復号することは、準拠するビットストリーム内のみの前記第１の動作点および前記ＨＲＤパラメータ情報を示す前記シンタックス要素を復号することを備える、方法。
[Ｃ２] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第１の組を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第１の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ１に記載の方法。
[Ｃ３] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第２の組を有する前記ＨＲＤパラメータ情報を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第２の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ１に記載の方法。
[Ｃ４] コンテンツの前記第１の組は、前記第１の動作点のサブビットストリームに属する前記準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、前記第１の動作点に関するレイヤ識別子の組を備える、Ｃ１に記載の方法。
[Ｃ５] 前記第１の動作点に関するレイヤ識別子の前記組が２つ以上のレイヤ識別子を含み、前記方法は、前記２つ以上のレイヤ識別子を差分的に復号することをさらに備える、Ｃ４に記載の方法。
[Ｃ６] 前記第１の動作点に関して簡単な動作点モードが使用されるかどうかを示す前記準拠するビットストリーム内の１つまたは複数のシンタックス要素を復号することをさらに備える、Ｃ４に記載の方法。
[Ｃ７] 前記第１の動作点に関して前記簡単な動作点モードが使用される前記指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組のターゲットレイヤ識別子のみを復号することをさらに備え、ここにおいて、前記第１の動作点は、前記ターゲットレイヤ識別子と前記準拠するビットストリームの時間的サブレイヤを示す時間的識別子とによって識別される、Ｃ６に記載の方法。
[Ｃ８] 前記第１の動作点に関して前記簡単な動作点モードが使用されない前記指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組の各レイヤ識別子を明示的に復号することをさらに備える、Ｃ６に記載の方法。
[Ｃ９] 前記第１の動作点を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を備える、Ｃ１に記載の方法。
[Ｃ１０] コンテンツの前記第２の組は、前記第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、前記第１の動作点に関するＨＲＤパラメータの組を備える、Ｃ１に記載の方法。
[Ｃ１１] 前記ＨＲＤパラメータ情報を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を備える、Ｃ１に記載の方法。
[Ｃ１２] 前記準拠するビットストリームのコード化ビデオシーケンス全体に関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を復号することをさらに備え、ここにおいて、前記準拠するビットストリームは、前記コード化ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない、Ｃ１に記載の方法。
[Ｃ１３] 前記時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造から除去される、Ｃ１２に記載の方法。
[Ｃ１４] ビデオデータを符号化する方法であって、
コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素を符号化することと、
前記第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、前記準拠するビットストリーム内の前記ＶＰＳにおけるシンタックス要素を符号化することとを備え、
前記準拠するビットストリームは、第２の動作点のコンテンツの前記第１または第２の組のうちの少なくとも１つを複製する、前記ＶＰＳにおけるシンタックス要素を含まず、シンタックス要素を符号化することは、準拠するビットストリームのみからの前記第１の動作点および前記ＨＲＤパラメータ情報を示す前記シンタックス要素を符号化することを備える、方法。
[Ｃ１５] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第１の組を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第１の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ１４に記載の方法。
[Ｃ１６] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第２の組を有する前記ＨＲＤパラメータ情報を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第２の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ１４に記載の方法。
[Ｃ１７]
コンテンツの前記第１の組は、前記第１の動作点のサブビットストリームに属する前記準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、前記第１の動作点に関するレイヤ識別子の組を備える、Ｃ１４に記載の方法。
[Ｃ１８] 前記第１の動作点に関するレイヤ識別子の前記組が２つ以上のレイヤ識別子を含み、前記方法は、前記２つ以上のレイヤ識別子を差分的に符号化することをさらに備える、Ｃ１７に記載の方法。
[Ｃ１９] 前記第１の動作点に関して簡単な動作点モードが使用されるかどうかを示す前記準拠するビットストリーム内の１つまたは複数のシンタックス要素を符号化することをさらに備える、Ｃ１７に記載の方法。
[Ｃ２０] 前記第１の動作点に関して前記簡単な動作点モードが使用される前記指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組のターゲットレイヤ識別子のみを符号化することをさらに備え、ここにおいて、前記第１の動作点は、前記ターゲットレイヤ識別子と前記準拠するビットストリームの時間的サブレイヤを示す時間的識別子とによって識別される、Ｃ１９に記載の方法。
[Ｃ２１] 前記第１の動作点に関して前記簡単な動作点モードが使用されない前記指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組の各レイヤ識別子を明示的に符号化することをさらに備える、Ｃ２０に記載の方法。
[Ｃ２２] 前記第１の動作点を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を備える、Ｃ１４に記載の方法。
[Ｃ２３] コンテンツの前記第２の組は、前記第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、前記第１の動作点に関するＨＲＤパラメータの組を備える、Ｃ１４に記載の方法。
[Ｃ２４] 前記ＨＲＤパラメータ情報を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を備える、Ｃ１４に記載の方法。
[Ｃ２５] 前記準拠するビットストリームのコード化ビデオシーケンス全体に関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を符号化することをさらに備え、ここにおいて、前記準拠するビットストリームは、前記コード化ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない、Ｃ１４に記載の方法。
[Ｃ２６] 前記時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造から除去される、Ｃ２５に記載の方法。
[Ｃ２７] ビデオコーダを備えるビデオコーディングデバイスであって、前記ビデオコーダは、
コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素をコーディングし、
存在する場合、前記第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、前記準拠するビットストリーム内の前記ＶＰＳにおけるシンタックス要素をコーディングするように構成され、
前記準拠するビットストリームは、第２の動作点のコンテンツの前記第１または第２の組のうちの少なくとも１つを複製する、前記ＶＰＳにおけるシンタックス要素を含まず、前記ビデオコーダは、準拠するビットストリーム内のみの前記第１の動作点および前記ＨＲＤパラメータ情報を示す前記シンタックス要素をコーディングするように構成される、ビデオコーディングデバイス。
[Ｃ２８] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第１の組を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第１の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ２９] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第２の組を有する前記ＨＲＤパラメータ情報を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第２の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ３０] コンテンツの前記第１の組は、前記第１の動作点のサブビットストリームに属する前記準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、前記第１の動作点に関するレイヤ識別子の組を備える、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ３１] 前記第１の動作点に関するレイヤ識別子の前記組が２つ以上のレイヤ識別子を含み、前記ビデオコーダは、前記２つ以上のレイヤ識別子を差分的にコーディングするようにさらに構成される、Ｃ３０に記載のビデオコーディングデバイス。
[Ｃ３２] 前記ビデオコーダは、前記第１の動作点に関して簡単な動作点モードが使用されるかどうかを示す前記準拠するビットストリーム内の１つまたは複数のシンタックス要素をコーディングするようにさらに構成される、Ｃ３０に記載のビデオコーディングデバイス。
[Ｃ３３] 前記ビデオコーダは、前記第１の動作点に関して前記簡単な動作点モードが使用される前記指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組のターゲットレイヤ識別子のみをコーディングするようにさらに構成され、ここにおいて、前記第１の動作点は、前記ターゲットレイヤ識別子と前記準拠するビットストリームの時間的サブレイヤを示す時間的識別子とによって識別される、Ｃ３２に記載のビデオコーディングデバイス。
[Ｃ３４] 前記ビデオコーダは、前記第１の動作点に関して前記簡単な動作点モードが使用されない前記指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組の各レイヤ識別子を明示的にコーディングするようにさらに構成される、Ｃ３２に記載のビデオコーディングデバイス。
[Ｃ３５] 前記第１の動作点を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を備える、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ３６] コンテンツの前記第２の組は、前記第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、前記第１の動作点に関するＨＲＤパラメータの組を備える、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ３７] 前記ＨＲＤパラメータ情報を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を備える、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ３８] 前記ビデオコーダは、前記準拠するビットストリームのコード化ビデオシーケンス全体に関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素をコーディングするようにさらに構成され、ここにおいて、前記準拠するビットストリームは、前記コード化ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示すシンタックス要素を含まない、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ３９] 前記時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示す前記シンタックス要素は、前記準拠するビットストリーム内の前記ＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造から除去される、Ｃ３８に記載のビデオコーディングデバイス。
[Ｃ４０] 前記ビデオコーダは、前記第１の動作点を示す、前記ＶＰＳにおける前記シンタックス要素を復号し、存在する場合、ＨＲＤパラメータ情報を示す、前記ＶＰＳにおけるシンタックス要素を復号し、前記復号シンタックス要素に基づいて前記準拠するビットストリーム内のビデオデータを復号するように構成されたビデオデコーダを備える、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ４１] 前記ビデオコーダは、前記第１の動作点を示す、前記ＶＰＳにおける前記シンタックス要素を符号化し、存在する場合、ＨＲＤパラメータ情報を示す、前記ＶＰＳにおけるシンタックス要素を符号化し、前記復号シンタックス要素に基づいて前記準拠するビットストリーム内のビデオデータを符号化するように構成されたビデオエンコーダを備える、Ｃ２７に記載のビデオコーディングデバイス。
[Ｃ４２] 命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、ビデオデータをコーディングするためのデバイスのプロセッサに、
コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素をコーディングさせ、
存在する場合、前記第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、前記準拠するビットストリーム内の前記ＶＰＳにおけるシンタックス要素をコーディングさせ、
ここにおいて、前記準拠するビットストリームは、第２の動作点のコンテンツの前記第１または第２の組のうちの少なくとも１つを複製する、前記ＶＰＳにおけるシンタックス要素を含まず、前記プロセッサは、準拠するビットストリーム内のみの前記第１の動作点および前記ＨＲＤパラメータ情報を示す前記シンタックス要素をコーディングするように構成される、コンピュータ可読記憶媒体。
[Ｃ４３] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第１の組を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第１の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４４] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第２の組を有する前記ＨＲＤパラメータ情報を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第２の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４５] コンテンツの前記第１の組は、前記第１の動作点のサブビットストリームに属する前記準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、前記第１の動作点に関するレイヤ識別子の組を備える、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４６] コンテンツの前記第２の組は、前記第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、前記第１の動作点に関するＨＲＤパラメータの組を備える、Ｃ４２に記載のコンピュータ可読記憶媒体。
[Ｃ４７] コンテンツの第１の組を有する第１の動作点を示す準拠するビットストリーム内のビデオパラメータセット（ＶＰＳ）におけるシンタックス要素をコーディングするための手段と、
存在する場合、前記第１の動作点のコンテンツの第２の組を有する仮想参照デコーダ（ＨＲＤ）パラメータ情報を示す、前記準拠するビットストリーム内の前記ＶＰＳにおけるシンタックス要素をコーディングするための手段とを備え、
前記準拠するビットストリームは、第２の動作点のコンテンツの前記第１または第２の組のうちの少なくとも１つを複製する、前記ＶＰＳにおけるシンタックス要素を含まず、前記コーディングデバイスは、準拠するビットストリーム内のみの前記第１の動作点および前記ＨＲＤパラメータ情報を示す前記シンタックス要素をコーディングするように構成される、ビデオコーディングデバイス。
[Ｃ４８] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第１の組を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第１の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ４７に記載のビデオコーディングデバイス。
[Ｃ４９] 前記準拠するビットストリームは、前記第２の動作点のコンテンツの前記第２の組を有する前記ＨＲＤパラメータ情報を複製する、前記ＶＰＳにおけるシンタックス要素を含まず、コンテンツの前記第２の組は、前記ＶＰＳにおける前記第１の動作点に対して一意である、Ｃ４７に記載のビデオコーディングデバイス。
[Ｃ５０] コンテンツの前記第１の組は、前記第１の動作点のサブビットストリームに属する前記準拠するビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別する、前記第１の動作点に関するレイヤ識別子の組を備える、Ｃ４７に記載のビデオコーディングデバイス。
[Ｃ５１] コンテンツの前記第２の組は、前記第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、前記第１の動作点に関するＨＲＤパラメータの組を備える、Ｃ４７に記載のビデオコーディングデバイス。

Claims

符号化ビデオデータのビットストリームを復号する方法であって、
前記ビットストリームの第１の動作点を識別するレイヤ識別子の組を示す前記ビットストリーム内のビデオパラメータセット（ＶＰＳ）における第１のシンタックス要素を復号することと、
存在する場合、前記第１の動作点に関する仮想参照デコーダ（ＨＲＤ）パラメータの組を示す、前記ビットストリーム内の前記ＶＰＳにおける第２のシンタックス要素を復号することと、
前記ビットストリームが準拠するビットストリームである場合にのみ復号し続けることと、ここにおいて、準拠するビットストリームは、第２の動作点に関するレイヤ識別子の前記組とＨＲＤパラメータの前記組とのうちの少なくとも１つを複製する、前記ＶＰＳにおけるシンタックス要素を含まないビットストリームである、
前記ビットストリームが非準拠ビットストリームである場合に前記ビットストリームを破棄することと
を備える、方法。
ビデオデータのビットストリームを符号化する方法であって、
前記ビットストリームが準拠するビットストリームであるように前記ビットストリームを符号化することと、ここにおいて前記ビットストリームを符号化することは、
前記ビットストリームの第１の動作点を識別するレイヤの組を示す前記ビットストリーム内のビデオパラメータセット（ＶＰＳ）における第１のシンタックス要素を符号化することと、
前記第１の動作点に関する仮想参照デコーダ（ＨＲＤ）パラメータの組を示す、前記ビットストリーム内の前記ＶＰＳにおける第２のシンタックス要素を符号化することと
を含み、
前記第１の動作点に関して符号化されたレイヤ識別子の前記組またはＨＲＤパラメータの前記組のうちの少なくとも１つを複製する、第２の動作点に関する前記ＶＰＳにおけるシンタックス要素を符号化しないことと
を備える、方法。
レイヤ識別子の前記組が、前記ＶＰＳにおける前記第１の動作点に対して一意であるように、前記準拠するビットストリームは、前記第２の動作点に関するレイヤ識別子の前記組を複製する、前記ＶＰＳにおけるシンタックス要素を含まないビットストリームである、請求項１または２に記載の方法。
レイヤ識別子の前記組が、前記ＶＰＳにおける前記第１の動作点に対して一意であるように、前記準拠するビットストリームは、前記第２の動作点に関するＨＲＤパラメータの前記組を複製する、前記ＶＰＳにおけるシンタックス要素を含まないビットストリームである、請求項１または２に記載の方法。
前記第１の動作点に関するレイヤ識別子の前記組は、前記第１の動作点のサブビットストリームに属する前記ビットストリームの１つまたは複数のネットワークアブストラクションレイヤ（ＮＡＬ）ユニットを識別し、および／または、前記第１の動作点に関するＨＲＤパラメータの前記組は、前記第１の動作点のサブビットストリームの準拠をチェックするために使用されるＨＲＤを定義する、請求項１または２に記載の方法。
前記第１の動作点に関するレイヤ識別子の前記組が２つ以上のレイヤ識別子を含み、前記方法は、前記２つ以上のレイヤ識別子を差分的に復号することをさらに備える、請求項１または２に記載の方法。
前記第１の動作点に関して簡単な動作点モードが使用されるかどうかを示す前記ビットストリーム内の１つまたは複数のシンタックス要素をコーディングすることをさらに備え、簡単な動作点モード、レイヤ識別子の前記組は単一のレイヤ識別子を含む、請求項１または２に記載の方法。
前記第１の動作点に関して前記簡単な動作点モードが使用されることの指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組のターゲットレイヤ識別子のみをコーディングすることをさらに備え、ここにおいて、前記第１の動作点は、前記ターゲットレイヤ識別子と前記準拠するビットストリームの時間的サブレイヤを示す時間的識別子とによって識別される、請求項７に記載の方法。
前記第１の動作点に関して前記簡単な動作点モードが使用されないことの指示に基づいて、前記第１の動作点に関するレイヤ識別子の前記組の各レイヤ識別子を明示的にコーディングすることをさらに備える、請求項７に記載の方法。
前記第１の動作点を示す前記第１のシンタックス要素は、前記ビットストリーム内の前記ＶＰＳにおけるｏｐｅｒａｔｉｏｎ＿ｐｏｉｎｔ（）シンタックス構造を備える、請求項１または２に記載の方法。
前記ＨＲＤパラメータ情報を示す前記第２のシンタックス要素は、前記ビットストリーム内の前記ＶＰＳにおけるｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造を備える、請求項１または２に記載の方法。
前記ビットストリームのコード化ビデオシーケンス全体に関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示す第３のシンタックス要素をコーディングすることをさらに備え、ここにおいて、前記ビットストリームは、前記コード化ビデオシーケンスの１つまたは複数の時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示す他のシンタックス要素を含まない、請求項１または２に記載の方法。
前記時間的サブレイヤに関するプロファイル空間、ティア、互換性のあるプロファイル、およびプロファイル関連の制約条件のうちの１つまたは複数を示す第３のシンタックス要素は、前記ビットストリーム内の前記ＶＰＳにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造に含まれない、請求項１または２に記載の方法。
ビットストリームをコーディングするためのビデオコーディングデバイスであって、
前記ビットストリームの第１の動作点を識別するレイヤ識別子の組を示す前記ビットストリーム内のビデオパラメータセット（ＶＰＳ）における第１のシンタックス要素をコーディングするための手段と、
存在する場合、前記第１の動作点に関する仮想参照デコーダ（ＨＲＤ）パラメータの組を示す、前記ビットストリーム内の前記ＶＰＳにおける第２のシンタックス要素をコーディングするための手段と、
前記ビットストリームが準拠するビットストリームである場合にのみ復号し続けるための手段と、ここにおいて、準拠するビットストリームは、第２の動作点に関するレイヤ識別子の前記組とＨＲＤパラメータの前記組とのうちの少なくとも１つを複製する前記ＶＰＳにおけるシンタックス要素を含まないビットストリームである、
前記ビットストリームが非準拠ビットストリームである場合に前記ビットストリームを破棄することと
を備える、ビデオコーディングデバイス。
命令を記憶したコンピュータ可読記憶媒体であって、前記命令は、実行されたとき、ビデオデータをコーディングするためのデバイスのプロセッサに、請求項１〜１３のいずれかに記載の方法を行わせる、コンピュータ可読記憶媒体。