[go: up one dir, main page]

JP2016213615A - 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム - Google Patents

動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム Download PDF

Info

Publication number
JP2016213615A
JP2016213615A JP2015094346A JP2015094346A JP2016213615A JP 2016213615 A JP2016213615 A JP 2016213615A JP 2015094346 A JP2015094346 A JP 2015094346A JP 2015094346 A JP2015094346 A JP 2015094346A JP 2016213615 A JP2016213615 A JP 2016213615A
Authority
JP
Japan
Prior art keywords
encoding
block
sub
unit
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015094346A
Other languages
English (en)
Other versions
JP6459761B2 (ja
Inventor
章弘 屋森
Akihiro Yamori
章弘 屋森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015094346A priority Critical patent/JP6459761B2/ja
Publication of JP2016213615A publication Critical patent/JP2016213615A/ja
Application granted granted Critical
Publication of JP6459761B2 publication Critical patent/JP6459761B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化を行う単位となるブロックのサイズを適切に決定できる動画像符号化装置を提供する。【解決手段】動画像符号化装置は、動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、ブロックを符号化単位としてそのブロックを符号化する場合の第1の符号化コストが、サブブロックを符号化単位としてそのブロックを符号化する場合の複数のサブブロックのそれぞれの第2の符号化コストの和とオフセット値の合計以下である場合、符号化単位としてブロックを選択し、一方、第1の符号化コストがその合計よりも大きい場合、符号化単位としてサブブロックを選択する符号化モード決定部12と、ブロックを選択した符号化単位ごとに符号化する符号化部13とを有する。【選択図】図4

Description

本発明は、例えば、動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラムに関する。
動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを符号化することにより圧縮する。代表的な動画像の符号化方式として、International Organization for Standardization /International Electrotechnical Commission(ISO/IEC)またはInternational Telecommunication Union - Telecommunication Standardization Sector(ITU-T)で策定されたMoving Picture Experts Group phase 2(MPEG-2/H.262)、MPEG-4、あるいはH.264 MPEG-4 Advanced Video Coding(H.264 MPEG-4 AVC)が利用されている。MPEG-4 AVC/H.264以降は、合同で設立された(Joint Collaborative Team on Video Coding (JCT-VC)によって標準化が進められ、新たな符号化標準として、HEVC(High Efficiency Video Coding, MPEG-H/H.265、正式名称はISO/IEC 23008、あるいはITU-T H.265)が策定されている。
HEVCでは、従来の動画像符号化方式と比較して、動画像データに含まれる各ピクチャを分割するブロックのサイズの自由度が向上している。図1は、HEVCによる、ピクチャの分割の一例を示す図である。
図1に示されるように、ピクチャ100は、符号化ブロックCoding Tree Unit(CTU)単位で分割され、各CTU101は、ラスタスキャン順に符号化される。CTU101のサイズは、64x64〜16x16画素の中から選択できる。ただし、CTU101のサイズは、シーケンス単位で一定とされる。
CTU101は、さらに、四分木構造で複数のCoding Unit(CU)102に分割される。一つのCTU101内の各CU102は、Zスキャン順に符号化される。CU102のサイズは可変であり、そのサイズは、CU分割モード8x8〜64x64画素の中から選択される。CU102は、符号化モードの一例であるイントラ予測符号化モードとインター予測符号化モードを選択する単位となる。CU102は、Prediction Unit(PU)103単位またはTransform Unit(TU)104単位で個別に処理される。PU103は、符号化モードに応じた予測が行われる単位となる。例えば、PU103は、イントラ予測符号化モードでは、予測モードが適用される単位となり、インター予測符号化モードでは、動き補償を行う単位となる。PU103のサイズは、例えば、イントラ予測符号化モードが適用される場合、2Nx2NとNxN(Nは、CUサイズ/2)から選択可能である。
一方、TU104は、直交変換の単位である。またイントラ予測符号化モードでは、TU104は、予測ブロックの生成単位でもある。TU104のサイズは、4x4画素〜32x32画素の中から選択される。TU104は、四分木構造で分割され、Zスキャン順に処理される。
なお、イントラ予測符号化モードは、動画像データが空間方向に相関性が高いことを利用する符号化モードであり、符号化対象ピクチャの符号化対象ブロックを、符号化対象ピクチャの既に符号化された領域の情報を用いて符号化する符号化モードである。一方、インター予測符号化モードは、動画像データが時間方向に相関性が高いことを利用する符号化モードであり、符号化対象ピクチャの符号化対象ブロックを、既に符号化された他のピクチャの情報を用いて符号化する符号化モードである。
HEVCでは、着目するCTUについて、CU、PU及びTUのサイズを決定する際に、例えば、CU、PU及びTUのそれぞれの取り得るサイズと符号化モードの組み合わせごとに、符号化コストが算出される。そしてその符号化コストが最小となるCU、PU及びTUのそれぞれのサイズと符号化モードの組み合わせが、着目するCTUの符号化の際に適用される。
また、符号化対象のブロックのサイズを決定する際に、対象となるブロックの複雑度を表す空間アクティビティ値を用いる技術が提案されている(例えば、特許文献1を参照)。特許文献1に開示された動画像符号化方法は、対象ブロックの符号化条件の決定の際に、その対象ブロックの少なくとも一部の領域の複雑度を表す第1空間アクティビティ値が第1閾値より小さい場合、小分割用の第1符号化条件を対象ブロックの符号化条件とする。一方、その動画像符号化方法は、第1空間アクティビティ値が第1閾値以上である場合、大分割用の第2符号化条件を対象ブロックの符号化条件とする。
国際公開第2010/150486号
特許文献1に開示された技術では、符号化対象ブロックの複雑度が大きいほど、その符号化対象ブロックのサイズは大きくなる。
一方、符号化された動画像データを復号して得られる動画像の画質と圧縮効率のバランスを最適化するよう、適用する符号化モードを決定するための方式として、レート歪み最適化(Rate distortion optimization, RDO)方式が提案されている。RDO方式では、符号化モードを決定する際に、符号化の前後での誤差統計量である歪み量と、符号化対象のブロックの符号量であるレートとが考慮される。そして歪み量とレートとの関係を表すRD特性が最も良好となる符号化モードが選択される。
ここで、特許文献1に記載のように、符号化対象ブロックの複雑度に基づいて符号化対象ブロックのサイズを決定した場合、その決定されたサイズについてのRD特性が必ずしも最良とならず、他のサイズについてのRD特性の方がより良好となることがあった。
そこで、本明細書は、符号化を行う単位となるブロックのサイズを適切に決定できる動画像符号化装置を提供することを目的とする。
一つの実施形態によれば、動画像符号化装置が提供される。この動画像符号化装置は、動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、ブロックを符号化単位としてそのブロックを符号化する場合の第1の符号化コストが、サブブロックを符号化単位としてそのブロックを符号化する場合の複数のサブブロックのそれぞれの第2の符号化コストの和とオフセット値の合計以下である場合、符号化単位としてブロックを選択し、一方、第1の符号化コストがその合計よりも大きい場合、符号化単位としてサブブロックを選択する符号化モード決定部と、ブロックを選択した符号化単位ごとに符号化する符号化部とを有する。
本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成される。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
本明細書に開示された動画像符号化装置は、符号化を行う単位となるブロックのサイズを適切に決定できる。
HEVCによる、ピクチャの分割の一例を示す図である。 (a)及び(b)は、それぞれ、ブロック分割の一例を示すである。 (a)及び(b)は、それぞれ、図2(a)及び図2(b)に示されたピクチャについて、TUサイズを予め設定された値としたときのRD特性を示す図である。 一つの実施形態による動画像符号化装置の概略構成図である。 符号化モード決定処理の動作フローチャートである。 動画像符号化処理の動作フローチャートである。 上記の実施形態またはその変形例による動画像符号化装置の各部の機能を実現するコンピュータプログラムが動作することにより、動画像符号化装置として動作するコンピュータの構成図である。
以下、図を参照しつつ、動画像符号化装置について説明する。最初に、HEVCに準拠してピクチャをブロックごとに分割する例について説明する。
図2(a)及び図2(b)は、それぞれ、ブロック分割の一例を示すである。図2(a)に示されたピクチャ200には、並木が写っている。また、図2(b)に示されたピクチャ210は、ホワイドノイズを表している。そしてピクチャ200上に示された各ブロック201、及び、ピクチャ210上に示された各ブロック211は、CU、PU及びTUのそれぞれのサイズの組み合わせごとの符号化コストを次式で算出した場合に、符号化コストが最小となるTUを表す。なお、この例では、ピクチャを他のピクチャの情報を参照しないイントラ予測符号化モードで符号化すると仮定して符号化コストを算出した。
Figure 2016213615
ここで予測誤差は、例えば、符号化コスト算出対象となるブロックと予測ブロックの対応画素間の誤差絶対値和として算出される。またモード情報量は、符号化コスト算出対象となる符号化モードで用いられる情報についての情報量を表す。そしてλは、ラグランジュの未定乗数である。
図2(a)及び図2(b)に示されるように、複雑なところほど、小さいサイズのTUが選択されている。特に、ピクチャ210については、ピクチャ全体において最小サイズのTUが選択されている。しかしながら、このような複雑なシーンが写っているピクチャにおいて、ピクチャのRD特性は、ピクチャの分割サイズが小さいほど良好になるとは限らない。
図3(a)及び図3(b)は、それぞれ、図2(a)及び図2(b)に示されたピクチャについて、TUサイズを予め設定された値としたときのRD特性を示す図である。図3(a)及び図3(b)において、横軸は発生情報量、すなわち、レート(単位:Mbps)を表し、縦軸はピーク信号対雑音比(Peak Signal-to-Noise Ratio, PSNR)、すなわち、歪み量(単位:dB)を表す。したがって、左上に近いRD特性ほど、良好である。図3(a)において、グラフ301〜グラフ304は、それぞれ、TUサイズが32、16、8、4である場合のピクチャ200についてのRD特性を表す。同様に、図3(b)において、グラフ311〜グラフ314は、それぞれ、TUサイズが32、16、8、4である場合のピクチャ210についてのRD特性を表す。
図3(a)及び図3(b)に示されるように、ピクチャ200及びピクチャ210の両方について、TUサイズが32のときのRD特性が最も良好となっており、TUサイズが小さくなるほど、RD特性は低下する。
このように、(1)式に従って算出された符号化コストに基づいて、ピクチャを分割するブロックのサイズを決定すると、必ずしもRD特性は最適とはならない。一方、ピクチャ200及びピクチャ210では、ピクチャ全体が相対的に複雑である。そのため、特許文献1に記載のように複雑度に基づいてブロックのサイズを決定すると、ピクチャ上の局所的な位置によっては、小さいブロックサイズを用いた方がRD特性が良好となる場合でも、ピクチャ全体で大きなブロックサイズが選択される可能性が高い。
ここで、本発明者は、鋭意研究の結果、複数のサブブロックに分割可能なブロックについて、以下の二つの条件が満たされる場合には、サブブロックに分割しない方がRD特性が良好となる可能性が高いことを見出した。
(1)各サブブロックに写っている被写体が複雑であること
(2)各サブブロックに写っている被写体が互いに類似していること
そこで、本実施形態による動画像符号化装置は、符号化モード及び符号化単位となるブロックのサイズを決定する際に、着目するブロックについて、そのブロックを分割可能な複数のサブブロックのそれぞれの複雑度と、サブブロック間の類似度を算出する。動画像符号化装置は、サブブロックごとの複雑度、及びサブブロック間の類似度が上記の(1)と(2)の条件を満たす場合に正の値を持つオフセットを算出する。さらに、動画像符号化装置は、着目するブロックをサブブロックを符号化単位として符号化する際のサブブロックごとの符号化コストとブロックそのものを符号化単位として着目するブロックを符号化する際の符号化コストを算出する。そして動画像符号化装置は、サブブロックごとの符号化コストの和と着目するブロックそのものの符号化コストとの比較の際に、各サブブロックの符号化コストの和にオフセットを加算する。これにより、この動画像符号化装置は、上記の(1)と(2)の条件が満たされるブロックについてはサブブロックに分割され難くする。
本実施形態では、動画像符号化装置は、HEVCに準拠するものとする。動画像符号化装置は、ピクチャをCTU単位で分割し、CTUごとに、CUサイズ、PUサイズ、TUサイズ及び符号化モードの組み合わせを選択する。そして動画像符号化装置は、CTUごとに、選択した組み合わせにしたがってそのCTUを符号化する。
図4は、一つの実施形態による動画像符号化装置の概略構成図である。動画像符号化装置1は、動きベクトル算出部11と、符号化モード決定部12と、符号化部13と、記憶部14とを有する。
動画像符号化装置1が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置1が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置1に実装されてもよい。さらに、動画像符号化装置1が有するこれらの各部は、動画像符号化装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
符号化対象となるピクチャは、例えば、動画像符号化装置1全体を制御する制御部(図示せず)により複数のCTUに分割される。そして動画像符号化装置1には、各CTUが、例えばラスタスキャン順で入力される。そして動画像符号化装置1は、CTUごとに符号化する。以下、動画像符号化装置1が有する各部について説明する。
動きベクトル算出部11は、符号化対象ピクチャが、PピクチャまたはBピクチャといった、インター予測符号化モードが適用可能なピクチャである場合、符号化対象のCTUについて適用可能なPUのそれぞれについて、動きベクトルを算出する。その際、動きベクトル算出部11は、各PUについて、既に符号化され、かつ、符号化対象ピクチャが参照可能な参照ピクチャに対してブロックマッチングを実行して、PUと最も一致する参照ピクチャ及びその参照ピクチャ上の領域の位置を決定する。そして動きベクトル算出部11は、PUとその領域間の空間的な移動量を表すベクトルを動きベクトルとして算出する。
なお、動きベクトル算出部11は、各PUについて、そのPUと参照ピクチャ上の対応領域との対応画素間の差分絶対値和と動きベクトルの符号量の合計が最小となるときのPUと対応領域間の移動量を動きベクトルとしてもよい。
動きベクトル算出部11は、各PUについて、動きベクトル及びその動きベクトルが参照する参照ピクチャを示す情報を、符号化モード決定部12へ出力する。
符号化モード決定部12は、符号化対象のCTUにおいて、適用可能なCUサイズ、PUサイズ、TUサイズ、及び符号化モードの組み合わせを求める。そして符号化モード決定部12は、各組み合わせについて、符号量の推定値である符号化コストを算出する。そして符号化モード決定部12は、各組み合わせの符号化コストに基づいて、符号化対象のCTUに適用するCUサイズ、PUサイズ、TUサイズ、及び符号化モードの組み合わせを決定する。
符号化モード決定部12は、適用可能なCUサイズ、PUサイズ、TUサイズ、及び符号化モードの組み合わせのそれぞれごとに、予測ブロックを生成する。予測ブロックは、着目する組み合わせに含まれる符号化モードに従って、符号化済みの参照ピクチャまたは符号化済みの他のブロックから生成される。なお、符号化モードには、例えば、イントラ予測符号化モード及びインター予測符号化モードが含まれる。さらに、イントラ予測符号化モードに基づいて予測ブロックが作成される場合、符号化モード決定部12は、例えば、HEVCに規定される、予測ブロックの作成方法を規定する複数のモードのそれぞれについて予測ブロックを作成する。また、インター予測符号化モードに基づいて予測ブロックが生成される場合、符号化モード決定部12は、適用可能な動きベクトルの生成方式または予測方式のそれぞれ(例えば、ダイレクトモードあるいはマージモードなど)について予測ブロックを作成する。また、符号化対象ピクチャが双方向予測が可能なBピクチャである場合、符号化モード決定部12は、一方向の予測による動きベクトルに基づく予測ブロックだけでなく、各方向の予測による二つの動きベクトルに基づく予測ブロックも作成する。
以下では、便宜上、イントラ予測符号化モードにおける、予測ブロックの作成方法を規定するモードだけでなく、インター予測符号化モードにおける、動きベクトルの生成方式または予測方式と一方向予測または双方向予測の組み合わせを、予測モードと呼ぶ。
符号化モード決定部12は、例えば、着目する組み合わせの符号化コストを算出するために、その組み合わせに含まれるTUについて、予測誤差を算出する。本実施形態では、符号化モード決定部12は、予測誤差として、次式に従って画素差分絶対値和SADを算出する。
Figure 2016213615
ここで、OrgPixelは着目する組み合わせに含まれるTU内の画素の値であり、PredPixelは、予測ブロックの対応画素の値である。
なお、符号化モード決定部12は、予測誤差として、SADを算出する代わりに、着目するTUと予測ブロック間の差分画像をアダマール変換した後の各画素の値の絶対値和SATDなどを算出してもよい。また、TUがピクチャの左上端に位置し、かつ、着目する符号化モードがイントラ予測符号化モードである場合のように、予測ブロックが作成されないTUについては、符号化モード決定部12は、予測誤差として、アクティビティを算出してもよい。アクティビティACTは、例えば、次式に従って算出される。
Figure 2016213615
ここで、AveBは、TU全体の画素値の平均値である。
符号化モード決定部12は、着目する組み合わせについて、次式に従って符号化コストCostを算出する。
Figure 2016213615
ここで、SADは、着目する組み合わせに含まれるTUについて算出された予測誤差である。またRは、モード情報量であり、動きベクトル、予測モードを表すフラグなど、直交変換係数以外の項目についての符号量の推定値である。そしてλはラグランジュの未定乗数である。
符号化モード決定部12は、インター予測符号化モードとイントラ予測符号化モードとについて、別個に、適用するCUサイズ、PUサイズ、TUサイズ、及び予測モードの組み合わせを求める。その際、符号化モード決定部12は、例えば、同一サイズのTUごとに、符号化コストが最小となるPUサイズ及び予測モードを決定する。さらに、符号化モード決定部12は、そのTUについて決定したPUサイズ及び予測モードを用いる場合の符号化コストと、そのTUを4分割した各TU(以下、便宜上、サブTUと呼ぶ)について決定したPUサイズ及び予測モードを用いる場合の符号化コストの和を比較する。そして符号化モード決定部12は、符号化コストの比較結果に応じてTUのサイズを選択する。符号化モード決定部12は、再帰的に上記の処理をTUサイズの大きい方から順に繰り返すことで、インター予測符号化モードとイントラ予測符号化モードのそれぞれごとに、CUサイズ、PUサイズ、TUサイズ、及び予測モードの組み合わせを求める。そして符号化モード決定部12は、CUごとに、インター予測符号化モードについて求めた組み合わせとイントラ予測符号化モードについて求めた組み合わせのうち、符号化コストが小さい方を、符号化対象のCTUに適用する組み合わせとする。
図1に関して説明したように、TUのサイズは、4x4画素〜32x32画素の中から選択される。そこで符号化モード決定部12は、例えば、32x32画素のサイズを持つTUについての符号化コストと、そのTUを4分割した、16x16画素のサイズを持つ4個のサブTUのそれぞれの符号化コストの和とを比較する。同様に、符号化モード決定部12は、16x16画素のサイズを持つTUについての符号化コストと、そのTUを4分割した、8x8画素のサイズを持つ4個のサブTUのそれぞれの符号化コストの和とを比較する。さらに、符号化モード決定部12は、8x8画素のサイズを持つTUについての符号化コストと、そのTUを4分割した、4x4画素のサイズを持つ4個のサブTUのそれぞれの符号化コストの和とを比較する。
本実施形態では、異なるTUサイズについての符号化コストを比較する際、符号化モード決定部12は、上記の(1)及び(2)の条件が満たされる場合に、着目するTUを分割して得られる4個のサブTUよりも着目するTUの方が選択され易いようにする。
例えば、着目するTUの符号化コストをC0とし、着目するTUを4分割した4個のサブTUのそれぞれの符号化コストをC1[i](i=1,2,3,4)とする。この場合、符号化モード決定部12は、次式が満たされる場合に、TUのサイズとして、着目するTUのサイズ、すなわち、大きい方のTUのサイズを選択する。一方、次式が満たされない場合、符号化モード決定部12は、TUのサイズとして、サブTUのサイズ、すなわち、小さい方のTUのサイズを選択する。
Figure 2016213615
ここでoffsetは、着目するTUを4分割した4個のTUのそれぞれの複雑度及び4個のTU間の類似度に基づいて決定されるオフセット値である。
符号化コストC1[i]が大きいほど、対応するサブTUとその予測ブロック間の予測誤差が大きいので、そのサブTUに写っている被写体は複雑であると想定される。また、各サブTUの符号化コストC1[i]の分散が小さいほど、各サブTUに写っている被写体は類似していると想定される。したがって、本実施形態では、符号化モード決定部12は、各サブTUについて算出された符号化コストC1[i]を、そのサブTUについての複雑度とし、各サブTUの符号化コストC1[i]の分散を、各サブTU間の類似度とする。
この場合、offsetは、例えば、次式に従って算出される。
Figure 2016213615
ここでμは定数であり、例えば、0よりも大きく、かつ、1以下の値に設定される。またVar(C1[i])は、各サブTUの符号化コストC1[i]の分散であり、次式で算出される。閾値Th1は、例えば、サブTUの画素数に定数α(例えば、1〜5)を乗じた値に設定される。また、閾値Th2は、着目するTUに含まれるサブTUの数(本実施形態では、4)に画素の取り得る値の最大値(例えば、255)と定数β(例えば、0.05〜0.1)を乗じた値に設定される。
Figure 2016213615
すなわち、各サブTUが一定以上複雑である場合、かつ、サブTU間のシーンが類似しているほどoffsetは大きな値となり、その結果として大きい方のTUのサイズが選択され易くなる。
なお、変形例によれば、符号化モード決定部12は、各サブTUの予測誤差を、そのサブTUについての複雑度とし、各サブTUの予測誤差の分散を、各サブTU間の類似度としてもよい。この場合、符号化モード決定部12は、例えば、次式に従ってoffsetを算出する。
Figure 2016213615
ここでt1[i](i=1,2,3,4)は、各サブTUについて、そのサブTUと対応する予測ブロック間の差分画像をアダマール変換した後の各画素の値の絶対値和SATDである。そしてVar(t1[i])は、各サブTUのSATDの分散である。閾値Th3は、例えば、サブTUの画素数に定数α(例えば、1〜5)を乗じた値に設定される。また、閾値Th4は、着目するTUに含まれるサブTUの数(本実施形態では、4)に画素の取り得る値の最大値(例えば、255)と定数β(例えば、0.05〜0.1)を乗じた値に設定される。SATDは、周波数領域でのサブTUの成分の大きさを表している。そのため、Var(t1[i])が小さいほど、各サブTUに写っている被写体はより類似していると想定される。この変形例における定数μの値は、上記の(6)式におけるμの値よりも大きい方が好ましい。
また他の変形例によれば、各サブTU間の類似度は、サブTU間のSADの差の絶対値で評価されてもよい。この場合、符号化モード決定部12は、例えば、次式に従ってoffsetを算出する。
Figure 2016213615
ここでs1[i](i=1,2,3,4)は、各サブTUについて、そのサブTUと対応する予測ブロック間のSADである。また、関数max(s1[i])は、s1[i](i=1,2,3,4)のうちの最大値を出力する関数であり、関数min(s1[i])は、s1[i](i=1,2,3,4)のうちの最小値を出力する関数である。閾値Th5は、例えば、サブTUの画素数に定数α(例えば、1〜5)を乗じた値に設定される。また、閾値Th6は、着目するTUに含まれるサブTUの数(本実施形態では、4)に画素の取り得る値の最大値(例えば、255)と定数β(例えば、0.05〜0.1)を乗じた値に設定される。
なお、(max(s1[i])- min(s1[i]))が0である場合、各サブTUに写っているシーンは同一である可能性がある。そこでこの場合には、符号化モード決定部12は、(9)式によらず、大きい方のTUのサイズを選択することが好ましい。
さらに他の変形例によれば、各サブTU間の類似度は、各サブTUの符号化コストC1[i]のうちの最大値と最小値の差として算出されてもよい。また、各サブTUの複雑度は、(3)式で算出されるアクティビティとして算出されてもよい。
図5は、符号化モード決定処理の動作フローチャートである。符号化モード決定部12はCTUごとに、下記の動作フローチャートに従って、符号化対象のCTUに適用するCUサイズ、PUサイズ、TUサイズ及び符号化モードの組み合わせを決定する。
符号化モード決定部12は、イントラ予測符号化モードを着目する符号化モードに設定する(ステップS101)。そして符号化モード決定部12は、最大のTUサイズを着目するTUサイズに設定する(ステップS102)。
符号化モード決定部12は、着目するTUサイズを持つTUのそれぞれと、そのTUを4分割したサブTUのそれぞれについて、符号化コストの最小値C0、C1[i]を算出する(ステップS103)。
符号化モード決定部12は、着目するTUサイズを持つTUのそれぞれについて、そのTUを4分割した各サブTUの複雑度及びサブTU間の類似度に基づいてoffsetを算出する(ステップS104)。
符号化モード決定部12は、着目するTUサイズを持つTUのそれぞれについて、そのTUの符号化コストC0が、各サブTUの符号化コストの和ΣC1[i]とoffsetの合計以下か否か判定する(ステップS105)。そして符号化モード決定部12は、符号化コストC0が各サブTUの符号化コストの和ΣC1[i]とoffsetの合計以下である場合(ステップS105−Yes)、着目するTUのサイズを選択する(ステップS106)。一方、符号化コストC0が各サブTUの符号化コストの和ΣC1[i]とoffsetの合計より大きい場合(ステップS105−No)、符号化モード決定部12は、サブTUのサイズを選択する(ステップS107)。
符号化モード決定部12は、サブTUのサイズが選択されたTUが有るか否か判定する(ステップS108)。サブTUサイズが選択されたTUが一つ以上あれば(ステップS108−Yes)、符号化モード決定部12は、サブTUのサイズがTUの取り得る最小サイズか否か判定する(ステップS109)。なお、TUの取り得る最小サイズは、HEVCで規定される4x4画素であってもよく、あるいは、4x4画素以上で、予め設定されるサイズであってもよい。サブTUのサイズがTUの取り得る最小サイズでなければ(ステップS109−No)、符号化モード決定部12は、サブTUのサイズを着目するTUのサイズに設定する(ステップS110)。そして符号化モード決定部12は、サブTUのサイズが選択されたTUのそれぞれについて、サブTUとTUとして、ステップS103以降の処理を繰り返す。
一方、ステップS108において、サブTUのサイズが選択されたTUが無い場合(ステップS108−No)、符号化モード決定部12は、TUの分割を終了する。また、ステップS109においてサブTUのサイズがTUの取り得る最小サイズである場合(ステップS109−Yes)も、符号化モード決定部12は、TUの分割を終了する。その後、符号化モード決定部12は、着目する符号化モードがインター予測符号化モードか否か判定する(ステップS111)。着目する符号化モードがイントラ予測符号化モードであれば(ステップS111−No)、符号化モード決定部12は、インター予測符号化モードを着目する符号化モードに設定する(ステップS112)。そして符号化モード決定部12は、ステップS102以降の処理を繰り返す。
一方、着目する符号化モードがインター予測符号化モードであれば(ステップS111−Yes)、符号化モード決定部12は、CUごとに、上記のTU分割結果及び対応するPUと予測モードとに基づいて、インター予測符号化モードの符号化コストとイントラ予測符号化モードの符号化コストを算出する。そして符号化モード決定部12は、インター予測符号化モードとイントラ予測符号化モードのうち、符号化コストが小さい方をそのCUについて適用する符号化モードとする(ステップS113)。なお、符号化モード決定部12は、CUについても、取り得る最大サイズのCUから順に、CUの符号化コストと、そのCUを4分割した4個のサブCUのそれぞれの符号化コストの和とを比較して、符号化コストが小さい方を選択すればよい。ただし、TU及びPUは、複数のCUにわたって設定されることはないので、上記のTU分割の結果により、着目するCUが4個のサブCUに分割できない場合には、着目するCUは、それ以上分割されない。そして符号化モード決定部12は、符号化モード決定処理を終了する。
なお、符号化対象ピクチャが、インター予測符号化モードの適用がない、Iピクチャである場合には、符号化モード決定部12は、ステップS110以降の処理を行わずに符号化モード決定処理を終了する。
符号化モード決定部12は、符号化対象のCTUに適用するCUサイズ、PUサイズ、TUサイズ及び符号化モードの組み合わせを決定すると、その組み合わせを符号化部13に出力する。なお、インター予測符号化されるCUについては、符号化モード決定部12は、そのCUに含まれるPUについて算出された動きベクトルも符号化部13へ出力する。
符号化部13は、符号化モード決定部12により決定されたCUサイズ、PUサイズ及びTUサイズに従って、符号化対象のCTUを分割する。そして符号化部13は、符号化モード決定部12により決定されたCUごとの符号化モードに従って、そのCUに含まれる各TUの予測ブロックを作成する。そして符号化部13は、符号化対象のCTUに含まれる各TUと対応する予測ブロック間の予測誤差信号を、TUごとに直交変換して得られる直交変換係数を量子化及び可変長符号化することで、符号化対象のCTUを符号化する。
再度図4を参照すると、符号化部13は、予測ブロック生成部21と、予測誤差信号算出部22と、直交変換部23と、量子化部24と、復号部25と、可変長符号化部26とを有する。
予測ブロック生成部21は、予測ブロックを生成する。予測ブロック生成部21は、符号化対象のCTUに含まれる着目するCUがインター予測符号化される場合、そのCUに含まれる各PUについて、そのPUに設定される動きベクトルを用いて参照ピクチャを動き補償することで予測ブロックを生成する。また、予測ブロック生成部21は、着目するCUがイントラ予測符号化される場合、そのCUに含まれる各PUについて、そのPUに適用される予測モードに従って、そのPUの周囲の符号化済みのブロックに含まれる画素から予測ブロックを生成する。
予測ブロック生成部21は、予測ブロックを予測誤差信号算出部22へ出力する。
予測誤差信号算出部22は、符号化対象のCTU内の各画素について、予測ブロックの対応する画素との差分演算を実行する。そして予測誤差信号算出部22は、その差分演算により得られた各画素に対応する差分値を、予測誤差信号とする。予測誤差信号算出部22は、予測誤差信号を直交変換部23へ出力する。
直交変換部23は、符号化対象のCTU内のTUごとに、予測誤差信号を直交変換することにより、直交変換係数の組を求める。例えば、直交変換部23は、直交変換処理として、離散コサイン変換(Discrete Cosine Transform、DCT)を用いることで、直交変換係数として、TUごとのDCT係数の組を得る。あるいは、直交変換部23は、直交変換処理として、アダマール変換を利用してもよい。
直交変換部23は、TUごとの直交変換係数の組を量子化部24へ出力する。
量子化部24は、TUごとに、直交変換係数を量子化することにより、その直交変換係数の量子化係数を算出する。この量子化処理は、一定区間に含まれる信号値を一つの信号値で表す処理である。そしてその一定区間は、量子化幅と呼ばれる。例えば、量子化部24は、直交変換係数から、量子化幅に相当する所定数の下位ビットを切り捨てることにより、その直交変換係数を量子化する。量子化幅は、量子化パラメータによって決定される。例えば、量子化部24は、量子化パラメータの値に対する量子化幅の値を表す関数にしたがって、使用される量子化幅を決定する。またその関数は、量子化パラメータの値に対する単調増加関数とすることができ、予め設定される。
また量子化部24は、HEVCなどの動画像符号化規格に対応した様々な量子化パラメータ決定方法の何れかに従って量子化パラメータを決定すればよい。量子化部24は、例えば、MPEG-2の標準テストモデル5に関する量子化パラメータの算出方法を用いることができる。なお、MPEG-2の標準テストモデル5に関する量子化パラメータの算出方法に関しては、例えば、http://www.mpeg.org/MPEG/MSSG/tm5/Ch10/Ch10.htmlで特定されるURLを参照されたい。
量子化部24は、量子化処理を実行することにより、直交変換係数を表すために使用されるビットの数を削減できるので、符号量を低減できる。量子化部24は、量子化係数を復号部25及び可変長符号化部26へ出力する。
復号部25は、符号化対象のCTUの量子化係数から、そのCTUよりも後のCTU及び符号化対象のCTUを含むピクチャよりも符号化順で後のピクチャを符号化するために参照される参照ピクチャを生成する。そのために、復号部25は、量子化係数に、量子化パラメータにより決定された量子化幅に相当する所定数を乗算することにより、量子化係数を逆量子化する。この逆量子化により、各TUの直交変換係数の組、例えば、DCT係数の組が復元される。その後、復号部25は、TUごとに、直交変換係数の組を逆直交変換処理する。例えば、直交変換部23がDCTを用いている場合、復号部25は、各TUに対して逆DCT処理を実行する。逆量子化処理及び逆直交変換処理を量子化信号に対して実行することにより、符号化前の予測誤差信号と同程度の情報を有する予測誤差信号が再生される。
復号部25は、予測ブロックの各画素値に、その画素に対応する再生された予測誤差信号を加算する。これらの処理を各予測ブロックについて実行することにより、復号部25は、その後に符号化されるPUに対する予測ブロックを生成するために参照されるブロックを復元する。さらに、復号部25は、復元したブロックに対してデブロッキングフィルタ処理を実行してもよい。
復号部25は、ブロックを復元する度に、その復元されたブロックを、記憶部14に記憶する。
記憶部14は、復元されたブロックを一時的に記憶する。各ブロックの符号化順序にしたがって、1枚のピクチャ分の復元されたブロックを結合することで、後続するピクチャの符号化の際に参照されるピクチャが得られる。記憶部14は、符号化対象ピクチャが参照する可能性がある、予め定められた所定枚数分のピクチャを記憶し、記憶しているピクチャの枚数がその所定枚数を超えると、符号化順序が古いピクチャから順に破棄する。
さらに、記憶部14は、インター予測符号化されたPUのそれぞれについての動きベクトルを記憶する。
可変長符号化部26は、符号化対象のCTUに含まれる量子化係数を可変長符号化する。さらに、可変長符号化部26は、予測ブロックの作成に利用された動きベクトルなども可変長符号化する。そして可変長符号化部26は、その可変長符号化によって得られた符号化ビットを、HEVCなどに従って所定の順序に並べたビットストリームを出力する。なお、可変長符号化部26は、可変長符号化方式として、Context-based Adaptive Binary Arithmetic Coding(CABAC)といった算術符号化処理を用いることができる。あるいは、可変長符号化部26は、可変長符号化方式として、Context-based Adaptive Variable Length Coding (CAVLC)といったハフマン符号化処理を用いてもよい。
制御部(図示せず)は、出力されたビットストリームを所定の順序で結合し、HEVCなどに従ったヘッダ情報などを付加することで、符号化された動画像データを含むビットストリームを得る。
図6は、動画像符号化装置1による動画像符号化処理の動作フローチャートである。動画像符号化装置1はCTUごとに、下記の動作フローチャートに従って符号化する。
動きベクトル算出部11は、符号化対象ピクチャが、PピクチャまたはBピクチャといった、インター予測符号化モードが適用可能なピクチャである場合、符号化対象のCTUについて適用可能なPUのそれぞれについて、動きベクトルを算出する(ステップS201)。
符号化モード決定部12は、符号化対象のCTUに適用される、CUサイズ、PUサイズ、TUサイズ、及び符号化モードの組み合わせを決定する(ステップS202)。
符号化部13の予測ブロック生成部21は、決定した組み合わせに含まれる符号化モードに従って、PUごとに予測ブロックを算出する(ステップS203)。そして符号化部13の予測誤差信号算出部22は、TUごとに、TUとそのTUに対応する予測ブロック間で画素ごとに差分演算することで、予測誤差信号を算出する(ステップS204)。
その後、符号化部13の直交変換部23は、予測誤差信号をTUごとに直交変換して直交変換係数の組を算出する(ステップS205)。そして符号化部13の量子化部24は、各直交変換係数を量子化する(ステップS206)。
符号化部13の復号部25は、量子化係数を逆量子化及び逆直交変換して再生した予測誤差信号と予測ブロックを加算して参照ブロックを生成する(ステップS207)。そして復号部25は、その参照ブロックを記憶部14に記憶する。一方、符号化部13の可変長符号化部26は、各量子化係数を可変長符号化する(ステップS208)。そして動画像符号化装置1は、動画像符号化処理を終了する。
以上に説明してきたように、この動画像符号化装置は、符号化対象のブロックについて、そのブロックを分割した複数のサブブロックのそれぞれの複雑度が所定以上で、各サブブロック間の類似度が高いほど、そのブロックを分割され難くする。これにより、この動画像符号化装置は、符号化単位のサイズ、例えば、直交変換の単位のサイズを適切に決定できる。
なお、インター予測符号化モードが適用されるピクチャについては、着目するTUを分割した各サブTUの複雑度が高く、かつ、各サブTU間の類似度が高い場合でも、参照ピクチャ上に各サブTUと良好に一致する領域が存在することがある。このような場合には、着目するTUがサブTUに分割されたとしても、各サブTUについての予測誤差が非常に少なく、RD特性が比較的良好となることがある。そこで、符号化モード決定部12は、符号化モードとしてインター予測符号化モードが適用される場合には、offsetを常に0として、TUサイズを決定してもよい。
また、他の変形例によれば、動画像符号化装置は、直交変換の単位だけでなく、符号化モードを選択する単位を決定する際にも、上記の処理を適用してもよい。例えば、動画像符号化装置は、着目するCUとそのCUを4分割したサブCU間で符号化コストを比較する際に、各サブCUの複雑度と各サブCU間の類似度に応じて決定されるオフセットを、各サブCUの符号化コストの和に加えてもよい。
図7は、上記の実施形態またはその変形例による動画像符号化装置の各部の機能を実現するコンピュータプログラムが動作することにより、動画像符号化装置として動作するコンピュータの構成図である。
コンピュータ100は、ユーザインターフェース部101と、通信インターフェース部102と、記憶部103と、記憶媒体アクセス装置104と、プロセッサ105とを有する。プロセッサ105は、ユーザインターフェース部101、通信インターフェース部102、記憶部103及び記憶媒体アクセス装置104と、例えば、バスを介して接続される。
ユーザインターフェース部101は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。または、ユーザインターフェース部101は、タッチパネルディスプレイといった、入力装置と表示装置とが一体化された装置を有してもよい。そしてユーザインターフェース部101は、例えば、ユーザの操作に応じて、符号化する動画像データを選択する操作信号をプロセッサ105へ出力する。
通信インターフェース部102は、コンピュータ100を、動画像データを生成する装置、例えば、ビデオカメラと接続するための通信インターフェース及びその制御回路を有してもよい。そのような通信インターフェースは、例えば、High-Definition Multimedia Interface(HDMI)(登録商標)、またはUniversal Serial Bus(ユニバーサル・シリアル・バス、USB)とすることができる。
さらに、通信インターフェース部102は、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有してもよい。
この場合には、通信インターフェース部102は、通信ネットワークに接続された他の機器から、符号化する動画像データを取得し、そのデータをプロセッサ105へ渡す。また通信インターフェース部102は、プロセッサ105から受け取った、符号化済みの動画像データを通信ネットワークを介して他の機器へ出力してもよい。
記憶部103は、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリとを有する。そして記憶部103は、プロセッサ105上で実行される、動画像符号化処理を実行するためのコンピュータプログラム、及びこれらの処理の途中または結果として生成されるデータを記憶する。
記憶媒体アクセス装置104は、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体106にアクセスする装置である。記憶媒体アクセス装置104は、例えば、記憶媒体106に記憶されたプロセッサ105上で実行される、動画像符号化処理用のコンピュータプログラムを読み込み、プロセッサ105に渡す。
プロセッサ105は、上記の実施形態または変形例による動画像符号化処理用コンピュータプログラムを実行することにより、符号化動画像データを生成する。そしてプロセッサ105は、生成された符号化動画像データを記憶部103に保存し、または通信インターフェース部102を介して他の機器へ出力する。
なお、動画像符号化装置1の各部の機能をプロセッサ上で実行可能なコンピュータプログラムは、コンピュータによって読み取り可能な媒体に記録された形で提供されてもよい。ただし、そのような記録媒体には、搬送波は含まれない。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
以上説明した実施形態及びその変形例に関し、更に以下の付記を開示する。
(付記1)
動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、前記ブロックを符号化単位として前記ブロックを符号化する場合の第1の符号化コストが、前記サブブロックを前記符号化単位として前記ブロックを符号化する場合の前記複数のサブブロックのそれぞれの第2の符号化コストの和と前記オフセット値の合計以下である場合、前記符号化単位として前記ブロックを選択し、一方、前記第1の符号化コストが前記合計よりも大きい場合、前記符号化単位として前記サブブロックを選択する符号化モード決定部と、
前記ブロックを前記選択した符号化単位ごとに符号化する符号化部と、
を有する動画像符号化装置。
(付記2)
前記符号化モード決定部は、前記複数のサブブロックのそれぞれについて、当該サブブロックの前記第2の符号化コストを当該サブブロックの前記複雑度とする、付記1に記載の動画像符号化装置。
(付記3)
前記符号化モード決定部は、前記複数のサブブロックのそれぞれについて、当該サブブロックと当該サブブロックについての予測ブロックとの対応画素間の差分絶対値和を当該サブブロックの前記複雑度とする、付記1に記載の動画像符号化装置。
(付記4)
前記符号化モード決定部は、前記複数のサブブロックのそれぞれの前記複雑度の分散を前記類似度として算出する、付記2または3に記載の動画像符号化装置。
(付記5)
前記符号化モード決定部は、前記複数のサブブロックのそれぞれの前記複雑度のうちの最大値と最小値の差を前記類似度として算出する、付記2または3に記載の動画像符号化装置。
(付記6)
前記符号化モード決定部は、前記ブロックを符号化済みの他のピクチャを参照して符号化するインター予測符号化モードに基づいて符号化する場合、前記オフセットを0とし、一方、前記ブロックを前記ピクチャの符号化済みの領域を参照して符号化するイントラ予測符号化モードに基づいて符号化する場合、前記複数のサブブロックのそれぞれの前記複雑度及び各サブブロック間の前記類似度に応じて前記オフセット値を算出する、付記1〜5の何れかに記載の動画像符号化装置。
(付記7)
前記符号化部は、前記ブロックと、前記ブロックについての予測ブロック間の予測誤差を前記選択した符号化単位ごとに直交変換して前記符号化単位ごとに直交変換係数を算出し、前記符号化単位ごとの前記直交変換係数を符号化する、付記1〜6の何れかに記載の動画像符号化装置。
(付記8)
動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、
前記ブロックを符号化単位として前記ブロックを符号化する場合の第1の符号化コストが、前記サブブロックを前記符号化単位として前記ブロックを符号化する場合の前記複数のサブブロックのそれぞれの第2の符号化コストの和と前記オフセット値の合計以下である場合、前記符号化単位として前記ブロックを選択し、一方、前記第1の符号化コストが前記合計よりも大きい場合、前記符号化単位として前記サブブロックを選択し、
前記ブロックを前記選択した符号化単位ごとに符号化する、
ことを含む動画像符号化方法。
(付記9)
動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、
前記ブロックを符号化単位として前記ブロックを符号化する場合の第1の符号化コストが、前記サブブロックを前記符号化単位として前記ブロックを符号化する場合の前記複数のサブブロックのそれぞれの第2の符号化コストの和と前記オフセット値の合計以下である場合、前記符号化単位として前記ブロックを選択し、一方、前記第1の符号化コストが前記合計よりも大きい場合、前記符号化単位として前記サブブロックを選択し、
前記ブロックを前記選択した符号化単位ごとに符号化する、
ことをコンピュータに実行させるための動画像符号化用コンピュータプログラム。
1 動画像符号化装置
11 動きベクトル算出部
12 符号化モード決定部
13 符号化部
14 記憶部
21 予測ブロック生成部
22 予測誤差信号算出部
23 直交変換部
24 量子化部
25 復号部
26 可変長符号化部
100 コンピュータ
101 ユーザインターフェース部
102 通信インターフェース部
103 記憶部
104 記憶媒体アクセス装置
105 プロセッサ

Claims (7)

  1. 動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、前記ブロックを符号化単位として前記ブロックを符号化する場合の第1の符号化コストが、前記サブブロックを前記符号化単位として前記ブロックを符号化する場合の前記複数のサブブロックのそれぞれの第2の符号化コストの和と前記オフセット値の合計以下である場合、前記符号化単位として前記ブロックを選択し、一方、前記第1の符号化コストが前記合計よりも大きい場合、前記符号化単位として前記サブブロックを選択する符号化モード決定部と、
    前記ブロックを前記選択した符号化単位ごとに符号化する符号化部と、
    を有する動画像符号化装置。
  2. 前記符号化モード決定部は、前記複数のサブブロックのそれぞれについて、当該サブブロックの前記第2の符号化コストを当該サブブロックの前記複雑度とする、請求項1に記載の動画像符号化装置。
  3. 前記符号化モード決定部は、前記複数のサブブロックのそれぞれについて、当該サブブロックと当該サブブロックについての予測ブロックとの対応画素間の差分絶対値和を当該サブブロックの前記複雑度とする、請求項1に記載の動画像符号化装置。
  4. 前記符号化モード決定部は、前記複数のサブブロックのそれぞれの前記複雑度の分散を前記類似度として算出する、請求項2または3に記載の動画像符号化装置。
  5. 前記符号化モード決定部は、前記複数のサブブロックのそれぞれの前記複雑度のうちの最大値と最小値の差を前記類似度として算出する、請求項2または3に記載の動画像符号化装置。
  6. 動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、
    前記ブロックを符号化単位として前記ブロックを符号化する場合の第1の符号化コストが、前記サブブロックを前記符号化単位として前記ブロックを符号化する場合の前記複数のサブブロックのそれぞれの第2の符号化コストの和と前記オフセット値の合計以下である場合、前記符号化単位として前記ブロックを選択し、一方、前記第1の符号化コストが前記合計よりも大きい場合、前記符号化単位として前記サブブロックを選択し、
    前記ブロックを前記選択した符号化単位ごとに符号化する、
    ことを含む動画像符号化方法。
  7. 動画像データに含まれるピクチャ上のブロックを分割した、複数のサブブロックのそれぞれの複雑度及び各サブブロック間の類似度に応じたオフセット値を算出し、
    前記ブロックを符号化単位として前記ブロックを符号化する場合の第1の符号化コストが、前記サブブロックを前記符号化単位として前記ブロックを符号化する場合の前記複数のサブブロックのそれぞれの第2の符号化コストの和と前記オフセット値の合計以下である場合、前記符号化単位として前記ブロックを選択し、一方、前記第1の符号化コストが前記合計よりも大きい場合、前記符号化単位として前記サブブロックを選択し、
    前記ブロックを前記選択した符号化単位ごとに符号化する、
    ことをコンピュータに実行させるための動画像符号化用コンピュータプログラム。
JP2015094346A 2015-05-01 2015-05-01 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム Expired - Fee Related JP6459761B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015094346A JP6459761B2 (ja) 2015-05-01 2015-05-01 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015094346A JP6459761B2 (ja) 2015-05-01 2015-05-01 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2016213615A true JP2016213615A (ja) 2016-12-15
JP6459761B2 JP6459761B2 (ja) 2019-01-30

Family

ID=57552124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015094346A Expired - Fee Related JP6459761B2 (ja) 2015-05-01 2015-05-01 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6459761B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108777794A (zh) * 2018-06-25 2018-11-09 腾讯科技(深圳)有限公司 图像的编码方法和装置、存储介质、电子装置
WO2019037533A1 (zh) * 2017-08-22 2019-02-28 华为技术有限公司 一种处理视频数据的方法和装置
WO2019179523A1 (zh) * 2018-03-22 2019-09-26 北京航空航天大学 基于深度学习方法的块分割编码复杂度优化方法及装置
JP2020028067A (ja) * 2018-08-15 2020-02-20 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
CN113170133A (zh) * 2018-11-27 2021-07-23 Op方案有限责任公司 用于图片的基于块的空间活动度量
JP2022087262A (ja) * 2018-03-29 2022-06-09 日本放送協会 画像復号装置及び画像復号方法
CN116347077A (zh) * 2016-11-21 2023-06-27 松下电器(美国)知识产权公司 计算机可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010150486A1 (ja) * 2009-06-22 2010-12-29 パナソニック株式会社 画像符号化方法及び画像符号化装置
JP2012178768A (ja) * 2011-02-28 2012-09-13 Mega Chips Corp 符号化装置
JP2013121044A (ja) * 2011-12-07 2013-06-17 Hitachi Kokusai Electric Inc 画像符号化装置及び画像符号化方法
JP2013162395A (ja) * 2012-02-07 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像符号化装置及び画像符号化プログラム
JP2015211269A (ja) * 2014-04-24 2015-11-24 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2016208094A (ja) * 2015-04-15 2016-12-08 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010150486A1 (ja) * 2009-06-22 2010-12-29 パナソニック株式会社 画像符号化方法及び画像符号化装置
JP2012178768A (ja) * 2011-02-28 2012-09-13 Mega Chips Corp 符号化装置
JP2013121044A (ja) * 2011-12-07 2013-06-17 Hitachi Kokusai Electric Inc 画像符号化装置及び画像符号化方法
JP2013162395A (ja) * 2012-02-07 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像符号化装置及び画像符号化プログラム
JP2015211269A (ja) * 2014-04-24 2015-11-24 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2016208094A (ja) * 2015-04-15 2016-12-08 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116347077A (zh) * 2016-11-21 2023-06-27 松下电器(美国)知识产权公司 计算机可读介质
WO2019037533A1 (zh) * 2017-08-22 2019-02-28 华为技术有限公司 一种处理视频数据的方法和装置
WO2019179523A1 (zh) * 2018-03-22 2019-09-26 北京航空航天大学 基于深度学习方法的块分割编码复杂度优化方法及装置
JP2022087262A (ja) * 2018-03-29 2022-06-09 日本放送協会 画像復号装置及び画像復号方法
CN115022633A (zh) * 2018-03-29 2022-09-06 日本放送协会 图像编码装置、图像解码装置以及程序
JP7309959B2 (ja) 2018-03-29 2023-07-18 日本放送協会 画像復号装置及び画像復号方法
JP2023123811A (ja) * 2018-03-29 2023-09-05 日本放送協会 画像復号装置及び画像復号方法
JP7522270B2 (ja) 2018-03-29 2024-07-24 日本放送協会 画像復号装置及び画像復号方法
JP2024133699A (ja) * 2018-03-29 2024-10-02 日本放送協会 画像復号装置及び画像復号方法
CN108777794B (zh) * 2018-06-25 2022-02-08 腾讯科技(深圳)有限公司 图像的编码方法和装置、存储介质、电子装置
CN108777794A (zh) * 2018-06-25 2018-11-09 腾讯科技(深圳)有限公司 图像的编码方法和装置、存储介质、电子装置
JP2023053272A (ja) * 2018-08-15 2023-04-12 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
JP2020028067A (ja) * 2018-08-15 2020-02-20 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
JP7483964B2 (ja) 2018-08-15 2024-05-15 日本放送協会 画像符号化装置、画像復号装置、及びプログラム
CN113170133A (zh) * 2018-11-27 2021-07-23 Op方案有限责任公司 用于图片的基于块的空间活动度量

Also Published As

Publication number Publication date
JP6459761B2 (ja) 2019-01-30

Similar Documents

Publication Publication Date Title
KR102442270B1 (ko) 인트라 예측 방법 및 그 장치
KR102462009B1 (ko) 영상 부호화 방법 및 컴퓨터로 읽을 수 있는 기록 매체
JP6459761B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
EP2622577B1 (en) Video coding using intra-prediction
JP5590133B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
JP6244864B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP7646258B2 (ja) 適応的な数の領域を伴う幾何学的分割のための形状適応離散コサイン変換
KR20120116936A (ko) 영상 블록 코딩 및 재구성 방법
KR101973571B1 (ko) 영상 변환 부호화/복호화 방법 및 장치
US10638155B2 (en) Apparatus for video encoding, apparatus for video decoding, and non-transitory computer-readable storage medium
CN111316642B (zh) 信令图像编码和解码划分信息的方法和装置
KR102513756B1 (ko) 이미지 인코딩 방법, 디코딩 방법, 인코더, 디코더 및 저장매체
KR101912769B1 (ko) 그래프 템플릿으로부터 유도된 변환을 이용하여 비디오 신호를 디코딩/인코딩하는 방법 및 장치
CA3141303A1 (en) Image encoding/decoding method and device
JP7156471B2 (ja) 動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラム
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP6528635B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP6248783B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2017073602A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2012081895A1 (ko) 인트라 예측 방법 및 그 장치
JP6904156B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
US11218705B2 (en) Information processing device and video encoding method
JP2018110313A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
JP6435822B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2011199685A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181217

R150 Certificate of patent or registration of utility model

Ref document number: 6459761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees