JP2015027022A

JP2015027022A - 動画像符号化装置、動画像符号化方法、およびプログラム

Info

Publication number: JP2015027022A
Application number: JP2013156514A
Authority: JP
Inventors: 知伸吉野; Tomonobu Yoshino; 内藤　整; Hitoshi Naito; 整内藤
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2013-07-29
Filing date: 2013-07-29
Publication date: 2015-02-05

Abstract

【課題】主観品質の低下の抑制しつつ、高い符号化性能を実現すること。【解決手段】動画像符号化装置は、画素値勾配評価部１１、エッジ解析部１２、および分割決定部１３を備える。画素値勾配評価部１１は、入力画像ａの各画素の画素値勾配を算出する。エッジ解析部１２は、画素値勾配評価部１１により算出された各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出する。分割決定部１３は、エッジ解析部１２によりオブジェクトの境界を含むと検出された符号化処理単位ブロックについて、画素値勾配評価部１１により算出された各画素の画素値勾配に基づいて四分木構造の分割サイズを決定する。【選択図】図２

Description

本発明は、動画像符号化装置、動画像符号化方法、およびプログラムに関する。

非特許文献１には、符号化処理ブロックごとに映像圧縮符号化処理を行う手法が示されている。また、非特許文献２には、符号化処理ブロックに関して、ブロックサイズの上限を予め定めておき、上限のブロックサイズ（Coding Tree Unit ；ＣＴＵ）に対して、四分木構造に従って符号化処理ブロックを分割する手法（図３参照）が示されている。

非特許文献２に示されている手法では、非特許文献１に示されている手法と比べて、ブロックサイズの大きい符号化処理ブロックを許容することで、ブロックごとに付与される制御情報量を少なくして、符号化性能を向上させることができる。特に、高解像度かつ低ビットレートでの符号化では、非特許文献２に示されている手法では、非特許文献１に示されている手法と比べて、高い符号化性能を実現できる。

符号化処理ブロックを分割する際には、例えば、ＲＤ最適化法が用いられる（例えば、非特許文献３参照）。このＲＤ最適化法では、符号化による歪みおよび発生符号量をコスト関数で評価して、符号化性能を判断する。コスト関数については、発生符号量に対して量子化の粗さに応じた重み付けを行い、量子化が粗くなるに従って（ビットレートが低くなるに従って）、大きな重み付けを行う。

Joint Video Team(JVT) of ISO/IEC MPEG and ITU-T VCEG, "Text of ISO/IEC 14496-10 Advanced Video Coding," July 2004. "High Efficiency Video Coding (HEVC) text specification draft10," JCT-VC 12th meeting, JCTVC-L1003 v34, Jan. 2013. G. Sullivan, T. Wiegand, "Rate-distortion optimization for video compression," IEEE Signal Processing Magazine, Vol. 15, issue 6, p74-90, Nov. 1998.

ＲＤ最適化法を用いて四分木構造の分割を行うことで、低ビットレート符号化時において、大きなブロックが採用されやすくなる。しかし、オブジェクトの境界を含むＣＴＵを分割する場合に大きなブロックが採用されると、エッジ成分の欠損や、不適切な動き参照によるエッジ近傍でのノイズの発生につながってしまい、主観品質の著しい低下を招いてしまっていた。

また、インター符号化ピクチャでは、ＲＤコスト関数で発生符号量に大きな重み（ラグランジュ乗数）が設定されるため、大きなブロックが採用されやすくなる。特に低ビットレート符号化では、オブジェクトの境界近傍でも大きなブロックが採用されやすくなる。オブジェクトが動いている場合には、オブジェクトの境界近傍の大きなブロックに、オブジェクトの背後から出現するオクルージョン領域が含まれることになるので、オクルージョン領域で主観品質の著しい低下を招いてしまっていた。

そこで、本発明は、上述の課題に鑑みてなされたものであり、主観品質の低下の抑制しつつ、高い符号化性能を実現することを目的とする。

本発明は、上記の課題を解決するために、以下の事項を提案している。
（１）本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置（例えば、図１の動画像符号化装置１に相当）であって、前記符号化処理単位ブロックごとに画素値の特徴量（例えば、後述の画素値勾配に相当）を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類（例えば、後述の分割回数（ＣＵｄｅｐｔｈ）ｂに相当）を推定することを特徴とする動画像符号化装置を提案している。

ここで、オブジェクトの境界を境にして、画素値の特徴量が大きく変化する。そこで、この発明によれば、互いに隣接する符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、これら符号化処理単位ブロックに適した分割種類を決定することとした。このため、オブジェクトの境界を考慮して符号化処理単位ブロックを木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。

（２）本発明は、（１）の動画像符号化装置について、前記画素値の特徴量として、入力画像の各画素の画素値勾配を算出する画素値勾配評価手段（例えば、図２の画素値勾配評価部１１に相当）と、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出するエッジ解析手段（例えば、図２のエッジ解析部１２に相当）と、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックについて、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて木構造の分割サイズを決定する分割決定手段（例えば、図２の分割決定部１３に相当）と、を備えることを特徴とする動画像符号化装置を提案している。

この発明によれば、（１）の動画像符号化装置において、入力画像の各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出し、検出した符号化処理単位ブロックについての木構造の分割サイズを、各画素の画素値勾配に基づいて決定することとした。このため、オブジェクトの境界を含む符号化処理単位ブロックについて、オブジェクトの境界を考慮して木構造に従って分割することができる。

（３）本発明は、（２）の動画像符号化装置について、前記画素値勾配評価手段は、入力画像の各画素の画素値に対してｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする動画像符号化装置を提案している。

この発明によれば、動画像符号化装置において、入力画像の各画素の画素値に対してｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、各画素の画素値勾配を算出することとした。このため、各画素の画素値勾配を適切に算出することができる。

（４）本発明は、（２）の動画像符号化装置について、前記画素値勾配評価手段は、入力画像の各画素の画素値に対してローパスフィルタを施した後に、ｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする動画像符号化装置を提案している。

この発明によれば、（２）の動画像符号化装置において、入力画像の各画素の画素値に対してローパスフィルタを施した後に、ｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、各画素の画素値勾配を算出することとした。このため、各画素の画素値勾配を適切に算出することができる。

（５）本発明は、（２）から（４）のいずれかの動画像符号化装置について、前記エッジ解析手段は、符号化処理単位ブロック内の各画素の画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であることと、隣接する符号化処理単位ブロックとの画素値勾配の絶対値の平均値または分散値の差分が予め定められた閾値以上であることと、の少なくともいずれかを満たす符号化処理単位ブロックを、前記オブジェクトの境界を含む符号化処理単位ブロックとして検出することを特徴とする動画像符号化装置を提案している。

この発明によれば、（２）から（４）のいずれかの動画像符号化装置において、符号化処理単位ブロック内の各画素の画素値勾配の絶対値の平均値または分散値が閾値以上であることと、隣接する符号化処理単位ブロックとの画素値勾配の絶対値の平均値または分散値の差分が閾値以上であることと、の少なくともいずれかを満たす符号化処理単位ブロックを、オブジェクトの境界を含む符号化処理単位ブロックとして検出することとした。このため、オブジェクトの境界を含む符号化処理単位ブロックを、適切に検出することができる。

（６）本発明は、（２）から（５）のいずれかの動画像符号化装置について、前記分割決定手段は、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が、予め定められた閾値より大きいブロックが存在すれば、当該分割前のブロックを分割可能と判断することを特徴とする動画像符号化装置を提案している。

この発明によれば、（２）から（５）のいずれかの動画像符号化装置において、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が閾値より大きいブロックが存在すれば、分割前のブロックを分割可能と判断することとした。このため、どのブロックにオブジェクトの境界が含まれており、分割可能なのかを、適切に判断することができる。

（７）本発明は、（２）から（６）のいずれかの動画像符号化装置について、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて量子化パラメータを決定する量子化パラメータ決定手段を備えることを特徴とする動画像符号化装置を提案している。

この発明によれば、（２）から（６）のいずれかの動画像符号化装置において、ブロックごとに、各画素の画素値勾配に基づいて量子化パラメータを決定することとした。このため、ブロックごとに適切な量子化パラメータを決定することができる。

（８）本発明は、（７）の動画像符号化装置について、前記量子化パラメータ決定手段は、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であるか否かにより、前記量子化パラメータを決定することを特徴とする動画像符号化装置を提案している。

この発明によれば、（７）の動画像符号化装置において、ブロックごとに、画素値勾配の絶対値の平均値または分散値が閾値以上であるか否かにより、量子化パラメータを決定することとした。このため、ブロックごとにさらに適切な量子化パラメータを決定することができる。

（９）本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置（例えば、図１の動画像符号化装置１に相当）における動画像符号化方法であって、前記符号化処理単位ブロックごとに画素値の特徴量（例えば、後述の画素値勾配に相当）を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類（例えば、後述の分割回数（ＣＵｄｅｐｔｈ）ｂに相当）を推定することを特徴とする動画像符号化方法を提案している。

この発明によれば、互いに隣接する符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、これら符号化処理単位ブロックに適した分割種類を決定することとした。このため、オブジェクトの境界を考慮して符号化処理単位ブロックを木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。

（１０）本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置（例えば、図１の動画像符号化装置１に相当）における動画像符号化方法を、コンピュータに実行させるためのプログラムであって、前記符号化処理単位ブロックごとに画素値の特徴量（例えば、後述の画素値勾配に相当）を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類（例えば、後述の分割回数（ＣＵｄｅｐｔｈ）ｂに相当）を推定するためのプログラムを提案している。

本発明によれば、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。

本発明の一実施形態に係る動画像符号化装置のブロック図である。前記実施形態に係る動画像符号化装置が備える画質制御部のブロック図である。四分木構造に従った符号化処理ブロックの分割について説明するための図である。

以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素などとの置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。

［動画像符号化装置１の構成および動作］
図１は、本発明の一実施形態に係る動画像符号化装置１のブロック図である。動画像符号化装置１は、符号化処理単位ブロックを四分木構造に従って分割することを許容し、分割したブロックごとに量子化パラメータを制御可能な動画像符号化装置である。この動画像符号化装置１は、画質制御部１０、映像分割部２０、予測値生成部３０、ＤＣＴ／量子化部４０、エントロピー符号化部５０、逆ＤＣＴ／逆量子化部６０、およびローカルメモリ７０を備える。

画質制御部１０は、入力画像ａを入力とする。この画質制御部１０は、入力画像ａの画素値に関する画素値勾配の評価値に基づいて、オブジェクトの境界を含むＣＴＵを検出し、そのＣＴＵで許容する分割回数（ＣＵｄｅｐｔｈ）ｂを求めて出力する。また、入力画像ａの画素値に関する画素値勾配の評価値に基づいて、ＣＵ（ＣｏｄｉｎｇＵｎｉｔ）ごとに、量子化パラメータ（ＱＰ）に対する差分の情報（ΔＱＰ）を決定し、量子化パラメータに対する差分情報ｃとして出力する。なお、量子化パラメータ（ＱＰ）に対する差分の情報（ΔＱＰ）とは、処理スライスにおける量子化パラメータ（ＱＰ）と、そのＣＵで用いられる量子化パラメータと、の差分のことである。

図２は、画質制御部１０のブロック図である。画質制御部１０は、画素値勾配評価部１１、エッジ解析部１２、分割決定部１３、および量子化パラメータ決定部１４を備える。

画素値勾配評価部１１は、入力画像ａを入力とする。この画素値勾配評価部１１は、入力画像ａの全画素値について画素値勾配を算出し、各画素の画素値勾配ｊとして出力する。画素値勾配の算出は、例えば、入力画像ａの全画素値に対して、ローパスフィルタを施した後に、ｓｏｂｅｌフィルタやラプラシアンフィルタなどを適用することで、実現できる。

エッジ解析部１２は、各画素の画素値勾配ｊを入力とする。このエッジ解析部１２は、各画素の画素値勾配ｊに基づいて、オブジェクトの境界を含むＣＴＵを検出する。オブジェクトの境界を含むＣＴＵの検出では、例えば、まず、各ＣＴＵ内の各画素の画素値勾配の絶対値の平均値または分散値を算出し、算出した平均値または分散値が予め定められた閾値以上であるか否かを判別することにより、各ＣＴＵの画素値勾配の大小を判別する。次に、同一のオブジェクトが複数のＣＴＵにまたがって存在する場合にはこれらＣＴＵのそれぞれの画素値勾配の特徴が類似するという特徴を考慮して、互いに隣接するＣＴＵ同士の画素値勾配の絶対値の平均値または分散値の差分が予め定められた閾値以上であるか否かを判別する。次に、ＣＴＵ内の画素値の絶対値の平均値または分散値が閾値以上で、かつ、隣接するＣＴＵとの画素値勾配の絶対値の平均値または分散値の差分が閾値以上であるＣＴＵを、オブジェクトの境界を含むＣＴＵとして検出し、検出したＣＴＵの座標を、オブジェクトの境界を含むＣＴＵの座標ｋとして出力する。

分割決定部１３は、各画素の画素値勾配ｊと、オブジェクトの境界を含むＣＴＵの座標ｋと、を入力とする。この分割決定部１３は、オブジェクトの境界を含むＣＴＵについて、四分木構造に基づく四分割の可否を判断する。具体的には、まず、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値を算出する。次に、算出した差分の絶対値が予め定められた閾値より大きいブロックが存在すれば、分割前のブロックを分割可能と判断する。そして、分割不可能と判断するか、予め定められた分割回数の最大値まで、上述の差分の絶対値の算出と、上述の分割可否の判断と、を繰り返し、分割サイズが小さい方からＮ階層（ただし、ＮはＮ＞０を満たす整数）の四分木構造表現までを、オブジェクトの境界を含むＣＴＵの座標ｋで示されるＣＴＵで許容する分割回数（ＣＵｄｅｐｔｈ）ｂとして出力する。

量子化パラメータ決定部１４は、各画素の画素値勾配ｊと、オブジェクトの境界を含むＣＴＵの座標ｋと、分割回数ｂと、を入力とする。また、量子化パラメータ決定部１４には、処理スライスにおける量子化パラメータ（ＱＰ）も入力される（図示省略）。この量子化パラメータ決定部１４は、分割回数ｂに従って、ＣＵごとに画素値勾配の絶対値の平均値または分散値を算出し、閾値判定に基づいてＣＵごとに量子化パラメータに対する差分情報ｃを決定して出力する。

図１に戻って、映像分割部２０は、入力画像ａと、分割回数ｂと、を入力とする。この映像分割部２０は、まず、入力画像ａをＣＴＵに分割する。次に、ＣＴＵに分割された各画像について、分割回数ｂで示される回数を上限としてＲＤ最適化法により分割回数を決定し、決定した分割回数だけ四分木構造で分割し、分割された入力画像ｄとして出力する。

予測値生成部３０は、分割された入力画像ｄと、ローカルメモリ７０から供給される後述の符号化済み画像ｉと、を入力とする。この予測値生成部３０は、イントラ予測やインター予測などのそれぞれの予測方法に基づいて予測値を生成し、最も高い符号化性能の期待される予測方法による予測値を、予測値ｅとして出力する。

ＤＣＴ／量子化部４０は、予測残差信号と、量子化パラメータに対する差分情報ｃと、を入力とする。予測残差信号とは、分割された入力画像ｄと、予測値ｅと、の差分信号のことである。このＤＣＴ／量子化部４０は、予測残差信号に対して直交変換処理を行い、この直交変換処理により得られた変換係数について量子化処理を行って、量子化された変換係数ｆを出力する。なお、量子化処理では、量子化パラメータに対する差分情報ｃとしてのΔＱＰだけ処理スライスの量子化パラメータ（ＱＰ）に対して変化させた量子化パラメータ値を、用いる。

エントロピー符号化部５０は、量子化された変換係数ｆを入力とする。このエントロピー符号化部５０は、量子化された変換係数ｆに対してエントロピー符号化処理を行って、その結果について、符号化データへの記述規則（符号化シンタックス）に従って符号化データに記述し、符号化データｇとして出力する。

逆ＤＣＴ／逆量子化部６０は、量子化された変換係数ｆと、量子化パラメータに対する差分情報ｃと、を入力とする。この逆ＤＣＴ／逆量子化部６０は、量子化された変換係数ｆについて逆量子化処理を行い、この逆量子化処理により得られた変換係数に対して逆変換処理を行って、逆直交変換された変換係数ｈとして出力する。なお、逆量子化処理では、量子化パラメータに対する差分情報ｃとしてのΔＱＰだけ処理スライスの量子化パラメータ（ＱＰ）に対して変化させた量子化パラメータ値を、用いる。

ローカルメモリ７０は、フィルタ処理済みのローカルデコード画像である符号化済み画像ｉを入力とする。このローカルメモリ７０は、入力された符号化済み画像ｉを蓄積する。そして、次の符号化処理単位ブロック以降において過去の符号化済み画像ｉを参照する必要がある場合に、適宜、予測値生成部３０に符号化済み画像ｉを供給する。

以上の動画像符号化装置１によれば、以下の効果を奏することができる。

動画像符号化装置１は、互いに隣接するＣＴＵ同士の画素値勾配の絶対値の平均値または分散値の差分に基づいて、これらＣＴＵに適した分割種類を決定する。このため、オブジェクトの境界を考慮してＣＴＵを四分木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。

また、動画像符号化装置１は、入力画像ａの各画素の画素値勾配に基づいて、オブジェクトの境界を含むＣＴＵを検出し、検出したＣＴＵについての四分木構造の分割サイズを、各画素の画素値勾配に基づいて決定する。このため、オブジェクトの境界を含むＣＴＵについて、オブジェクトの境界を考慮して四分木構造に従って分割することができる。

また、動画像符号化装置１は、入力画像ａの各画素の画素値に対してローパスフィルタを施した後に、ｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、各画素の画素値勾配を算出する。このため、各画素の画素値勾配を適切に算出することができる。

また、動画像符号化装置１は、ＣＴＵ内の各画素の画素値勾配の絶対値の平均値または分散値が閾値以上であることと、隣接するＣＴＵとの画素値勾配の絶対値の平均値または分散値の差分が閾値以上であることと、の少なくともいずれかを満たすＣＴＵを、オブジェクトの境界を含むＣＴＵとして検出する。このため、オブジェクトの境界を含むＣＴＵを、適切に検出することができる。

また、動画像符号化装置１は、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が閾値より大きいブロックが存在すれば、分割前のブロックを分割可能と判断する。このため、どのブロックにオブジェクトの境界が含まれており、分割可能なのかを、適切に判断することができる。

また、動画像符号化装置１は、ブロックごとに、画素値勾配の絶対値の平均値または分散値が閾値以上であるか否かにより、量子化パラメータを決定する。このため、ブロックごとにさらに適切な量子化パラメータを決定することができる。

なお、本発明の動画像符号化装置１の処理を、コンピュータ読み取り可能な非一時的な記録媒体に記録し、この記録媒体に記録されたプログラムを動画像符号化装置１に読み込ませ、実行することによって、本発明を実現できる。

ここで、上述の記録媒体には、例えば、ＥＰＲＯＭやフラッシュメモリといった不揮発性のメモリ、ハードディスクといった磁気ディスク、ＣＤ−ＲＯＭなどを適用できる。また、この記録媒体に記録されたプログラムの読み込みおよび実行は、動画像符号化装置１に設けられたプロセッサによって行われる。

また、上述のプログラムは、このプログラムを記憶装置などに格納した動画像符号化装置１から、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク（通信網）や電話回線などの通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。

また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を動画像符号化装置１にすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル（差分プログラム）であってもよい。

以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。

例えば、上述の実施形態では、符号化処理ブロックを木構造に基づいて分割する例として、非特許文献２に示されている四分木構造の分割を示した。しかし、これに限らず、二分木構造といった任意の分岐数に基づく木構造の分割に、本発明は適用することができる。

また、上述の実施形態では、画質制御部１０には入力画像ａが入力されるものとしたが、これに限らず、例えば入力画像ａの構造成分のみで構成される画像が入力されてもよい。これによれば、画質制御部１０によるオブジェクトの境界の検出性能を向上させることができ、その結果、主観品質をさらに向上させることができる。なお、入力画像ａから構造成分を抽出する手法としては、例えばＴｏｔａｌＶａｒｉａｔｉｏｎを適用することができる。

１・・・動画像符号化装置
１０・・・画質制御部
１１・・・画素値勾配評価部
１２・・・エッジ解析部
１３・・・分割決定部
１４・・・量子化パラメータ決定部
２０・・・映像分割部
３０・・・予測値生成部
４０・・・ＤＣＴ／量子化部
５０・・・エントロピー符号化部
６０・・・逆ＤＣＴ／逆量子化部
７０・・・ローカルメモリ

Claims

符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置であって、
前記符号化処理単位ブロックごとに画素値の特徴量を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類を推定することを特徴とする動画像符号化装置。
前記画素値の特徴量として、入力画像の各画素の画素値勾配を算出する画素値勾配評価手段と、
前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出するエッジ解析手段と、
前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックについて、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて木構造の分割サイズを決定する分割決定手段と、を備えることを特徴とする請求項１に記載の動画像符号化装置。
前記画素値勾配評価手段は、入力画像の各画素の画素値に対してｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする請求項２に記載の動画像符号化装置。
前記画素値勾配評価手段は、入力画像の各画素の画素値に対してローパスフィルタを施した後に、ｓｏｂｅｌフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする請求項２に記載の動画像符号化装置。
前記エッジ解析手段は、
符号化処理単位ブロック内の各画素の画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であることと、
隣接する符号化処理単位ブロックとの画素値勾配の絶対値の平均値または分散値の差分が予め定められた閾値以上であることと、
の少なくともいずれかを満たす符号化処理単位ブロックを、前記オブジェクトの境界を含む符号化処理単位ブロックとして検出することを特徴とする請求項２から４のいずれかに記載の動画像符号化装置。
前記分割決定手段は、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が、予め定められた閾値より大きいブロックが存在すれば、当該分割前のブロックを分割可能と判断することを特徴とする請求項２から５のいずれかに記載の動画像符号化装置。
前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて量子化パラメータを決定する量子化パラメータ決定手段を備えることを特徴とする請求項２から６のいずれかに記載の動画像符号化装置。
前記量子化パラメータ決定手段は、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であるか否かにより、前記量子化パラメータを決定することを特徴とする請求項７に記載の動画像符号化装置。
符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置における動画像符号化方法であって、
前記符号化処理単位ブロックごとに画素値の特徴量を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類を推定することを特徴とする動画像符号化方法。
符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置における動画像符号化方法を、コンピュータに実行させるためのプログラムであって、
前記符号化処理単位ブロックごとに画素値の特徴量を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類を推定するためのプログラム。