JP2015027022A - 動画像符号化装置、動画像符号化方法、およびプログラム - Google Patents
動画像符号化装置、動画像符号化方法、およびプログラム Download PDFInfo
- Publication number
- JP2015027022A JP2015027022A JP2013156514A JP2013156514A JP2015027022A JP 2015027022 A JP2015027022 A JP 2015027022A JP 2013156514 A JP2013156514 A JP 2013156514A JP 2013156514 A JP2013156514 A JP 2013156514A JP 2015027022 A JP2015027022 A JP 2015027022A
- Authority
- JP
- Japan
- Prior art keywords
- pixel value
- pixel
- value
- encoding
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】主観品質の低下の抑制しつつ、高い符号化性能を実現すること。【解決手段】動画像符号化装置は、画素値勾配評価部11、エッジ解析部12、および分割決定部13を備える。画素値勾配評価部11は、入力画像aの各画素の画素値勾配を算出する。エッジ解析部12は、画素値勾配評価部11により算出された各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出する。分割決定部13は、エッジ解析部12によりオブジェクトの境界を含むと検出された符号化処理単位ブロックについて、画素値勾配評価部11により算出された各画素の画素値勾配に基づいて四分木構造の分割サイズを決定する。【選択図】図2
Description
本発明は、動画像符号化装置、動画像符号化方法、およびプログラムに関する。
非特許文献1には、符号化処理ブロックごとに映像圧縮符号化処理を行う手法が示されている。また、非特許文献2には、符号化処理ブロックに関して、ブロックサイズの上限を予め定めておき、上限のブロックサイズ(Coding Tree Unit ; CTU)に対して、四分木構造に従って符号化処理ブロックを分割する手法(図3参照)が示されている。
非特許文献2に示されている手法では、非特許文献1に示されている手法と比べて、ブロックサイズの大きい符号化処理ブロックを許容することで、ブロックごとに付与される制御情報量を少なくして、符号化性能を向上させることができる。特に、高解像度かつ低ビットレートでの符号化では、非特許文献2に示されている手法では、非特許文献1に示されている手法と比べて、高い符号化性能を実現できる。
符号化処理ブロックを分割する際には、例えば、RD最適化法が用いられる(例えば、非特許文献3参照)。このRD最適化法では、符号化による歪みおよび発生符号量をコスト関数で評価して、符号化性能を判断する。コスト関数については、発生符号量に対して量子化の粗さに応じた重み付けを行い、量子化が粗くなるに従って(ビットレートが低くなるに従って)、大きな重み付けを行う。
Joint Video Team(JVT) of ISO/IEC MPEG and ITU-T VCEG, "Text of ISO/IEC 14496-10 Advanced Video Coding," July 2004.
"High Efficiency Video Coding (HEVC) text specification draft10," JCT-VC 12th meeting, JCTVC-L1003 v34, Jan. 2013.
G. Sullivan, T. Wiegand, "Rate-distortion optimization for video compression," IEEE Signal Processing Magazine, Vol. 15, issue 6, p74-90, Nov. 1998.
RD最適化法を用いて四分木構造の分割を行うことで、低ビットレート符号化時において、大きなブロックが採用されやすくなる。しかし、オブジェクトの境界を含むCTUを分割する場合に大きなブロックが採用されると、エッジ成分の欠損や、不適切な動き参照によるエッジ近傍でのノイズの発生につながってしまい、主観品質の著しい低下を招いてしまっていた。
また、インター符号化ピクチャでは、RDコスト関数で発生符号量に大きな重み(ラグランジュ乗数)が設定されるため、大きなブロックが採用されやすくなる。特に低ビットレート符号化では、オブジェクトの境界近傍でも大きなブロックが採用されやすくなる。オブジェクトが動いている場合には、オブジェクトの境界近傍の大きなブロックに、オブジェクトの背後から出現するオクルージョン領域が含まれることになるので、オクルージョン領域で主観品質の著しい低下を招いてしまっていた。
そこで、本発明は、上述の課題に鑑みてなされたものであり、主観品質の低下の抑制しつつ、高い符号化性能を実現することを目的とする。
本発明は、上記の課題を解決するために、以下の事項を提案している。
(1) 本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置(例えば、図1の動画像符号化装置1に相当)であって、前記符号化処理単位ブロックごとに画素値の特徴量(例えば、後述の画素値勾配に相当)を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類(例えば、後述の分割回数(CU depth)bに相当)を推定することを特徴とする動画像符号化装置を提案している。
(1) 本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置(例えば、図1の動画像符号化装置1に相当)であって、前記符号化処理単位ブロックごとに画素値の特徴量(例えば、後述の画素値勾配に相当)を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類(例えば、後述の分割回数(CU depth)bに相当)を推定することを特徴とする動画像符号化装置を提案している。
ここで、オブジェクトの境界を境にして、画素値の特徴量が大きく変化する。そこで、この発明によれば、互いに隣接する符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、これら符号化処理単位ブロックに適した分割種類を決定することとした。このため、オブジェクトの境界を考慮して符号化処理単位ブロックを木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。
(2) 本発明は、(1)の動画像符号化装置について、前記画素値の特徴量として、入力画像の各画素の画素値勾配を算出する画素値勾配評価手段(例えば、図2の画素値勾配評価部11に相当)と、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出するエッジ解析手段(例えば、図2のエッジ解析部12に相当)と、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックについて、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて木構造の分割サイズを決定する分割決定手段(例えば、図2の分割決定部13に相当)と、を備えることを特徴とする動画像符号化装置を提案している。
この発明によれば、(1)の動画像符号化装置において、入力画像の各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出し、検出した符号化処理単位ブロックについての木構造の分割サイズを、各画素の画素値勾配に基づいて決定することとした。このため、オブジェクトの境界を含む符号化処理単位ブロックについて、オブジェクトの境界を考慮して木構造に従って分割することができる。
(3) 本発明は、(2)の動画像符号化装置について、前記画素値勾配評価手段は、入力画像の各画素の画素値に対してsobelフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする動画像符号化装置を提案している。
この発明によれば、動画像符号化装置において、入力画像の各画素の画素値に対してsobelフィルタまたはラプラシアンフィルタを適用して、各画素の画素値勾配を算出することとした。このため、各画素の画素値勾配を適切に算出することができる。
(4) 本発明は、(2)の動画像符号化装置について、前記画素値勾配評価手段は、入力画像の各画素の画素値に対してローパスフィルタを施した後に、sobelフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)の動画像符号化装置において、入力画像の各画素の画素値に対してローパスフィルタを施した後に、sobelフィルタまたはラプラシアンフィルタを適用して、各画素の画素値勾配を算出することとした。このため、各画素の画素値勾配を適切に算出することができる。
(5) 本発明は、(2)から(4)のいずれかの動画像符号化装置について、前記エッジ解析手段は、符号化処理単位ブロック内の各画素の画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であることと、隣接する符号化処理単位ブロックとの画素値勾配の絶対値の平均値または分散値の差分が予め定められた閾値以上であることと、の少なくともいずれかを満たす符号化処理単位ブロックを、前記オブジェクトの境界を含む符号化処理単位ブロックとして検出することを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)から(4)のいずれかの動画像符号化装置において、符号化処理単位ブロック内の各画素の画素値勾配の絶対値の平均値または分散値が閾値以上であることと、隣接する符号化処理単位ブロックとの画素値勾配の絶対値の平均値または分散値の差分が閾値以上であることと、の少なくともいずれかを満たす符号化処理単位ブロックを、オブジェクトの境界を含む符号化処理単位ブロックとして検出することとした。このため、オブジェクトの境界を含む符号化処理単位ブロックを、適切に検出することができる。
(6) 本発明は、(2)から(5)のいずれかの動画像符号化装置について、前記分割決定手段は、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が、予め定められた閾値より大きいブロックが存在すれば、当該分割前のブロックを分割可能と判断することを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)から(5)のいずれかの動画像符号化装置において、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が閾値より大きいブロックが存在すれば、分割前のブロックを分割可能と判断することとした。このため、どのブロックにオブジェクトの境界が含まれており、分割可能なのかを、適切に判断することができる。
(7) 本発明は、(2)から(6)のいずれかの動画像符号化装置について、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて量子化パラメータを決定する量子化パラメータ決定手段を備えることを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)から(6)のいずれかの動画像符号化装置において、ブロックごとに、各画素の画素値勾配に基づいて量子化パラメータを決定することとした。このため、ブロックごとに適切な量子化パラメータを決定することができる。
(8) 本発明は、(7)の動画像符号化装置について、前記量子化パラメータ決定手段は、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であるか否かにより、前記量子化パラメータを決定することを特徴とする動画像符号化装置を提案している。
この発明によれば、(7)の動画像符号化装置において、ブロックごとに、画素値勾配の絶対値の平均値または分散値が閾値以上であるか否かにより、量子化パラメータを決定することとした。このため、ブロックごとにさらに適切な量子化パラメータを決定することができる。
(9) 本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置(例えば、図1の動画像符号化装置1に相当)における動画像符号化方法であって、前記符号化処理単位ブロックごとに画素値の特徴量(例えば、後述の画素値勾配に相当)を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類(例えば、後述の分割回数(CU depth)bに相当)を推定することを特徴とする動画像符号化方法を提案している。
この発明によれば、互いに隣接する符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、これら符号化処理単位ブロックに適した分割種類を決定することとした。このため、オブジェクトの境界を考慮して符号化処理単位ブロックを木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。
(10) 本発明は、符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置(例えば、図1の動画像符号化装置1に相当)における動画像符号化方法を、コンピュータに実行させるためのプログラムであって、前記符号化処理単位ブロックごとに画素値の特徴量(例えば、後述の画素値勾配に相当)を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類(例えば、後述の分割回数(CU depth)bに相当)を推定するためのプログラムを提案している。
この発明によれば、互いに隣接する符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、これら符号化処理単位ブロックに適した分割種類を決定することとした。このため、オブジェクトの境界を考慮して符号化処理単位ブロックを木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。
本発明によれば、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素などとの置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
[動画像符号化装置1の構成および動作]
図1は、本発明の一実施形態に係る動画像符号化装置1のブロック図である。動画像符号化装置1は、符号化処理単位ブロックを四分木構造に従って分割することを許容し、分割したブロックごとに量子化パラメータを制御可能な動画像符号化装置である。この動画像符号化装置1は、画質制御部10、映像分割部20、予測値生成部30、DCT/量子化部40、エントロピー符号化部50、逆DCT/逆量子化部60、およびローカルメモリ70を備える。
図1は、本発明の一実施形態に係る動画像符号化装置1のブロック図である。動画像符号化装置1は、符号化処理単位ブロックを四分木構造に従って分割することを許容し、分割したブロックごとに量子化パラメータを制御可能な動画像符号化装置である。この動画像符号化装置1は、画質制御部10、映像分割部20、予測値生成部30、DCT/量子化部40、エントロピー符号化部50、逆DCT/逆量子化部60、およびローカルメモリ70を備える。
画質制御部10は、入力画像aを入力とする。この画質制御部10は、入力画像aの画素値に関する画素値勾配の評価値に基づいて、オブジェクトの境界を含むCTUを検出し、そのCTUで許容する分割回数(CU depth)bを求めて出力する。また、入力画像aの画素値に関する画素値勾配の評価値に基づいて、CU(Coding Unit)ごとに、量子化パラメータ(QP)に対する差分の情報(ΔQP)を決定し、量子化パラメータに対する差分情報cとして出力する。なお、量子化パラメータ(QP)に対する差分の情報(ΔQP)とは、処理スライスにおける量子化パラメータ(QP)と、そのCUで用いられる量子化パラメータと、の差分のことである。
図2は、画質制御部10のブロック図である。画質制御部10は、画素値勾配評価部11、エッジ解析部12、分割決定部13、および量子化パラメータ決定部14を備える。
画素値勾配評価部11は、入力画像aを入力とする。この画素値勾配評価部11は、入力画像aの全画素値について画素値勾配を算出し、各画素の画素値勾配jとして出力する。画素値勾配の算出は、例えば、入力画像aの全画素値に対して、ローパスフィルタを施した後に、sobelフィルタやラプラシアンフィルタなどを適用することで、実現できる。
エッジ解析部12は、各画素の画素値勾配jを入力とする。このエッジ解析部12は、各画素の画素値勾配jに基づいて、オブジェクトの境界を含むCTUを検出する。オブジェクトの境界を含むCTUの検出では、例えば、まず、各CTU内の各画素の画素値勾配の絶対値の平均値または分散値を算出し、算出した平均値または分散値が予め定められた閾値以上であるか否かを判別することにより、各CTUの画素値勾配の大小を判別する。次に、同一のオブジェクトが複数のCTUにまたがって存在する場合にはこれらCTUのそれぞれの画素値勾配の特徴が類似するという特徴を考慮して、互いに隣接するCTU同士の画素値勾配の絶対値の平均値または分散値の差分が予め定められた閾値以上であるか否かを判別する。次に、CTU内の画素値の絶対値の平均値または分散値が閾値以上で、かつ、隣接するCTUとの画素値勾配の絶対値の平均値または分散値の差分が閾値以上であるCTUを、オブジェクトの境界を含むCTUとして検出し、検出したCTUの座標を、オブジェクトの境界を含むCTUの座標kとして出力する。
分割決定部13は、各画素の画素値勾配jと、オブジェクトの境界を含むCTUの座標kと、を入力とする。この分割決定部13は、オブジェクトの境界を含むCTUについて、四分木構造に基づく四分割の可否を判断する。具体的には、まず、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値を算出する。次に、算出した差分の絶対値が予め定められた閾値より大きいブロックが存在すれば、分割前のブロックを分割可能と判断する。そして、分割不可能と判断するか、予め定められた分割回数の最大値まで、上述の差分の絶対値の算出と、上述の分割可否の判断と、を繰り返し、分割サイズが小さい方からN階層(ただし、NはN>0を満たす整数)の四分木構造表現までを、オブジェクトの境界を含むCTUの座標kで示されるCTUで許容する分割回数(CU depth)bとして出力する。
量子化パラメータ決定部14は、各画素の画素値勾配jと、オブジェクトの境界を含むCTUの座標kと、分割回数bと、を入力とする。また、量子化パラメータ決定部14には、処理スライスにおける量子化パラメータ(QP)も入力される(図示省略)。この量子化パラメータ決定部14は、分割回数bに従って、CUごとに画素値勾配の絶対値の平均値または分散値を算出し、閾値判定に基づいてCUごとに量子化パラメータに対する差分情報cを決定して出力する。
図1に戻って、映像分割部20は、入力画像aと、分割回数bと、を入力とする。この映像分割部20は、まず、入力画像aをCTUに分割する。次に、CTUに分割された各画像について、分割回数bで示される回数を上限としてRD最適化法により分割回数を決定し、決定した分割回数だけ四分木構造で分割し、分割された入力画像dとして出力する。
予測値生成部30は、分割された入力画像dと、ローカルメモリ70から供給される後述の符号化済み画像iと、を入力とする。この予測値生成部30は、イントラ予測やインター予測などのそれぞれの予測方法に基づいて予測値を生成し、最も高い符号化性能の期待される予測方法による予測値を、予測値eとして出力する。
DCT/量子化部40は、予測残差信号と、量子化パラメータに対する差分情報cと、を入力とする。予測残差信号とは、分割された入力画像dと、予測値eと、の差分信号のことである。このDCT/量子化部40は、予測残差信号に対して直交変換処理を行い、この直交変換処理により得られた変換係数について量子化処理を行って、量子化された変換係数fを出力する。なお、量子化処理では、量子化パラメータに対する差分情報cとしてのΔQPだけ処理スライスの量子化パラメータ(QP)に対して変化させた量子化パラメータ値を、用いる。
エントロピー符号化部50は、量子化された変換係数fを入力とする。このエントロピー符号化部50は、量子化された変換係数fに対してエントロピー符号化処理を行って、その結果について、符号化データへの記述規則(符号化シンタックス)に従って符号化データに記述し、符号化データgとして出力する。
逆DCT/逆量子化部60は、量子化された変換係数fと、量子化パラメータに対する差分情報cと、を入力とする。この逆DCT/逆量子化部60は、量子化された変換係数fについて逆量子化処理を行い、この逆量子化処理により得られた変換係数に対して逆変換処理を行って、逆直交変換された変換係数hとして出力する。なお、逆量子化処理では、量子化パラメータに対する差分情報cとしてのΔQPだけ処理スライスの量子化パラメータ(QP)に対して変化させた量子化パラメータ値を、用いる。
ローカルメモリ70は、フィルタ処理済みのローカルデコード画像である符号化済み画像iを入力とする。このローカルメモリ70は、入力された符号化済み画像iを蓄積する。そして、次の符号化処理単位ブロック以降において過去の符号化済み画像iを参照する必要がある場合に、適宜、予測値生成部30に符号化済み画像iを供給する。
以上の動画像符号化装置1によれば、以下の効果を奏することができる。
動画像符号化装置1は、互いに隣接するCTU同士の画素値勾配の絶対値の平均値または分散値の差分に基づいて、これらCTUに適した分割種類を決定する。このため、オブジェクトの境界を考慮してCTUを四分木構造に従って分割することができる。したがって、主観品質の低下を抑制しつつ、高い符号化性能を実現できる。
また、動画像符号化装置1は、入力画像aの各画素の画素値勾配に基づいて、オブジェクトの境界を含むCTUを検出し、検出したCTUについての四分木構造の分割サイズを、各画素の画素値勾配に基づいて決定する。このため、オブジェクトの境界を含むCTUについて、オブジェクトの境界を考慮して四分木構造に従って分割することができる。
また、動画像符号化装置1は、入力画像aの各画素の画素値に対してローパスフィルタを施した後に、sobelフィルタまたはラプラシアンフィルタを適用して、各画素の画素値勾配を算出する。このため、各画素の画素値勾配を適切に算出することができる。
また、動画像符号化装置1は、CTU内の各画素の画素値勾配の絶対値の平均値または分散値が閾値以上であることと、隣接するCTUとの画素値勾配の絶対値の平均値または分散値の差分が閾値以上であることと、の少なくともいずれかを満たすCTUを、オブジェクトの境界を含むCTUとして検出する。このため、オブジェクトの境界を含むCTUを、適切に検出することができる。
また、動画像符号化装置1は、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が閾値より大きいブロックが存在すれば、分割前のブロックを分割可能と判断する。このため、どのブロックにオブジェクトの境界が含まれており、分割可能なのかを、適切に判断することができる。
また、動画像符号化装置1は、ブロックごとに、画素値勾配の絶対値の平均値または分散値が閾値以上であるか否かにより、量子化パラメータを決定する。このため、ブロックごとにさらに適切な量子化パラメータを決定することができる。
なお、本発明の動画像符号化装置1の処理を、コンピュータ読み取り可能な非一時的な記録媒体に記録し、この記録媒体に記録されたプログラムを動画像符号化装置1に読み込ませ、実行することによって、本発明を実現できる。
ここで、上述の記録媒体には、例えば、EPROMやフラッシュメモリといった不揮発性のメモリ、ハードディスクといった磁気ディスク、CD−ROMなどを適用できる。また、この記録媒体に記録されたプログラムの読み込みおよび実行は、動画像符号化装置1に設けられたプロセッサによって行われる。
また、上述のプログラムは、このプログラムを記憶装置などに格納した動画像符号化装置1から、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を動画像符号化装置1にすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
例えば、上述の実施形態では、符号化処理ブロックを木構造に基づいて分割する例として、非特許文献2に示されている四分木構造の分割を示した。しかし、これに限らず、二分木構造といった任意の分岐数に基づく木構造の分割に、本発明は適用することができる。
また、上述の実施形態では、画質制御部10には入力画像aが入力されるものとしたが、これに限らず、例えば入力画像aの構造成分のみで構成される画像が入力されてもよい。これによれば、画質制御部10によるオブジェクトの境界の検出性能を向上させることができ、その結果、主観品質をさらに向上させることができる。なお、入力画像aから構造成分を抽出する手法としては、例えばTotal Variationを適用することができる。
1・・・動画像符号化装置
10・・・画質制御部
11・・・画素値勾配評価部
12・・・エッジ解析部
13・・・分割決定部
14・・・量子化パラメータ決定部
20・・・映像分割部
30・・・予測値生成部
40・・・DCT/量子化部
50・・・エントロピー符号化部
60・・・逆DCT/逆量子化部
70・・・ローカルメモリ
10・・・画質制御部
11・・・画素値勾配評価部
12・・・エッジ解析部
13・・・分割決定部
14・・・量子化パラメータ決定部
20・・・映像分割部
30・・・予測値生成部
40・・・DCT/量子化部
50・・・エントロピー符号化部
60・・・逆DCT/逆量子化部
70・・・ローカルメモリ
Claims (10)
- 符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置であって、
前記符号化処理単位ブロックごとに画素値の特徴量を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類を推定することを特徴とする動画像符号化装置。 - 前記画素値の特徴量として、入力画像の各画素の画素値勾配を算出する画素値勾配評価手段と、
前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて、オブジェクトの境界を含む符号化処理単位ブロックを検出するエッジ解析手段と、
前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックについて、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて木構造の分割サイズを決定する分割決定手段と、を備えることを特徴とする請求項1に記載の動画像符号化装置。 - 前記画素値勾配評価手段は、入力画像の各画素の画素値に対してsobelフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする請求項2に記載の動画像符号化装置。
- 前記画素値勾配評価手段は、入力画像の各画素の画素値に対してローパスフィルタを施した後に、sobelフィルタまたはラプラシアンフィルタを適用して、前記各画素の画素値勾配を算出することを特徴とする請求項2に記載の動画像符号化装置。
- 前記エッジ解析手段は、
符号化処理単位ブロック内の各画素の画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であることと、
隣接する符号化処理単位ブロックとの画素値勾配の絶対値の平均値または分散値の差分が予め定められた閾値以上であることと、
の少なくともいずれかを満たす符号化処理単位ブロックを、前記オブジェクトの境界を含む符号化処理単位ブロックとして検出することを特徴とする請求項2から4のいずれかに記載の動画像符号化装置。 - 前記分割決定手段は、分割前のブロックの画素値勾配の絶対値の平均値または分散値と、分割後の各ブロックの画素値勾配の絶対値の平均値または分散値と、の差分の絶対値が、予め定められた閾値より大きいブロックが存在すれば、当該分割前のブロックを分割可能と判断することを特徴とする請求項2から5のいずれかに記載の動画像符号化装置。
- 前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、前記画素値勾配評価手段により算出された各画素の画素値勾配に基づいて量子化パラメータを決定する量子化パラメータ決定手段を備えることを特徴とする請求項2から6のいずれかに記載の動画像符号化装置。
- 前記量子化パラメータ決定手段は、前記エッジ解析手段によりオブジェクトの境界を含むと検出された符号化処理単位ブロックを分割したブロックごとに、画素値勾配の絶対値の平均値または分散値が、予め定められた閾値以上であるか否かにより、前記量子化パラメータを決定することを特徴とする請求項7に記載の動画像符号化装置。
- 符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置における動画像符号化方法であって、
前記符号化処理単位ブロックごとに画素値の特徴量を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類を推定することを特徴とする動画像符号化方法。 - 符号化処理単位ブロックを木構造に従って分割することを許容する動画像符号化装置における動画像符号化方法を、コンピュータに実行させるためのプログラムであって、
前記符号化処理単位ブロックごとに画素値の特徴量を評価し、互いに隣接する前記符号化処理単位ブロック同士の画素値の特徴量の差異に基づいて、当該符号化処理単位ブロックに適した分割種類を推定するためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013156514A JP2015027022A (ja) | 2013-07-29 | 2013-07-29 | 動画像符号化装置、動画像符号化方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013156514A JP2015027022A (ja) | 2013-07-29 | 2013-07-29 | 動画像符号化装置、動画像符号化方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015027022A true JP2015027022A (ja) | 2015-02-05 |
Family
ID=52491326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013156514A Pending JP2015027022A (ja) | 2013-07-29 | 2013-07-29 | 動画像符号化装置、動画像符号化方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015027022A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017005505A (ja) * | 2015-06-10 | 2017-01-05 | 日本電信電話株式会社 | 映像符号化装置、映像符号化方法及び映像符号化プログラム |
WO2017142262A1 (ko) * | 2016-02-16 | 2017-08-24 | 삼성전자 주식회사 | 적응적인 블록 파티셔닝 방법 및 장치 |
JP2021516504A (ja) * | 2018-04-02 | 2021-07-01 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム |
JPWO2021171360A1 (ja) * | 2020-02-25 | 2021-09-02 | ||
CN114071189A (zh) * | 2020-08-03 | 2022-02-18 | 纬创资通股份有限公司 | 视频处理装置及视频串流的处理方法 |
CN114793279A (zh) * | 2016-02-03 | 2022-07-26 | Oppo广东移动通信有限公司 | 运动图像解码装置、编码装置、以及预测图像生成装置 |
US11880966B2 (en) | 2020-08-03 | 2024-01-23 | Wistron Corporation | Image quality assessment apparatus and image quality assessment method thereof |
-
2013
- 2013-07-29 JP JP2013156514A patent/JP2015027022A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017005505A (ja) * | 2015-06-10 | 2017-01-05 | 日本電信電話株式会社 | 映像符号化装置、映像符号化方法及び映像符号化プログラム |
CN114793279A (zh) * | 2016-02-03 | 2022-07-26 | Oppo广东移动通信有限公司 | 运动图像解码装置、编码装置、以及预测图像生成装置 |
WO2017142262A1 (ko) * | 2016-02-16 | 2017-08-24 | 삼성전자 주식회사 | 적응적인 블록 파티셔닝 방법 및 장치 |
JP2021516504A (ja) * | 2018-04-02 | 2021-07-01 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム |
JP7080542B2 (ja) | 2018-04-02 | 2022-06-06 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム |
JPWO2021171360A1 (ja) * | 2020-02-25 | 2021-09-02 | ||
JP7453581B2 (ja) | 2020-02-25 | 2024-03-21 | 日本電信電話株式会社 | 符号化方法、符号化装置及びプログラム |
US12225202B2 (en) | 2020-02-25 | 2025-02-11 | Nippon Telegraph And Telephone Corporation | Encoding method, encoding apparatus, and program |
CN114071189A (zh) * | 2020-08-03 | 2022-02-18 | 纬创资通股份有限公司 | 视频处理装置及视频串流的处理方法 |
US11880966B2 (en) | 2020-08-03 | 2024-01-23 | Wistron Corporation | Image quality assessment apparatus and image quality assessment method thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11102515B2 (en) | In loop chroma deblocking filter | |
TWI782904B (zh) | 合併用於視訊寫碼之用於多類別區塊之濾波器 | |
JP6258980B2 (ja) | イントラ予測方法とそれを利用した符号化器及び復号化器 | |
CN109309838B (zh) | 用于视频编码的系统和方法 | |
KR102570202B1 (ko) | 움직임 벡터 정밀도의 선택 | |
KR102469145B1 (ko) | 영상을 부호화 또는 복호화하는 방법 및 장치 | |
JP6345694B2 (ja) | 大きなhevcブロックアーティファクト用のブロッキネスメトリック | |
TWI650995B (zh) | 視訊解碼裝置、視訊編碼方法及非暫態電腦可讀記錄媒體 | |
JP2015027022A (ja) | 動画像符号化装置、動画像符号化方法、およびプログラム | |
CN109845256B (zh) | 影像编码方法/装置、影像解码方法/装置以及保存有比特流的记录介质 | |
CN107113438A (zh) | 帧内编码模式 | |
CN111316642B (zh) | 信令图像编码和解码划分信息的方法和装置 | |
EP2099225A1 (en) | Method for intra prediction coding of image data | |
JP6459761B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
CN106464880A (zh) | 用于减少高效率视频编码中的计算负荷的方法和设备 | |
KR20180040517A (ko) | 비디오 부호화, 복호화 방법 및 장치 | |
KR20240161053A (ko) | 영상 부호화 또는 복호화를 위한 장치 및 방법 | |
CN116886910A (zh) | 影像编码方法、影像解码方法以及传送比特流的方法 | |
US10057573B2 (en) | Moving image coding device, moving image decoding device, moving image coding method and moving image decoding method | |
JP6564315B2 (ja) | 符号化装置、復号装置、及びプログラム | |
JP6357133B2 (ja) | イントラ予測処理装置、イントラ予測処理方法、イントラ予測処理プログラム、画像符号化装置及び画像復号装置 | |
JP6200220B2 (ja) | 画像処理装置、符号化装置、復号装置、及びプログラム | |
KR20220107139A (ko) | 영상 신호 부호화/복호화 방법 및 장치 | |
JP2013223149A (ja) | 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム | |
JP2015119332A (ja) | 動画像符号化装置、動画像符号化方法、およびプログラム |