[go: up one dir, main page]

JP6110724B2 - 画像処理装置、符号化装置、及び符号化プログラム - Google Patents

画像処理装置、符号化装置、及び符号化プログラム Download PDF

Info

Publication number
JP6110724B2
JP6110724B2 JP2013096584A JP2013096584A JP6110724B2 JP 6110724 B2 JP6110724 B2 JP 6110724B2 JP 2013096584 A JP2013096584 A JP 2013096584A JP 2013096584 A JP2013096584 A JP 2013096584A JP 6110724 B2 JP6110724 B2 JP 6110724B2
Authority
JP
Japan
Prior art keywords
motion vector
unit
block
target block
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013096584A
Other languages
English (en)
Other versions
JP2014220571A (ja
Inventor
康孝 松尾
康孝 松尾
境田 慎一
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2013096584A priority Critical patent/JP6110724B2/ja
Publication of JP2014220571A publication Critical patent/JP2014220571A/ja
Application granted granted Critical
Publication of JP6110724B2 publication Critical patent/JP6110724B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像の奥行き情報に基づいて画像を処理する画像処理装置、符号化装置、及び符号化プログラムに関する。
近年、奥行き情報を取得できる深度センサを搭載したカメラが盛んに研究開発されている。例えば、RGBにD(奥行き)を加えた画像情報を取得するRGB―Dセンサを搭載したカメラの一例として、Microsoft社のKinect(登録商標)がある。このような背景から、2次元の画像信号と、奥行き情報とを有する動画像情報の利用が増加することが予想される。
また、動画情報を効率的に処理する規格であるH.264/AVC(Advanced Video Coding)やH.265/HEVC(High Efficiency Video Coding)の映像の圧縮符号化方式では、映像の各フレームをブロックと呼ばれる矩形領域に分割して符号化が行われる。
この映像の圧縮の手法の1つとして、ブロックの動きベクトルを用いた画像予測が利用される。動きベクトルとは、ブロック単位で参照画像内から処理対象ブロックに最も類似している位置を探索するブロックマッチング技術などを用いて求められるブロック単位の空間的なずれを示す値である。この動きベクトルを用いて予測画像と、処理対象の画像との差分値を求めることにより、映像のデータ量を削減することが可能である。
上記の標準においても、動きベクトルが用いられている。なお、動きベクトルの検出手法自体は、規格として定義されていないが、例えばブロック毎にブロックマッチング法を用いて行われている(例えば、非特許文献1参照)。
図1は、動きベクトルの検出例を示している。動画像情報は、複数のフレームを含む。例えば、基準フレーム110は、時刻t=0のときの動画像のフレームを表している。そして、参照フレーム120は、時刻t=−1における動画像のフレームを表している。各々のフレームは、複数のブロックで構成されている。基準フレーム110に存在する処理対象ブロック112の動きベクトルを探索するために、参照フレーム120には、探索範囲121が設定される。ブロックマッチング法を利用した場合には、基準フレーム上の処理対象ブロックの画像と、参照フレーム上の同じ空間位置を中心として設定した上記探索範囲内のブロックの画像SAD(Sum of Absolute Distance:予測誤差の絶対値和)又はSSD(Sum of Square Distance:二乗誤差和)を計算する。この値が最も小さい参照フレーム上のブロックと基準フレーム上の処理対象ブロック位置差から動きベクトルが決定される。
なお、H.264/AVC及びH.265/HEVCの標準では、基準フレームと参照フレームを縦横2倍又は4倍にして、原画像から見て1/2又は1/4画素精度の動きベクトル検出が行われる。
動きベクトルの検出確度は、映像の圧縮効率などに影響を与えるため、より確度の高い動きベクトルの検出手法が望まれている。
大久保榮監修,「改訂三版 H.264/AVC 教科書」,インプレス R&D,p124,2009年1月1日
上述したようにブロックマッチングなどの手法を用いた動きベクトルの検出においては、基準フレームの処理対象ブロックと、参照フレームのブロックが異なるオブジェクトに属するにもかかわらず、両者の輝度又は色等が近似しているために、ブロックマッチングの結果が最小となる場合あり得る。この場合には、検出された動きベクトルは、本来のオブジェクトの動きを反映していないものとなる。特に、H.264/AVC及びH.265/HEVCの標準で、時間ダイレクトモードが採用された場合、例えば1フレーム隣のフレームの動きベクトルを2倍にスケーリングすることで2フレーム隣のフレームとの間の動きベクトルを予測することがある。この場合、そもそもオブジェクトが異なっているために、2フレーム隣のフレームとの間の動きベクトルは、本来の動きベクトルとは更に乖離してしまうこととなる。その結果は、符号化された画質の低下となって現れる。
なお、例えば色情報などを用いて、同一オブジェクトであるか否かの判定を行うことはできるが、その判定精度には限界があった。例えばオブジェクトが異なっていても、これらのオブジェクトの色が同じであれば、これらのオブジェクトは同一オブジェクトと判定されてしまう。
そこで、本発明は、奥行き情報を用いて、より確度の高い動きベクトルの検出を行うことによって、画質の向上を図ることができる画像処理装置、符号化装置、及び符号化プログラムを提供することを目的とする。
本発明の一態様における画像処理装置は、奥行き情報を含む画像に対してブロック単位で処理を行う画像処理装置であって、基準フレームの複数のブロックのうちの何れかである処理対象ブロックと、参照される参照フレームの画像の一致度に基づいて、前記処理対象ブロックの動きベクトルの複数の候補を特定する、動きベクトル候補特定部と、前記処理対象ブロックの奥行き情報と、前記動きベクトルを求めた参照フレームの対応するブロックの奥行き情報とを用いて、前記処理対象ブロックと、前記参照フレームの対応するブロックとが、同一のオブジェクトに属するか否かを判定するオブジェクト判定部と、前記動きベクトルの複数の候補の各々に対応する前記一致度と前記オブジェクト判定部の判定結果とに基づいて、前記処理対象ブロックの動きベクトルを決定する、動きベクトル決定部と、を有する。
また、前記基準フレーム及び前記参照フレームの奥行き情報にクラスタリングの処理を施す、奥行き情報クラスタリング部を更に有し、前記オブジェクト判定部は、前記クラスタリングの結果を用いて、前記判定を行ってもよい。
また、前記動きベクトル決定部は、前記動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合、前記同一のオブジェクトに属すると判定された動きベクトルのうち、前記一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定するか、又は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合、前記一致度が最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定してもよい。
また、前記動きベクトル決定部は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、前記処理対象ブロックが更に複数のサブブロックに分割できる場合、前記サブブロックを、処理対象ブロックとして、当該画像処理装置の処理を繰り返してもよい。
また、本発明の他の態様における符号化装置は、上記画像処理装置を備えてもよい。
また、本発明の他の態様における符号化プログラムは、コンピュータを、上記符号化装置として機能させる。
本発明によれば、奥行き情報を用いて動きベクトルを、より的確に検出し、画質の向上を図ることができる。
動きベクトルの検出例を示す図である。 実施例1における画像処理装置10の構成の一例を示すブロック図である。 動きベクトル決定部170の細部の構成の例を示す図である。 実施例1における画像処理装置の処理の一例を示すフローチャートである。 実施例2における符号化装置の概略構成の一例を示すブロック図である。 実施例3における画像処理装置の概略構成の一例を示すブロック図である。
以下、各実施例について、添付図面を参照しながら詳細に説明する。
[実施例1]
まず、実施例1における画像処理装置について説明する。実施例1における画像処理装置は、奥行き情報を用いて動きベクトルを決定する装置である。この画像処理装置は、集積回路により実装されてもよい。また、記憶媒体に記憶されたプログラムをコンピュータが読み込んで、このプログラムをコンピュータが実行することにより実装されてもよい。
<構成>
図2は、実施例1における画像処理装置10の構成の一例を示すブロック図である。図2に示す画像処理装置10は、動きベクトル候補特定部140と、奥行き情報クラスタリング部150と、オブジェクト判定部160と、動きベクトル決定部170とを有する。
動きベクトル候補特定部140には、基準フレームと参照フレームの画像情報が入力される。参照フレームは、複数であってもよい。動きベクトル候補特定部140は、基準フレームの画像をブロック分割(例えば16×16画素サイズに分割)する。基準フレームの分割された複数のブロックのうちの1つを、順に処理対象ブロックとして選択する。そして、処理対象ブロックについて、参照フレームの画像を探索することによって動きベクトルを検出する。動きベクトルの検出には、例えば既存の手法であるブロックマッチング法を用いてもよい。
なお、本実施例では、処理対象ブロック毎にSAD又はSSDの値がn番目までに小さい動きベクトルを動きベクトルの複数の候補として検出することが望ましい。nの値は、例えば3を用いてもよい。動きベクトルの複数の候補は、動きベクトル決定部170と、オブジェクト判定部160に出力する。また、動きベクトルを求めたときの処理対象ブロックと、参照フレームのブロックの位置情報をオブジェクト判定部160に出力する。
奥行き情報クラスタリング部150は、例えば、基準フレームと参照フレームの各奥行き情報をクラスタリングする。ここで、奥行き情報は、画素毎、又は撮像時に決定されるブロック領域毎に存在する。奥行き情報クラスタリング部150は、奥行き情報を示す奥行き深度が例えば256段階である場合、クラスタ数k=8に設定し、K−means法を適用して奥行き情報のクラスタリングを行う。
奥行き深度の段階数は、深度センサの性能に従うため256に限られない。クラスタ数kは、予め適切な値が設定されていればよい。
また、奥行き情報クラスタリング部150は、奥行き情報のヒストグラムを求め、このヒストグラムが取る値の範囲をクラスタ数kに等分割し、奥行き情報を分類してもよい。
奥行き情報クラスタリング部150は、上述のK−means法による奥行き情報のクラスタリング、又は、奥行き情報のヒストグラムから求めた奥行き情報の分類を用いることができる。奥行き情報クラスタリング部150は、各画素位置又は各所定領域の奥行き情報のクラスタリング結果として、奥行き降順に番号を付与して、このクラスタリング結果を示すクラスタリング情報(例えば0〜7)をオブジェクト判定部160に出力する。
オブジェクト判定部160は、動きベクトルが算出された処理対象ブロックと、対応する参照フレームのブロックが同一のオブジェクトに属するか否かの判定を行う。オブジェクト判定部160は、取得部162と奥行き判定部164とを備える。
取得部162は、ブロック毎に、クラスタリング情報の代表値を取得する。取得部162は、ブロック毎にクラスタリング情報を平均化し、端数を四捨五入する整数化を行うことで、ブロック毎に1つの奥行き情報(代表値)を取得する。なお、取得部162は、ブロック毎に、クラスタリング情報の中央値や最頻値を代表値としてもよい。取得部162は、ブロック内の奥行き情報の代表値を、ブロックの奥行き代表情報として奥行き判定部164に出力する。
奥行き判定部164は、取得部162から取得した、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報が所定範囲内に属するか否かを判定する。例えば、奥行き判定部164は、処理対象ブロック奥行き情報と、対応する参照フレームのブロックの奥行き代表情報との差が所定値以内にあるか否かを判定してもよい。
奥行き判定部164は、所定値を0にすれば、奥行き情報が同じクラスタに属するか否かを判定でき、所定値を例えば1などにすれば、奥行き情報同士が類似するか否かを判定できる。
奥行き判定部164は、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報の差が所定値以内であれば、処理対象ブロックと、対応する参照フレームのブロックは、同一オブジェクトに属すると判定する。また、奥行き判定部164は、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報との差が所定値より大きければ、処理対象ブロックと、対応する参照フレームのブロックは、同一オブジェクトに属しないと判定する。
なお、オブジェクト判定部160は、奥行き情報のクラスタリング情報を用いずに、ブロック内の奥行き情報から直接に代表値を決定し、処理対象ブロックと、対応する参照フレームのブロックの奥行き代表情報の代表値の差が所定値以内であるかを判定してもよい。
オブジェクト判定部160は、奥行き判定部164の判定結果を動きベクトル決定部170に出力する。
動きベクトル決定部170は、オブジェクト判定部160からの情報を用いて、処理対象ブロックに対する動きベクトルの複数の候補から、処理対象ブロックの動きベクトルを決定する。
図3は、動きベクトル決定部170の細部の構成の例を示している。動きベクトル決定部170は、第1決定部171、第2決定部172、第3決定部173、選択部174、及び測定部175を備える。
なお、選択部174は、動きベクトル候補特定部140からの情報及びオブジェクト判定部160からの情報を、第1決定部171、第2決定部172、第3決定部173の何れかに、選択的に伝達するように動作してもよい。
また、選択部174は、後に説明する測定部からの情報に基づいて、選択的に伝達する機能が制御される。選択部174は、オペレータなどの外部からの設定によって、選択的に伝達するように設定されてもよい。
第1決定部171は、一致度が最も高い動きベクトル、すなわち、ブロック間のSAD(Sum of Absolute Difference)又はSSD(Sum of Squared Difference)が最小となる動きベクトルを、処理対象ブロックの動きベクトルとして採用すべきか否かを決定する。すなわち、第1決定部171は、一致度が最も高い動きベクトルに関して、処理対象ブロックと、対応する参照フレームのブロックとが同一のオブジェクトに属しないと前記オブジェクト判定部において判定された場合、一致度が最も高い動きベクトルを、前記処理対象ブロックの動きベクトルとして採用することを却下する決定を行ってもよい。一致度が最も高い動きベクトルであっても、処理対象ブロックと、対応する参照フレームのブロックとが同一のオブジェクトに属しないと判断される場合には、この動きベクトルを採用することは、適切な判断ではないからである。
第1決定部171は、却下を行わない場合には、一致度が最も高い動きベクトルを出力する。第1決定部171が、却下を行った場合には、nullが出力されてもよい。例えば、レジストレーション超解像の処理においては、動きベクトルとしてnullが許容されている。なお、H.264/AVC、又はH.265/HEVCの標準においては、nullは適切ではないとされているため、後述する第2決定部172の処理を行ってもよい。
第2決定部172は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、同一のオブジェクトに属すると判定された動きベクトルのうち、一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定する。なお、第2決定部172は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合、一致度が最も高い動きベクトルを、処理対象ブロックの動きベクトルと決定してもよい。
第3決定部173は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、第2決定部172と同じ処理を行ってもよい。第3決定部173は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、処理対象ブロックが更に複数のサブブロックに分割できる場合、サブブロックを、処理対象ブロックとして、動きベクトルの検出の処理を繰り返す処理(図2及び図3の処理)を、例えば動きベクトル候補特定部140に指示してもよい(176)。例えば、16×16画素サイズのブロックを用いてベクトルの検出の処理を行っていた場合には、このブロックを8×8画素サイズの4つのブロックに分割して、同様に動きベクトルの検出の処理を行う。なお、更なるブロックの分割が行えない場合には、一致度が最も高い動きベクトルを、処理対象ブロックの動きベクトルと決定してもよい。
なお、上記の更なるブロック分割が行われた場合には、このブロック分割に係る指示176をビットストリームに含めるために、この指示176を、図5と共に後に説明するエントロピー符号化部204に出力し、符号化するとともに、上述のように動きベクトル候補特定部140に指示してもよい。
そして、ブロックの復号化においては、このブロック分割に係る符号化された指示176が復号化されて利用される。
また、画像を量子化した後の情報(例えば、図5における量子化部203からの量子化データ180)が、測定部175に入力される。第3決定部が選択部174において選択されている場合に、測定部175は、量子化データ180に係る単位時間当たりの情報量を随時測定する。例えば、量子化データ180に係る単位時間当たりの情報量が増加する傾向であれば、選択部が第1決定部171、又は第2決定部172を選択する様、選択部に指令を発してもよい。この処理を行う理由は、例えば、ブロック分割が頻繁に発生する場合には、ブロック分割に係る指示176を表すデータが、量子化データ180に係る単位時間当たりの情報量を増加させる要因となり得るため、この単位時間当たりの情報量を所定の量以下に止めることが望ましいからである。
以上の構成を有することで、動き情報を利用して、動きベクトルをより的確に検出し、画質の向上を図ることができる。
<動作>
次に、実施例1における画像処理装置10の動作について図4及び図5を用いて説明する。
図4は、実施例1の基準フレームの1つの処理対象ブロックに対する処理の概要を示している。
ステップS102で、動きベクトル候補特定部140は、処理対象ブロックに対する動きベクトルの複数の候補を特定する。
ステップS104で、奥行き情報クラスタリング部150は、基準フレーム及び参照フレームの奥行き情報のクラスタリング処理を行う。クラスタリング処理は、K−means法を利用してもよい。奥行き情報クラスタリング部150は、奥行き情報のクラスタリング結果として、奥行きを降順に番号を付与して、各画素位置又は各所定領域に対して、このクラスタリング結果を示すクラスタリング情報(例えば0〜7)を出力してもよい。
ステップS106で、オブジェクト判定部160は、取得部162において、関連する各ブロックについて、ブロックの奥行きを代表する代表値を取得する。取得部162は、ブロック毎にクラスタリング情報を平均化し、端数を四捨五入する整数化を行うことで、ブロック毎に1つの奥行き情報(代表値)を取得する。なお、取得部162は、ブロック毎に、クラスタリング情報の中央値や最頻値を代表値としてもよい。
ステップS108で、奥行き判定部は、動きベクトルの複数の候補の各々に関連する処理対象ブロックと、参照フレーム内の対応するブロックが同一オブジェクトに属するか否かを判定する。
ステップS110において、動きベクトル決定部170は、一致度が最も高い値を有する第一候補の動きベクトルが取得された2つのブロックが同一オブジェクトに属すると判定された場合には、その第一候補の動きベクトルを、処理対象ブロックの動きベクトルとして決定する。
上記以外の場合には、既に説明したように以下のようになる。
まず、第1決定部171は、NULLを出力する。
第2決定部172は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、同一のオブジェクトに属すると判定された動きベクトルのうち、一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定してもよい。なお、第2決定部172は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合、一致度が最も高い動きベクトルを、処理対象ブロックの動きベクトルと決定してもよい。
第3決定部173は、動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合には、第2決定部172と同じ処理を行う。第3決定部173は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、処理対象ブロックが更に複数のサブブロックに分割できる場合、サブブロックに分割し、このサブブロックを、処理対象ブロックとして、動きベクトルの検出の処理を繰り返す処理(図2及び図3の処理)の指示176を出力する。
以上、実施例1によれば、奥行き情報を利用することにより、同一オブジェクトと判定されたブロックに基づいて、動きベクトルを検出することが可能となり、より的確に動きベクトルを検出でき、画質の向上を図ることができる。
[実施例2]
実施例2では、実施例1における画像処理装置10を動きベクトル計算部213に含む符号化装置について説明する。実施例2では、入力される情報に奥行き情報が含まれているとする。
<構成>
図5は、実施例2における符号化装置20の概略構成の一例を示すブロック図である。図5に示す例では、符号化装置20は、前処理部200と、予測誤差信号生成部201と、直交変換部202と、量子化部203と、エントロピー符号化部204と、逆量子化部205と、逆直交変換部206と、復号画像生成部207と、ループフィルタ部209と、復号画像記憶部210と、イントラ予測部211と、インター予測部212と、動きベクトル計算部213と、予測画像選択部215とを有する。各部についての概略を以下に説明する。
前処理部200は、ピクチャタイプに合わせてピクチャを並べ替え、ピクチャタイプ及びフレーム毎のフレーム画像等を順次出力する。また、前処理部200は、ブロック分割なども行い、ブロック分割の境界情報をループフィルタ部209に出力してもよい。また、前処理部200は、原画に含まれる奥行き情報を動きベクトル計算部213に出力する。
予測誤差信号生成部201は、入力された動画像データの符号化対象画像が、例えば32×32、16×16、8×8画素などのブロックに分割されたブロックデータを取得する。
予測誤差信号生成部201は、そのブロックデータと、予測画像選択部215から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部201は、生成された予測誤差信号を直交変換部202に出力する。
直交変換部202は、入力された予測誤差信号を直交変換処理する。直交変換部202は、変換された係数値を示す信号を量子化部203に出力する。
量子化部203は、直交変換部202からの出力信号を量子化する。量子化部203は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部204及び逆量子化部205に出力する。量子化部203は、量子化パラメータのQP値をループフィルタ部209に出力する。量子化部の出力信号は、量子化データ180として、動きベクトル計算部213に出力されてもよい。
エントロピー符号化部204は、量子化部203からの出力信号や、動きベクトル計算部213から出力された動きベクトル情報やループフィルタ部209からのフィルタ係数などをエントロピー符号化して出力する。
また、エントロピー符号化部204は、イントラ予測部211から取得したイントラ予測方向の差分値や、インター予測部212から取得した動きベクトルと予測ベクトルの差分値などをエントロピー符号化する。
また、エントロピー符号化部204は、動きベクトル決定部170内の第3決定部173から取得した、ブロック再分割に関する情報を符号化してもよい。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
逆量子化部205は、量子化部203からの出力信号を逆量子化してから逆直交変換部206に出力する。逆直交変換部206は、逆量子化部205からの出力信号を逆直交変換処理してから復号画像生成部207に出力する。これら逆量子化部205及び逆直交変換部206によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
復号画像生成部207は、イントラ予測部211で画面内予測された画像或いはインター予測部212で動き補償された画像のブロックデータと、逆量子化部205及び逆直交変換部206により復号処理された予測誤差信号とを加算する。復号画像生成部207は、加算して生成した復号画像のブロックデータを、ループフィルタ部209に出力する。
ループフィルタ部209は、例えばALF(Adaptive Loop Filter)やデブロッキングフィルタである。ループフィルタ部209は、フィルタ処理結果を復号画像記憶部210に出力し、蓄積された1画像分のフィルタ処理結果を参照画像として記憶させる。
復号画像記憶部210は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部211、インター予測部212及び動きベクトル計算部213に出力する。
イントラ予測部211は、符号化対象画像の処理対象ブロックに対して、既に符号化された参照画素から予測画像のブロックデータを生成する。イントラ予測部211は、複数の予測方向を用いて予測を行い、最適な予測方向を決定する。予測方向については、符号化済みブロックの予測方向との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
インター予測部212は、復号画像記憶部210から取得した参照画像のデータを動きベクトル計算部213から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。動きベクトルについては、符号化済みブロックの動きベクトル(予測ベクトル)との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
動きベクトル計算部213は、実施例1における画像処理装置10の構成を有し、奥行き情報と、符号化対象画像におけるブロックデータと、復号画像記憶部210から取得する参照画像とを用いて、動きベクトルを求める。
動きベクトル計算部213は、求めた動きベクトルをインター予測部212に出力し、参照画像を示す情報を含む動きベクトル情報をエントロピー符号化部204に出力する。
イントラ予測部211とインター予測部212から出力されたブロックデータは、予測画像選択部215に入力される。
予測画像選択部215は、イントラ予測部211とインター予測部212から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部201に出力される。
なお、図5に示す符号化装置20の構成は一例であり、必要に応じて各構成を組み合わせたり、各構成を適宜変更したりしてもよい。
以上、実施例2によれば、画像符号化時に、奥行き情報を用いて画質の向上を図ることができる。
[実施例3]
図6は、実施例3における画像処理装置40の概略構成の一例を示すブロック図である。図6に示す画像処理装置40は、上述した実施例1及び2で説明した画像処理装置10、符号化装置20をソフトウェアで実装した画像処理装置の一例である。
図6に示すように、画像処理装置40は、制御部401と、主記憶部402と、補助記憶部403と、ドライブ装置404と、ネットワークI/F部406と、入力部407と、表示部408とを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
制御部401は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPU(Central Processing Unit)である。また、制御部401は、主記憶部402又は補助記憶部403に記憶された画像処理のプログラムを実行する演算装置である。制御部401は、入力部407や記憶装置からデータを受け取り、演算、加工した上で、表示部408や記憶装置などに出力する。
また、制御部401は、画像処理のプログラムを実行することで、実施例1及び2で説明した処理を実現することができる。
主記憶部402は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部402は、制御部401が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
補助記憶部403は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
ドライブ装置404は、記録媒体405、例えばフレキシブルディスクからプログラムを読み出し、記憶部にインストールする。
また、記録媒体405に、所定のプログラムを格納し、この記録媒体405に格納されたプログラムはドライブ装置404を介して画像処理装置40にインストールされる。インストールされた所定のプログラムは、画像処理装置40により実行可能となる。
ネットワークI/F部406は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像処理装置40とのインターフェースである。
入力部407は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部408の表示画面上でキーの選択等を行うためのマウスやスライドパット等を有する。表示部408は、LCD(Liquid Crystal Display)等により構成され、制御部401から入力される表示データに応じた表示が行われる。
なお、図3に示す画像処理装置10の各部は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
また、図5に示す復号画像記憶部210は、例えば主記憶部402又は補助記憶部403により実現され、図5に示す復号画像記憶部210以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
また、図6に示す復号情報記憶部305及びフレームメモリ311は、例えば主記憶部402又は補助記憶部403により実現されうる。図6に示す復号情報記憶部305及びフレームメモリ311以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
画像処理装置40で実行されるプログラムは、実施例1及び2で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部401が補助記憶部403からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部402上にロードされ、1又は複数の各部が主記憶部402上に生成されるようになっている。
このように、上述した実施例1及び2で説明した画像処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、実施例1及び2で説明した処理を実現することができる。
また、このプログラムを記録媒体405に記録し、このプログラムが記録された記録媒体405をコンピュータや携帯端末などの処理装置に読み取らせて、前述した画像処理を実現させることも可能である。
なお、記録媒体405は、CD−ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、上述した各実施例で説明した画像処理は、1つ又は複数の集積回路に実装されてもよい。なお、実施例3における画像処理装置40は、上記の通り、画像処理装置10、符号化装置20の少なくとも1つの装置としての機能を有してもよい。
また、上述した各実施例における画像処理装置10、符号化装置20、及び画像処理装置40は、奥行き情報を用いて動きベクトルを検出する符号化技術、及びこの符号化技術によって符号化されたビットストリームの復号に対して適用可能であり、H.264/AVCやH.265/HEVCだけに限られるものではない。
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。
10 画像処理装置
20 符号化装置
40 画像処理装置
140 動きベクトル候補特定部
150 奥行き情報クラスタリング部
160 オブジェクト判定部
162 取得部
164 奥行き判定部
170 動きベクトル決定部
171 第1決定部
172 第2決定部
173 第3決定部
174 選択部
175 測定部
204 エントロピー符号化部
213 動きベクトル計算部
301 エントロピー復号部
401 制御部
402 主記憶部
403 補助記憶部

Claims (6)

  1. 奥行き情報を含む画像に対してブロック単位で処理を行う画像処理装置であって、
    基準フレームの複数のブロックのうちの何れかである処理対象ブロックと、参照される参照フレームの画像の一致度に基づいて、前記処理対象ブロックの動きベクトルの複数の候補を特定する、動きベクトル候補特定部と、
    前記処理対象ブロックの奥行き情報と、前記動きベクトルを求めた参照フレームの対応するブロックの奥行き情報とを用いて、前記処理対象ブロックと、前記参照フレームの対応するブロックとが、同一のオブジェクトに属するか否かを判定するオブジェクト判定部と、
    前記動きベクトルの複数の候補の各々に対応する前記一致度と前記オブジェクト判定部の判定結果とに基づいて、前記処理対象ブロックの動きベクトルを決定する、動きベクトル決定部と、
    を有する画像処理装置。
  2. 前記基準フレーム及び前記参照フレームの奥行き情報にクラスタリングの処理を施す、奥行き情報クラスタリング部を更に有し、
    前記オブジェクト判定部は、前記クラスタリングの結果を用いて、前記判定を行う、
    請求項1記載の画像処理装置。
  3. 前記動きベクトル決定部は、
    前記動きベクトルの複数の候補に係る参照フレームのブロックが、処理対象ブロックと同一のオブジェクトに属すると判定された動きベクトルが存在する場合、前記同一のオブジェクトに属すると判定された動きベクトルのうち、前記一致度の最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定するか、又は、複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合、前記一致度が最も高い動きベクトルを、前記処理対象ブロックの動きベクトルと決定する、
    請求項1又は2記載の画像処理装置。
  4. 前記動きベクトル決定部は、
    複数の動きベクトルの候補に係る参照フレームの何れのブロックも、前記処理対象ブロックと同一のオブジェクトに属しないと判定された場合であって、前記処理対象ブロックが更に複数のサブブロックに分割できる場合、前記サブブロックを、処理対象ブロックとして、当該画像処理装置の処理を繰り返す指示を出力する請求項1又は2記載の画像処理装置。
  5. 請求項1ないし4のうちいずれか1項記載の画像処理装置を備える符号化装置。
  6. コンピュータを、請求項5記載の符号化装置として機能させるための符号化プログラム。
JP2013096584A 2013-05-01 2013-05-01 画像処理装置、符号化装置、及び符号化プログラム Active JP6110724B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013096584A JP6110724B2 (ja) 2013-05-01 2013-05-01 画像処理装置、符号化装置、及び符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013096584A JP6110724B2 (ja) 2013-05-01 2013-05-01 画像処理装置、符号化装置、及び符号化プログラム

Publications (2)

Publication Number Publication Date
JP2014220571A JP2014220571A (ja) 2014-11-20
JP6110724B2 true JP6110724B2 (ja) 2017-04-05

Family

ID=51938688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013096584A Active JP6110724B2 (ja) 2013-05-01 2013-05-01 画像処理装置、符号化装置、及び符号化プログラム

Country Status (1)

Country Link
JP (1) JP6110724B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12005350B2 (en) 2019-03-25 2024-06-11 Sony Interactive Entertainment Inc. Image transmission/reception system, image transmission apparatus, image reception apparatus, image transmission/reception method, and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6567469B1 (en) * 2000-03-23 2003-05-20 Koninklijke Philips Electronics N.V. Motion estimation algorithm suitable for H.261 videoconferencing applications
WO2008010929A2 (en) * 2006-07-18 2008-01-24 Thomson Licensing Methods and apparatus for adaptive reference filtering
JP4938884B2 (ja) * 2010-09-30 2012-05-23 シャープ株式会社 予測ベクトル生成方法、画像符号化方法、画像復号方法、予測ベクトル生成装置、画像符号化装置、画像復号装置、予測ベクトル生成プログラム、画像符号化プログラムおよび画像復号プログラム
JP5357199B2 (ja) * 2011-03-14 2013-12-04 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
WO2012153440A1 (ja) * 2011-05-09 2012-11-15 シャープ株式会社 予測ベクトル生成方法、予測ベクトル生成装置、予測ベクトル生成プログラム、画像符号化方法、画像符号化装置、画像符号化プログラム、画像復号方法、画像復号装置、及び画像復号プログラム

Also Published As

Publication number Publication date
JP2014220571A (ja) 2014-11-20

Similar Documents

Publication Publication Date Title
US10291925B2 (en) Techniques for hardware video encoding
US11025913B2 (en) Encoding video using palette prediction and intra-block copy
JP6073405B2 (ja) 映像復号化方法及び装置
TWI536811B (zh) 影像處理方法與系統、解碼方法、編碼器與解碼器
CN107241605B (zh) 视频编码器以及视频编码方法
JP7542118B2 (ja) 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置
JP5216710B2 (ja) 復号化処理方法
JP6042001B2 (ja) 動画像符号化装置及び動画像符号化方法
CN110637462A (zh) 视频编解码的方法及装置
CN112087628A (zh) 使用两级帧内搜索对视频进行编码
JP2019110530A (ja) ビデオデータを符号化するための方法及び装置
CN107770527B (zh) 使用邻近编码参数和最近编码参数的数据压缩方法和装置
JP2019110529A (ja) ビデオデータを符号化するための方法及び装置
JP6110724B2 (ja) 画像処理装置、符号化装置、及び符号化プログラム
JP2019057886A (ja) 符号化装置、符号化方法及びプログラム
JP5698629B2 (ja) 画像処理装置、フィルタ処理方法及びプログラム
JP2019016896A (ja) 画像処理装置、画像処理方法
JP2017050744A (ja) 画像符号化装置、画像符号化方法、及びプログラム
JP2013207402A (ja) 画像符号化装置及びプログラム
JP6101067B2 (ja) 画像処理装置及び画像処理プログラム
JP2014143515A (ja) 画像処理装置及び画像処理プログラム
JP2018186456A (ja) 画像符号化装置、画像符号化方法及びプログラム
JP2008072608A (ja) 画像符号化装置及び画像符号化方法
JP2007243391A (ja) 動画像符号化装置
JP6159139B2 (ja) 画像処理装置、符号化装置、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170310

R150 Certificate of patent or registration of utility model

Ref document number: 6110724

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250