[go: up one dir, main page]

JP4702943B2 - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法 Download PDF

Info

Publication number
JP4702943B2
JP4702943B2 JP2005304583A JP2005304583A JP4702943B2 JP 4702943 B2 JP4702943 B2 JP 4702943B2 JP 2005304583 A JP2005304583 A JP 2005304583A JP 2005304583 A JP2005304583 A JP 2005304583A JP 4702943 B2 JP4702943 B2 JP 4702943B2
Authority
JP
Japan
Prior art keywords
picture
encoding
encoded
list
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005304583A
Other languages
English (en)
Other versions
JP2007116355A (ja
JP2007116355A5 (ja
Inventor
純 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005304583A priority Critical patent/JP4702943B2/ja
Priority to US11/548,392 priority patent/US20070127571A1/en
Publication of JP2007116355A publication Critical patent/JP2007116355A/ja
Publication of JP2007116355A5 publication Critical patent/JP2007116355A5/ja
Application granted granted Critical
Publication of JP4702943B2 publication Critical patent/JP4702943B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像データを符号化して圧縮する画像処理装置及びその方法に関するものである。
従来から、画像データを圧縮して記録する様々の方式が提案されている。また新たに、MPEG4 part-10:AVC(ISO/IEC 14496-10、別名H.264)方式が提案されている(以下、H.264方式と呼ぶ)。
図6は、このH.264方式の圧縮手順を説明する図である。
入力された画像データは、マクロブロックに分けられ、差分器601で予測値との差分を求める。この差分は、DCT部602で整数DCT変換されて、量子化部603で量子化される。この量子化された結果の一方は、差分画像データとしてエントロピー符号化部615に送られる。他方は、逆量子化部604で逆量子化され、逆DCT変換部605で逆整数DCT変換され、加算器606で予測値を加えて画像を復元する。こうして復元された画像データの一方は、イントラ予測のためのフレームメモリ607に送られて記憶される。他方はフィルタ609で、デブロッキングフィルタ処理が行われた後、インター予測のためのフレームメモリ610に送られる。
フレームメモリ607のイントラ予測のための画像データは、イントラ予測部608におけるイントラ予測で使用される。このイントラ予測では、同一ピクチャ内で、既に符号化されたブロックの隣接画素の値を予測値として用いる。一方、フレームメモリ610のインター予測のための画像データは、後述するように、複数のピクチャで構成され、そのピクチャがリスト0(list 0)とリスト1(list 1)の2つのリストに分けられてインター予測部611で使用される。この予測した画像データは、メモリコントローラ613によってフレームメモリ610に記憶され、フレームメモリ610の画像データが更新される。インター予測部611におけるインター予測では、フレーム毎の異なる画像データに対して、動き予測部612で動き検出を行って最適な動きベクトルを求め、予測画像データを決定する。
これらイントラ予測とインター予測の結果である画像データの内、最適な予測データがスイッチ614で選択され、一方は、イントラ予測モード又は予測ベクトルがエントロピー符号化部615に送られる。ここで予測値は差分画像データと共に符号化され、出力ビットストリームが形成される。また他方は、差分器601に送られて、入力される画像データとの差分が取られる。
ここで、H.264のインター予測について、図7、図9、図10及び図11を参照して詳細に説明する。
H.264のインター予測では、複数のピクチャを予測に用いることができる。このため参照ピクチャを特定するためにリストを2つ(List 0及びList 1)用意している。ここで各リストには、最大5枚の参照ピクチャを割り当てられるようにしている。
Pピクチャでは、List 0のみを使用して、主に前方向予測を行う。BピクチャではList 0及びList 1を用いて、双方向予測(又は前方、或は後方のみの予測)を行う。即ち、List 0には、主に前方向予測のためのピクチャが割り当てられ、List 1には主に後方向予測のためのピクチャが収められる。
図7は、各ピクチャの表示順序と符号化順序を示す図である。尚、ここでは、Iピクチャ、Pピクチャ及びBピクチャの割合を、標準的なIピクチャが16フレーム間隔、Pピクチャが4フレーム間隔、その間のBピクチャが3フレームである場合で説明する。
図において、701は、表示順に並べた画像データを示し、四角の中にはピクチャの種類と表示順を示す番号が記入されている。例えばI00は、表示順が0番目のIピクチャであり、イントラ予測のみを行う。P04は表示順が4番目のPピクチャであり、前方向予測のみを行う。B01は、表示順が1番目のBピクチャであり、双方向予測を行う。ここで符号化を行う順序は表示順序と異なり、予測を行う順に符号化を行う。即ち、符号化順は、図7の702で示す様に、I00,P04、B01,B02,B03,P08,B05.B06,...といった順になる。
図8は、符号化されるピクチャと、参照リストとの関係を示す図である。
802は参照リスト(List 0)を示し、一旦符号化され復号化されたピクチャが収められている。例えば、P24のピクチャ(表示順が24番目のピクチャで、Pピクチャ)でインター予測を行う場合、リスト内の既に符号化が終わって復号化されたピクチャを参照する。この例では、P04,P08,P12,I16,P20がリストに収められている。インター予測では、マクロブロック毎に、このリスト中の参照ピクチャ内から最適な予測値をもつ動きベクトルを求めて符号化する。リスト内のピクチャは、参照ピクチャ番号が順に与えられて区別される(図示した番号とは別に与えられる)。こうしてP24の符号化が終わると、こんどは新たにP24が復号化されて参照リストに追加される。この参照リストからは、最も古い参照ピクチャ(ここではP04)がリストから除去される。符号化は、この後、B21,B22,B23と行われてP28へと続く。
更に、この参照リストの変化の様子を、各ピクチャ毎に示したのが図9である。
図9では、符号化されるピクチャ順に上から下へと、符号化中のピクチャとList 0及びList 1の内容を示してある。図の様にPピクチャ(又はIピクチャ)が符号化されると、参照リストが更新され、その参照リストの最も古いピクチャが除去されている。この例では、List 1は1つのピクチャしか持っていないが、これは後方参照を多くすると復号までのバッファ量が増えてしまうため、あまり離れた後方ピクチャの参照を避けたためである。
ここで挙げた例においては、参照に用いるピクチャはI及びPピクチャとし、I及びPピクチャは全て参照リストに順次加えている。またList 1で後方予測に使うピクチャは1ピクチャだけとした。これは通常最もよく用いられるであろうピクチャの構成で、最も良く使用されるであろう一例に過ぎず、H.264自体は、参照リストの構成に、より高い自由度を持っている。例えば、全てのI及びPピクチャを参照リストに加える必要は無く、またBピクチャを参照に加えることも可能である。また明示的に指示されるまで参照リストに留まる長期参照リストも定義されている。
図10及び図11は、Bピクチャを参照リストに加える場合の、符号化順の様子及び参照リストの変化の様子を示す図である。
Bピクチャを参照リストに加える場合、全てのBピクチャを符号化する度に、参照リストに追加する必要は無い。連続するBピクチャのうち、一部のBピクチャのみを参照リストに追加する方法が考えられている。例として、Bピクチャが3フレーム続く構成で、中間のBピクチャのみを参照ピクチャに加える場合を示す。この場合、符号化順序は、図10に示す様に、Pピクチャの符号化後、中間のBピクチャを符号化し、順次残りのBピクチャを符号化してゆく。図10の例では、P08の符号化後、B06を符号化し、B05,B07の順で符号化してゆく。B06は符号化した後、参照リストに追加される。
図11は、ピクチャの符号化順に応じた参照リストの更新を説明する図である。尚、図11では図10の場合とピクチャの番号を変更しているが、I,P,Bピクチャの番号順は図10に示すピクチャの順番に対応している。
図11では、1100,1101で示すように、P40,P44を符号化した後、参照リスト0(List 0),1(List 1)が更新されている。尚、Bピクチャの利用に関係する技術を開示する文献として特許文献1が挙げられる。
特開2004−88722号公報
このように、H.264では、符号化処理の際、Bピクチャを参照リストに追加するか否かを選択可能である。一般に、Bピクチャの方が符号化効率を高く出来るため、圧縮率を高めるためには、Bピクチャを多めに設定した方が良い。しかしながら、Bピクチャを単に多くして、参照リストに追加しない場合は、参照に使われるIPピクチャが、符号化対象ピクチャから時間的に離れてしまう。このため、動きの大きな画像については、中間のBピクチャを参照リストに追加する図10の構成の方が、参照ピクチャと符号化対象ピクチャとの時間間隔が近く、動き補償が行いやすいと考えられる。
一方、H.264の規格では、Bピクチャの枚数を幾つにするか、またBピクチャを参照するかどうかについては決められていない。即ち、画像や圧縮目的によって、Bピクチャを参照リストに加えるかどうかは任意とされている。このため、Bピクチャを参照リストに加えるかどうかは、画像や圧縮目的に応じて固定的に設定されており、符号化中に画像の性質が変化した場合などでも、同じ設定が使用されていた。尚、特許文献1に記載の技術は、Bピクチャの枚数について符号化順序を工夫をしたものである。従って、Bピクチャの参照について言及したものではない。
本発明の目的は上記従来技術の問題点を解決することにある。
本発明の特徴は、Bピクチャを参照ピクチャに加えるか否かを選択できるようにすることで、より効率の良い画像符号化を行うことができる。
上記目的を達成するために本発明の一態様に係る画像処理装置は以下のような構成を備える。即ち、
撮像装置により撮像された画像を入力して、Iピクチャ、Pピクチャ及びBピクチャを含む複数のフレームで構成される画像データとして符号化を行う画像処理装置であって、
前記Iピクチャをフレーム内予測により符号化する第1符号化手段と、
参照ピクチャを参照して前記Pピクチャをフレーム間予測及び動き補償により符号化する第2符号化手段と、
前記第1及び第2符号化手段による符号化の後、前記Iピクチャ又はPピクチャの間に存在する複数の前記Bピクチャを、前記参照ピクチャを参照して前記フレーム間予測及び動き補償により符号化する第3符号化手段と、
前記画像データの符号化の途中で、前記第3符号化手段で符号化されたBピクチャを復号したピクチャを、前記参照ピクチャとして使用するか否かを判定する判定手段と、
前記判定手段によって、前記第3符号化手段で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用するように判定されると、前記Bピクチャを復号したピクチャにより前記参照ピクチャを更新する更新手段と、を有し、
前記判定手段は、ピント外れにより画像の鮮鋭度が低い状態、及び、手ぶれによりフレーム間の相関が低い状態のうち、少なくとも一つの状態を検出した場合には、前記第3符号化手段で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用しないと判定することを特徴とする。
上記目的を達成するために本発明の一態様に係る画像処理方法は以下のような工程を備える。即ち、
撮像装置により撮像された画像を入力して、Iピクチャ、Pピクチャ及びBピクチャを含む複数のフレームで構成される画像データとして符号化を行う画像処理方法であって、
前記Iピクチャをフレーム内予測により符号化する第1符号化工程と、
参照ピクチャを参照して前記Pピクチャをフレーム間予測及び動き補償により符号化する第2符号化工程と、
前記第1及び第2符号化工程での符号化の後、前記Iピクチャ又はPピクチャの間に存在する複数の前記Bピクチャを、前記参照ピクチャを参照して前記フレーム間予測及び動き補償により符号化する第3符号化工程と、
前記画像データの符号化の途中で、前記第3符号化工程で符号化されたBピクチャを復号したピクチャを、前記参照ピクチャとして使用するか否かを判定する判定工程と、
前記判定工程で、前記第3符号化工程で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用するように判定されると、前記Bピクチャを復号したピクチャにより前記参照ピクチャを更新する更新工程と、を有し、
前記判定工程は、ピント外れにより画像の鮮鋭度が低い状態、及び、手ぶれによりフレーム間の相関が低い状態のうち、少なくとも一つの状態を検出した場合には、前記第3符号化工程で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用しないと判定することを特徴とする。
本発明によれば、Bピクチャを参照ピクチャに加えるか否かを選択できるようにしたことにより、より効率の良い画像符号化を行えるという効果がある。
以下、添付図面を参照して本発明の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施の形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
本実施の形態に係る圧縮手順を図1乃至図3を参照して説明する。尚、本実施の形態では、Bピクチャを参照リストに加えるか否かを選択する機能をもつBピクチャセレクタを設け、Bピクチャを参照リストに加えるか否かを変更可能にしている。
図1は、本発明の実施の形態に係る画像符号化装置の構成を説明する機能ブロック図である。
入力される画像データ(Input Video)は、マクロブロックに分けられた画像データである。差分器101は、その入力した画像データと、イントラ予測部(Intra Prediction)108或はインター予測部111(INter Prediction)からの予測値との差分を求める。DCT変換部(Integer Transform)102は、差分器101の出力を整数DCT変換し、その変換した結果は量子化部(Quant)103で量子化される。こうして量子化された結果の一方は、差分画像データとしてエントロピー符号化部(Entropy Coding)115に送られる。また他方は、逆量子化部(Inv Quant)104で逆量子化され、逆整数DCT変換部(Inv Integer Transform)105で逆整数DCT変換される。加算器106は、その逆整数DCT変換された結果に予測値を加えて画像を復元する。こうして復元された画像の一方は、イントラ予測のためのフレームメモリ(Frame Mem)107に送られて格納される。他方はフィルタ(Deblocking Filter)109で、デブロッキングフィルタ処理が行われた後、インター予測のためのフレームメモリ110に格納される。
フレームメモリ107の画像データは、イントラ予測のための画像データであり、イントラ予測部108におけるイントラ予測で使用される。このイントラ予測では、同一ピクチャ内で、既に符号化されたブロックの隣接画素の値を予測値として用いる。またフレームメモリ110に格納されたインター予測のための画像データは、後述するように、複数のピクチャで構成され、そのピクチャがList 0とList 1の2つの参照リストに分けられており、インター予測部111で使用される。こうして予測された画像データにより、メモリコントローラ(Memory Controller)113によって、参照リスト内のピクチャが更新される。インター予測部111では、フレームの異なる画像データに対して、動き予測部(Motion Estimation)112で動き検出を行って最適な動きベクトルを求め、予測画像を決定する。
これらイントラ予測とインター予測の結果、最適な予測値がスイッチ114で選択される。このスイッチ114で選択されたイントラ予測モード又は予測ベクトルが、エントロピー符号化部115と差分器101に送られる。エントロピー符号化部115では、差分画像データと共に符号化し、出力ビットストリームを形成する。Bピクチャセレクタ(B reference Decision)116は、Bピクチャを符号化した後、そのBピクチャを参照リストに加えるかどうかを選択する。そのBピクチャを参照リストに加える場合は、メモリコントローラ113に対してBピクチャを参照リストに追加して更新するように伝える。
図では、Bピクチャセレクタ116からの指示は、メモリコントローラ113にのみ関連しているように描画している。しかし参照リストに加えないピクチャについては、デブロッキングフィルタ109の処理は不要である。よって、Bピクチャセレクタ116の出力をデブロッキングフィルタ109に入力して、参照リストに加えないBピクチャに対してデブロッキングフィルタ処理を行わないように制御しても良い。
本実施の形態では、画像を符号化する過程で、画像の性質などに応じて、Bピクチャを参照リストに加えるか否かを適宜、選択して切り替えることを特徴としている。
この手順を図2のフローチャートで説明する。
図2は、本実施の形態に係る画像符号化装置による符号化処理を制御する制御部の処理を説明するフローチャートである。尚、この制御部としては、後述する図5のカメラ制御部505などが挙げられるが、本発明は、このようなカメラ制御だけに限定されるものではない。
まずステップS201で、符号化の開始が指示されるとステップS202に進み、各ピクチャに対する符号化処理を行う。この符号化では図1を参照して説明したように、予測値との差分データをDCT変換して量子化してエントロピー符号化するとともに、フレーム間予測、フレーム内予測、及び動き補償による符号化を行う。この符号化の後ステップS203で、その符号化したピクチャが最後のピクチャかどうかを判断し、そうであればステップS207に進み、符号化を終了する。
一方、ステップS203で、最後のピクチャでなければステップS204に進み、参照リストを更新するか否かを判断する。まずステップS204では、その符号化したピクチャがBピクチャかどうかを判断する。Bピクチャでない場合、即ち、Iピクチャ又はPピクチャである場合はステップS206に進み、その符号化したI又はPピクチャを参照リストに追加して更新する。
一方、ステップS204でBピクチャである場合はステップS205に進み、これまでの符号化結果や画像の性質に応じて、そのBピクチャを参照リストに追加するか否かを判断する。ここで参照リストに追加する場合はステップS206に進み、参照リストの更新する。それ以外のBピクチャについては、参照リストの更新を行わず、ステップS202における次のピクチャの符号化処理に移る。
本実施の形態に係る参照ピクチャの更新処理を図3及び図4を参照して説明する。ここでは、Iピクチャ、Pピクチャ及びBピクチャの割合を、標準的なIピクチャが16フレーム間隔、Pピクチャが4フレーム間隔、その間のBピクチャが3フレームである場合で説明する。
図3は、表示順に並べられているピクチャを符号化している途中で、Bピクチャを参照リストに追加するように指示された場合の具体例を説明する図である。
図3において、301は表示順に並べた画像データを示し、302は符号化順を示す。I00(0番目でIピクチャ)から、I16(16番目でIピクチャ)までを符号化する。ここで、P08(8番目でPピクチャ)までは、Bピクチャを参照リストに追加しない状態(Bピクチャ参照無し)であり、P08以降のピクチャを、Bピクチャを参照リストに追加する状態(Bピクチャ参照有り)で符号化する例を示している。
始めに符号化するピクチャ、即ち、I00からP04及びP08については、Bピクチャ参照無しで符号化している。次にP12の符号化した後、Bピクチャ参照無しであれば、次にB09が符号化される。しかし、ここではBピクチャを参照するように変更されているので、P08とP12の間にあるB09〜B11の符号化に際しては、参照に用いる予定のB10をまず最初に符号化して参照リストに追加する。そして、その後、B09,B11を符号化する。以下も同様に、IピクチャとPピクチャ間のBピクチャについては、参照に用いる予定のBピクチャを先に符号化して参照リストに追加し、他のBピクチャは、その後に符号化する。例えば、P12とI16との間のB13〜B15の符号化に際しては、参照に用いる予定のB14をまず最初に符号化して参照リストに追加し、その後、B13,B15を符号化する。
図4は、符号化の途中からBピクチャを参照する様に変更した場合の、参照リストの更新の様子を示す図である。尚、符号化初期では、参照リスト内に十分なピクチャが保持されていないので、説明の都合上、各ピクチャの番号を図3と異ならせているが、I,P,Bピクチャの順番は、前述した例と同じである。
図4では、上から下に、時系列で参照リストの変化を示している。図の400は、符号化対象となっているピクチャを示す。401は参照リスト0(List 0)のピクチャを示し、402は参照リスト1(List 1)のピクチャの様子を示している。尚、この例では、参照リスト内のピクチャ数は、List 0に5枚、List 1に1枚となっている。List 1は、通常Bピクチャの後方参照用に用いられるが、時間的に大きく離れたピクチャを参照すると、復号時の遅延が大幅に増加するため、通常は、最近のI又はPピクチャを1枚だけ参照している。例えば、最初のP40を符号化する場合、Pピクチャであるから参照リスト0から参照するので、この時点で参照リスト0内にあるP20,P24,P28,I32及びP36を参照する。P40の符号化が終了した後は、Pピクチャであるから、参照リストの更新が行われる。即ち、410で示すように、参照リスト0については、リスト内で最も古いP20が破棄され、P40が新たにリストに加わる。同様に参照リスト1については、P36が破棄され、P40がリストに加わる。
これにより次のB37では、参照リスト0から、P24,P28,I32,P36を参照し、参照リスト1から、P40を参照して符号化する。このB37の符号化が終了した後は、Bピクチャであり、この時点ではBピクチャの参照を行っていないから、参照リストの更新は行わない。
次にP44の符号化後からBピクチャの参照を行う場合を考える。この場合、表示順序では、P44の符号化まではBピクチャ参照を行わない。そしてP44を符号化して参照リストに追加更新(411)した後、次に符号化されるのは、B41,B42、B43のうち、参照リストに追加する予定のB42となる。そして、このB42の符号化を終了した後、412で示すように、B42が参照リスト0,1に追加されて参照リストの更新が行われる。更に、この次に符号化するピクチャ、即ち、B41は、参照リスト0からI32,P36,P40及びP44を、参照リスト1からB42を参照して符号化される。続くB43も同様に、参照リスト0からI32,P36,P40及びP44を、参照リスト1からB42を参照して符号化される。また次のP48も同様に、参照リスト0からI32,P36,P40,P44を、参照リスト1からB42を参照して符号化される。
本実施の形態では、図1に示すように、符号化部にBピクチャセレクタ116を設けて、Bピクチャを参照リストに追加するか否かを選択して切り替えている。この切り替えの判断(図2のステップS205に相当)は、符号化部の内部で判断するか、符号化部の外部で判断するかのいずれでも可能である。
符号化部の内部で切り替えの判断を行う場合は、図1に示した符号化部に、画像の性質(輝度レベル、色情報、レベル分布、レベル分散、周波数特性、又はこれらの組み合わせ等)や、符号化の状態(符号量、量子化パラメータの値、圧縮率、符号劣化によるS/N値、動きベクトルの長さ、動きベクトルの符号量、又はこれらの組み合わせ等)を調べる手段を設けて、その結果から判断することができる。この場合、一連の画像を、符号化処理する最中に、Bピクチャ参照の可否を判断して切り替えるようにしても良い。また或は、処理開始前に予備的に符号化処理を行って画像の性質などを判断し、その判断結果に応じて、処理開始前にBピクチャ参照の可否を判断しても良い。
Bピクチャを参照リストに追加するか否かの判断を、符号化部の外部で行う場合では、例えば、図5に示す様に、符号化部がテレビカメラと接続されている場合、撮影時のカメラの状態に応じて、Bピクチャ参照の変更を符号化部に指示することができる。
図5は、本実施の形態に係る撮像装置の構成を説明するブロック図である。
501はレンズ部であり、502は撮像素子、503はカメラ信号処理部である。504は符号化部であって、図1に示すような符号化処理を行う。505はカメラ制御部で、カメラ全体の処理をコントロールする。CPU505aは、ROM505bに記憶されたプログラムに従って、この撮像装置の動作を制御している。RAM505cは、CPU505aの制御時、各種データを記憶するためのワークエリアとして使用される。506は焦点(Focus)検出部であって、画像の合焦状態を検出する。507,508はレンズアクチュエータで、ピント調整やズームの動作を実行させる。509は動きセンサで、カメラ全体の手ぶれ状態を検出する。カメラ制御部505は、各センサ類からの信号の状況やレンズの動作状態等を把握して、符号化部504にBピクチャ参照を行うかどうかを指示している。尚、これ以外にも、符号化部504で符号化した画像データを記憶する記憶媒体(例えば、磁気テープ、メモリカード、DVDなど)を有している。
本実施の形態に係るカメラ制御部505は、前述の図2のフローチャートで示される処理を実行するプログラムをROM505bに記憶しており、このプログラムはCPU505aにより実行される。そしてステップS205における判断処理では、例えば、焦点検出部506で、ピントはずれの状態を検出した場合、画像の鮮鋭度が低く符号化は容易であるためBピクチャ参照をする効果が低い。よってこの場合、カメラ制御部505は、符号化部504に対して「Bピクチャ参照無し」を指示する。一方、ピントが合った場合では、画像の鮮鋭度が高くなり、符号化が困難となってくる反面、Bピクチャ参照の効果が高くなる。よって、このような場合には、カメラ制御部505から符号化部504に対して「Bピクチャ参照有り」を指示する。
また他の例として、動きセンサ509により手ブレの状態を検出する。ここで手ぶれ状態であると検出すると、各フレーム間の相関が低く、Bピクチャを参照する効果が低いと考えられる。従って、この場合は、カメラ制御部505から符号化部504に対して「Bピクチャ参照無し」を指示する。一方、手ぶれ状態で無い場合は、「Bピクチャ参照有り」を指示する。また、パンニング撮影の様に、比較的ゆっくり画面が動くような撮影状態の場合は、時間的に近い画像間の相関が高い。即ち、Bピクチャ参照の効果が高くなるので、「Bピクチャ参照有り」を指示する。
更に他の例として、カメラ制御部505が、レンズアクチュエータ507,508に対してピント調整やズーム動作の指示を行っている場合には、カメラ制御部505は、センサ出力の結果によらず、制御中の動作判断に基づいてBピクチャ参照の可否を判断する。こうしてBピクチャ参照をすべきかどうかを決定して指示することができる。
このように、Bピクチャを参照リストに追加するか否かの判断は、外部の状態から決めることができる。この場合、撮影中(符号化処理中)に外部状況の変化から、Bピクチャ参照を行うか否かを切り替えることもできるし、撮影前(符号化処理前)にその時の外部状況から、Bピクチャ参照を行うか否かを切り替えることもできる。
以上説明したように本実施の形態によれば、符号化部にBピクチャセレクタ116を設けて、Bピクチャを参照リストに追加するか否かを選択して切り替えることにより、最適な符号化処理を実現している。
尚、説明の都合上、図1において、Bピクチャセレクタ116を符号化部の内部に一体化して設けた例で説明したが、これは実装された場合、Bピクチャセレクタが同一のICチップ内に内蔵されることを意味するものではない。よって、Bピクチャセレクタ116が別のICチップ上に構成されてもよい。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを読み出して実行することによっても達成され得る。上記実施形態では、図2のフローチャートに対応したプログラムである。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明のクレームでは、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、様々なものが使用できる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などである。その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。その場合、ダウンロードされるのは、本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルであってもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明のクレームに含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布する形態としても良い。その場合、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムが実行可能な形式でコンピュータにインストールされるようにする。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される形態以外の形態でも実現可能である。例えば、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれるようにしてもよい。この場合、その後で、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって前述した実施形態の機能が実現される。
本発明の実施の形態に係る画像符号化装置の構成を説明する機能ブロック図である。 本実施の形態に係る画像符号化装置による符号化処理を制御する制御部の処理を説明するフローチャートである。 表示順に並べられているピクチャを符号化している途中で、Bピクチャを参照リストに追加するように指示された場合の具体例を説明する図である。 符号化の途中からBピクチャを参照する様に変更した場合の、参照リストの更新の様子を示す図である。 本実施の形態に係る撮像装置の構成を説明するブロック図である。 H.264方式の圧縮手順を説明する図である。 各ピクチャの表示順序と符号化順序を示す図である。 符号化されるピクチャと、参照リストとの関係を示す図である。 参照リストの変化の様子を、各ピクチャ毎に示した図である。 Bピクチャを参照リストに加える場合の符号化順の様子を説明する図である。 Bピクチャを参照リストに加える場合の参照リストの変化の様子を示す図である。

Claims (6)

  1. 撮像装置により撮像された画像を入力して、Iピクチャ、Pピクチャ及びBピクチャを含む複数のフレームで構成される画像データとして符号化を行う画像処理装置であって、
    前記Iピクチャをフレーム内予測により符号化する第1符号化手段と、
    参照ピクチャを参照して前記Pピクチャをフレーム間予測及び動き補償により符号化する第2符号化手段と、
    前記第1及び第2符号化手段による符号化の後、前記Iピクチャ又はPピクチャの間に存在する複数の前記Bピクチャを、前記参照ピクチャを参照して前記フレーム間予測及び動き補償により符号化する第3符号化手段と、
    前記画像データの符号化の途中で、前記第3符号化手段で符号化されたBピクチャを復号したピクチャを、前記参照ピクチャとして使用するか否かを判定する判定手段と、
    前記判定手段によって、前記第3符号化手段で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用するように判定されると、前記Bピクチャを復号したピクチャにより前記参照ピクチャを更新する更新手段と、を有し、
    前記判定手段は、ピント外れにより画像の鮮鋭度が低い状態、及び、手ぶれによりフレーム間の相関が低い状態のうち、少なくとも一つの状態を検出した場合には、前記第3符号化手段で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用しないと判定することを特徴とする画像処理装置。
  2. 前記参照ピクチャは、複数枚を組みにして第1及び第2参照リストを構成し、各参照リストの各参照ピクチャが前記フレーム間予測によって参照されるものであり、
    前記Pピクチャは、前記第1参照リストの参照ピクチャを参照して前記フレーム間予測されるものであり、前記Bピクチャは前記第1及び第2参照リストの両方の参照ピクチャを参照して前記フレーム間予測されるものであることを特徴とする請求項1に記載の画像処理装置。
  3. 前記判定手段は、前記撮像装置が有する焦点検出部または動き検出部からの信号を用いて判定処理を行うことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 撮像装置により撮像された画像を入力して、Iピクチャ、Pピクチャ及びBピクチャを含む複数のフレームで構成される画像データとして符号化を行う画像処理方法であって、
    前記Iピクチャをフレーム内予測により符号化する第1符号化工程と、
    参照ピクチャを参照して前記Pピクチャをフレーム間予測及び動き補償により符号化する第2符号化工程と、
    前記第1及び第2符号化工程での符号化の後、前記Iピクチャ又はPピクチャの間に存在する複数の前記Bピクチャを、前記参照ピクチャを参照して前記フレーム間予測及び動き補償により符号化する第3符号化工程と、
    前記画像データの符号化の途中で、前記第3符号化工程で符号化されたBピクチャを復号したピクチャを、前記参照ピクチャとして使用するか否かを判定する判定工程と、
    前記判定工程で、前記第3符号化工程で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用するように判定されると、前記Bピクチャを復号したピクチャにより前記参照ピクチャを更新する更新工程と、を有し、
    前記判定工程は、ピント外れにより画像の鮮鋭度が低い状態、及び、手ぶれによりフレーム間の相関が低い状態のうち、少なくとも一つの状態を検出した場合には、前記第3符号化工程で符号化されたBピクチャを復号したピクチャを前記参照ピクチャとして使用しないと判定することを特徴とする画像処理方法。
  5. 前記参照ピクチャは、複数枚を組みにして第1及び第2参照リストを構成し、各参照リストの各参照ピクチャが前記フレーム間予測によって参照されるものであり、
    前記Pピクチャは、前記第1参照リストの参照ピクチャを参照して前記フレーム間予測されるものであり、前記Bピクチャは前記第1及び第2参照リストの両方の参照ピクチャを参照して前記フレーム間予測されるものであることを特徴とする請求項に記載の画像処理方法。
  6. 前記判定工程では、前記撮像装置が有する焦点検出部または動き検出部からの信号を用いて判定処理を行うことを特徴とする請求項又はに記載の画像処理方法。
JP2005304583A 2005-10-19 2005-10-19 画像処理装置及びその方法 Expired - Fee Related JP4702943B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005304583A JP4702943B2 (ja) 2005-10-19 2005-10-19 画像処理装置及びその方法
US11/548,392 US20070127571A1 (en) 2005-10-19 2006-10-11 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005304583A JP4702943B2 (ja) 2005-10-19 2005-10-19 画像処理装置及びその方法

Publications (3)

Publication Number Publication Date
JP2007116355A JP2007116355A (ja) 2007-05-10
JP2007116355A5 JP2007116355A5 (ja) 2008-11-27
JP4702943B2 true JP4702943B2 (ja) 2011-06-15

Family

ID=38098161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005304583A Expired - Fee Related JP4702943B2 (ja) 2005-10-19 2005-10-19 画像処理装置及びその方法

Country Status (2)

Country Link
US (1) US20070127571A1 (ja)
JP (1) JP4702943B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008124772A (ja) * 2006-11-13 2008-05-29 Hitachi Ltd 符号化装置及び符号化方法
JP5173613B2 (ja) * 2007-07-03 2013-04-03 キヤノン株式会社 動画像符号化装置及びその制御方法
WO2012090495A1 (ja) * 2010-12-27 2012-07-05 パナソニック株式会社 画像符号化方法および画像復号方法
US9049455B2 (en) * 2010-12-28 2015-06-02 Panasonic Intellectual Property Corporation Of America Image coding method of coding a current picture with prediction using one or both of a first reference picture list including a first current reference picture for a current block and a second reference picture list including a second current reference picture for the current block
MX2014000159A (es) 2011-07-02 2014-02-19 Samsung Electronics Co Ltd Metodo y aparato para la codificacion de video, y metodo y aparato para la decodificacion de video acompañada por inter prediccion utilizando imagen co-localizada.

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003274411A (ja) * 2002-03-14 2003-09-26 Matsushita Electric Ind Co Ltd 画像符号化方法および画像復号方法
JP2004088722A (ja) * 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5359365A (en) * 1991-05-24 1994-10-25 Canon Kabushiki Kaisha Moving image processing method and apparatus
JP3221785B2 (ja) * 1993-10-07 2001-10-22 株式会社日立製作所 撮像装置
US6408030B1 (en) * 1996-08-20 2002-06-18 Hitachi, Ltd. Scene-change-point detecting method and moving-picture editing/displaying method
US6192188B1 (en) * 1997-10-20 2001-02-20 Lsi Logic Corporation Programmable audio/video encoding system capable of downloading compression software from DVD disk
US6091776A (en) * 1998-05-26 2000-07-18 C-Cube Microsystems, Inc. Delay balanced video encoder system
JP2000013790A (ja) * 1998-06-19 2000-01-14 Sony Corp 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体
US6115076A (en) * 1999-04-20 2000-09-05 C-Cube Semiconductor Ii, Inc. Compressed video recording device with non-destructive effects addition
EP1765018B1 (en) * 2002-02-01 2008-01-16 Matsushita Electric Industrial Co., Ltd. Moving picture decoding method and moving picture decoding apparatus
US7321626B2 (en) * 2002-03-08 2008-01-22 Sharp Laboratories Of America, Inc. System and method for predictive motion estimation using a global motion predictor
EP2271106B1 (en) * 2002-04-19 2016-05-25 Panasonic Intellectual Property Corporation of America Motion vector calculating method
KR100506864B1 (ko) * 2002-10-04 2005-08-05 엘지전자 주식회사 모션벡터 결정방법
US7889792B2 (en) * 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
JP4541825B2 (ja) * 2004-10-15 2010-09-08 キヤノン株式会社 動画像符号化装置及びその制御方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004088722A (ja) * 2002-03-04 2004-03-18 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
JP2003274411A (ja) * 2002-03-14 2003-09-26 Matsushita Electric Ind Co Ltd 画像符号化方法および画像復号方法

Also Published As

Publication number Publication date
US20070127571A1 (en) 2007-06-07
JP2007116355A (ja) 2007-05-10

Similar Documents

Publication Publication Date Title
TWI790409B (zh) 視頻編碼及解碼
JP7530465B2 (ja) ビデオ符号化及び復号化
EP1770639B1 (en) Moving image coding apparatus
JP6344800B2 (ja) 画像処理装置及び動画像伝送方法
WO2001049026A1 (en) Digital camera, memory control device usable for it, image processing device and image processing method
JP2010199656A (ja) 動画撮像装置
GB2582929A (en) Residual signalling
JP2022501868A (ja) ビデオ符号化の動きベクトル予測子インデックス符号化
JP2010035133A (ja) 動画像符号化装置及び動画像符号化方法
JP2009260943A (ja) 撮像装置
US8036281B2 (en) Image coding apparatus and image coding method
JP7321345B2 (ja) ビデオ符号化及び復号
JP2023052553A (ja) ビデオ符号化及び復号
JP4702943B2 (ja) 画像処理装置及びその方法
JP2016021731A (ja) 撮像装置およびその制御方法ならびにプログラム
US8306110B2 (en) Moving image coding apparatus and method using copy pictures depending on virtual buffer verifier occupancy
JP4357560B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2005175974A (ja) 撮像装置
US8953055B2 (en) Image pickup apparatus
JP6598376B2 (ja) 符号化装置、及び、符号化方法
JP2005303487A (ja) 動画像復号装置及び動画像復号プログラム
JP4596975B2 (ja) 画像符号化方法、及び画像処理装置
JP4594163B2 (ja) 画像符号化方法、及び画像符号化装置
JP2015050688A (ja) 撮像装置、撮像装置の制御方法、プログラム
JP2010166518A (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081009

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110307

LAPS Cancellation because of no payment of annual fees