[go: up one dir, main page]

JP4769717B2 - 画像復号化方法 - Google Patents

画像復号化方法 Download PDF

Info

Publication number
JP4769717B2
JP4769717B2 JP2006520529A JP2006520529A JP4769717B2 JP 4769717 B2 JP4769717 B2 JP 4769717B2 JP 2006520529 A JP2006520529 A JP 2006520529A JP 2006520529 A JP2006520529 A JP 2006520529A JP 4769717 B2 JP4769717 B2 JP 4769717B2
Authority
JP
Japan
Prior art keywords
picture
pictures
decoded
random access
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006520529A
Other languages
English (en)
Other versions
JPWO2006075635A1 (ja
Inventor
雅保 井口
眞也 角野
正真 遠間
清史 安倍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006520529A priority Critical patent/JP4769717B2/ja
Publication of JPWO2006075635A1 publication Critical patent/JPWO2006075635A1/ja
Application granted granted Critical
Publication of JP4769717B2 publication Critical patent/JP4769717B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、ストリームに含まれる符号化されたピクチャを復号化して再生する画像復号化方法に関する。
近年、音声や画像などを統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN:Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格では対象とする品質を伝送速度が主として約1.5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号を2〜15MbpsでTV放送品質を実現する。さらに現状では、MPEG−1及びMPEG−2の標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1、MPEG−2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。
更に、2003年に、ISO/IECとITU−Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG−4 AVCおよびITU H.264が標準化されている(例えば、非特許文献1参照。)。H.264規格は、現在HD(High Definition)画像などに適したHigh Profile対応の改正規格案を策定中である。MPEG−2の動画像圧縮技術用いたアプリケーションとしては、映画などを再生するDVDプレーヤが一般的になっているが、BD−ROM(Blu-ray Disk ROM)を用いたプレーヤではH.264の圧縮規格が採用される予定であり、現在そのフォーマット規格の策定段階である。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号化の基本単位であるブロックごとに指定することができるが、符号化を行ったストリーム(ビットストリーム)中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
Pピクチャ又はBピクチャの符号化には、動き補償画面間予測符号化が用いられている。動き補償画面間予測符号化とは、画面間予測符号化に動き補償を適用した符号化方式である。動き補償とは、単純に参照フレームの画素値から予測するのではなく、ピクチャ内の各部の動き量(以下、これを動きベクトルと呼ぶ)を検出し、当該動き量を考慮した予測を行うことにより予測精度を向上すると共に、データ量を減らす方式である。例えば、符号化対象ピクチャの動きベクトルを検出し、その動きベクトルの分だけシフトした予測値と符号化対象ピクチャとの予測残差を符号化することによりデータ量を減している。この方式の場合には、復号化の際に動きベクトルの情報が必要になるため、動きベクトルも符号化されて記録又は伝送される。
動きベクトルはマクロブロック単位で検出されており、具体的には、符号化対象ピクチャ側のマクロブロックを固定しておき、参照ピクチャ側のマクロブロックを探索範囲内で移動させ、基準ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。
図1Aおよび図1Bは、従来のMPEG2のストリームの構成図である。
図1Aおよび図1Bに示すようにMPEG−2のストリームは以下のような階層構造を有している。ストリーム(Stream)は、複数のグループ・オブ・ピクチャ(Group Of Picture、GOP)から構成されており、これを符号化処理の基本単位とすることで動画像の編集やランダムアクセスが可能になっている。グループ・オブ・ピクチャは、複数のピクチャから構成され、各ピクチャは、Iピクチャ、Pピクチャ又はBピクチャである。ストリーム、GOPおよびピクチャはさらにそれぞれの単位の区切りを示す同期信号(sync)と当該単位に共通のデータであるヘッダ(header)から構成されている。
図2は、他の従来のストリームの構成図である。
このストリームは、現在ITU−TとISO/IECが共同で標準化中のJVT(H.264/MPEG-4 AVC)に対応する。JVTでは、ヘッダという概念は無く、共通データはストリームの先頭にパラメータセットPSという名称で配置される。また、GOPに相当する概念は無いが他のピクチャに依存せずに復号化できる特別なピクチャ単位でデータを分割すればGOPに相当するランダムアクセス可能な単位が構成できるので、これをランダムアクセスユニットRAUと呼ぶことにする。パラメータセットPSには、各ピクチャのヘッダに相当するデータであるピクチャパラメータセットPPSと、MPEG−2におけるGOP以上の単位のヘッダに相当するシーケンスパラメータセットSPSがある。各ピクチャには前記ピクチャパラメータセットPPSおよびシーケンスパラメータセットSPSの何れを参照するかを示す識別子が付与される。即ち、それぞれ互いに異なる複数のピクチャパラメータセットPPSおよびシーケンスパラメータセットSPSは、1回だけ符号化され、各ピクチャではそのセットの中のどれを参照するかを識別子で示すことで、各ピクチャ毎に同じ値のパラメータセット(ヘッダ)を何回も符号化する無駄を省き圧縮率を向上している。ピクチャ番号PNはピクチャを識別するための識別番号である。なお、ここでのピクチャ番号PNとはピクチャの表示の順番を示す番号であって、上記非特許文献1に記載された、復号化順を示すPictureNumberとは異なる。シーケンスパラメータセットSPSには、最大参照可能ピクチャ数、画像サイズ等が含まれており、ピクチャパラメータセットPPSには、可変長符号化のタイプ(ハフマン符号化と算術符号化の切替)、量子化ステップの初期値、参照ピクチャ数等が含まれている。
図3Aおよび図3Bは、従来のMPEG−2などで使用されているGOP間の参照状態の説明図である。
図3Aは、Closed GOPにおけるピクチャ間の予測構造を示す。同図で斜線をつけたピクチャは他のピクチャから参照されるピクチャである。また、各ピクチャは表示順で配列している。Closed GOP構造ではIDR(Instantaneous Decoding Refresh)ピクチャよりも表示時刻で前になるBピクチャ(B6、B7)は、IDRピクチャのみを参照した予測符号化が可能であり、GOPを跨いだ参照はできない。また、図3BはOpen GOPにおけるピクチャ間の予測構造を示す。同図で斜線をつけたピクチャは図3Aと同様に他のピクチャから参照されるピクチャである。また、各ピクチャは表示順で配列している。Open GOP構造ではIピクチャ(I8)よりも表示時刻で前になるBピクチャ(B6、B7)は、同じGOP3内のピクチャに加えて直前のGOP4のPピクチャ(P5)を参照した予測符号化が可能となっている。
MPEG−2ではPピクチャ(P2、P5、P11、P14)は表示時刻が直前1枚のIピクチャもしくはPピクチャのみを参照した予測符号化が可能である。また、Bピクチャ(B0、B1、B3、B4、B6、B7、B9、B10、B12及びB13)は表示時刻が直前1枚と直後1枚のIピクチャもしくはPピクチャを参照した予測符号化が可能であり、更に、ストリームに配置される順序も決まっている。
一方、H.264の規格では、符号化効率(圧縮率)を大きく向上させるために、非常に柔軟なピクチャ間の予測構造を導入している。つまり、Pピクチャは直前1枚だけの参照ではなく、既に復号化した後のピクチャで、参照ピクチャのバッファに管理されていれば、前方後方を問わず複数枚のIピクチャもしくはPピクチャもしくはBピクチャから符号化ブロックごとに異なるピクチャを1枚ずつ選択することが可能である。また同様に、Bピクチャでは、直前の1枚と直後の1枚だけでなく、前方後方を問わず複数枚のIピクチャもしくはPピクチャもしくはBピクチャから符号化ブロックごとに異なるピクチャを2枚ずつ選択することが可能である。
BD−ROMのフォーマット規格では、Open GOP構造となるストリーム位置でも従来と同様にランダムアクセスユニットRAUとすることが可能である。ただし、H.264規格のピクチャ間の予測符号化には例えば次の制限がかかっている。
(1)ランダムアクセス再生開始点として指定されているIピクチャの表示時刻で直前にあるBピクチャ(B6、B7)は、表示時刻の前後のピクチャを参照する可能性があるため、ランダムアクセス再生時には表示を行わない。
(2)ランダムアクセス再生開始点として指定されているIピクチャの表示時刻後方のピクチャからは、そのIピクチャよりも表示時刻で前方のピクチャを参照してはいけない。
図4は、従来の画像復号化方法を実現する画像復号化装置のブロック図である。
図4の画像復号化装置は、可変長復号化部901と、動き補償部902と、ピクチャメモリ903と、加算部904と、変換部905とを備えている。
可変長復号化部901は、ストリームStrを復号化し、量子化値Qco、相対インデックスInd、ピクチャタイプPtyおよび動きベクトルMVを出力する。量子化値Qco、相対インデックスIndおよび動きベクトルMVは、ピクチャメモリ903、動き補償部902および変換部905に入力され復号化処理が行われる。
変換部905は、量子化値Qcoを逆量子化して周波数係数に復元し、さらに周波数係数から画素差分値に逆周波数変換し、加算部904に出力する。
加算部904は、画素差分値と動き補償部902から出力される予測画像とを加算して復号化画像Voutを生成する。生成した復号化画像Voutはピクチャメモリ903に保存される。この時、複数のピクチャを参照ピクチャとして使用することができるように、参照するピクチャの識別番号を指定するための参照番号(相対インデックスInd)がブロックごとに必要となる。そこで、相対インデックスIndと、ピクチャメモリ903中の各ピクチャが有するピクチャ番号との対応を取ることにより、相対インデックスIndによって参照ピクチャを指定することが可能となる。
ピクチャメモリ903は、参照ピクチャリストを備えて、復号化されて参照に用いられる参照ピクチャはこの参照ピクチャリストに格納される。また、この参照ピクチャリストは、参照ピクチャをFIFO(First In First Out)管理するリスト(STRL=Short Term Reference List)と、明示的に指定された参照ピクチャをリストに蓄えるか破棄するかの管理を行うリスト(LTRL=Long Term Reference List)とを有する。
動き補償部902は、上記処理によって検出された動きベクトルおよび相対インデックスIndを用いて、ピクチャメモリ903に格納されている復号化画像から予測画像に最適な画像領域を取り出す。そして、動き補償部902は、上述の予測画像を生成して加算部904に出力する。
次に、相対インデックスIndによってピクチャを指定するために、各ピクチャに付加するピクチャ番号PNの生成方法について説明する。ここでは、H.264で定義されている3つのピクチャ番号PNの生成方法から例として2つの方法の概略を説明する。
(ピクチャ番号の生成方法例1)
図5は、ピクチャ番号の生成方法例1の説明図である。
以下、図5を用いてピクチャ番号の生成方法例1を説明する。生成方法例1では、復号化処理において変数として管理するオフセット値Msbと、それぞれのピクチャに付加されている、オフセット値Msbからの差分値(カウント値lsb)とを加算することによりピクチャ番号PNを生成する。
図5において、各ピクチャPicはI、PおよびBのいずれかのピクチャであり、画面への表示順に並べられている。ただし、復号化順は、IDR、…、P3、B1、B2、P6、B4、B5、I9、B7、B8、…の並びで復号化されていることを想定している。Msb1とMsb2はオフセット値Msbの値を表しており、Msb1=96、Msb2=112となっているとする。
ピクチャPicの並びの先頭に示すように、ストリームの開始点や復号化対象のGOPとその前のGOPの間に参照関係がない場所には、アクセスユニットAUの最初に復号されるIピクチャとしてIDRピクチャが存在する。まず、IDRピクチャの復号化時には、オフセット値Msbは0に初期化され、カウント値lsbも0となっているので、そのIDRピクチャのピクチャ番号PNは0となる。例えば、次のPピクチャでカウント値lsbが3となっている場合には、Msb+lsb=0+3=3となり、そのPピクチャに対するピクチャ番号PNは3となる。
また、その次のBピクチャでカウント値lsbが1となっている場合には0+1=1で、そのBピクチャに対するピクチャ番号PNは1となり、さらにその次のBピクチャでカウント値lsbが2となっている場合には0+2=2で、そのBピクチャに対するピクチャ番号PNは2となる。
ここで、以上に示した動作を繰り返しつつ、カウント値lsbのビット数が大きくなりすぎず、符号化効率を落とさないように、カウント値lsbが一定の値(最大カウント値Lsb)になると、オフセット値Msbに最大カウント値Lsbを加える処理を行い、カウント値lsbの値が最大カウント値Lsbを超えないように管理している。例えば、最大カウント値Lsb=16の場合、カウント値lsbが最大カウント値Lsbに6回到達するとオフセット値Msbは0+16×6=96の値に更新されていることになる。
また、ピクチャP3を復号化する時、オフセット値Msbが96に更新されており、カウント値lsb=12となっている場合、ピクチャP3のピクチャ番号PNは96+12=108となる。同様に、ピクチャB1、B2、P6、B4及びB5(復号化順)で、カウント値lsbが10、11、15、13及び14となっている場合、ピクチャ番号PNはそれぞれ107、108、111、109及び110となる。
さらに、ピクチャI9、B7、B8及びB10以降はカウント値lsbをそのまま増加させると最大カウント値Lsbの16を超えてしまうので、オフセット値Msb=Msb1+最大カウント値Lsb=96+16=112のようにオフセット値Msbを更新することによって、カウント値lsbを16未満の数に抑えている。そこで、ピクチャI9、B7、B8及びB10において、カウント値lsbが2、0、1及び3となり、ピクチャ番号PNはそれぞれ114、112、113及び115となる。
以上のように、ピクチャごとに付加されているカウント値lsbと復号化処理で更新管理するオフセット値Msbを用いてピクチャ番号PNを生成し、このピクチャ番号を用いて画面への表示順序や参照ピクチャの管理を行うことが可能となる。
(ピクチャ番号の生成方法例2)
図6は、ピクチャ番号の生成方法例2の説明図である。
図6のピクチャ番号の生成方法例2では、復号化処理において変数として管理されているオフセット値FNOとそれぞれのピクチャに付加されているフレーム番号(カウント値)fnとを加算し、さらに加算結果を2倍することによりピクチャ番号PNを生成する。なお、非参照のピクチャの場合は、上述の加算結果から1を減算することにより、そのピクチャに対するピクチャ番号PNを生成する。
FNO1とFNO2は、オフセット値FNOの値を表しており、図6に示した例ではFNO1=96、FNO2=112となっている。
まず、IDRピクチャを復号化する時に、オフセット値FNOは0に初期化され、フレーム番号fnも0となり、そのIDRピクチャに対するピクチャ番号PNは0となる。次のBピクチャでフレーム番号fnが1となっている場合には2×(オフセット値FNO+フレーム番号fn)=2×(0+1)=2となり、そのBピクチャに対するピクチャ番号PNは2となる。
また、その次のBピクチャでフレーム番号fnが2となっている場合には2×(0+2)=4で、そのBピクチャに対するピクチャ番号PNは4となり、さらにその次のPピクチャでフレーム番号フレーム番号fnが3となっている場合には2×(0+3)=6で、そのPピクチャに対するピクチャ番号PNは6となる。
フレーム番号fnが直前に復号化したピクチャのフレーム番号よりも小さくなる場合は、オフセット値FNOに最大フレーム番号MFNを加える処理を行い、オフセット値FNOを更新する。
これは、フレーム番号の取り得る値を一定以下に制限して符号化ビット量を削減しつつ、大きな値のピクチャ番号PNも表現できるようにするための仕組みである。図6では、例えばフレーム番号fnが直前に復号化したピクチャのフレーム番号よりも小さくなることが6回発生した場合のオフセット値FNOがFNO1となり、7回目の発生でFNO2の状態に更新していることを示している。
例えば、ピクチャPicの中のピクチャB1を復号化する時、オフセット値FNOが96に更新されており、フレーム番号fn=10となっているとすると、ピクチャB1のピクチャ番号PNは2×(96+10)=212となる。同様に、ピクチャB2、P3、B4、B5及びP6(復号化順)で、フレーム番号fnが11、12、13、14及び15となっている場合、ピクチャ番号PNはそれぞれ214、216、218、220及び222となる。
また、ピクチャB7を復号化する時、フレーム番号fnが0になっていたとすると、直前のピクチャのフレーム番号である15よりも小さな値となるため、オフセット値FNOが更新され、オフセット値FNO=FNO1+最大フレーム番号MFN=96+16=112となる。従って、ピクチャB7のピクチャ番号PNは2×(112+0)=224となり、同様にピクチャB8、I9及びB10において、フレーム番号fnが1、2、3となっている場合、ピクチャ番号PNはそれぞれ226、228及び230となる。
従って、ピクチャ番号の生成方法例1と同様に、ピクチャごとに付加されているフレーム番号fnの値と復号化処理で更新管理するオフセット値FNOを用いてピクチャ番号PNを生成することができ、このピクチャ番号を用いて参照ピクチャの管理を行うことが可能となる。なお、ピクチャ番号の生成方法例2では、復号化順と表示順は等しくなる。
ISO/IEC 14496-10, International Standard: "Information technology - Coding of audio-visual objects - Part 10 : Advanced video coding"(2003-12-01). pp. 82-100
しかしながら、上記従来の画像復号化方法では、ランダムアクセス再生が行われたときに、不適切なピクチャを参照して復号化対象のピクチャを復号化してしまうという問題がある。
例えばBD−ROMにおいてランダムアクセス再生を行う時、ランダムアクセス再生の開始点として指定されているストリームの位置がOpen GOP構造をとっている場合には、上述のBD−ROMのフォーマット制限だけでは正常な復号化処理ができないことがある。
従来のMPEG−2などの画面間動き補償予測でのピクチャ参照の関係では、上述のような問題は生じない。このような場合には、Bピクチャによって参照されるピクチャが、そのBピクチャの前後のIピクチャもしくはPピクチャの1枚に限定されているため、Open GOPへのランダムアクセス再生が発生しても、再生開始点のIピクチャよりも表示順で前に位置するBピクチャのみの復号化と表示を行わないことだけで、Iピクチャから正常に復号化処理することができる。
しかし、H.264規格の場合、複数枚の参照画像を選択できるため、Open GOP構造をとるランダムアクセスポイント(Random Access Point、RAP)からのランダムアクセス再生(特殊再生)が発生した場合には、本来通常の連続再生でピクチャメモリ103に蓄えられているはずの再生開始位置より前の再生情報がないためピクチャ番号を正常に生成できないことがある。
即ち、ランダムアクセス再生が行われたときには、参照ピクチャリストのピクチャに対するピクチャ番号に基づく管理が乱れ、その結果、適切なピクチャを参照してストリームに含まれる各ピクチャを正常に復号化することができないという問題が生じるのである。
以下、ランダムアクセス再生時にピクチャ番号の生成が正常にできず、参照ピクチャリストの管理に悪影響を与え、参照ピクチャの選択が異常となる状況に関して2つの例を用いて説明する。
(ピクチャ番号の生成方法例1を用いた誤動作例)
図7は、ピクチャ番号の生成方法例1によるSTRLの管理方法の説明図である。なお、この図7は、図5の復号化の流れに従った場合にFIFOにより管理されるSTRLの状態を示す。ここでは、説明を簡単にするため、STRLは4枚の参照ピクチャを管理している。図5と同様に、PNはピクチャ番号を表し、Picは復号化対象のピクチャを表しているが、異なる点としてピクチャPicの並びは復号化順としている。RAPはランダムアクセスポイントを示しており、ストリームはOpen GOPの構造となっているものとする。また、STRL(a)〜(f)は、それぞれFIFO管理のSTRLの状態を示しており、ピクチャの復号化に伴うSTRLの状態遷移を表している。
ランダムアクセスユニットRAUがClosed GOP構造となっている時は、最初にIDRピクチャが復号化される。この時STRLで管理される各領域は全て空(empty)になり(STRL(a)の状態)、ピクチャ番号PNは0に初期化される。次に、IDRピクチャの復号化後に、STRLにIDRピクチャが挿入される(STRL(b)の状態)。以降、新規に参照ピクチャとして管理する必要のあるピクチャPicが復号化された後には、STRLにおいてFIFO管理に従って参照ピクチャの破棄と追加が行われる。
例えば、ピクチャ番号PNが108のピクチャP3が参照ピクチャとして復号化された場合、STRLからピクチャ番号PNが99より小さいピクチャが非参照ピクチャとなり、新たにピクチャ番号PNが108のピクチャP3が参照ピクチャとしてSTRLに追加される(STRL(c)の状態)。また、ピクチャ番号PNが106、107のピクチャB1、B2が非参照ピクチャとして復号化され、ピクチャ番号PNが111のピクチャP6が参照ピクチャとして復号化された場合、STRLからピクチャ番号PNが99のピクチャPxが非参照ピクチャとなり、新たにピクチャ番号PNが111のピクチャP6が参照ピクチャとしてSTRLに追加される(STRL(d)の状態)。
さらに、ピクチャ番号PNが109、110のピクチャB4、B5が非参照ピクチャとして復号化され、ランダムアクセスポイントRAPを跨いで、ピクチャ番号PNが114のピクチャI9が参照ピクチャとして復号化された場合、STRLからピクチャ番号PNが102のピクチャPyが非参照ピクチャとなり、新たにピクチャ番号PNが114のピクチャI9が参照ピクチャとしてSTRLに追加される(STRL(e)の状態)。
続いて、ピクチャ番号PNが112、113のピクチャB7、B8が非参照ピクチャとして復号化され、ピクチャ番号PNが117のピクチャP12が参照ピクチャとして復号化された場合、STRLからピクチャ番号PNが105のピクチャPzが非参照ピクチャとなり、新たにピクチャ番号PNが117のピクチャP12が参照ピクチャとしてSTRLに追加される(STRL(f)の状態)。以降同様に、ピクチャ番号PNが115、116のピクチャB10、B11が非参照ピクチャとして復号化され、参照ピクチャの管理が続けて行われる。
STRLで管理される各参照ピクチャは、相対インデックスIndで指定されるために、復号化対象のピクチャがPピクチャであれば片方向参照用の1つのリストに、Bピクチャであれば両方向参照用の2つのリストに並び替えられる。L0_for_B11_n(L0リスト)とL1_for_B11_n(L1リスト)は、ピクチャ番号PNが116のピクチャB11を復号化する時に生成されるリストである。復号化対象のピクチャがBピクチャの場合、まず、STRLの参照ピクチャのうち、復号化対象のピクチャ番号と比べてピクチャ番号が小さい参照ピクチャが、復号化対象ピクチャに近い順に並べられ、次に、STRLの参照ピクチャのうち、復号化対象のピクチャ番号と比べてピクチャ番号が大きい参照ピクチャが、復号化対象ピクチャに近い順に並べられる。これにより上述のL0リストが生成される。さらに、STRLの参照ピクチャのうち、復号化対象のピクチャ番号と比べてピクチャ番号が大きい参照ピクチャが、復号化対象ピクチャに近い順に並べられ、次に、STRLの参照ピクチャのうち、復号化対象のピクチャ番号と比べてピクチャ番号が小さい参照ピクチャが、復号化対象ピクチャに近い順に並べられる。これにより上述のL1リストが生成される。相対インデックスIndを用いて、それぞれのリストからピクチャを1枚ずつ指定することにより、参照ピクチャが決定される。
また、RefIdxは、相対インデックスIndのリストを示し、L0リストとL1リストのそれぞれにおける参照ピクチャの並びと対応するように各相対インデックスIndを示す。例えば、L0_for_B11_nの場合、相対インデックス(index0)によってピクチャ番号PNが114のピクチャI9が選択され、以下同様に、相対インデックス(index1)によってピクチャ番号PNが111のピクチャP6が選択され、相対インデックス(index2)によってピクチャ番号PNが108のピクチャP3が選択され、相対インデックス(index3)によってピクチャ番号PNが117のP12ピクチャが選択される。
ところが、上述のようなピクチャ番号PNの生成方法では、ランダムアクセスが発生すると、L0リストとL1リストを適切に管理することができない場合がある。
図8は、ピクチャ番号の生成方法例1によって管理されるリストによって、誤動作が生じる例を説明するための説明図である。この図8に示す例は、図7のピクチャP3より4枚前のピクチャ番号PNが101番のBピクチャを復号化した直後にピクチャI9からスキップ再生(ランダムアクセス再生)が行われた場合の例を示したものである。図8において図7と同じ記号のものは同じ意味のものであるとして説明を省略する。
図8中のSTRL(g)はピクチャ番号PNが101のSTRLの状態を示している。また、STRL(h)は、前述のピクチャ番号PNが101のBピクチャの位置からピクチャI9にスキップし、ピクチャI9を復号化した後のSTRLの状態を示している。ここで、スキップ動作を行った場合には、その間のピクチャP3、B1、B2など(図中では斜線をつけたピクチャPic)は復号化されない。そのため、STRLは、STRL(g)の状態から更新され、オフセット値Msbは、その前のオフセット値Msb(96)に維持される。従って、ピクチャI9、B7及びB8のピクチャ番号はそれぞれ、Msb+lsb=96+2=98、Msb+lsb=96+0=96、及びMsb+lsb=96+1=97のように生成される。ただし、ランダムアクセス時には、Iピクチャの表示順で直前となるBピクチャは復号化する必要がないので、図8中の横線を付けて示すピクチャB7,B8は復号化されない。また、同様にピクチャP12のピクチャ番号は101、ピクチャB10のピクチャ番号は99、ピクチャB11のピクチャ番号は100としてそれぞれ生成される。
また、それぞれのピクチャに付加したピクチャ番号PNの値と復号化対象のピクチャ番号PNとによってL0リストとL1リストが生成される。したがって、ピクチャ番号PNが100となるピクチャB11が復号化対象となっている場合、L0リスト(L0_for_B11_r1)とL1リスト(L1_for_B11_r1)とはそれぞれ「#99:Px、#98:I9、#101:P12、#102:Py」及び「#101:P12、#102:Py、#99:Px、#98:I9」となる。
ところが、通常の連続再生の場合には、図7に示すように、相対インデックス(index0)を用いればL0リストからピクチャI9を参照できるが、ランダムアクセス再生が行われた場合には、図8に示すように、上述と同様に相対インデックス(index0)を用いてもピクチャI9を参照できず、誤ってピクチャPxを参照してしまう。即ち、ランダムアクセス再生が行われたときには、不適切なピクチャを参照して復号化対象のピクチャを復号化してしまう。
(ピクチャ番号の生成方法例2の誤動作例)
図9は、ピクチャ番号の生成方法例2によるSTRLの管理方法の説明図である。
ピクチャ番号PNの管理できる最大値を最大ピクチャ番号MPNとし、ピクチャI0の場所がOpen GOPのランダムアクセスポイントRAPとして指定されており、通常の連続再生ではピクチャI0の復号化時点でオフセット値FNOが最大ピクチャ番号MPN−最大フレーム番号MFN+1の値になる。また、ピクチャP8までの復号化を行った時点で、ピクチャP8のピクチャ番号は最大ピクチャ番号MPNとなり、Open GOPが閉じられ、次のIDRピクチャからClosed GOPとして新たなGOP構造が始まる。また、各ピクチャI0、B1、B2、…、B6、B7、P8の復号化において、フレーム番号fnがそれぞれ0、1、2、…、最大フレーム番号MFN−3、最大フレーム番号MFN−2、最大フレーム番号MFN−1となる時、上記各ピクチャのピクチャ番号PNは、2×(最大ピクチャ番号MPN−最大フレーム番号MFN+1)、2×(最大ピクチャ番号MPN−最大フレーム番号MFN+2)、2×(最大ピクチャ番号MPN−最大フレーム番号MFN+3)、…、2×(最大ピクチャ番号MPN−2)、2×(最大ピクチャ番号MPN−1)、2×(最大ピクチャ番号MPN)となる。
ここで、再生位置がピクチャB4からランダムアクセスポイントRAPに後方ジャンプ(BackJamp)した場合について説明する。この場合、ピクチャB4のフレーム番号fnは最大フレーム番号MFN−5であり、ジャンプ後に復号化を行うピクチャI0のフレーム番号fnは0であるので、(ピクチャB4のフレーム番号fn)>(ピクチャI0のフレーム番号fn)となる。したがって、フレーム番号fnが小さくなるため、オフセット値FNOは、最大ピクチャ番号MPN−最大フレーム番号MFN+1から、最大フレーム番号MFNを加算した最大ピクチャ番号MPN+1に更新される。従って、ピクチャI0のピクチャ番号PNは2(オフセット値FNO+フレーム番号fn)=2(最大ピクチャ番号MPN+1+0)=2(最大ピクチャ番号MPN+1)となってしまう。
つまり、ピクチャ番号PNは、管理可能な最大の値である最大ピクチャ番号MPNを超えてしまうため、ピクチャ番号PNのビット精度によってはピクチャ番号PNがマイナスの値になってしまう可能性が生じる。もし、マイナスの値が付けられてしまえば、そのピクチャ番号PNがSTRLの中で一番小さくなってしまうため、(ピクチャ番号の生成方法例1を用いた誤動作例)と同様に、L0リストとL1リストが通常の連続再生とは異なる状態になってしまう。その結果、相対インデックスIndを用いて正常な参照ピクチャの指定が出来なくなってしまうため、以降の復号化が正常には行われないという誤動作が引き起こされる。
そこで、本発明は、かかる問題に鑑みてなされたものであって、ランダムアクセス再生が行われたときにおいても、適切なピクチャを参照して復号化対象のピクチャを復号化する画像復号化方法を提供することを目的とする。
上記目的を達成するために、本発明に係る画像復号化方法は、ストリームに含まれる符号化された複数のピクチャを、既に復号化されてメモリに格納されたピクチャを参照して復号化する画像復号化方法であって、前記ストリームに含まれる各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第1の格納ステップと、ランダムアクセス再生が指定されたか否かを判別する判別ステップと、前記判別ステップでランダムアクセス再生が指定されたと判別されたときには、前記メモリ内でピクチャを管理するための管理状態を変更する状態変更ステップと、前記状態変更ステップで変更された管理状態を初期状態として、前記ランダムアクセス再生先からの各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第2の格納ステップとを含むことを特徴とする。例えば、前記ストリームに含まれる符号化された複数のピクチャは、アクセス単位でグループ分けされており、前記判別ステップでは、他のアクセス単位のピクチャを参照することが許されたアクセス単位からのランダムアクセス再生が指定されたか否かを判別する。また、前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、前記状態変更ステップでは、前記ピクチャ番号を生成するためのオフセット値を前記管理状態として更新する。
ランダムアクセス再生が指定されたときには、従来では、オフセット値が更新されなかったり、オフセット値が必要以上に大きく更新されたりすることで不適切なピクチャ番号が生成されてしまい、その結果、メモリに格納されるピクチャをそのピクチャ番号を用いて適切に管理することができなかった。そこで、本発明に係る画像復号化方法では、ランダムアクセス再生が指定されたときには、それまでのオフセット値などのピクチャを管理するための管理状態が変更されて、その変更された管理状態を初期状態としてランダムアクセス再生が行われるため、適切なピクチャ番号を生成してメモリに格納されるピクチャを正常に管理することができる。その結果、適切なピクチャを参照してランダムアクセス再生先からの復号化対象の各ピクチャを復号化することができる。従って、H.264規格を用いたBD−ROMフォーマット規格において、通常の連続再生もランダムアクセス再生も正常に行うことが可能となる。
また、前記第1の格納ステップでは、復号化対象のアクセス単位に含まれる全てのピクチャが復号化されるごとに、前記オフセット値を大きくなるように更新しながら、前記ストリームのアクセス単位ごとに各ピクチャに割り当てられたカウント値と前記オフセット値とを用いて、復号化された各ピクチャに対するピクチャ番号を生成し、前記状態変更ステップでは、前記オフセット値を大きくなるように更新し、前記第2の格納ステップでは、前記更新されたオフセット値を初期状態として、復号化対象のアクセス単位に含まれる全てのピクチャが復号化されるごとに、前記オフセット値を大きくなるように更新しながら、前記カウント値とオフセット値とを用いて、前記ランダムアクセス再生先からの復号化された各ピクチャに対するピクチャ番号を生成することを特徴としても良い。
これにより、ランダムアクセス再生が指定されたときには、アクセス単位に含まれる全てのピクチャが復号化されるごとにオフセット値を大きくさせるのと同様に、オフセット値が大きく更新されるため、ランダムアクセス再生先からのピクチャに対するピクチャ番号が、それまでのピクチャに対するピクチャ番号よりも小さくなってしまうことを防ぎ、メモリに格納されるピクチャを正常に管理することができる。
例えば、前記第1及び第2の格納ステップと前記状態変更ステップでは、少なくともアクセス単位におけるカウント値の最大値だけ大きくなるように前記オフセット値を更新する。
これにより、ランダムアクセス再生先からのピクチャに対するピクチャ番号が、それまでのピクチャに対するピクチャ番号よりも小さくなってしまうことを確実に防ぐことができる。
また、前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、前記状態変更ステップでは、前記メモリに格納されている全てのピクチャを非参照の状態に変更することで、前記管理状態を変更することを特徴としても良い。
これにより、ランダムアクセス再生が指定されたときには、それまでにメモリに格納されている全てのピクチャが非参照の状態に変更されるため、ランダムアクセス再生前にメモリに格納されたピクチャと、ランダムアクセス再生後にメモリに格納されるピクチャとの間で、ピクチャ番号に基づく管理に乱れが生じるのを防ぐことできる。その結果、適切なピクチャを参照してランダムアクセス再生先からの復号化対象の各ピクチャを復号化することができる。
また、前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、前記第1の格納ステップでは、復号化対象のピクチャのカウント値が直前に復号化されたピクチャのカウント値よりも小さくなるごとに、前記ピクチャ番号を生成するためのオフセット値を大きくなるように更新しながら、前記ストリームのアクセス単位ごとに各ピクチャに割り当てられたカウント値と前記オフセット値とを用いて、復号化された各ピクチャに対するピクチャ番号を生成し、前記状態変更ステップでは、前記管理状態として存在する前記オフセット値を小さくなるように更新し、前記第2の格納ステップでは、前記更新されたオフセット値を初期状態として、復号化対象のピクチャのカウント値が直前に復号化されたピクチャのカウント値よりも小さくなるごとに、前記オフセット値を大きくなるように更新しながら、前記カウント値とオフセット値とを用いて、前記ランダムアクセス再生先からの復号化された各ピクチャに対するピクチャ番号を生成することを特徴としても良い。例えば、前記状態変更ステップでは、前記オフセット値を0に更新する。
ランダムアクセス再生が指定されたときには、従来では、オフセット値が必要以上に大きく更新されることで不適切なピクチャ番号が生成されてしまい、その結果、メモリに格納されるピクチャをそのピクチャ番号を用いて適切に管理することができなかった。そこで、本発明に係る画像復号化方法では、ランダムアクセス再生が指定されたときには、それまでのオフセット値が小さくなるように変更されて、且つ、メモリ内のピクチャが非参照の状態に変更されて、その変更された管理状態を初期状態としてランダムアクセス再生が行われるため、適切なピクチャ番号を生成してメモリに格納されるピクチャを正常に管理することができる。その結果、適切なピクチャを参照してランダムアクセス再生先からの復号化対象の各ピクチャを復号化することができる。つまり、ランダムアクセス再生が指定されたときには、前記オフセット値が小さく更新されるため、ピクチャ番号が異常に大きくなることを要因にしてピクチャ番号に基づく管理に乱れが生じてしまうのを防ぐことができる。
また、前記第2の格納ステップでは、さらに、前記メモリに非参照の状態にされたピクチャがあるときには、前記ピクチャを直前に格納された参照可能なピクチャに置き換えることを特徴としても良い。
これにより、さらに適切なピクチャを参照することができる。
また、前記第2の格納ステップでは、さらに、ランダムアクセス再生の開始に基づく開始情報を用いて前記メモリに格納されるピクチャを管理することを特徴としても良い。例えば、前記第2の格納ステップでは、ランダムアクセス再生が開始されるごとに更新されるランダムアクセス番号を前記開始情報として用いる。
従来では表示時刻の最も古いピクチャを特定してそのピクチャをメモリから破棄していたが、ランダムアクセス再生が多く指定されると、表示されていないにも関わらずピクチャが破棄されてしまうことがある。そこで、本発明に係る画像復号化方法では、ランダムアクセス番号を用いてピクチャを管理することで、表示されていないピクチャをメモリに残しておくことができる。
また、前記メモリは、ピクチャに対する管理態様が互いに異なる第1及び第2の格納領域を有し、前記状態変更ステップでは、さらに、ランダムアクセス再生先に応じて、前記第1及び第2の格納領域の大きさを相補的に変更することを特徴としても良い。例えば、前記第1の格納領域では、ピクチャが新たに格納されるときには、最も古く格納されたピクチャが破棄され、前記第2の格納領域では、ピクチャが新たに格納されるときには、指定されたピクチャが破棄される。
これにより、第1及び第2の格納領域の大きさが、通常の連続再生とランダムアクセス再生とで異なってしまうことを防ぎ、メモリに格納されるピクチャを正常に管理することができる。
また、前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、前記状態変更ステップでは、メモリに格納されているピクチャのピクチャ番号を、ランダムアクセス再生先のピクチャのピクチャ番号よりも小さなピクチャ番号に変更することを特徴としてもよい。
これにより、ランダムアクセス再生によって復号化されなかったピクチャが、あたかも通常通り復号化されてメモリに格納された状態となる。その結果、適切なピクチャを参照してランダムアクセス再生先からの復号化対象の各ピクチャを復号化することができる。
また、前記状態変更ステップでは、メモリに格納されているピクチャを、ランダムアクセス再生先のピクチャのピクチャ番号よりも小さなピクチャ番号を有するダミーピクチャに置き換えることを特徴としてもよい。例えば、前記ダミーピクチャは、前記ストリームに含まれていないピクチャや、前記第1の格納ステップで復号化されたピクチャである。
これにより、上述と同様、ランダムアクセス再生によって復号化されなかったピクチャが、あたかも通常通り復号化されてメモリに格納された状態となる。その結果、適切なピクチャを参照してランダムアクセス再生先からの復号化対象の各ピクチャを復号化することができる。
なお、本発明は、このような画像復号化方法として実現することができるだけでなく、その方法を用いて動作する画像復号化装置や集積回路、その方法に基づく動作をコンピュータに実行させるプログラム、そのプログラムを格納する記憶媒体としても実現することができる。
本発明の画像復号化方法は、ランダムアクセス再生が行われたときにおいても、適切なピクチャを参照して復号化対象のピクチャを復号化することができるという作用効果を奏する。
以下、本発明の画像復号化方法について図面を参照しながら説明する。
(実施の形態1)
本発明の第1の実施の形態における画像復号化方法では、図5に示すピクチャ番号の生成方法例1を基礎にピクチャ番号を生成して、ストリームに含まれる各ピクチャを復号化する。
図10は、本実施の形態の画像復号化方法を実現する画像復号化装置のブロック図である。
本実施の形態の画像復号化装置100は、可変長復号化部101と、動き補償部102と、ピクチャメモリ103と、加算部104と、変換部105と、メモリ管理部106と、ピクチャ番号生成部107と、再生判別部108とを備えている。
可変長復号化部101は、ストリームStrを復号化し、量子化値Qco、相対インデックスInd、ピクチャタイプPtyおよび動きベクトルMVを出力する。量子化値Qco、相対インデックスIndおよび動きベクトルMVは、ピクチャメモリ103、動き補償部102および変換部105に入力され復号化処理が行われる。
変換部105は、量子化値Qcoを逆量子化して周波数係数に復元し、さらに周波数係数から画素差分値に逆周波数変換し、その画素差分値を加算部104に出力する。
加算部104は、画素差分値と動き補償部102から出力される予測画像とを加算して復号化画像Voutを生成する。生成した復号化画像Voutはピクチャメモリ103に保存される。この時、複数のピクチャを参照ピクチャとして使用することができるように、参照するピクチャの識別番号を指定するための参照番号(相対インデックスInd)がブロックごとに必要となる。そこで、相対インデックスIndと、ピクチャメモリ103中の各ピクチャが有するピクチャ番号との対応を取ることにより、相対インデックスIndによって参照ピクチャを指定することが可能となる。
動き補償部102は、上記処理によって検出された動きベクトルおよび相対インデックスIndを用いて、ピクチャメモリ103に格納されている復号化画像から予測画像に最適な画像領域を取り出す。そして、動き補償部102は、上述の予測画像を生成して加算部104に出力する。
再生判別部108は、再生形式の判別を行う。即ち、再生判別部108は、シーケンス再生を行うときに、通常の連続再生を行うか、それともOpen GOP構造をとるランダムアクセスポイントRAPからのランダムアクセス再生を行うかの判別を行う。例えば、再生判別部108は、画像復号化装置の上位階層に位置するシステム制御による指示に従って再生形式を判別する。また、再生判別部108は、ランダムアクセスポイントRAPのGOPがIDRピクチャを含むときには、そのGOPはClosed GOP構造であると判別し、IDRピクチャを含まないときには、そのGOPはOpen GOP構造であると判別する。なお、各ピクチャに付加されているフレーム番号fnの復号化のトレース結果から再生形式を推定することも可能である。また、上記通常の連続再生には、Closed GOPからのランダムアクセス再生が含まれる。
そして、再生判別部108は、その判別結果を示す再生判別信号を出力する。
ピクチャ番号生成部107は、再生判別部108から再生判別信号を取得して、その再生判別信号の示す再生形式(通常の連続再生またはランダムアクセス再生)に基づいて、ピクチャ番号を生成して出力する。
メモリ管理部106は、再生判別部108から出力された再生判別信号と、ピクチャ番号生成部107から出力されたピクチャ番号とを用いて、ピクチャメモリ103に格納されるピクチャの管理を行う。
図11は、画像復号化装置100の動作の一例を示すフロー図である。
まず、画像復号化装置100は、ストリームStrの再生処理が開始されると、開始位置にある復号化対象のピクチャを復号化し(ステップS100)、生成方法例1に基づいて、そのピクチャに対するピクチャ番号を生成する(ステップS102)。そして、画像復号化装置100は、そのピクチャに対してピクチャ番号を付与し、そのピクチャをピクチャメモリ103に格納する(ステップS104)。次に、画像復号化装置100は、ランダムアクセス再生が指定されたか否かを判別し(ステップS106)、指定されたと判別したときは(ステップS106のY)、ピクチャの管理状態を変更する(ステップS108)。そして、画像復号化装置100は、ランダムアクセス再生先のピクチャに対して、ステップS100からの処理を繰り返し実行する。つまり、画像復号化装置100は、変更された管理状態を初期状態として、ランダムアクセス再生先からの各ピクチャを順に復号化し、各ピクチャのうち参照に用いられるピクチャをピクチャメモリ103に格納して管理する。
一方、ステップS106でランダムアクセス再生が指定されていないと判別したときには(ステップS106のN)、画像復号化装置100は、シーケンス再生にしたがって未復号のピクチャがあるか否かを判別する(ステップS110)。未復号のピクチャがあると判別したときには(ステップS110のY)、画像復号化装置100は、そのピクチャに対して、ステップS100からの処理を繰り返し実行する。一方、未復号のピクチャがないと判別したときには(ステップS110のN)、ストリームStrの再生処理を終了する。
図12は、ピクチャ番号生成部107の動作を示すフロー図である。
ピクチャ番号生成部107は、図12に示すように、まず、再生判別部108から再生判別信号を取得し(ステップS120)、その再生判別信号に基づいて、指定される再生形式が通常の連続再生か、Open GOP構造のランダムアクセスポイントRAPからのランダムアクセス再生かを判定する(ステップS122)。
ここで、ピクチャ番号生成部107は、ステップS122で通常の連続再生が指定されたと判別したときには、生成方法例1によりピクチャ番号を生成する。
一方、ピクチャ番号生成部107は、ステップS122でランダムアクセス再生が指定されたと判別したときには、オフセット値Msbに最大カウント値Lsbを加算してそのオフセット値Msbを更新する(ステップS126)。次に、ピクチャ番号生成部107は、生成方法例1に基づき、ランダムアクセスポイントRAPのピクチャに対して、その更新されたオフセット値Msbと、そのピクチャのカウント値lsbとを加算したピクチャ番号PNを生成する(ステップS128)。
このように本実施の形態では、ランダムアクセス再生が行われたときには、ピクチャの管理状態を変更する、つまりオフセット値Msbに最大カウント値Lsbを加算してそのオフセット値Msbを更新することで、ランダムアクセス再生を開始した時のピクチャ番号PNを、STRLに存在する既存のピクチャPicの持ついかなるピクチャ番号PNよりも大きな値とする。これにより、誤動作の発生を防ぐことができる。
なお、本実施の形態では、オフセット値Msbに最大カウント値Lsbを加算してそのオフセット値Msbを更新したが、ランダムアクセス再生を開始した時のピクチャ番号PNを、他の方法により、STRLに存在する既存のピクチャPicの持ついかなるピクチャ番号PNよりも大きな値としても良い。
図13は、本実施の形態により管理されるピクチャメモリ103の様子を説明するための説明図である。
まず、ピクチャ番号101のピクチャBの復号化後に、スキップ(ランダムアクセス再生)が発生してピクチャI9が復号化されると、オフセット値Msbは、96+16=112に更新される。次に、ピクチャI9に対するピクチャ番号PNとして、Msb+lsb=112+2=114が生成される。その結果、参照ピクチャリストは、更新されてSTRL(h')の状態となり、続けてピクチャP12の復号化後に参照ピクチャリストはSTRL(i')の状態に更新される。さらにピクチャB10、ピクチャB11の復号化が続けられる。
この時、STRL(参照ピクチャリスト)の中でピクチャP12のピクチャ番号PNが最も大きく、その次にピクチャI9のピクチャ番号PNが大きくなるため、図13に示すL0リスト(L0_for_B11_r2)とL1リスト(L1_for_B11_r2)が生成される。その結果、従来では通常の連続再生と同様の相対インデックスIndで指定できなかったピクチャI9やピクチャP12を指定することができる。
このように、本実施の形態では、ランダムアクセス再生が行われるときには、まず、オフセット値Msbを強制的に大きくなるように更新してピクチャの管理状態を変更する。したがって、図8に示すようなランダムアクセス再生後のピクチャ番号がランダムアクセス再生前のピクチャ番号よりも小さくなるのを防ぐことができる。その結果、参照ピクチャリストのピクチャに対するピクチャ番号PNに基づく管理の乱れを防ぎ、通常の連続再生の場合と同様に、相対インデックスIndを用いて適切なピクチャを参照して復号化対象のピクチャを復号化することができる。
(変形例1)
ここで、本実施の形態のピクチャの管理状態の変更に関する変形例を説明する。
上記実施の形態では、ランダムアクセス再生が指定されたときには、オフセット値Msbを更新することで、ピクチャの管理状態を変更したが、本変形例では、ピクチャメモリ103に参照用として格納されている全てのピクチャを非参照とする。
これにより、ランダムアクセス再生時から復号化されたピクチャのみがピクチャメモリ103に格納されるため、ランダムアクセス再生前に格納されたピクチャと、ランダムアクセス再生後に格納されたピクチャとの間で、混乱が生じてしまうのを防ぐことができる。また、ランダムアクセス再生時にピクチャ番号PNが強制的に大きくなることがないため、ピクチャ番号PNの管理可能な最大値(最大ピクチャ番号MPN)を越えてしまうことなく、ピクチャ番号PNの増大に基づく誤動作の発生を防ぐことができる。
ここで、さらに、L0リストの生成においても、特別な処理を行っても良い。
図14は、L0リストの生成方法を説明するための説明図である。
まず、ピクチャ番号101のピクチャBの復号化後に、スキップ(ランダムアクセス再生)が発生し、ピクチャI9が復号化されると、参照ピクチャリスト(STRL)の全てのピクチャが非参照となる。即ち、参照ピクチャリストに格納されていたピクチャは、参照用のピクチャとしては消去されて、その格納されていた領域は空(empty)となる。次に、生成方法例1にしたがって、ピクチャI9に対するピクチャ番号PNとして、Msb+lsb=96+2=98が生成される。その結果、参照ピクチャリストは、更新されてSTRL(h')の状態となり、続けてピクチャP12の復号化後に参照ピクチャリストはSTRL(i')の状態に更新される。さらにピクチャB10およびピクチャB11の復号化が続けられる。
このようなSTRL(i')の状態の参照ピクチャリストから、上述の規格で定められた方法でL0リスト(L0_for_B11_r3)とL1リスト(L1_for_B11_r3)が生成される。
さらに、L0リスト(L0_for_B11_r3)は、最後に追加されたピクチャ番号PNのピクチャと同じピクチャが空の領域に続けて挿入されることにより、L0リスト(L0_for_B11_r4)に更新される。
このように、空の領域にピクチャが挿入されることにより、ランダムアクセス再生が行われた場合にも、L0リストから所望のピクチャを参照ピクチャとしてより適切に選択することができる。
例えば、ピクチャB11が前方1枚のピクチャI9と後方1枚のピクチャP12を参照する場合を想定する。この場合、それらのピクチャI9、P12を参照するためには、図7に示す通常の連続再生の場合と同様、L0リスト(L0_for_B11_r4)に対して0番の相対インデックス(Index0)を指定し、L1リスト(L1_for_B11_r3)に対して0番の相対インデックス(Index0)を指定すればよい。
また例えば、ピクチャB11がピクチャP12に対して後方2枚参照する場合を想定する。この場合、図7に示す通常の連続再生では、ピクチャP12を参照するために、L0リスト(L0_for_B11_n)に対して3番の相対インデックス(Index3)を指定する必要がある。
ここで、仮に、L0リスト(L0_for_B11_r3)を更新することなく、空の領域を残したままにしておくと、L0リスト(L0_for_B11_r3)に対して3番の相対インデックス(Index3)を指定しても、ピクチャP12を参照することができない。そこで、L0リスト(L0_for_B11_r3)をL0リスト(L0_for_B11_r4)に更新しておく。即ち、L0リスト(L0_for_B11_r3)の空き領域に、直前に格納されたピクチャP12を埋め込む。これにより、図7に示す通常の連続再生の場合と同様に3番の相対インデックス(Index3)を指定することで、ピクチャP12を参照することができる。また、このようにL0リストの空き領域を埋めておけば、1番から3番の何れの相対インデックスIndを指定しても、ピクチャP12を正常に参照することができる。
(変形例2)
ここで、本実施の形態のピクチャの管理状態の変更に関する他の変形例を説明する。
上記実施の形態では、ランダムアクセス再生が指定されたときには、オフセット値Msbを更新することで、ピクチャの管理状態を変更したが、本変形例では、参照可能なピクチャの枚数だけ、ランダムアクセス再生先のピクチャのピクチャ番号よりも小さなピクチャ番号を持つ仮のピクチャ(ダミーピクチャ)をSTRLに挿入することで、ピクチャの管理状態を変更する。
これにより、ランダムアクセスによって復号化が省かれたピクチャが、あたかも通常通り復号化されてピクチャメモリ103に格納された状態となる。その結果、適切なピクチャを参照してランダムアクセス再生先からの復号化対象の各ピクチャを復号化することができる。
図15は、本変形例に係るL0リストおよびL1リストの生成方法を説明するための説明図である。
まず、ピクチャ番号101のピクチャBの復号化後に、スキップ(ランダムアクセス再生)が発生すると、ピクチャI9の復号化に先立って、ピクチャI9に割当てられるピクチャ番号PNが算出される。例えば、生成方法例1にしたがって、ピクチャI9に対するピクチャ番号PNとして、Msb+lsb=96+2=98が算出される。そして、そのピクチャI9のピクチャ番号PNよりも小さなピクチャ番号PNを持つ仮のピクチャが、参照可能なピクチャの枚数だけ、参照ピクチャリスト(STRL)に挿入される。その結果、参照ピクチャリストは、STRL(j)の状態となる。つまり、ピクチャ番号が102のピクチャPyが、ピクチャ番号が97のダミーピクチャに置き換えられ、ピクチャ番号が99のピクチャPxが、ピクチャ番号が96のダミーピクチャに置き換えられる。さらに、ピクチャ番号が96のピクチャPwが、ピクチャ番号が95のダミーピクチャに置き換えられ、ピクチャ番号が93のピクチャPvが、ピクチャ番号が94のダミーピクチャに置き換えられる。
ここで、上述の仮のピクチャは、その後の復号化処理において実際には参照に使用されないので、ランダムアクセス再生先のピクチャ番号よりも小さなピクチャ番号が割り当てられた、ストリームStrに存在しないピクチャであってもよい。例えば、その仮のピクチャは、全ての画素値が所定の値(例えば0など)を示すようなピクチャや、画素値を持たないピクチャである。また、上述の仮のピクチャは、ストリームStrにあるピクチャのうち既に復号化されたピクチャであってもよい。例えば、その仮のピクチャは直前に復号化されたピクチャである。なお、参照ピクチャリストに格納されているピクチャを置き換えることなく、そのピクチャのピクチャ番号だけを、ランダムアクセス再生先のピクチャ番号よりも小さなピクチャ番号に変更してもよい。
次に、ピクチャI9の復号化が行われると、参照ピクチャリストは更新されてSTRL(h')の状態となり、続けてピクチャP12の復号化後に、参照ピクチャリストはSTRL(i')の状態に更新される。さらにピクチャB10およびピクチャB11の復号化が続けられる。
このようなSTRL(i')の状態の参照ピクチャリストから、上述の規格で定められた方法でL0リスト(L0_for_B11_r5)とL1リスト(L1_for_B11_r5)が生成される。
このように、仮のピクチャを挿入することにより、ランダムアクセス再生が行われた場合にも、L0リストから所望のピクチャを参照ピクチャとしてより適切に選択することができる。
例えば、ピクチャB11が前方1枚のピクチャI9と後方1枚のピクチャP12を参照する場合を想定する。この場合、それらのピクチャI9、P12を参照するためには、図7に示す通常の連続再生の場合と同様、L0リスト(L0_for_B11_r5)に対して0番の相対インデックス(Index0)を指定し、L1リスト(L1_for_B11_r5)に対して0番の相対インデックス(Index0)を指定すればよい。
また例えば、ピクチャB11がピクチャP12に対して後方2枚参照する場合を想定する。この場合、図7に示す通常の連続再生では、ピクチャP12を参照するために、L0リスト(L0_for_B11_n)に対して3番の相対インデックス(Index3)を指定する必要があるが、その場合と全く同様に、L0リスト(L0_for_B11_r5)に対して3番の相対インデックス(Index3)を指定することで、ピクチャP12を参照することができる。
(実施の形態2)
本発明の第2の実施の形態における画像復号化方法では、図6に示すピクチャ番号の生成方法例2を基礎にピクチャ番号を生成して、ストリームに含まれる各ピクチャを復号化する。
図16は、本実施の形態の画像復号化方法を実現する画像復号化装置のブロック図である。
本実施の形態の画像復号化装置200は、可変長復号化部101と、動き補償部102と、ピクチャメモリ103と、加算部104と、変換部105と、メモリ管理部206と、ピクチャ番号生成部207と、再生判別部108とを備えている。
なお、本実施の形態の画像復号化装置200が備える構成要素のうち、実施の形態1の画像復号化装置100が備える構成要素と同一のものは、実施の形態1と同一の符号を付して示し、詳細な説明は省略する。
ピクチャ番号生成部207は、再生判別部108から再生判別信号を取得して、その再生判別信号の示す再生形式(通常の連続再生かランダムアクセス再生)に基づいて、ピクチャ番号を生成して出力する。
メモリ管理部206は、再生判別部108から出力された再生判別信号と、ピクチャ番号生成部207から出力されたピクチャ番号とを用いて、ピクチャメモリ103に格納されるピクチャの管理を行う。
図17は、画像復号化装置200の動作の一例を示すフロー図である。
まず、画像復号化装置200は、ストリームStrの再生処理が開始されると、開始位置にある復号化対象のピクチャを復号化し(ステップS200)、生成方法例2に基づいて、そのピクチャに対するピクチャ番号を生成する(ステップS202)。そして、画像復号化装置200は、そのピクチャに対してピクチャ番号を付与し、そのピクチャをピクチャメモリ103に格納する(ステップS204)。次に、画像復号化装置200は、ランダムアクセス再生が指定されたか否かを判別し(ステップS206)、指定されたと判別したときは(ステップS206のY)、実施の形態1とは異なる態様でピクチャの管理状態を変更する(ステップS208)。そして、画像復号化装置200は、ランダムアクセス再生先のピクチャに対して、ステップS200からの処理を繰り返し実行する。つまり、画像復号化装置200は、変更された管理状態を初期状態として、ランダムアクセス再生先からの各ピクチャを順に復号化し、各ピクチャのうち参照に用いられるピクチャをピクチャメモリ103に格納して管理する。
一方、ステップS106でランダムアクセス再生が指定されていないと判別したときには(ステップS206のN)、画像復号化装置100は、シーケンス再生にしたがって未復号のピクチャがあるか否かを判別する(ステップS210)。未復号のピクチャがあると判別したときには(ステップS210のY)、画像復号化装置200は、そのピクチャに対して、ステップS200からの処理を繰り返し実行する。一方、未復号のピクチャがないと判別したときには(ステップS210のN)、ストリームStrの再生処理を終了する。
図18は、ピクチャ番号生成部207の動作を示すフロー図である。
ピクチャ番号生成部207は、図18に示すように、まず、再生判別部108から再生判別信号を取得し(ステップS220)、その再生判別信号に基づいて、指定される再生形式が通常の連続再生か、Open GOP構造のランダムアクセスポイントRAPからのランダムアクセス再生かを判定する(ステップS222)。
ここで、ピクチャ番号生成部207は、ステップS222で通常の連続再生が指定されたと判別したときには、生成方法例2によりピクチャ番号を生成する(ステップS224)。
一方、ピクチャ番号生成部207は、ステップS222でランダムアクセス再生が指定されたと判別したときには、参照ピクチャリストのSTRLを初期化する(ステップS226)。即ち、ピクチャ番号生成部207は、参照ピクチャリストのSTRLに格納されている全てのピクチャを非参照とする。例えば、H.264の規格ではリスト管理において、「STRL参照(used for short term reference)」の状態が「非参照(unused for reference)」の状態に更新される。
参照ピクチャリストのSTRLが初期化されることにより、STRLには参照ピクチャは存在しないため、STRLに存在するピクチャPicの中で特殊再生(ランダムアクセス再生)を開始した時のピクチャ番号PNは最も大きな値をとることになる。ただし、図9を用いて説明したように、ピクチャ番号PNが最大ピクチャ番号MPN付近となってしまう時には、ランダムアクセス再生位置からのシーケンス再生を続けていくうちにピクチャ番号PNが最大ピクチャ番号MPNを越えて、誤動作が生じる可能性がある。即ち、誤動作が生じないように各ピクチャを管理するためには、ピクチャ番号PNを0に近い正の数にすれば良い。つまり、ピクチャ番号PNがオフセット値FNOとフレーム番号fnから生成されるので、オフセット値FNOを小さい自然数に設定し直せばよい。
そこで、ピクチャ番号生成部207は、オフセット値FNOを強制的に0にする(ステップS228)。なお、オフセット値FNOを、Closed GOPから再生が始まった状態に近い値や、0以上で小さい値にしても良い。
このような参照ピクチャリストの初期化とオフセット値FNO=0の設定により、ピクチャの管理状態が変更される。
そして、ピクチャ番号生成部207は、変更されたピクチャの管理状態を初期状態として、生成方法例2に基づき、ランダムアクセスポイントRAPからの各ピクチャに対して、オフセット値FNOと、そのピクチャのフレーム番号(カウント値)fnとを加算して2倍することにより、ピクチャ番号PNを生成する(ステップS230)。
なお、ランダムアクセス再生開始直前のフレーム番号fnの保存値を例えば0などの値に変更しておいても良い。これはランダムアクセス再生の開始後、オフセット値FNOに最大フレーム番号MFNの加算処理が発生しオフセット値FNO及びピクチャ番号PNの値が大きくなってしまうのを防ぐためである。
このように、本実施の形態では、ランダムアクセス再生が行われるときには、まず、参照ピクチャリストの初期化とオフセット値FNO=0の設定とを行ってピクチャの管理状態を変更する。したがって、図9に示すようなピクチャ番号PNが最大ピクチャ番号を越えてしまうのを防ぐことができる。その結果、参照ピクチャリストのピクチャに対するピクチャ番号PNに基づく管理の乱れを防ぎ、通常の連続再生の場合と同様に、相対インデックスIndを用いて適切なピクチャを参照して復号化対象のピクチャを復号化することができる。
なお、実施の形態1と実施の形態2において、ランダムアクセス再生時におけるピクチャ番号PNの生成方法を説明したが、画面表示時刻を示すプレゼンテーション・タイム・スタンプ(Presentation Time Stamp、PTS)の情報がストリーム中に含まれるのであれば、通常の連続再生時とランダムアクセス再生時とでピクチャ番号PNの生成方法を切り替えずにPTSを流用し、L0リストとL1リストを作り出すことも可能である。
(変形例1)
ここで、本実施の形態の参照ピクチャリストの管理方法についての変形例について説明する。
図19は、本変形例における参照ピクチャリスト(STRL)の管理方法を説明するための説明図である。
例えば、図19の(a)に示すようなストリームの再生が行われることを想定する。ストリームに含まれる各ピクチャは、通常、図中左側から右側の順に処理される。つまり、ストリーム上の時間は左から右に流れている。また、各ランダムアクセスポイントRAPの先頭ピクチャはピクチャI0、I1、I2及びI3である。
ここで、ピクチャP4、P5、P6及びI7を連続再生した後、ピクチャI3を再生し、ピクチャI2を再生し、ピクチャI1を再生し、最後にピクチャI0を再生していく後方へのスキップ動作(ランダムアクセス再生)が行われる。
上述のようなランダムアクセス再生が行われると、上述の実施の形態では、それまでの参照ピクチャリストが初期化される、つまり参照ピクチャリストに含まれる全てのピクチャが非参照とされる。そして、参照ピクチャリストはPTS管理されるため、それらの非参照とされたピクチャのうち、PTSの最も古いピクチャが参照ピクチャリストから破棄されて、その破棄された領域に新たなピクチャが格納される。
即ち、参照ピクチャリストの状態は、図19の(b)に示すように、ピクチャP4から順にピクチャI7まで復号されたときには状態a00となり、ピクチャI3が復号化されたときには状態a01となり、ピクチャI2が復号化されたときには状態a02となり、ピクチャI1が復号化されたときには状態a03となり、ピクチャI0が復号化されたときには状態a04となる。なお、図19中の斜線で示すピクチャは、非参照とされたピクチャであって、表示用としてのみ残されているピクチャである。
状態a00における参照ピクチャリストでは、ピクチャI7、P6、P5、P4の順で相対インデックスIndが付けられ、逆に、ピクチャP4、P5、P6、P7の順で画面表示され、各ピクチャは「表示待ち」もしくは「表示済み」のどちらかの状態になっている。
状態a01における参照ピクチャリストでは、ピクチャI7、P6、P5、P4が「非参照」とされ、新たにピクチャI3が参照ピクチャとしてピクチャP4に上書きされている。また各ピクチャは、ピクチャI3、P5、P6、I7の順で配置されて画面表示される。
状態a02における参照ピクチャリストでは、ピクチャI3が「非参照」とされた上で、新たにピクチャI2が参照ピクチャとしてそのピクチャI3に上書きされている。また各ピクチャは、ピクチャI2、P5、P6、I7の順で配置されて画面表示される。
状態a03における参照ピクチャリストでは、ピクチャI2が「非参照」とされた上で、新たにピクチャI1が参照ピクチャとしてそのピクチャI2に上書きされている。また各ピクチャは、ピクチャI1、P5、P6、I7の順で配置されて画面表示される。
状態a04における参照ピクチャリストでは、ピクチャI0が「非参照」とされた上で、新たにピクチャI0が参照ピクチャとしてそのピクチャI1に上書きされている。また各ピクチャは、ピクチャI0、P5、P6、I7の順で配置されて画面表示される。
従って、画面表示のタイミングによっては、逆再生でピクチャI0が再生された後に、ピクチャP5、P6及びI7が表示されたりする。また、復号化処理が画面表示処理よりも早く行われるような場合、参照ピクチャリストに格納されたピクチャI3、I2、I1及びI0が、画面表示前に、次の復号化されたピクチャの上書きによって、画面表示できなかったりする可能性が考えられる。
そこで、本変形例では、Open GOPのランダムアクセスポイントRAPへのアクセスを伴うランダムアクセス再生を行う場合は、PTSの情報を部分的に用いずに参照ピクチャリストの管理を行うことにより前述の画面表示の誤動作を回避することができる。
具体的に、本変形例では、ランダムアクセス再生が開始されるごとにRAID番号を更新して、参照ピクチャリストに格納されるピクチャに対してそのRAID番号を付与する。そして、PTSとそのRAID番号とを用いて参照ピクチャリストを管理する。これにより、図19の(c)に示すように、参照ピクチャリストに格納されたピクチャが長期間保持されて、上述の誤動作を防ぐことができる。
図20Aは、メモリ管理部206が付与対象のピクチャに対してRAID番号を付与する動作を示すフロー図である。
まず、メモリ管理部206は、参照ピクチャリストに格納すべきピクチャであって、RAID番号の付与対象となるピクチャが再生処理の最初にあるか否かを判別する(ステップS300)。例えば、参照ピクチャリストが全て非参照で表示済みのピクチャしか残っていない状態となっているか否か判断する。
ここで、再生処理の最初であると判別すると(ステップS300のY)、メモリ管理部206は、付与対象ピクチャのRAID番号を0に決定する(ステップS302)。一方、再生処理の最初でないと判別すると(ステップS300のN)、メモリ管理部206は、さらに、付与対象のピクチャはランダムアクセス再生の最初にあるか否かを判別する(ステップS304)。
ここで、ランダムアクセス再生の最初であると判別すると(ステップS304のY)、メモリ管理部206は、前回他のピクチャに付与されたRAID番号に1を加算した値を、付与対象ピクチャのRAID番号として決定する(ステップS306)。一方、ランダムアクセス再生の最初でないと判別すると(ステップS304のN)、メモリ管理部206は、前回他のピクチャに付与されたRAID番号を、付与対象ピクチャのRAID番号として決定する(ステップS308)。
そして、メモリ管理部206は、上述のように、決定したRAID番号を付与対象ピクチャに付与して参照ピクチャリストに格納する(ステップS310)。
図20Bは、メモリ管理部206が参照ピクチャリストに格納されたピクチャの中から破棄されるピクチャを選択する動作を示すフロー図である。
まず、メモリ管理部206は、参照ピクチャリストに格納されているピクチャのうち、RAID番号が最も小さいピクチャ群を選択する(ステップS320)。
次に、メモリ管理部206は、選択したピクチャ群の中でPTSの最も古いピクチャを、破棄されるピクチャとして選択する(ステップS322)。
なお、実際の処理では各ピクチャの状態が「参照」状態であるか「非参照」状態であるか、及び「表示待ち」状態であるか「表示済み」状態であるかなどの判定処理も必要となる。
図19の(c)は、上述のようにRAID番号を用いたメモリ管理部206の管理によって実現される参照ピクチャリストの状態を示す図である。
参照ピクチャリストの状態は、図19の(c)に示すように、ピクチャP4から順にピクチャI7まで復号されたときには状態a10となり、ピクチャI3が復号化されたときには状態a11となり、ピクチャI2が復号化されたときには状態a12となり、ピクチャI1が復号化されたときには状態a13となり、ピクチャI0が復号化されたときには状態a14となる。なお、図19中の斜線で示すピクチャは、非参照とされたピクチャである。
状態a10における参照ピクチャリストでは、上述の状態a00の参照ピクチャリストと同様、ピクチャI7、P6、P5、P4の順で相対インデックスIndが付けられ、逆に、ピクチャP4、P5、P6、P7の順で画面表示され、各ピクチャは「表示待ち」もしくは「表示済み」のどちらかの状態になっている。また、これらの全てのピクチャに付与されたRAID番号は0である。
状態a11における参照ピクチャリストでは、ピクチャI7、P6、P5、P4が「非参照」とされてピクチャP4が破棄され、新たにピクチャI3が参照ピクチャとして追加されている。ここで、ピクチャI7、P6、P5のRAID番号は0であり、ピクチャI3のRAID番号は1であるため、ピクチャI7、P6、P5とピクチャI3との間ではPTSによる管理は行われず、ピクチャI7、P6、P5の間でのみPTSによる管理が行われる。したがって、各ピクチャはピクチャP5、P6、I7、I3の順で配列されて画面表示される。
状態a12における参照ピクチャリストでは、ピクチャI3が「非参照」とされてピクチャP5が破棄され、新たにピクチャI2が参照ピクチャとして追加されている。また各ピクチャは、ピクチャP6、I7、I3、I2の順で配置されて画面表示される。
状態a13における参照ピクチャリストでは、ピクチャI2が「非参照」とされてピクチャP6が破棄され、新たにピクチャI1が参照ピクチャとして追加されている。また各ピクチャは、ピクチャI7、I3、I2、I1の順で配置されて画面表示される。
状態a14における参照ピクチャリストでは、ピクチャI1が「非参照」とされてピクチャI7が破棄され、新たにピクチャI0が参照ピクチャとして追加されている。また各ピクチャは、ピクチャI3、I2、I1、I0の順で配置されて画面表示される。
このように本変形例では、PTSとRAID番号に基づいて参照ピクチャリストを管理するため、画面表示に必要な順番でピクチャを残すことができる。
なお、本変形例では、ランダムアクセス再生が指定されたときには、オフセット値FNOを更新しなくてもよい。即ち、本変形例では、オフセット値FNOを更新することなく参照ピクチャリストを初期化し、上述のようにPTSとRAID番号に基づいてその参照ピクチャリストを管理してもよい。
(変形例2)
ここで、本実施の形態の参照ピクチャリストの管理方法についての他の変形例について説明する。 本変形例では、参照ピクチャリストのSTRLとLTRLのそれぞれで管理されるピクチャの枚数を、ランダムアクセス再生先に合わせて相補的に変更する点に特徴がある。
図21Aから図21Fは、本変形例における参照ピクチャリストの状態を示す図である。
参照ピクチャリストRPLは、上述のようにFIFO的な管理を行うSTRLと、明示的に指定されたピクチャの格納破棄を行うLTRLとで構成されている。
例えば、メモリ管理部206は、図21Aに示すように、全体で6枚のピクチャを管理し得るように参照ピクチャリストRPLを構成し、4枚のピクチャP4、P5、P6及びI7をSTRLに格納し、2枚のピクチャP0、P1をLTRLに格納する。
ここで、ランダムアクセス再生が行われると、メモリ管理部206は、まず、図21Bに示すように、参照ピクチャリストRPLの管理対象となる全てのピクチャを非参照とする。即ち、LTRL及びSTRLのそれぞれに格納されているピクチャが非参照に設定される。
次に、メモリ管理部206は、ランダムアクセス再生先のSTRL及びLTRLの管理枚数の特定を試みる。その結果、ランダムアクセス再生先のSTRLの管理枚数が4枚でLTRLの管理枚数が2枚であることが分かれば、メモリ管理部206は、現状のSTRL及びLTRLの管理枚数を維持する。そして、メモリ管理部206は、STRLに格納されている非参照のピクチャを順に破棄し、図21Cに示すように、新しい4枚のピクチャnew0、new1、new2及びnew3をSTRLに格納する。
ここで、ランダムアクセス再生先のSTRLの管理枚数が5枚でLTRLの管理枚数が1枚であることが分かれば、メモリ管理部206は、図21Eに示すように、現状のSTRL及びLTRLの管理枚数をそのランダムアクセス再生先に合わせて変更する。そして、メモリ管理部206は、5枚のピクチャnew0、new1、new2、new3、new4をSTRLに格納する。
仮に、メモリ管理部206が、STRL及びLTRLの管理枚数をそのランダムアクセス再生先に合わせて変更しなければ、図21Dに示すように、ピクチャnew4を格納するためにピクチャnew0が破棄される。このような場合、ピクチャnew0を参照することができなくなり、復号化処理に誤動作を引き起こしてしまう可能性が生じる。そこで、本変形例では、上述のように、STRL及びLTRLの管理枚数をそのランダムアクセス再生先に合わせて変更することにより、誤動作の発生を防ぐのである。
また、メモリ管理部206は、ランダムアクセス再生先のSTRL及びLTRLの管理枚数がそれぞれ6枚及び0枚であることが分かれば、図21Fに示すように、STRLの管理枚数を6枚に変更し、LTRLの管理枚数を0枚に変更する。なお、ランダムアクセス再生開始後に、LTRLにピクチャを格納する必要がある時は、特別な処理として必要に応じてSTRLの管理枚数を減らしてLTRLの管理枚数を増やす処理を行ってから、そのピクチャの格納を行う。
また、メモリ管理部206は、ランダムアクセス再生先のSTRL及びLTRLの管理枚数の特定を試みた結果、その管理枚数が分からなければ、STRLの管理枚数を最大の6枚に変更し、LTRLの管理枚数を最小の0枚に変更する。なお、その後、管理枚数が分かるまでは、LTRLへのピクチャの格納が指示される度に、STRLとLTRLの管理枚数を更新して、指示されたピクチャの格納を行なう。このようなLTRLへのピクチャの格納の指示は、例えばピクチャのヘッダ情報領域にあるMMCO(memory management control operation)に記されている。
このように、本変形例では、Open GOPへのランダムアクセスが発生した場合は、ランダムアクセス再生が発生した時の参照ピクチャリストRPLの特別な管理処理として、STRLの全てのピクチャを「非参照」にするだけでなく、LTRLの全てのピクチャに関しても「非参照」にした後、STRL及びLTRLの管理枚数をそのランダムアクセス再生先に合わせて変更する。
なお、本変形例では、ランダムアクセス再生が指定されたときには、オフセット値FNOを更新しなくてもよい。即ち、本変形例では、オフセット値FNOを更新することなく参照ピクチャリストを初期化し、上述のようにSTRL及びLTRLの管理枚数をそのランダムアクセス再生先に合わせて変更してもよい。
なお、本実施の形態及び各変形例においも、実施の形態1の変形例1と同様、L0リストの空き領域に、直前に格納されたピクチャを埋め込んでも良い。
なお、本実施の形態及び各変形例においも、実施の形態1の変形例2と同様、参照可能なピクチャの枚数だけ、ランダムアクセス再生先のピクチャのピクチャ番号よりも小さなピクチャ番号を持つ仮のピクチャをSTRL及びLTRLに挿入してもよい。
(実施の形態3)
さらに、上記各実施の形態で示した画像復号化方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録することにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図22Aから図22Cは、上記各実施の形態の画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図22Bは、フレキシブルディスクFの正面図、側面図、及びフレキシブルディスク本体FDの正面図である。図22Aは、記録媒体本体であるフレキシブルディスク本体FDの物理フォーマットの例を示している。フレキシブルディスクFは、フレキシブルディスク本体FDをケースに内蔵して構成される。フレキシブルディスク本体FDの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクFでは、上記フレキシブルディスク本体FD上に割り当てられた領域に、上記プログラムが記録されている。
また、図22Cは、フレキシブルディスクFに対して上記プログラムの記録再生を行うための構成を示す。画像復号化方法を実現する上記プログラムをフレキシブルディスクFに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブFDDを介して書き込む。また、フレキシブルディスクF内のプログラムにより上記画像復号化方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブFDDによりプログラムをフレキシブルディスクFから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
(実施の形態4)
本実施の形態のAV処理装置は、上記実施の形態1又は2で示した画像復号化方法を用いた応用的な動作を行う。
図23は、本実施の形態のAV処理装置の構成を示す構成図である。
このAV処理装置500は、ディジタル圧縮された音声及び画像を再生するDVDプレーヤやBD−ROMプレーヤなどとして構成されている。
ストーム入出力部501は、外部からストリームexStrを取得する。画像符号化復号化部503は、画像の符号化及び復号化を行う。音声符号化復号化部504は、音声の符号化及び復号化を行う。メモリ505は、ストリームexStrや符号化データや復号化データなどのデータを格納する。メモリ入出力部506は、メモリ505に対してデータの格納や取出しを行う。画像処理部507は、画像信号に対してプレ処理及びポスト処理を行う。画像入出力部508は、画像処理部507で処理された、もしくは画像処理部507で処理されずに通過された画像信号を外部に画像信号exVSigとして出力する。また、画像入出力部508は、外部からの画像信号exVSigを取り込む。
また、音声処理部509は、音声信号に対してプレ処理及びポスト処理を行う。音声入出力部510は、音声処理部509で処理された、もしくは音声処理部509で処理されずに通過だけされた音声信号を外部に音声信号exASigとして出力する。また、音声入出力部510は、外部からの音声信号exASigを取り込む。AV制御部511は、AV処理装置500の全体の制御を行う。
そして、ストリーム入出力部501、画像符号化復号化部503、音声符号化復号化部504、メモリ入出力部506、画像処理部507、音声処理部509、及びAV制御部511は、ストリームexStrや音声・画像の復号データなどのデータを転送するバス502に接続されている。
ここで、このようなAV処理装置500の復号化動作について説明する。まず、ストリーム入出力部exStrIFは、光ディスクなどの蓄積メディアからのデータの読み出しや、衛星放送などからのデータ受信により、音声及び画像のストリームexStrを取得する。画像符号化復号化部503は、そのストリームexStrから画像ストリームを抽出し、音声符号化復号化部504は、音声ストリームを抽出する。
メモリ入出力部506は、画像符号化復号化部503によって復号化された画像データをメモリ505に格納する。画像処理部507は、メモリ505に格納されたデータを取り出して、ノイズ除去などの加工処理を行う。また、画像符号化復号化部503は、メモリ505に格納された画像データを再び取り出して、画面間動き補償予測の参照ピクチャとして使用する。
ここで、画像符号化復号化部503は、実施の形態1又は2の画像復号化装置100,200を備える。なお、画像符号化復号化部503は、画像復号化装置100,200のピクチャメモリ103を備えていなくても良い。この場合、画像符号化復号化部503は、ピクチャメモリ103の代わりにメモリ505を使用する。また、上述の画像ストリームは実施の形態1又は2のストリームStrに相当する。
一方、メモリ入出力部506は、音声符号化復号化部504によって復号化された音声データをメモリ505に格納する。音声処理部509は、メモリ505に格納されたデータを取得して、そのデータに対して音響などに関連する加工処理を行う。
最後に、音声と画像の時間的な同期をとりながら、画像処理部507で加工処理されたデータは、画像入出力部508を介して画像信号exVSigとして出力されテレビ画面などに表示される。また、音声処理部509で加工処理されたデータは、音声入出力部510を介して音声信号exASigとして出力されスピーカなどから出力される。
なお、実施の形態1又は2の画像復号化装置100,200が有する各構成要素は、典型的には集積回路であるLSI(Large Scale Integration)として実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。(例えばピクチャメモリ103などのメモリ以外の各構成要素が1チップ化されても良い。)
また、集積回路としてLSIを挙げたが、集積度の違いにより、IC(Integrated Circuit)、システムLSI、スーパーLSI、ウルトラLSIとして実現しても良い。また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて構成要素の集積化を行ってもよい。なお、バイオ技術の適応等が可能性としてありえる。
また、各構成要素のうち、復号化の対象となるデータを格納するメモリ(ピクチャメモリ103やメモリ505)だけ1チップ化せずに別構成としても良い。
本発明の画像復号化方法は、ランダムアクセス再生が行われたときにおいても、適切なピクチャを参照して復号化対象のピクチャを復号化することができるという効果を奏し、例えばH.264規格を用いた画像や音声を再生するDVDプレーヤやBD−ROMプレーヤなどに適用することができる。
図1Aは、従来のMPEG2のストリームの構成図である。 図1Bは、従来のMPEG2のストリームの他の構成図である。 図2は、他の従来のストリームの構成図である。 図3Aは、従来のMPEG−2などで使用されているGOP間の参照状態の説明図である。 図3Bは、従来のMPEG−2などで使用されている他のGOP間の参照状態の説明図である。 図4は、従来の画像復号化方法を実現する画像復号化装置のブロック図である。 図5は、ピクチャ番号の生成方法例1の説明図である。 図6は、ピクチャ番号の生成方法例2の説明図である。 図7は、ピクチャ番号の生成方法例1によるSTRLの管理方法の説明図である。 図8は、ピクチャ番号の生成方法例1によって管理されるリストによって、誤動作が生じる例を説明するための説明図である。 図9は、ピクチャ番号の生成方法例2によるSTRLの管理方法の説明図である。 図10は、本発明の実施の形態1の画像復号化方法を実現する画像復号化装置のブロック図である。 図11は、同上の画像復号化装置の動作の一例を示すフロー図である。 図12は、同上のピクチャ番号生成部の動作を示すフロー図である。 図13は、同上のピクチャメモリの様子を説明するための説明図である。 図14は、同上の変形例1に係るL0リストの生成方法を説明するための説明図である。 図15は、同上の変形例2に係るL0リストおよびL1リストの生成方法を説明するための説明図である。 図16は、本発明の実施の形態2の画像復号化方法を実現する画像復号化装置のブロック図である。 図17は、同上の画像復号化装置の動作の一例を示すフロー図である。 図18は、同上のピクチャ番号生成部の動作を示すフロー図である。 図19は、同上の変形例1に係る参照ピクチャリスト(STRL)の管理方法を説明するための説明図である。 図20Aは、同上の変形例1に係るメモリ管理部が付与対象のピクチャに対してRAID番号を付与する動作を示すフロー図である。 図20Bは、同上の変形例1に係るメモリ管理部が参照ピクチャリストに格納されたピクチャの中から破棄されるピクチャを選択する動作を示すフロー図である。 図21Aは、同上の変形例2における参照ピクチャリストの状態を示す図である。 図21Bは、同上の変形例2における参照ピクチャリストの他の状態を示す図である。 図21Cは、同上の変形例2における参照ピクチャリストのさらに他の状態を示す図である。 図21Dは、同上の変形例2における参照ピクチャリストのさらに他の状態を示す図である。 図21Eは、同上の変形例2における参照ピクチャリストのさらに他の状態を示す図である。 図21Fは、同上の変形例2における参照ピクチャリストのさらに他の状態を示す図である。 図22Aは、実施の形態1及び2の画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。 図22Bは、実施の形態1及び2の画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の他の説明図である。 図22Cは、実施の形態1及び2の画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合のさらに他の説明図である。 図23は、本実施の形態4のAV処理装置の構成を示す構成図である。
符号の説明
100 画像復号化装置
101 可変長復号化部
102 動き補償部
103 ピクチャメモリ
104 加算部
105 変換部
106 メモリ管理部
107 ピクチャ番号生成部
108 再生判別部
Pic ピクチャ
RAP ランダムアクセスポイント
PN ピクチャ番号
STRL ショートタームリファレンスリスト
LTRL ロングタームリファレンスリスト
RPL 参照ピクチャリスト
Str ストリーム
Qco 量子化値
Ind 相対インデックス
Pty ピクチャタイプ
MV 動きベクトル
Vout 復元画像

Claims (22)

  1. ストリームに含まれる符号化された複数のピクチャを、既に復号化されてメモリに格納されたピクチャを参照して復号化する画像復号化方法であって、
    前記ストリームに含まれる各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第1の格納ステップと、
    ランダムアクセス再生が指定されたか否かを判別する判別ステップと、
    前記判別ステップでランダムアクセス再生が指定されたと判別されたときには、前記メモリ内でピクチャを管理するための管理状態を変更する状態変更ステップと、
    前記状態変更ステップで変更された管理状態を初期状態として、前記ランダムアクセス再生先からの各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第2の格納ステップと
    を含むことを特徴とする画像復号化方法。
  2. 前記ストリームに含まれる符号化された複数のピクチャは、アクセス単位でグループ分けされており、
    前記判別ステップでは、他のアクセス単位のピクチャを参照することが許されたアクセス単位からのランダムアクセス再生が指定されたか否かを判別する
    ことを特徴とする請求項1記載の画像復号化方法。
  3. 前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、
    前記状態変更ステップでは、前記ピクチャ番号を生成するためのオフセット値を前記管理状態として更新する
    ことを特徴とする請求項2記載の画像復号化方法。
  4. 前記第1の格納ステップでは、復号化対象のアクセス単位に含まれる全てのピクチャが復号化されるごとに、前記オフセット値を大きくなるように更新しながら、前記ストリームのアクセス単位ごとに各ピクチャに割り当てられたカウント値と前記オフセット値とを用いて、復号化された各ピクチャに対するピクチャ番号を生成し、
    前記状態変更ステップでは、前記オフセット値を大きくなるように更新し、
    前記第2の格納ステップでは、前記更新されたオフセット値を初期状態として、復号化対象のアクセス単位に含まれる全てのピクチャが復号化されるごとに、前記オフセット値を大きくなるように更新しながら、前記カウント値とオフセット値とを用いて、前記ランダムアクセス再生先からの復号化された各ピクチャに対するピクチャ番号を生成する
    ことを特徴とする請求項3記載の画像復号化方法。
  5. 前記第1及び第2の格納ステップと前記状態変更ステップでは、少なくともアクセス単位におけるカウント値の最大値だけ大きくなるように前記オフセット値を更新する
    ことを特徴とする請求項4記載の画像復号化方法。
  6. 前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、
    前記状態変更ステップでは、前記メモリに格納されている全てのピクチャを非参照の状態に変更することで、前記管理状態を変更する
    ことを特徴とする請求項2記載の画像復号化方法。
  7. 前記状態変更ステップでは、前記メモリに格納されている全てのピクチャを、表示し得る状態で残しつつ、非参照の状態に変更する
    ことを特徴とする請求項6記載の画像復号化方法。
  8. 前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、
    前記第1の格納ステップでは、復号化対象のピクチャのカウント値が直前に復号化されたピクチャのカウント値よりも小さくなるごとに、前記ピクチャ番号を生成するためのオフセット値を大きくなるように更新しながら、前記ストリームのアクセス単位ごとに各ピクチャに割り当てられたカウント値と前記オフセット値とを用いて、復号化された各ピクチャに対するピクチャ番号を生成し、
    前記状態変更ステップでは、前記管理状態として存在する前記オフセット値を小さくなるように更新し、
    前記第2の格納ステップでは、前記更新されたオフセット値を初期状態として、復号化対象のピクチャのカウント値が直前に復号化されたピクチャのカウント値よりも小さくなるごとに、前記オフセット値を大きくなるように更新しながら、前記カウント値とオフセット値とを用いて、前記ランダムアクセス再生先からの復号化された各ピクチャに対するピクチャ番号を生成する
    ことを特徴とする請求項7記載の画像復号化方法。
  9. 前記状態変更ステップでは、前記オフセット値を0に更新する
    ことを特徴とする請求項8記載の画像復号化方法。
  10. 前記第2の格納ステップでは、さらに、ランダムアクセス再生の開始に基づく開始情報を用いて前記メモリに格納されるピクチャを管理する
    ことを特徴とする請求項7記載の画像復号化方法。
  11. 前記第2の格納ステップでは、ランダムアクセス再生が開始されるごとに更新されるランダムアクセス番号を前記開始情報として用いる
    ことを特徴とする請求項10記載の画像復号化方法。
  12. 前記メモリは、ピクチャに対する管理態様が互いに異なる第1及び第2の格納領域を有し、
    前記状態変更ステップでは、さらに、ランダムアクセス再生先に応じて、前記第1及び第2の格納領域の大きさを相補的に変更する
    ことを特徴とする請求項7記載の画像復号化方法。
  13. 前記第1の格納領域では、ピクチャが新たに格納されるときには、最も古く格納されたピクチャが破棄され、
    前記第2の格納領域では、ピクチャが新たに格納されるときには、指定されたピクチャが破棄される
    ことを特徴とする請求項12記載の画像復号化方法。
  14. 前記状態変更ステップでは、ランダムアクセス再生先に応じて設定すべき前記第1及び第2の格納領域の大きさが特定できるか否かを判別し、特定できないと判別したときには、前記メモリの全ての領域を前記第1の格納領域に割り当てる
    ことを特徴とする請求項13記載の画像復号化方法。
  15. 前記第2の格納ステップでは、さらに、前記メモリに非参照の状態にされたピクチャがあるときには、前記ピクチャを直前に格納された参照可能なピクチャに置き換える
    ことを特徴とする請求項6記載の画像復号化方法。
  16. 前記第1及び第2の格納ステップでは、復号化された各ピクチャを識別するためのピクチャ番号を生成して前記各ピクチャに付与することで、前記参照に用いられるピクチャを管理し、
    前記状態変更ステップでは、メモリに格納されているピクチャのピクチャ番号を、ランダムアクセス再生先のピクチャのピクチャ番号よりも小さなピクチャ番号に変更する
    ことを特徴とする請求項2記載の画像復号化方法。
  17. 前記状態変更ステップでは、メモリに格納されているピクチャを、ランダムアクセス再生先のピクチャのピクチャ番号よりも小さなピクチャ番号を有するダミーピクチャに置き換える
    ことを特徴とする請求項16記載の画像復号化方法。
  18. 前記ダミーピクチャは、前記ストリームに含まれていないピクチャである
    ことを特徴とする請求項17記載の画像復号化方法。
  19. 前記ダミーピクチャは、前記第1の格納ステップで復号化されたピクチャである
    ことを特徴とする請求項17記載の画像復号化方法。
  20. ストリームに含まれる符号化された複数のピクチャを、既に復号化されてメモリに格納されたピクチャを参照して復号化する画像復号化装置であって、
    前記ストリームに含まれる各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第1の格納手段と、
    ランダムアクセス再生が指定されたか否かを判別する判別手段と、
    前記判別手段でランダムアクセス再生が指定されたと判別されたときには、前記メモリ内でピクチャを管理するための管理状態を変更する状態変更手段と、
    前記状態変更手段で変更された管理状態を初期状態として、前記ランダムアクセス再生先からの各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第2の格納手段と
    を備えることを特徴とする画像復号化装置。
  21. ストリームに含まれる符号化された複数のピクチャを、既に復号化されてメモリに格納されたピクチャを参照して復号化する集積回路であって、
    前記ストリームに含まれる各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第1の格納手段と、
    ランダムアクセス再生が指定されたか否かを判別する判別手段と、
    前記判別手段でランダムアクセス再生が指定されたと判別されたときには、前記メモリ内でピクチャを管理するための管理状態を変更する状態変更手段と、
    前記状態変更手段で変更された管理状態を初期状態として、前記ランダムアクセス再生先からの各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第2の格納手段と
    を備えることを特徴とする集積回路。
  22. ストリームに含まれる符号化された複数のピクチャを、既に復号化されてメモリに格納されたピクチャを参照して復号化するためのプログラムであって、
    前記ストリームに含まれる各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第1の格納ステップと、
    ランダムアクセス再生が指定されたか否かを判別する判別ステップと、
    前記判別ステップでランダムアクセス再生が指定されたと判別されたときには、前記メモリ内でピクチャを管理するための管理状態を変更する状態変更ステップと、
    前記状態変更ステップで変更された管理状態を初期状態として、前記ランダムアクセス再生先からの各ピクチャを順に復号化し、前記各ピクチャのうち参照に用いられるピクチャを前記メモリに格納して管理する第2の格納ステップと
    をコンピュータに実行させることを特徴とするプログラム。
JP2006520529A 2005-01-17 2006-01-11 画像復号化方法 Expired - Fee Related JP4769717B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006520529A JP4769717B2 (ja) 2005-01-17 2006-01-11 画像復号化方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005009677 2005-01-17
JP2005009677 2005-01-17
JP2006520529A JP4769717B2 (ja) 2005-01-17 2006-01-11 画像復号化方法
PCT/JP2006/300236 WO2006075635A1 (ja) 2005-01-17 2006-01-11 画像復号化方法

Publications (2)

Publication Number Publication Date
JPWO2006075635A1 JPWO2006075635A1 (ja) 2008-06-12
JP4769717B2 true JP4769717B2 (ja) 2011-09-07

Family

ID=36677660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006520529A Expired - Fee Related JP4769717B2 (ja) 2005-01-17 2006-01-11 画像復号化方法

Country Status (4)

Country Link
US (1) US8050328B2 (ja)
JP (1) JP4769717B2 (ja)
CN (1) CN100551074C (ja)
WO (1) WO2006075635A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101442291B1 (ko) * 2007-02-28 2014-09-23 소니 주식회사 화상 정보 부호화 장치 및 부호화 방법

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8582663B2 (en) 2006-08-08 2013-11-12 Core Wireless Licensing S.A.R.L. Method, device, and system for multiplexing of video streams
JP4976780B2 (ja) * 2006-08-10 2012-07-18 キヤノン株式会社 再生装置
US20140072058A1 (en) * 2010-03-05 2014-03-13 Thomson Licensing Coding systems
CN103281563B (zh) * 2007-04-18 2016-09-07 汤姆森许可贸易公司 解码方法
US8553781B2 (en) * 2007-12-07 2013-10-08 Thomson Licensing Methods and apparatus for decoded picture buffer (DPB) management in single loop decoding for multi-view video
JP5332773B2 (ja) * 2009-03-18 2013-11-06 ソニー株式会社 画像処理装置および方法
JP2011199396A (ja) * 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
JP5496047B2 (ja) * 2010-10-07 2014-05-21 パナソニック株式会社 画像再生方法、画像再生装置、画像再生プログラム、撮像システム、および再生システム
JP5863244B2 (ja) * 2011-01-12 2016-02-16 Necパーソナルコンピュータ株式会社 編集装置、制御方法及びプログラム
US9516379B2 (en) 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
KR101803970B1 (ko) * 2011-03-16 2017-12-28 삼성전자주식회사 컨텐트를 구성하는 장치 및 방법
US9338474B2 (en) 2011-09-23 2016-05-10 Qualcomm Incorporated Reference picture list construction for video coding
US20130089152A1 (en) * 2011-10-05 2013-04-11 Qualcomm Incorporated Signaling picture identification for video coding
WO2013062391A1 (ko) 2011-10-28 2013-05-02 삼성전자 주식회사 인터 예측 방법 및 그 장치, 움직임 보상 방법 및 그 장치
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US10051264B2 (en) 2012-04-20 2018-08-14 Qualcomm Incorporated Marking reference pictures in video sequences having broken link pictures
SG10201909372YA (en) * 2012-06-29 2019-11-28 Velos Media Int Ltd Encoding device and encoding method
US9479776B2 (en) * 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
JP6365924B2 (ja) * 2013-05-09 2018-08-01 サン パテント トラスト 画像復号方法及び画像復号装置
US9565454B2 (en) * 2013-06-24 2017-02-07 Microsoft Technology Licensing, Llc Picture referencing control for video decoding using a graphics processor
BR112016003135B1 (pt) * 2013-08-22 2023-03-07 Sony Corporation Dispositivos de codificação, de transmissão, de decodificação e de recepção, e, métodos de codificação e de decodificação
JP6365253B2 (ja) * 2014-11-12 2018-08-01 富士通株式会社 映像データ処理装置、映像データ処理プログラムおよび映像データ処理方法
US10148965B2 (en) * 2015-03-04 2018-12-04 Panasonic Intellectual Property Management Co., Ltd. Moving image coding apparatus and moving image coding method
US10178403B2 (en) * 2015-06-23 2019-01-08 Qualcomm Incorporated Reference picture list construction in intra block copy mode
WO2017024990A1 (en) * 2015-08-07 2017-02-16 Mediatek Inc. Method and apparatus of bitstream random access and synchronization for multimedia applications
US11356698B2 (en) 2019-12-30 2022-06-07 Tencent America LLC Method for parameter set reference constraints in coded video stream

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341640A (ja) * 1999-03-19 2000-12-08 Sony Corp 記録装置および方法、再生装置および方法、並びに記録媒体
JP2004242286A (ja) * 2003-01-17 2004-08-26 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3020528B2 (ja) * 1989-12-14 2000-03-15 キヤノン株式会社 画像処理装置
DE69222240T2 (de) * 1991-07-12 1998-02-05 Sony Corp Vorrichtung zum Decodieren eines Bildsignals
JP3156597B2 (ja) * 1996-09-04 2001-04-16 松下電器産業株式会社 画像情報復号化再生装置および画像情報復号化再生方法
US6167083A (en) * 1997-04-04 2000-12-26 Avid Technology, Inc. Computer system and process for capture editing and playback of motion video compressed using interframe and intraframe techniques
WO2001033832A1 (fr) * 1999-10-29 2001-05-10 Fujitsu Limited Appareil de reproduction d'images et appareil d'enregistrement/reproduction d'images
KR20050088918A (ko) 2003-01-17 2005-09-07 마쯔시다덴기산교 가부시키가이샤 동화상 부호화 방법 및 동화상 복호화 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341640A (ja) * 1999-03-19 2000-12-08 Sony Corp 記録装置および方法、再生装置および方法、並びに記録媒体
JP2004242286A (ja) * 2003-01-17 2004-08-26 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101442291B1 (ko) * 2007-02-28 2014-09-23 소니 주식회사 화상 정보 부호화 장치 및 부호화 방법

Also Published As

Publication number Publication date
US8050328B2 (en) 2011-11-01
JPWO2006075635A1 (ja) 2008-06-12
CN100551074C (zh) 2009-10-14
WO2006075635A1 (ja) 2006-07-20
US20080232467A1 (en) 2008-09-25
CN1943246A (zh) 2007-04-04

Similar Documents

Publication Publication Date Title
JP4769717B2 (ja) 画像復号化方法
KR101240089B1 (ko) 화상 부호화 장치 및 화상 복호화 장치
US8817873B2 (en) Image coding/recording apparatus and image coding/recording method
JP4884290B2 (ja) 動画像復号化集積回路、動画像復号化方法、動画像復号化装置及び動画像復号化プログラム
CN101697576B (zh) 运动画面产生装置,编码装置,解码装置及多路复用装置
US7046910B2 (en) Methods and apparatus for transcoding progressive I-slice refreshed MPEG data streams to enable trick play mode features on a television appliance
KR101215615B1 (ko) 동일 채널 내에서 서로 다른 코덱을 이용하여 부호화된 비디오 및 오디오 데이터 스트림의 재생을 위한 코덱 변경 방법 및 장치
KR101227330B1 (ko) 화상 부호화 장치 및 화상 복호화 장치
JP2000278692A (ja) 圧縮データ処理方法及び処理装置並びに記録再生システム
JPH06261303A (ja) 画像信号符号化方法、復号化方法および画像信号記録媒体
JP4570532B2 (ja) 動き検出装置、動き検出方法、集積回路およびプログラム
GB2321154A (en) Reverse playback of MPEG video
CN1933602B (zh) 编码解码装置、编码解码方法及编码解码集成电路
EP2249567A1 (en) Dynamic image stream processing method and device, and dynamic image reproduction device and dynamic image distribution device using the same
JP3203168B2 (ja) Mpegビデオデコーダ
US20080152313A1 (en) Image processing apparatus
US8155186B2 (en) Bit stream recording medium, video encoder, and video decoder
JP2008035294A (ja) 画像データ記録装置及び画像データ符号化装置
US6373905B1 (en) Decoding apparatus and decoding method
JP4902854B2 (ja) 動画像復号化装置、動画像復号化方法、動画像復号化プログラム、動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像符号化復号化装置
KR100256648B1 (ko) 영상 부호화 시스템의 압축 정보 포맷
JP2003274412A (ja) 画像符号化方法および画像復号化方法
JP2006311135A (ja) 動画像符号化装置
JP2002305725A (ja) データ再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081204

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110620

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees