JP2007067842A - Apparatus and method for editing moving image coding data - Google Patents
Apparatus and method for editing moving image coding data Download PDFInfo
- Publication number
- JP2007067842A JP2007067842A JP2005251358A JP2005251358A JP2007067842A JP 2007067842 A JP2007067842 A JP 2007067842A JP 2005251358 A JP2005251358 A JP 2005251358A JP 2005251358 A JP2005251358 A JP 2005251358A JP 2007067842 A JP2007067842 A JP 2007067842A
- Authority
- JP
- Japan
- Prior art keywords
- encoded data
- picture
- information
- reordering
- moving image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
Description
本発明は、動画像信号がピクチャ単位で符号化された符号化データを切り出す動画像符号化データ編集装置および動画像符号化データ編集方法に関するものである。 The present invention relates to a moving image encoded data editing apparatus and a moving image encoded data editing method for extracting encoded data obtained by encoding a moving image signal in units of pictures.
近年、動画像の高能率符号化方法として、MPEG2やMPEG4方式が用いられている。これらの符号化方式では、まず1画面相当のデジタル画像データをいくつかの画素からなるブロックに分割し、ブロック毎に画像間の動きを示す動きベクトルを検出し、動き補償と呼ばれる予測画像の生成を行い、得られた予測画像と符号化対照ピクチャとの差分値に対して符号化を行う。 In recent years, MPEG2 and MPEG4 systems have been used as high-efficiency encoding methods for moving images. In these encoding methods, first, digital image data corresponding to one screen is divided into blocks made up of several pixels, a motion vector indicating motion between images is detected for each block, and a predicted image called motion compensation is generated. And encoding is performed on the difference value between the obtained predicted image and the encoded reference picture.
この予測画像の生成方法によって、ピクチャはいくつかのタイプに分けられる。参照画像を持たず、画面内の予測のみを用いるものをIピクチャと呼び、1枚の参照画像を用いて画面間予測符号化を行うものをPピクチャと呼び、2枚の参照画像を用いて画面間予測符号化を行うものをBピクチャと呼ぶ。 Pictures are divided into several types according to the method of generating a predicted image. A picture that does not have a reference picture and uses only prediction within the screen is called an I picture, and a picture that performs inter-picture prediction coding using one reference picture is called a P picture, and uses two reference pictures. A picture that performs inter-screen predictive coding is called a B picture.
図18は、従来のMPEG−2符号化における符号化方法を説明する図であり、図18(a)は、表示時のフレームの並び、図18(b)は符号化時のフレームの並びを示す図である。図18において、IピクチャI2は参照画像を用いずに符号化されている。Pピクチャは、直前の1枚のIピクチャまたはPピクチャを用いて予測が行われるので、例えば、PピクチャP5は直前のIピクチャI2を用いて符号化されている。Bピクチャは、直前の1枚のIピクチャまたはPピクチャと、直後の1枚のIピクチャまたはPピクチャを用いて予測が行われるので、例えば、BピクチャB3は直前のIピクチャI2と直後のPピクチャP5を用いて符号化されている。 18A and 18B are diagrams for explaining an encoding method in the conventional MPEG-2 encoding. FIG. 18A shows the arrangement of frames at the time of display, and FIG. 18B shows the arrangement of frames at the time of encoding. FIG. In FIG. 18, an I picture I2 is encoded without using a reference image. Since the P picture is predicted using the immediately preceding I picture or P picture, for example, the P picture P5 is encoded using the immediately preceding I picture I2. The B picture is predicted using the immediately preceding I picture or P picture and the immediately following I picture or P picture. For example, the B picture B3 includes the immediately preceding I picture I2 and the immediately following P picture. It is encoded using the picture P5.
画面間予測符号化を用いた符号化においては、参照画像のデータが先に符号化されている必要があるため、ピクチャの並び替えを行ってから符号化を行う。つまり、図18(b)に示すように、例えば、BピクチャB3は直後のPピクチャP5を用いて予測符号化を行うため、BピクチャB3より前にPピクチャP5を符号化する。 In encoding using inter-picture predictive encoding, since reference image data needs to be encoded first, encoding is performed after rearranging pictures. That is, as shown in FIG. 18B, for example, the B picture B3 is subjected to predictive coding using the immediately following P picture P5, so the P picture P5 is coded before the B picture B3.
また、MPEG−2符号化では、複数のピクチャをまとめたグループ・オブ・ピクチャ(GOP)という階層が定義され、これを符号化処理の基本単位として符号化データの編集やランダムアクセスを実現している。GOPの構成は、例えば、図18(a)に示すGOPの場合、Bピクチャで始まっているが、最初のBピクチャは前のGOPのPピクチャからも予測が行われるため、GOP単位で切り出すことができない。そこで、前のGOPからの予測を排除した構成とすることもできる。これがクローズドGOPと呼ばれるものである。 Also, in MPEG-2 encoding, a hierarchy called a group of pictures (GOP) in which a plurality of pictures are grouped is defined, and this is used as a basic unit of encoding processing to implement editing and random access of encoded data. Yes. For example, in the case of the GOP shown in FIG. 18A, the GOP structure starts with a B picture. However, since the first B picture is also predicted from the P picture of the previous GOP, it is cut out in units of GOPs. I can't. Therefore, a configuration in which the prediction from the previous GOP is excluded can be adopted. This is called a closed GOP.
図19は、クローズドGOPの場合の符号化方法を説明するもので、図19(a)は表示時のフレームの並び、図19(b)は符号化時のフレームの並びを示す図である。例えば、図19(a)に示すように、表示時のフレームの並びもGOPの先頭にIピクチャがくるようにして、図19(b)に示すように、GOP単位で予測を完結、すなわち他のGOPのピクチャは予測に使用しないようにしている。 FIGS. 19A and 19B illustrate an encoding method in the case of a closed GOP. FIG. 19A shows the arrangement of frames at the time of display, and FIG. 19B shows the arrangement of frames at the time of encoding. For example, as shown in FIG. 19A, the I-picture is arranged at the head of the GOP in the frame arrangement at the time of display, and the prediction is completed in units of GOP as shown in FIG. The GOP pictures are not used for prediction.
一方、ITUで現在標準化中のH.264では、参照ピクチャは参照ピクチャリストと呼ばれる複数枚の候補の中から選んで使用することができるため、任意に離れたピクチャを参照することが可能となっている。 On the other hand, in H.264 currently being standardized by the ITU, a reference picture can be selected from a plurality of candidates called a reference picture list and used, so it is possible to refer to a picture that is arbitrarily distant. ing.
図20は、H.264における符号化方法を説明する図である。 20 is a diagram for explaining an encoding method in H.264.
例えば、PピクチャP6は、直前のPピクチャP3ではなく、もっと離れたIピクチャIDR(instantaneous Decorder Refresh)0を参照することが可能である。またBピクチャもB1のように時間的に離れたピクチャであるPピクチャP6を参照することが可能であるし、また、BピクチャB2のように時間的に後に位置するピクチャ2枚(P3、P6)を参照することも可能であるし、BピクチャB5のようにBピクチャを参照画像とすることも可能である。なお、IDR(instantaneous Decorder Refresh)ピクチャとは、そのピクチャより前のピクチャ(スライス)の情報を使わなくても、それ以後のピクチャを正しく復号することができることを示す特別なIピクチャであり、このピクチャをまたいで前のピクチャを参照することはできない。よって、図20では、IDR0より前のピクチャを参照することはできない。 For example, the P picture P6 can refer to an I picture IDR (instantaneous Decorder Refresh) 0 that is farther away than the immediately preceding P picture P3. Also, the B picture can refer to the P picture P6 which is a picture separated in time like B1, and two pictures (P3, P6) located later in time like the B picture B2 ) Or a B picture such as a B picture B5 can be used as a reference image. Note that an IDR (instantaneous decorder refresh) picture is a special I picture that indicates that subsequent pictures can be correctly decoded without using information of pictures (slices) before that picture. The previous picture cannot be referenced across pictures. Therefore, in FIG. 20, it is not possible to refer to pictures before IDR0.
前述したようにH.264では、任意に離れたピクチャを参照することが可能なため、デコードした画像をデコード・ピクチャ・バッファ(DPB)と呼ばれるバッファに入れて管理を行う。 As described above, in H.264, it is possible to refer to an arbitrarily distant picture, so that the decoded image is managed in a buffer called a decoded picture buffer (DPB).
図21は、H.264におけるDPBの管理を説明する概念図である。 FIG. 21 is a conceptual diagram illustrating DPB management in H.264.
DPBには、デコード後の出力待ちピクチャ及び被参照ピクチャが格納される。各ピクチャには、ピクチャ・オーダー・カウント(POC)と呼ばれる表示順を表す番号が付与されている。また、被参照ピクチャにはフレームナンバ(FN)と呼ばれる番号が付与される。FNは、符号化順、すなわち参照されるピクチャ順に1ずつ増加する番号である。 The DPB stores the decoded output waiting picture and the referenced picture. Each picture is assigned a number representing a display order called a picture order count (POC). Also, a number called a frame number (FN) is assigned to the referenced picture. FN is a number that increases by 1 in the coding order, that is, in the order of referenced pictures.
DPBに格納されるピクチャは、「参照画像として使用」(used for reference:以下、usedと呼ぶ)または「参照画像として不使用」(unused for reference:以下、unusedと呼ぶ)のどちらかにマークされる。さらに、「出力待ち」(needed for output:以下、neededと呼ぶ)または「出力済み」(not needed to output:以下、not neededと呼ぶ)のどちらかにマークされる。 A picture stored in the DPB is marked as either “used as reference” (hereinafter referred to as “used”) or “unused as a reference image” (hereinafter referred to as “unused”). The Further, it is marked as either “waiting for output” (hereinafter referred to as “needed”) or “not needed to output” (hereinafter referred to as “not needed”).
なお、図20(b)に示す符号化順において、デコードすべき現在のピクチャ(カレントピクチャ)がP6の場合、DPBの1番目と2番目の記録エリアには、図21に示すように、POCやFN、usedまたはunused、neededまたはnot neededが設定されたIDR0と、P3とが格納され、3番目の記録エリアは、空き(empty)ということになる。 When the current picture to be decoded (current picture) is P6 in the encoding order shown in FIG. 20B, the first and second recording areas of the DPB have POC as shown in FIG. IDR0 in which “FN”, “used” or “unused”, “needed” or “not needed” is set, and P3 are stored, and the third recording area is empty.
図22は、ピクチャに付与されるPOCとFNを説明する図である。 FIG. 22 is a diagram illustrating POC and FN given to a picture.
Bピクチャなどで、他のピクチャから参照されないピクチャが入る場合、例えばP、B、B、Pという並びであると、FNは、N、N+1、N+1、N+1となるので、図22に示す場合、FNは、0、1、2、3、3、3,4,4、5、5となる。 When a picture that is not referred to by other pictures, such as a B picture, is entered, for example, in the arrangement of P, B, B, P, FN becomes N, N + 1, N + 1, N + 1. The FN is 0, 1, 2, 3, 3, 3, 4, 4, 5, 5.
次に、図23を用いて、デコード後のDPBの処理について説明する。ここで、DPBのフレーム数の上限(MaxDPB)は3、参照ピクチャの最大格納枚数(no_of_ref)は3であるとする。図23(a)は、図22においてP6をデコードした後のDPBの状態を示す図である。DPBに格納されているIDR0、P3、P6は全て被参照ピクチャであるので、usedにマークされている。また、P3、P6は出力待ちであるのでneededにマークされているが、IDR0は出力済みなのでnot neededにマークされている。次に、B1をデコードする。B1は被参照ピクチャではないので、unusedにマークする。
Next, DPB processing after decoding will be described with reference to FIG. Here, it is assumed that the upper limit (MaxDPB) of the number of DPB frames is 3, and the maximum number of stored reference pictures (no_of_ref) is 3. FIG. 23A shows the state of DPB after decoding P6 in FIG. Since IDR0, P3, and P6 stored in the DPB are all referenced pictures, they are marked as used. Further, since P3 and P6 are waiting for output, they are marked as needed, but since IDR0 has already been output, it is marked as not needed. Next, B1 is decoded. Since B1 is not a referenced picture, it is marked as unused.
次に、DPBに格納されているピクチャのPOCと、ピクチャB1のPOCを比較し、B1のPOCが最小であるので、ピクチャB1を出力する。この場合、ピクチャB1は、DPBに格納する必要はない。B2も同様である。よって、B2をデコードした後のDPBの状態も図23(a)のままである。 Next, the POC of the picture stored in the DPB is compared with the POC of the picture B1, and since the POC of B1 is minimum, the picture B1 is output. In this case, the picture B1 does not need to be stored in the DPB. The same applies to B2. Therefore, the state of the DPB after decoding B2 remains as shown in FIG.
次に、B4をデコードする。B4はBピクチャであるが、被参照ピクチャであるので、unsedにマークされる。ここで、usedとマークされている参照ピクチャの数が4になり、no_of_refを上回ってしまうため、FNの最も小さいピクチャをunusedにする。すなわち、IDR0をunusedにマークする。これにより、unused でかつnot neededであるピクチャはこれ以降のデコード処理では不必要であるので、DPBから削除する。すなわち、IDR0をDPBから削除し、B4をDPBに格納する。 Next, B4 is decoded. B4 is a B picture, but is marked as unsed because it is a referenced picture. Here, since the number of reference pictures marked as used is four and exceeds no_of_ref, the picture with the smallest FN is set to unused. That is, IDR0 is marked as unused. As a result, unused and not needed pictures are unnecessary in the subsequent decoding process, and are therefore deleted from the DPB. That is, IDR0 is deleted from the DPB, and B4 is stored in the DPB.
図23(b)に、B4デコード後のDPBの状態を示す。 FIG. 23B shows the state of the DPB after B4 decoding.
B4の次はB5をデコードするが、B5は被参照ピクチャではないので、unusedとマークする。次に、DPBに格納されているピクチャのPOCと、ピクチャB5のPOCを比較するが、B5のPOCは最小ではないので、neededとマークしDPBに格納する。しかし、DPBは既に一杯であるので、POCが最小のピクチャを出力し、not neededとする。すなわち、P3を出力しnot neededとするが、P3はusedとマークされているので、DPBから削除することはできない。そこで、さらにPOCが最小のピクチャを出力する。この場合、B4が該当するが、B4もusedであり削除することはできない。そこでさらにB5を出力しnot neededとする。これにより、B5はunusedかつnot neededとなるので、DPBに格納することなく削除される。 Next to B4, B5 is decoded. Since B5 is not a referenced picture, it is marked as unused. Next, the POC of the picture stored in the DPB is compared with the POC of the picture B5. Since the POC of the B5 is not minimum, it is marked as need and stored in the DPB. However, since the DPB is already full, the picture with the smallest POC is output and is not needed. That is, P3 is output as not needed, but P3 is marked as used and cannot be deleted from the DPB. Therefore, a picture with the smallest POC is output. In this case, B4 is applicable, but B4 is also used and cannot be deleted. Therefore, B5 is further output and set as not needed. As a result, B5 becomes unused and not needed, and is deleted without being stored in the DPB.
図23(c)に、B5でコード後のDPBの状態を示す。 FIG. 23 (c) shows the state of the DPB after coding at B5.
H.264では前述したusedまたはunusedのマーク処理に関して、メモリ・マネジメント・コントロール・オペレーション(Memory management control operation;MMCO)コマンドという情報を付加することによって、DPB内の任意のusedとマークされたピクチャをunusedとすることも可能である。 In H.264, regarding the above-described used or unused mark processing, by adding information called a memory management control operation (MMCO) command, a picture marked as used in the DPB can be changed. It can also be unused.
特別なイントラピクチャであるIDRピクチャがデコードされると、DPB内の画像は全てunusedとマークされ、POC順に全ての画像が出力され、消去される(符号化データ内の情報によって、画像の出力を行わないことも可能である)。よって、IDRピクチャをまたいで前の画像を参照することはできない。IDRピクチャではPOCとFNは0にリセットされる。H.264では、符号化データの最初のピクチャはIDRピクチャでなければならない。 When an IDR picture that is a special intra picture is decoded, all the images in the DPB are marked as unused, and all the images are output and deleted in the POC order (the output of the image is determined by the information in the encoded data). It is also possible not to do this). Therefore, it is not possible to refer to the previous image across IDR pictures. In the IDR picture, POC and FN are reset to zero. In H.264, the first picture of the encoded data must be an IDR picture.
また、MMCOコマンドを用いて、特定のコマンドを付加した場合も、DPB内の画像は全てunusedとなり、DPB内の画像はPOC順に出力された上、全て削除される。 Also, when a specific command is added using the MMCO command, all the images in the DPB are unused, and all the images in the DPB are output in the POC order and are all deleted.
次に、参照ピクチャリストについて説明する。参照ピクチャリストは、DPBに格納されているピクチャのうち、usedとマークされているピクチャを順番に並べたものである。このリスト中の、何番目のピクチャを参照するという情報をマクロブロック(MB)またはサブMB毎に付加することにより、参照ピクチャを指定する。 Next, the reference picture list will be described. The reference picture list is a list in which the pictures marked as used among the pictures stored in the DPB are arranged in order. A reference picture is designated by adding information indicating what number of picture in the list to each macroblock (MB) or sub-MB.
Pピクチャでは、DPBのピクチャをピクチャ・ナンバ(PN)の小さい順に並べる。ここで、PNとは、FNを元にフィールド順を加味したもので、フレームピクチャではFNと同等である。例えば、図22において、P9をデコードするときのDPBの状態は、図23(c)の状態であるので、参照ピクチャリストは「P3、P6、B4」となる。 In the P picture, DPB pictures are arranged in ascending order of picture number (PN). Here, PN is a field picture based on FN, and is equivalent to FN in a frame picture. For example, in FIG. 22, the DPB state when decoding P9 is the state shown in FIG. 23C, so the reference picture list is “P3, P6, B4”.
Bピクチャでは、二つの参照ピクチャリストを用いる。一つはデコードしようとするピクチャよりPOCの小さいピクチャをPOCの大きな順に並べ、その後にデコードしようとするピクチャよりPOCの大きなピクチャをPOCの小さい順に並べたものである。もう一つはデコードしようとするピクチャよりPOCの大きなピクチャをPOCの小さい順に並べ、その後にデコードしようとするピクチャよりPOCの小さいピクチャをPOCの大きな順に並べたものである。例えば、図22においてB5をデコードするときにDPBの状態は、図23(b)の状態であるので、一つ目のリストは「B4、P3、P6」、二つ目のリストは「P6、B4、P3」となる。 In the B picture, two reference picture lists are used. One is a picture in which the POC is smaller than the picture to be decoded in order of increasing POC, and the picture in which the POC is larger than the picture to be decoded is arranged in order of increasing POC. The other is a picture in which the POC larger than the picture to be decoded is arranged in the order of increasing POC, and the picture having a smaller POC than the picture to be decoded is arranged in the order of increasing POC. For example, when B5 is decoded in FIG. 22, the DPB is in the state shown in FIG. 23B, so that the first list is “B4, P3, P6” and the second list is “P6, B4, P3 ".
さて、前述したように、MPEG−2符号化方式ではクローズドGOPでないGOPでは最初のBピクチャは前のGOPのPピクチャからも予測が行われるため、GOP単位で切り出すことができない。同様に、H.264においても、IDRピクチャでないイントラピクチャでは、その後の画像がイントラピクチャをまたいで前の画像を参照することができるため、符号化データを切り出すことはできない。 As described above, in the MPEG-2 encoding method, in a GOP that is not a closed GOP, the first B picture is predicted from the P picture of the previous GOP, and therefore cannot be cut out in GOP units. Similarly, also in H.264, in an intra picture that is not an IDR picture, a subsequent image can refer to a previous image across the intra picture, and thus encoded data cannot be cut out.
そこで、この問題を解決するために、例えば、特許文献1では、MPEG−2符号化方式においてクローズドGOPでない符号化データ同士が接続されたとき、GOPの最初のBピクチャを削除している。
Therefore, in order to solve this problem, for example, in
また、特許文献2では、MPEG−2符号化方式において、クローズドGOPでない符号化データが接続する場合、GOPの最初のBピクチャを直前のピクチャで置き替えて再符号化する手法が開示されている。
Also,
さらに、特許文献3では、H.264符号化方式において、IDRピクチャ以外のピクチャでの編集によってPOCの不連続が生じたときに、それを示すフラグを付加情報として格納し、再生時にそのフラグから編集ポイントを特定し、不整合が起こらないようにDPBを管理する手法が開示されている。
しかし、従来の方法では、GOPの最初のBピクチャを削除しているが、H.264符号化方式ではBピクチャも被参照画像となり得るため、Bピクチャを削除するとその後の符号化に不整合が生じる可能性がある、という問題がある。 However, in the conventional method, the first B picture of the GOP is deleted. However, in the H.264 encoding method, since the B picture can also be a referenced image, if the B picture is deleted, the subsequent encoding is inconsistent. There is a problem that may occur.
また、直前のピクチャで置きかえて再符号化する手法では、符号化データ編集装置に再符号化回路を持たせる必要があるが、符号化方式が複雑で回路が増大となるH.264方式では回路の大幅な増大を招く恐れがある、という問題もある。 In the method of re-encoding by replacing the previous picture, the encoded data editing apparatus needs to have a re-encoding circuit. However, in the H.264 method, the encoding method is complicated and the circuit is increased. There is also a problem that it may lead to a significant increase.
また、前述した特許文献3に開示される手法では、編集によって生じる不整合を表すフラグを用いているが、復号時にそのフラグを用いて特定の動作をする必要があり、汎用性に欠ける、という問題もある。
Further, in the technique disclosed in
そこで、本発明は以上の点に着目してなされたもので、任意の編集点にて符号化データを切り出すことができる動画像符号化データ編集装置および動画像符号化データ編集方法を提供することを目的とする。 Therefore, the present invention has been made paying attention to the above points, and provides a moving image encoded data editing apparatus and a moving image encoded data editing method capable of cutting out encoded data at an arbitrary editing point. With the goal.
上記目的を達成するため、本発明の画像符号化データ編集装置は、動画像信号がピクチャ単位で符号化された符号化データを、任意の編集点で切り出す動画像符号化データ編集装置であって、前記符号化データから前記編集点以降の符号化データを抽出する符号化データ抽出部と、前記編集点以降の符号化データのヘッダ情報を、前記編集点を先頭とする内容に変更するヘッダ情報変更部と、を有する。 In order to achieve the above object, an image encoded data editing apparatus according to the present invention is a moving image encoded data editing apparatus that extracts encoded data obtained by encoding a moving image signal in units of pictures at arbitrary editing points. An encoded data extraction unit for extracting encoded data after the edit point from the encoded data, and header information for changing the header information of the encoded data after the edit point to the content starting from the edit point And a changing unit.
本発明の画像符号化データ編集装置では、符号化データから編集点以降の符号化データを抽出し、編集点以降の符号化データのヘッダ情報を編集点を先頭とする内容に変更するので、任意の編集点にて符号化データを切り出すことができる。 In the image encoded data editing apparatus of the present invention, the encoded data after the editing point is extracted from the encoded data, and the header information of the encoded data after the editing point is changed to the content starting from the editing point. The encoded data can be cut out at the edit point.
以下、図面を参照して、本発明の実施の形態を詳述する。
実施の形態1
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の符号化データ編集装置の実施の形態1を示すブロック図である。以下、図1を用いて実施の形態1の符号化データ編集装置の動作、すなわち符号化データ編集処方法を説明する。
FIG. 1 is a block
図1において、本実施の形態1の符号化データ編集装置は、HDD101、符号化データ抽出部102、ヘッダ情報変更部103、リオーダリング情報作成部104、リオーダリング情報挿入部105を有している。
In FIG. 1, the encoded data editing apparatus according to the first embodiment includes an
次に動作の概要を説明する。 Next, an outline of the operation will be described.
HDD101に記憶された符号化データは、例えば、ITU−T H.264符号化方式にて符号化されたもので、符号化データ抽出部102およびリオーダリング情報作成部104に入力される。ここでは、符号化データは、HDD101に記憶されているものとしているが、もちろん他の媒体でもよい。
The encoded data stored in the
符号化データ抽出部102は、HDD101から抽出する符号化データから、外部のユーザ等により指定される編集点(切り出し点)と切り出し長さに応じて、編集点以降の符号化データを抽出し、抽出符号化データとしてヘッダ情報変更部103に出力する。なお、外部からユーザ等により指定される編集点(切り出し点)は、符号化データ抽出部102だけでなく、ヘッダ情報変更部103、リオーダリング情報作成部104、リオーダリング情報挿入部105にも入力している。これは、後述する他の実施の形態でも同様である。
The encoded
すると、ヘッダ情報変更部103は、符号化データ抽出部102から入力された抽出符号化データの先頭のイントラピクチャのヘッダを、後述するように、IDRピクチャであることを示すものに変更するとともに、編集点から次のIDRピクチャまでの間のヘッダ情報のPOC情報およびFN情報を変更し、ヘッダ変更符号化データとして出力する。
Then, the header
リオーダリング情報作成部104は、HDD101から入力される符号化データの参照ピクチャの最大格納枚数に基づいてリオーダリング情報を作成する。符号化データの参照ピクチャの最大格納枚数は、シーケンス全体の符号化データの先頭に付加あるいは予め送信されるシーケンスパラメ−タセット(SPS)に記述されているもので、その符号化データのスライス単位毎にパラメータセットの適応的に一つとして選択している。
The reordering
リオーダリング情報挿入部105は、ヘッダ情報変更部103から入力されるヘッダ変更符号化データにリオーダリング情報を追加し、編集済み符号化データとして出力する。
The reordering
次に、動作の詳細を説明する。 Next, details of the operation will be described.
図2は、本実施の形態1における符号化データ編集装置に入力される符号化データの一例である。 FIG. 2 is an example of encoded data input to the encoded data editing apparatus according to the first embodiment.
図2は、符号化データの一部を抜粋したもので、この前後にも符号化データは存在しているものとする。これは、後述する他の実施の形態でも同様である。また、図2に示す符号化データのPOCはFNは、図2に示す通りで、編集点をイントラピクチャI6としている。なお、図2において、矢印は、予測するピクチャの関係を示している。 FIG. 2 shows a part of the encoded data, and it is assumed that the encoded data exists before and after this. The same applies to other embodiments described later. Also, the POC of the encoded data shown in FIG. 2 is as shown in FIG. 2, and the editing point is the intra picture I6. In FIG. 2, arrows indicate the relationship of pictures to be predicted.
符号化データ抽出部103は、HDD101からの符号化データから外部より指定される編集点(切り出し点)と切り出し長さに応じて、編集点以降の符号化データを抽出する。また、編集点より前の符号化データから、シーケンス・パラメータ・セットなどの符号化データ全体に係る情報も同時に抽出する。ここでは編集点および長さを外部から指定されるものとしているが、もちろん、この符号化データ編集装置自体に編集点を指定できるような装置を設け、それを用いて指定を行うものでもよい。
The encoded
図3は、符号化データ抽出部102によって抽出された符号化データの例を示す図である。
FIG. 3 is a diagram illustrating an example of encoded data extracted by the encoded
なお、図3に示す符号化データは、抽出された符号化データの先頭の部分のみを示したものであり、シーケンス・パラメータ・セットなどは記載していない。また、この後にも符号化データが続いていても勿論よい。このことは、後述する他の実施の形態でも同様である。 Note that the encoded data shown in FIG. 3 shows only the head portion of the extracted encoded data, and does not describe a sequence parameter set or the like. Of course, the encoded data may continue after this. This also applies to other embodiments described later.
ヘッダ情報変更部103は、符号化データ抽出部102によって抽出された図3に示すような符号化データのヘッダ情報を変更する。
The header
図4は、ヘッダ情報変更部103におけるヘッダ情報変更処理の流れを示すフローチャートである。
FIG. 4 is a flowchart showing the flow of the header information changing process in the header
まず、ヘッダ情報変更部103は、S401により、ヘッダ情報のうち、そのピクチャがIDRピクチャであるか否かを示す情報をIDRピクチャであることを示す情報に変更する。
First, in S401, the header
次に、ヘッダ情報変更部103は、S402により、IDRピクチャに振られるIDなど、IDRピクチャのみに付加される情報を追加する。
Next, the header
次に、ヘッダ情報変更部103は、S403により、抽出符号化ストリームのPOCとFNから、差分値を算出する。なお、符号化データ抽出部102によって抽出された抽出符号化ストリームのPOCとFNとは、図3に示すようになっている。
Next, the header
そして、ヘッダ情報変更部103は、S404により、編集後の符号化ストリームの先頭ピクチャをIDRピクチャとするため、先頭ピクチャのFNとPOCは0にリセットすると共に、先頭ピクチャに続く他の抽出符号化データのピクチャのPOCおよびFNの変更を行う。その際、先頭ピクチャのPOCとFNの値が差分値となるので、先頭ピクチャのPOCとFNの値を、他の抽出符号化データのピクチャのPOCおよびFNの値から減算することによりその変更を行う。なお、この変更は、抽出符号化データの先頭ピクチャから次のIDRピクチャの前のピクチャまで繰り返して行う。
Then, in S404, the header
図5に、このようにしてヘッダ情報が変更されたヘッダ変更符号化データのピクチャタイプおよびPOCとFNを示す。 FIG. 5 shows the picture type and POC and FN of the header change encoded data in which the header information is changed in this way.
図5に示すヘッダ情報変更後の符号化データのPOCとFNとを、図3に示すヘッダ情報変更前の符号化データのPOCとFNと比較すると明らかだが、編集点のIピクチャI6のピクチャタイプをIDR0というIDRピクチャタイプに変更することにより、そのFNとPOCは0にリセットされ、IDR0に続くピクチャのPOCとFNも、IピクチャI6のFNとPOCのリセットに応じて相対的に、すなわちIピクチャI6のPOCの値6とFNの値3がそれぞれ減算されている。
As apparent from comparing the POC and FN of the encoded data after the header information change shown in FIG. 5 with the POC and FN of the encoded data before the header information change shown in FIG. 3, the picture type of the I picture I6 at the editing point Is changed to an IDR picture type of IDR0, the FN and POC are reset to 0, and the POC and FN of the picture following IDR0 are relatively changed in response to the reset of the FN and POC of the I picture I6, that is, I The
次に、リオーダリング情報作成部104でのリオーダリング情報作成処理について説明する。
Next, reordering information creation processing in the reordering
図6は、図5に示すヘッダ変更符号化データの先頭ピクチャIDR0をデコードした後のDPBの状態を示す図である。 FIG. 6 is a diagram showing the state of the DPB after decoding the first picture IDR0 of the header change encoded data shown in FIG.
ここでは、DPBのフレーム(ピクチャ)数の上限(MAX DPB)は、例えば2フレーム(ピクチャ)、参照ピクチャの最大格納枚数(no_of_ref)も、例えば、2フレーム(ピクチャ)であるとする。このように、IDR0ピクチャのデコード直後は、DPBにはIDR0ピクチャのみが格納されている状態となる。よって、前述した参照ピクチャリストを作成しても、参照ピクチャリストには1枚のピクチャしか存在ない。 Here, it is assumed that the upper limit (MAX DPB) of the number of DPB frames (pictures) is, for example, 2 frames (pictures), and the maximum number of reference pictures stored (no_of_ref) is, for example, 2 frames (pictures). Thus, immediately after the decoding of the IDR0 picture, only the IDR0 picture is stored in the DPB. Therefore, even if the above-described reference picture list is created, there is only one picture in the reference picture list.
図7は、IDR0の次のピクチャであるB5をデコードする際に用いられる参照ピクチャリストMPの一例を示したものである。この場合、図6に示すように、DPBには、IDR0ピクチャしか格納されていないので、参照ピクチャリストMPは、idx0はIDR0、idx1はNONE(無し)に設定される。なお、Bピクチャをデコードする際には二つの参照ピクチャリストMPが用いられるが、ここではその一つを取って説明することとする。 FIG. 7 shows an example of the reference picture list MP used when decoding B5 which is the next picture of IDR0. In this case, as shown in FIG. 6, since only the IDR0 picture is stored in the DPB, in the reference picture list MP, idx0 is set to IDR0 and idx1 is set to NONE (none). Note that, when decoding a B picture, two reference picture lists MP are used, but only one of them will be described here.
なお、参照ピクチャリストは、スライス毎に付加されるスライスヘッダ内でリオーダリング情報を送ることにより、前述した参照ピクチャリストを並び替えることが可能である。リオーダリング情報を用いると、参照ピクチャリストに同じピクチャを複数いれることも可能である。 The reference picture list can be rearranged by sending reordering information in the slice header added for each slice. If reordering information is used, it is possible to include a plurality of the same pictures in the reference picture list.
一方、図2に示す切り出す前の符号化データでは、I6ピクチャをデコードした後のDPBの状態は図8のようになっている。 On the other hand, in the encoded data before clipping shown in FIG. 2, the DPB state after decoding the I6 picture is as shown in FIG.
図8は、DPBにP4とI6が格納され、両方ともusedとneededにマークされていることを示す図である。 FIG. 8 is a diagram showing that P4 and I6 are stored in the DPB, and both are marked as used and needed.
このように、図2に示すような切り出す前のDPBの状態では、図8で示すように2枚のusedとマークされたピクチャがあるので、B5をデコードする際に使用する参照ピクチャリストMPには、図9に示すように、idx0、idx1として、2枚のピクチャI6、P4がそれぞれ存在することになる。 Thus, in the state of the DPB before being cut out as shown in FIG. 2, there are two pictures marked as used as shown in FIG. 8, so that the reference picture list MP used when decoding B5 is included in the reference picture list MP. As shown in FIG. 9, there are two pictures I6 and P4 as idx0 and idx1, respectively.
したがって、参照ピクチャとして、参照ピクチャリストの2番目のピクチャが指定される可能性があるが、DPBが例えば図6に示す状態であり、図7に示すような参照ピクチャリストである場合、ヘッダ変更符号化データでは参照ピクチャリストには1枚のピクチャしか存在しないため、不整合を生じることとなる。 Therefore, there is a possibility that the second picture in the reference picture list may be designated as the reference picture. However, if the DPB is in the state shown in FIG. 6 and the reference picture list as shown in FIG. In the encoded data, since only one picture exists in the reference picture list, inconsistency occurs.
そこで、本実施の形態1のリオーダリング情報作成部104では、編集点以降の符号化データの参照ピクチャリストのピクチャの数が、参照ピクチャの最大格納枚数(no_of_ref)と同じになるように、符号化すべきピクチャB5に時間的に最も近いピクチャを、参照ピクチャリストの空きに挿入するようにリオーダリング情報を作成する。その際、リオーダリング情報作成部104は、編集点であるイントラピクチャを挿入するようにリオーダリング情報を作成するようにしても勿論よいし、参照ピクチャリストに掲載されている、例えば、1番目のピクチャをコピーして参照ピクチャリストの空きに挿入するようにリオーダリング情報を作成するようにしても勿論よい。
Therefore, the reordering
図10に、このようなリオーダリング情報を受け取った場合の、復号時の参照ピクチャリストを示す。 FIG. 10 shows a reference picture list at the time of decoding when such reordering information is received.
この場合、符号化すべきピクチャB5に時間的に最も近いピクチャは、IDR0であるので、図7に示すように符号化データの任意の参照点における切り出しにより、参照ピクチャリストの後ろのidx1にNONE(無し)が設定されることになった場合、本実施の形態1のリオーダリング情報作成部104では、idx1として、IDR0を設定することになる。
In this case, since the picture temporally closest to the picture B5 to be encoded is IDR0, as shown in FIG. 7, by cutting out at an arbitrary reference point of the encoded data, NONE ( If no) is set, the reordering
従って、本実施の形態1のリオーダリング情報作成部104では、符号化データの任意の参照点における切り出しにより、参照ピクチャリストにNONE(無し)が設定されても、そのNONE(無し)に符号化すべきピクチャB5に時間的に最も近いピクチャを付加したリオーダリング情報を作成することにより、復号の際、参照ピクチャとして参照ピクチャリストの2番目のピクチャが指定されても、参照ピクチャの数が足りなくなるといる不整合を生じることを防ぐことができる。
Therefore, the reordering
そして、DPBは、次のIDRピクチャが来ることでリセットされるので、リオーダリング情報作成部104は、編集点から次のIDRピクチャまでの間のDPBの状態を調べ、DPBの中の被参照ピクチャの数が参照ピクチャの最大格納枚数(no_of_ref)に満たないピクチャに同様にリオーダリング情報を追加する。
Since the DPB is reset when the next IDR picture comes, the reordering
リオーダリング情報作成部104により作成されたリオーダリング情報は、オーダリング情報挿入部105へ出力され、リオーダリング情報挿入部105は、ヘッダ情報変更部103によりヘッダ情報が変更された編集点以降の符号化データに対し、リオーダリング情報を挿入する。
The reordering information created by the reordering
図11に、本実施の形態1のリオーダリング情報挿入部105から出力される編集済み符号化データの一例を示す。
FIG. 11 shows an example of edited encoded data output from the reordering
本実施の形態1のリオーダリング情報挿入部105は、ヘッダ情報変更部103によりヘッダ情報が変更された編集点以降の符号化データの各ピクチャにおけるスライスデータのスライスヘッダ内に、リオーダリング情報を挿入する。
The reordering
このように、本実施の形態1の符号化データ編集装置によれば、符号化データの切り出し等の編集を行う編集点以降の符号化データを抽出し、編集点以降の符号化データのヘッダ情報を編集点を先頭とする内容に変更するので、任意の編集点にて符号化データを切り出すことができる。 As described above, according to the encoded data editing apparatus of the first embodiment, the encoded data after the edit point to be edited such as extraction of the encoded data is extracted, and the header information of the encoded data after the edit point is extracted. Is changed to the content having the edit point as the head, so that the encoded data can be cut out at an arbitrary edit point.
特に、本実施の形態1では、H.264符号化方式にて符号化された符号化データの編集を行った後のDPBに格納されている被参照画像の数と、参照ピクチャの最大格納枚数(no_of_ref)を比較し、被参照画像の数が少なかった場合には、編集点としたイントラピクチャを、参照ピクチャリストのピクチャの数が最大格納枚数となるまで参照ピクチャリストに追加することを指示するリオーダリング情報を挿入するとともに、編集点のピクチャのヘッダ情報をIDRピクチャのものに書き換えるようにしたので、IDRピクチャ以外の任意のイントラピクチャにて切り出しをした符号化データを復号した場合でも、DPBにおける参照ピクチャの欠落を補填することができ、参照ピクチャの欠落による復号画像の品質劣化の防止を図りながらIDRピクチャ以外のイントラピクチャを編集点として符号化データを切り出すことが可能となる。 In particular, in the first embodiment, H.264 is used. The number of referenced images stored in the DPB after editing the encoded data encoded by the H.264 encoding method is compared with the maximum number of stored reference pictures (no_of_ref). If the number is small, reordering information is inserted to instruct that the intra picture as the editing point is added to the reference picture list until the maximum number of pictures in the reference picture list is stored. Since the header information of the picture is rewritten to that of the IDR picture, it is possible to compensate for the missing reference picture in the DPB even when the encoded data cut out with any intra picture other than the IDR picture is decoded. Intra-pictures other than IDR pictures while preventing quality degradation of the decoded image due to missing reference pictures It is possible to cut out the encoded data catcher as an editing point.
なお、本実施の形態1では、リオーダリング情報挿入部105によってリオーダリング情報が挿入された編集済み符号化データを他の符号化データに接続する符号化データ接続部を設けずに説明したが、次に説明する実施の形態2(図11参照)の符号化データ接続部207と同様に、符号化データ接続部207により、リオーダリング情報が挿入された編集済み符号化データを他の符号化データに接続するようにしても勿論よい。
In the first embodiment, the description has been given without providing an encoded data connection unit that connects the edited encoded data in which the reordering information is inserted by the reordering
実施の形態2.
図12は、本発明の符号化データ編集装置の実施の形態2の構成例を示すブロック図である。なお、本実施の形態2において、上記実施の形態1と同一の構成要素には、同一符号を付して説明を省略する。
FIG. 12 is a block diagram showing a configuration example of
図12において、実施の形態2の符号化データ編集装置は、HDD101、符号化データ抽出部102、ヘッダ情報変更部203、リオーダリング情報作成部104、リオーダリング情報挿入部105、MMCO情報挿入部206、符号化データ接続部207より構成されている。
In FIG. 12, the encoded data editing apparatus according to the second embodiment includes an
次に、動作の概要を説明する。 Next, an outline of the operation will be described.
HDD101に記憶された符号化データは、符号化データ抽出部102、リオーダリング情報作成部104、およびMMCO情報挿入部206に入力される。ここでは、符号化データは、HDD101に記憶されているものとしているが、もちろん他の媒体でもよい。本実施の形態2では、複数の符号化データを接続するので、HDD101からは複数の符号化データが入力される。ここで、符号化データの切り出しを行う符号化データを接続符号化データ、それを接続する符号化データを被接続符号化データとよぶこととする。なお、本実施の形態2の符号化データ編集装置に入力される符号化データは、実施の形態1で説明したように、図2に示すような符号化ビットストリームである。
The encoded data stored in the
符号化データ抽出部102は、実施の形態1と同様に、外部から指定される編集点(切り出し点)と、切り出し長さに応じて、接続符号化データから編集点以降の符号化データを抽出し、抽出符号化データとしてヘッダ情報変更部203に出力する。なお、外部または内部よりユーザ等により指定される編集点(切り出し点)は、実施の形態1と同様に、符号化データ抽出部102だけでなく、ヘッダ情報変更部203、リオーダリング情報作成部104、リオーダリング情報挿入部105、およびMMCO情報挿入部206に入力している一方、本実施の形態2の場合、符号化データ接続部207に、編集点にて切り出した符号化データの接続相手となる被接続符号化データを指定する情報が外部または内部よりユーザ等により指定される。また、編集点より前の符号化データから、シーケンス・パラメータ・セットなどの符号化データ全体に係る情報も同時に抽出する。ここでは編集点および長さを外部から指定されるものとしているが、もちろん符号化データ編集装置に編集点を指定できるような装置を設け、それを用いて指定を行うものでもよい。本実施の形態2では、編集点をイントラピクチャI6であるとする。なお、本実施の形態2の符号化データ抽出部103も、実施の形態1と同様に、図3に示すように符号化データを抽出する。
The encoded
ヘッダ情報変更部203は、入力された抽出符号化データの編集点から次のIDRピクチャまでの間のヘッダ情報のPOC情報およびFN情報を後述するように変更し、ヘッダ変更符号化データとして、リオーダリング情報作成部104へ出力する。
The header
リオーダリング情報作成部104は、実施の形態1と同様に、HDD101から入力される符号化データの編集点における参照ピクチャの最大格納枚数に基づいてリオーダリング情報を作成する。リオーダリング情報挿入部105は、ヘッダ情報変更部203から入力されるヘッダ情報変更後の符号化データに、リオーダリング情報を追加して、MMCO情報挿入部206へ出力する。
Similar to the first embodiment, the reordering
MMCO情報挿入部206は、リオーダリング情報挿入部105によってリオーダリング情報が追加された編集点のピクチャのヘッダ部に、DPBのリセットを指示するMMCO情報(以下、リセットMMCOコマンドと呼ぶ)を挿入し、MMCO挿入データとして符号化データ接続部207に出力する。
The MMCO
符号化データ接続部207は、外部または内部の指示により指定された被接続データの後ろに、編集点のピクチャ被接続のヘッダ部にMMCO情報が挿入された当該編集点以降の接続符号化データを接続して、編集済み符号化データとして、復号装置や再度HDD101等の記録装置へ出力する。
The encoded
次に、実施の形態2の符号化データ編集装置における主要動作を詳細に説明する。 Next, main operations in the encoded data editing apparatus according to the second embodiment will be described in detail.
図13は、本実施の形態2のヘッダ情報変更部203によるヘッダ情報変更処理の流れを示すフローチャートである。
FIG. 13 is a flowchart showing the flow of the header information changing process by the header
まず、ヘッダ情報変更部203は、S401により、符号化データ抽出部102によって抽出された抽出符号化ストリームのPOCとFNとから、その差分値を算出する。抽出符号化ストリームのPOCとFNとは、図3に示すようになっており、編集後の符号化データは、編集点のピクチャのヘッダ部にMMCOリセットコマンドを付加しているので、編集点のピクチャ、すなわち接続符号化データの先頭ピクチャのFNとPOCとは0にリセットされる。すなわち、抽出符号化データの先頭ピクチャのPOCおよびFNが差分値となる。
First, the header
次に、ヘッダ情報変更部203は、S402により、この差分値を用いてFNとPOCの変更を行う。この変更は抽出符号化データの先頭ピクチャから次のIDRピクチャの前のピクチャまで繰り返して行う。
Next, the header
図14は、本実施の形態2によるヘッダ変更符号化データのピクチャタイプおよびPOCとFNを示す図である。 FIG. 14 is a diagram showing the picture type, POC, and FN of the header change encoded data according to the second embodiment.
図3に示すヘッダ情報が変更される前の符号化データのPOCとFNと比較すると明らかだが、IピクチャI6のFNとPOCとはそれぞれ0にリセットされ、IピクチャI6に続くピクチャのPOCとFNも、IピクチャI6のFNとPOCのリセットに応じて相対的に変更されている。つまり、図5に示す実施の形態1によるヘッダ情報が変更後符号化データと比べると、ピクチャI6がピクチャIDR0に変更されない点が異なる。
As apparent from comparison with the encoded data POC and FN before the header information shown in FIG. 3 is changed, the FN and POC of the I picture I6 are reset to 0, respectively, and the POC and FN of the picture following the I picture I6 are reset. Also, the I picture I6 is relatively changed according to the reset of the FN and POC. That is, the difference between the header information according to
図15は、図13に示すヘッダ変更符号化データの先頭ピクチャI6をデコードした後のDPBの状態を示す図である。 FIG. 15 is a diagram showing the state of the DPB after decoding the first picture I6 of the header change encoded data shown in FIG.
ここでは、DPBのフレーム数の上限(MaxDPB)は2、参照ピクチャの最大格納枚数(no_of_ref)は2であるとする。このように、MMCOリセットコマンドが付加されたピクチャの次のピクチャのデコード直後は、DPBにはそのピクチャのみが格納されている状態となる。よって、前述した参照ピクチャリストを作成しても、DPBには1枚のピクチャしか存在ない。なお、図6とは、ピクチャI6がピクチャIDR0に変更されない点が異なる。 Here, it is assumed that the upper limit (MaxDPB) of the number of DPB frames is 2, and the maximum number of stored reference pictures (no_of_ref) is 2. In this way, immediately after decoding the next picture after the picture to which the MMCO reset command is added, only the picture is stored in the DPB. Therefore, even if the above-described reference picture list is created, there is only one picture in the DPB. 6 is different from FIG. 6 in that the picture I6 is not changed to the picture IDR0.
すると、本実施の形態2でも、ピクチャI6の次のピクチャであるB5をデコードする際に用いられる参照ピクチャリストは、実施の形態1と同様に、図7に示すようになる。 Then, also in the second embodiment, the reference picture list used when decoding B5, which is the next picture of picture I6, is as shown in FIG. 7, as in the first embodiment.
一方、図2に示す切り出す前の符号化データでは、ピクチャI6をデコードした後のDPBの状態は、実施の形態1と同様に、図8のようになる。 On the other hand, in the encoded data before clipping shown in FIG. 2, the state of DPB after decoding picture I6 is as shown in FIG. 8, as in the first embodiment.
図8は、DPBにP4とI6が格納され、両方ともusedとneededにマークされていることを示す図である。図8に示すように、切り出す前のDPBの状態では、2枚のusedとマークされたピクチャがあるので、B5をデコードする際に使用する参照ピクチャリストには、図9に示すように2枚のピクチャが存在している。したがって、参照ピクチャとして参照ピクチャリストの2番目のピクチャが指定される可能性があるが、前述したようにヘッダ変更符号化データでは参照ピクチャリストには1枚のピクチャしか存在しないため、不整合を生じることとなる。 FIG. 8 is a diagram showing that P4 and I6 are stored in the DPB, and both are marked as used and needed. As shown in FIG. 8, in the state of the DPB before being cut out, there are two pictures marked as used. Therefore, the reference picture list used when decoding B5 has two pictures as shown in FIG. There are pictures. Therefore, there is a possibility that the second picture in the reference picture list is designated as the reference picture. However, as described above, in the header change encoded data, only one picture exists in the reference picture list. Will occur.
そこで、リオーダリング情報作成部104は、実施の形態1と同様に、前記編集点以降の符号化データの参照ピクチャリストのピクチャの数が、参照ピクチャの最大格納枚数(no_of_ref)と同じになるように、符号化すべきピクチャB5に時間的に最も近いピクチャを、参照ピクチャリストの空きに挿入するようにリオーダリング情報を作成してリオーダリング情報挿入部105へ出力する。その際、リオーダリング情報作成部104は、実施の形態1と同様に、編集点であるイントラピクチャを挿入するようにリオーダリング情報を作成するようにしても勿論よいし、参照ピクチャリストに掲載されている、例えば、1番目のピクチャをコピーして参照ピクチャリストの空きに挿入するようにリオーダリング情報を作成するようにしても勿論よい。
Therefore, as in the first embodiment, the reordering
リオーダリング情報挿入部105は、リオーダリング情報作成部104が作成したリオーダリング情報を、上述のようにヘッダ情報変更部203によってヘッダ情報が変更された編集点以降の符号化データの最初のピクチャ、すなわち編集点のピクチャのヘッダ情報に挿入して、MMCO情報挿入部206へ出力する。
The reordering
これにより、本実施の形態2でも、このようなリオーダリング情報を受け取った場合の復号時の参照ピクチャリストは、実施の形態1と同様に、図10に示すようになり、このようにリオーダリング情報を付加することにより、参照ピクチャとして参照ピクチャの2番目のピクチャが指定されても参照ピクチャリストのピクチャの数が足りなくなるといる不整合を生じることを防ぐことができる。 Accordingly, also in the second embodiment, the reference picture list at the time of decoding when such reordering information is received is as shown in FIG. 10 as in the first embodiment, and thus reordering is performed in this way. By adding information, it is possible to prevent the occurrence of inconsistency that the number of pictures in the reference picture list becomes insufficient even when the second picture of the reference picture is designated as the reference picture.
よって、DPBは、次のIDRピクチャが来ることでリセットされるので、リオーダリング情報作成部104では、編集点から次のIDRピクチャまでの間のDPBの状態を調べ、DPBの中の被参照ピクチャの数が参照ピクチャの最大格納枚数(no_of_ref)に満たないピクチャに同様にリオーダリング情報を追加することになる。
Therefore, since the DPB is reset when the next IDR picture comes, the reordering
一方、MMCO情報挿入部206は、リオーダリング情報挿入部105によってリオーダリング情報が挿入された編集点のピクチャのヘッダ部に、DPBのリセットを指示するMMCO情報(以下、リセットMMCOコマンドと呼ぶ)を挿入し、MMCO挿入データとして符号化データ接続部207に出力する。
On the other hand, the MMCO
符号化データ接続部207は、被接続編集点のピクチャのヘッダ部にMMCO情報挿入部206によりMMCOコマンドが挿入された編集点以降の符号化データを、内部または外部から指定された被接続符号化データの最後のピクチャの後ろに接続して、編集済み符号化データとして、復号装置(図示せず)やHDD101等へ出力する。これにより、復号装置(図示せず)等では、ピクチャB18のデコード後、編集点のピクチャのヘッダ部のMMCOコマンドを復号した際、DPB内の全てのピクチャをunusedとマークし出力した上で消去(リセット)して、その後編集点以降の符号化データをデコードすることになる。
The encoded
図16は、被接続符号化データの一例を示す図である。 FIG. 16 is a diagram illustrating an example of connected encoded data.
図16に示す被接続符号化データの例は、被接続符号化データの最後尾の部分のみを示しており、この前にも被接続符号化データは存在している。この場合、編集点以降の接続符号化データは、符号化データ接続部207によって、被接続符号化データの最後のピクチャB18に接続されることになる。
The example of the connected encoded data shown in FIG. 16 shows only the last part of the connected encoded data, and the connected encoded data exists before this. In this case, the connection encoded data after the editing point is connected to the last picture B18 of the connected encoded data by the encoded
図17に、本実施の形態2の符号化データ編集装置より出力される編集済み符号化データの一例を示す。 FIG. 17 shows an example of edited encoded data output from the encoded data editing apparatus according to the second embodiment.
つまり、本実施の形態2では、ヘッダ情報変更部103によりヘッダ情報が変更された編集点以降の符号化データの各ピクチャにおけるスライスデータのスライスヘッダ内に、リオーダリング情報挿入部105によってリオーダリング情報作成部104により作成されたリオーダリング情報と、MMCO情報挿入部106によってMMCO情報とが挿入されることになる。
That is, in the second embodiment, the reordering
このように、本実施の形態2の符号化データ編集装置によれば、符号化データの切り出し等の編集を行う編集点以降の符号化データを抽出し、編集点以降の符号化データのヘッダ情報を、編集点を先頭とする内容に変更するので、任意の編集点にて符号化データを切り出すことができる。 As described above, according to the encoded data editing apparatus of the second embodiment, the encoded data after the editing point for performing editing such as extraction of the encoded data is extracted, and the header information of the encoded data after the editing point is extracted. Is changed to the content starting from the edit point, so that the encoded data can be cut out at an arbitrary edit point.
特に、本実施の形態2では、H.264符号化方式にて符号化された符号化データの編集を行った後のDPBに格納されている被参照画像の数と、参照ピクチャの最大格納枚数(no_of_ref)を比較し、被参照画像の数が少なかった場合には、編集点としたイントラピクチャを、参照ピクチャリストのピクチャの数が最大格納枚数となるまで参照ピクチャリストに追加することを指示するリオーダリング情報を挿入するとともに、被接続符号化データの最後のピクチャにDPB内の画像を参照不可として全て出力させるDPBのリセットを指示するMMCOコマンド情報を追加するようにしたので、実施の形態1と同様に、IDRピクチャ以外の任意のイントラピクチャにて切り出しをした符号化データを復号した場合でも、DPBにおける参照ピクチャの欠落を補填することができ、参照ピクチャの欠落による復号画像の品質劣化の防止を図りながらIDRピクチャ以外のイントラピクチャを編集点として符号化データを切り出して、他の符号化データに接続することが可能となる。 In particular, in the second embodiment, H.264 is used. The number of referenced images stored in the DPB after editing the encoded data encoded by the H.264 encoding method is compared with the maximum number of stored reference pictures (no_of_ref). If the number is small, reordering information is inserted to instruct that the intra picture as the editing point is added to the reference picture list until the number of pictures in the reference picture list reaches the maximum number of stored pictures. Since the MMCO command information for instructing resetting of the DPB that outputs all the images in the DPB as being unreferenceable is added to the last picture of the encoded data, as in the first embodiment, any other than the IDR picture Even when encoded data cut out with an intra picture is decoded, it is possible to compensate for the missing reference picture in the DPB. , While achieving prevention of quality deterioration of the decoded image due to lack of a reference picture is cut out encoded data an intra-picture other than the IDR picture as an editing point, it is possible to connect to other coded data.
なお、本実施の形態2では、符号化データ接続部207を設けて説明したが、本発明では、これに限らず、実施の形態1のように、符号化データ接続部207を設けずに、任意の編集点で符号化データを切り出して出力するだけでも勿論良い。
In the second embodiment, the encoded
また、本実施の形態2では、MMCO情報挿入部26がリオーダリング情報挿入部105によってリオーダリング情報が挿入された編集点のピクチャのヘッダ部に、MMCO情報を挿入し、MMCO挿入データとして符号化データ接続部207に出力するように説明したが、これに限らず、リオーダリング情報とMMCO挿入データの挿入のタイミングを逆にして、例えば、MMCO情報挿入部26が編集点のピクチャのヘッダ部にMMCO情報を挿入した後、リオーダリング情報挿入部105がリオーダリング情報作成部104からのリオーダリング情報を挿入するようにしても勿論かまわない。
Further, in the second embodiment, the MMCO information insertion unit 26 inserts MMCO information into the header portion of the picture at the editing point where the reordering
なお、上記実施の形態1,2では、ITU−T H.264符号化方式により符号化された符号化データを編集(切り出し)の対象として説明したが、本発明では、これに限るものではなく、他の符号化方式により符号化された符号化データを対象としても勿論よい。 In the first and second embodiments, the ITU-T H. The encoded data encoded by the H.264 encoding method has been described as the object of editing (cutting out), but the present invention is not limited to this, and the encoded data encoded by another encoding method is the target. Of course.
101 HDD
102 符号化データ抽出部
103,203 ヘッダ情報変更部
104 リオーダリング情報作成部
105 リオーダリング情報挿入部
206 MMCO情報挿入部
207 符号化データ接続部
101 HDD
102 Encoded
Claims (10)
前記符号化データから前記編集点以降の符号化データを抽出する符号化データ抽出部と、
前記編集点以降の符号化データのヘッダ情報を、前記編集点を先頭とする内容に変更するヘッダ情報変更部と、
を有する動画像符号化データ編集装置。 A moving image encoded data editing apparatus that cuts out encoded data obtained by encoding a moving image signal in units of pictures at an arbitrary editing point,
An encoded data extraction unit for extracting encoded data after the editing point from the encoded data;
A header information change unit that changes the header information of the encoded data after the edit point to the content starting from the edit point;
A moving image encoded data editing apparatus.
ことを特徴とする請求項1記載の動画像符号化データ編集装置。 The arbitrary editing point is an intra picture between two IDR (Instantaneous Decoding Refresh) pictures.
The moving image encoded data editing apparatus according to claim 1, wherein:
前記符号化データの参照ピクチャの最大数に応じて参照ピクチャリオーダリング情報を作成するリオーダリング情報作成部と、
前記リオーダリング情報を、前記ヘッダ情報の内容が変更された前記編集点以降の符号化データに挿入するリオーダリング情報挿入部と、
を有することを特徴とする請求項1または請求項2記載の動画像符号化データ編集装置。 further,
A reordering information creating unit that creates reference picture reordering information according to the maximum number of reference pictures of the encoded data;
A reordering information insertion unit for inserting the reordering information into encoded data after the editing point in which the content of the header information is changed;
The moving image encoded data editing apparatus according to claim 1 or 2, further comprising:
ことを特徴とする請求項2または請求項3記載の動画像符号化データ編集装置。 The header information change unit, when changing the header information of the encoded data after the edit point to the content starting from the edit point, information indicating the picture type in the header information of the picture at the edit point is an IDR picture Change to type,
The moving image encoded data editing apparatus according to claim 2 or 3, wherein
を有することを特徴とする請求項3記載の動画像符号化データ編集装置。 Further, an MMCO information insertion unit for inserting MMCO information for instructing resetting of a decoding picture buffer into a picture at an edit point into which the reordering information has been inserted by the reordering information insertion unit,
4. The moving image encoded data editing apparatus according to claim 3, further comprising:
ことを特徴とする請求項3記載の動画像符号化データ編集装置。 The reordering information creation unit creates reordering information so that the number of reference pictures of encoded data after the editing point is the same as the maximum number of reference pictures recorded in the encoded data.
4. The moving image encoded data editing apparatus according to claim 3, wherein
ことを特徴とする請求項6記載の動画像符号化データ編集装置。 The reordering information creation unit sets a time for a picture to be encoded so that the number of reference pictures of encoded data after the editing point is the same as the maximum number of reference pictures stored in the encoded data. Create reordering information that adds the closest picture as a reference image,
7. The moving image encoded data editing apparatus according to claim 6, wherein
ことを特徴とする請求項6記載の動画像符号化データ編集装置。 The reordering information creation unit generates an intra picture at an edit point so that the number of reference pictures of encoded data after the edit point is the same as the maximum number of reference pictures stored in the encoded data. Create reordering information to be added as a reference image,
7. The moving image encoded data editing apparatus according to claim 6, wherein
ことを特徴とする請求項6記載の動画像符号化データ編集装置。 The reordering information creation unit is listed in the reference picture list so that the number of reference pictures of the encoded data after the editing point is the same as the maximum number of reference pictures recorded in the encoded data. Create reordering information to add the current picture as a reference image,
7. The moving image encoded data editing apparatus according to claim 6, wherein
前記符号化データから前記編集点以降の符号化データを抽出し、
前記編集点以降の符号化データのヘッダ情報を、前記編集点を先頭とする内容に変更する、動画像符号化データ編集方法。 A moving image encoded data editing method for cutting out encoded data obtained by encoding a moving image signal in units of pictures at an arbitrary editing point,
Extracting encoded data after the edit point from the encoded data,
A moving image encoded data editing method, wherein header information of encoded data after the edit point is changed to contents starting from the edit point.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005251358A JP2007067842A (en) | 2005-08-31 | 2005-08-31 | Apparatus and method for editing moving image coding data |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005251358A JP2007067842A (en) | 2005-08-31 | 2005-08-31 | Apparatus and method for editing moving image coding data |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2007067842A true JP2007067842A (en) | 2007-03-15 |
Family
ID=37929505
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2005251358A Pending JP2007067842A (en) | 2005-08-31 | 2005-08-31 | Apparatus and method for editing moving image coding data |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2007067842A (en) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009063595A1 (en) * | 2007-11-13 | 2009-05-22 | Panasonic Corporation | Encoded data edition method, device, program, and medium |
| EP2109318A2 (en) | 2008-04-07 | 2009-10-14 | Fujitsu Limited | Moving image coding apparatus, moving image decoding apparatus, moving image coding method and moving image decoding method |
| JP2010068101A (en) * | 2008-09-09 | 2010-03-25 | Fujitsu Ltd | Apparatus and program for editing moving image |
| JP2010524338A (en) * | 2007-04-04 | 2010-07-15 | トムソン ライセンシング | Reference picture list management |
| JP2014530568A (en) * | 2011-09-23 | 2014-11-17 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | Reference picture list structure for video coding |
-
2005
- 2005-08-31 JP JP2005251358A patent/JP2007067842A/en active Pending
Cited By (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010524338A (en) * | 2007-04-04 | 2010-07-15 | トムソン ライセンシング | Reference picture list management |
| JP2013066200A (en) * | 2007-04-04 | 2013-04-11 | Thomson Licensing | Reference picture list management |
| TWI422230B (en) * | 2007-04-04 | 2014-01-01 | Thomson Licensing | Reference picture list management |
| JP2014195320A (en) * | 2007-04-04 | 2014-10-09 | Thomson Licensing | Reference picture list management |
| WO2009063595A1 (en) * | 2007-11-13 | 2009-05-22 | Panasonic Corporation | Encoded data edition method, device, program, and medium |
| EP2109318A2 (en) | 2008-04-07 | 2009-10-14 | Fujitsu Limited | Moving image coding apparatus, moving image decoding apparatus, moving image coding method and moving image decoding method |
| JP2009272660A (en) * | 2008-04-07 | 2009-11-19 | Fujitsu Ltd | Moving image coding apparatus, and moving image decoding apparatus and coding and decoding methods thereof |
| US8385407B2 (en) | 2008-04-07 | 2013-02-26 | Fujitsu Limited | Moving image coding apparatus, moving image decoding apparatus, moving image coding method and moving image decoding method |
| JP2010068101A (en) * | 2008-09-09 | 2010-03-25 | Fujitsu Ltd | Apparatus and program for editing moving image |
| US8406292B2 (en) | 2008-09-09 | 2013-03-26 | Fujitsu Limited | Moving picture editing apparatus |
| JP2014530568A (en) * | 2011-09-23 | 2014-11-17 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | Reference picture list structure for video coding |
| JP2014530567A (en) * | 2011-09-23 | 2014-11-17 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | Reference picture list structure for video coding |
| US9237356B2 (en) | 2011-09-23 | 2016-01-12 | Qualcomm Incorporated | Reference picture list construction for video coding |
| US9338474B2 (en) | 2011-09-23 | 2016-05-10 | Qualcomm Incorporated | Reference picture list construction for video coding |
| US9420307B2 (en) | 2011-09-23 | 2016-08-16 | Qualcomm Incorporated | Coding reference pictures for a reference picture set |
| US9998757B2 (en) | 2011-09-23 | 2018-06-12 | Velos Media, Llc | Reference picture signaling and decoded picture buffer management |
| US10034018B2 (en) | 2011-09-23 | 2018-07-24 | Velos Media, Llc | Decoded picture buffer management |
| US10542285B2 (en) | 2011-09-23 | 2020-01-21 | Velos Media, Llc | Decoded picture buffer management |
| US10856007B2 (en) | 2011-09-23 | 2020-12-01 | Velos Media, Llc | Decoded picture buffer management |
| US11490119B2 (en) | 2011-09-23 | 2022-11-01 | Qualcomm Incorporated | Decoded picture buffer management |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5341764B2 (en) | Multi-view video encoding and decoding method and apparatus | |
| CA2910306C (en) | Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method | |
| US9712838B2 (en) | Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method | |
| US20140003519A1 (en) | Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method | |
| JP2007067842A (en) | Apparatus and method for editing moving image coding data | |
| JP2007184791A (en) | Reproducing device for moving picture encoded data | |
| JP2006129177A (en) | Recording apparatus and recording medium | |
| JP2016167894A (en) | Computer program for decoding moving image | |
| JP2006253966A (en) | Coded data recording apparatus |