JP2006311589A - Moving image decoding method and apparatus - Google Patents
Moving image decoding method and apparatus Download PDFInfo
- Publication number
- JP2006311589A JP2006311589A JP2006155050A JP2006155050A JP2006311589A JP 2006311589 A JP2006311589 A JP 2006311589A JP 2006155050 A JP2006155050 A JP 2006155050A JP 2006155050 A JP2006155050 A JP 2006155050A JP 2006311589 A JP2006311589 A JP 2006311589A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- prediction
- encoding
- decoding
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000015654 memory Effects 0.000 description 100
- 238000010586 diagram Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動き補償予測フレーム間符号化を用いた動画像復号化方法及び装置に関する。 The present invention relates to a moving picture decoding method and apparatus using motion compensated prediction interframe coding.
動画像の圧縮符号化技術として、MPEG1(ISO/IEC11172-2),MPEG2(ISO/IEC13818-2),MPEG4(ISO/IEC14496-2)などが広く実用化されている。これらの動画像符号化方式では、フレーム内符号化(イントラ符号化)、前方予測フレーム間符号化及び両方向予測フレーム間符号化の組み合わせによる符号化が行われ、これらの符号化モードで符号化されるフレームはそれぞれIピクチャ、Pピクチャ及びBピクチャと呼ばれる。Pピクチャは直前のPまたはIピクチャを参照フレームとして符号化され、Bピクチャは直前及び直後のPまたはIピクチャを参照フレームとして符号化される。前方予測フレーム間符号化及び両方向予測フレーム間符号化は、動き補償予測フレーム間符号化と呼ばれる。 MPEG1 (ISO / IEC11172-2), MPEG2 (ISO / IEC13818-2), MPEG4 (ISO / IEC14496-2), and the like have been widely put into practical use as moving image compression coding techniques. In these moving image encoding systems, encoding is performed by a combination of intra-frame encoding (intra encoding), forward prediction inter-frame encoding, and bidirectional prediction inter-frame encoding, and encoding is performed in these encoding modes. Each frame is called an I picture, a P picture, and a B picture. The P picture is encoded using the immediately preceding P or I picture as a reference frame, and the B picture is encoded using the immediately preceding and immediately following P or I picture as a reference frame. Forward prediction interframe coding and bidirectional prediction interframe coding are called motion compensated prediction interframe coding.
MPEG方式による動画像の符号化データを早送り再生する場合は、参照フレームを必要としないIピクチャのみを再生するか、あるいはBピクチャが参照フレームとして用いられないという性質を利用し、Bピクチャを飛ばしてIピクチャ及びPピクチャのみを復号化する方法が一般的である。しかし、Iピクチャのみを再生する場合、Iピクチャの周期が長いと、高速な早送りは実現できるものの、滑らかな早送り再生が出来ない。Iピクチャ及びPピクチャを用いた早送りでは、Pピクチャにフレーム間予測符号化が用いられているため、全てのIピクチャ及びPピクチャの復号化を行う必要があり、早送り速度を自由に変更することが困難となる。 When fast-forwarding reproduction of encoded data of a moving picture according to the MPEG system, only an I picture that does not require a reference frame is reproduced, or a B picture is skipped by utilizing the property that a B picture is not used as a reference frame. In general, a method of decoding only the I picture and the P picture is used. However, when reproducing only an I picture, if the period of the I picture is long, high-speed fast-forwarding can be realized, but smooth fast-forwarding reproduction cannot be performed. In fast-forward using I and P pictures, inter-frame predictive coding is used for P pictures, so it is necessary to decode all I and P pictures, and the fast-forward speed can be freely changed. It becomes difficult.
また、従来のMPEG方式の動画像符号化では、Bピクチャは参照フレームとして用いられないため、複数のBピクチャが連続する予測構造の場合、Bピクチャの符号化において時間的に離れたPピクチャを参照フレームとせざるを得ず、Bピクチャの符号化効率が低下するという問題がある。一方、復号化されたBピクチャをPピクチャにおける参照フレームとして用いる構成とすると、上述のBピクチャを飛ばした早送り再生時にも、Bピクチャを含む全てのフレームを復号化することが必要となり、効率的に早送り再生を行うことが困難となる。 In addition, in the conventional MPEG video coding, B pictures are not used as reference frames. Therefore, in the case of a prediction structure in which a plurality of B pictures are continuous, P pictures that are separated in time are encoded in the B picture coding. There is a problem that the encoding efficiency of the B picture decreases because it must be a reference frame. On the other hand, when the decoded B picture is used as a reference frame in the P picture, it is necessary to decode all the frames including the B picture even during the fast-forward playback with the B picture skipped. It becomes difficult to perform fast forward playback.
上述したように、MPEGのように動き補償予測フレーム間符号化を含む符号化によって得られた動画像符号化データについて早送り再生を行う場合、Iピクチャのみを再生すると滑らかな早送りを自由な再生速度で行うことが難しく、またBピクチャを復号化せずにスキップした早送り再生を行う場合は、復号化されたBピクチャを参照フレームとして用いることが困難であり、Bピクチャが連続した予測構造では、符号化効率が低下するという問題があった。 As described above, when fast-forward playback is performed on moving image encoded data obtained by encoding including motion-compensated prediction inter-frame encoding as in MPEG, smooth playback can be freely performed when only I pictures are played back. In the case of performing fast forward playback skipped without decoding the B picture, it is difficult to use the decoded B picture as a reference frame. In a prediction structure in which the B picture is continuous, There was a problem that the encoding efficiency was lowered.
本発明の目的は、動き補償予測フレーム間符号化を用いた動画像の符号化及び復号化において、符号化効率が高く、また復号化側でより自由度の高い早送り再生を可能とすることにある。 An object of the present invention is to enable high-speed playback with high coding efficiency and higher degree of freedom on the decoding side in coding and decoding of moving images using motion compensated prediction interframe coding. is there.
上記の課題を解決するため、本発明は動画像の符号化対象フレームに対して、少なくとも一つの復号化済みフレームを参照フレームとして用いる動き補償予測フレーム間符号化を含む符号化処理を行う動画像符号化において、フレーム間予測構造を複数の階層化された予測グループ構造とし、符号化対象フレームを複数の参照フレームがそれぞれ属する複数階層の予測グループのうちの何れかの階層の予測グループに振り分け、符号化対象フレームが振り分けられた階層以下の少なくとも一つの階層の予測グループに属する参照フレームを用いて動き補償予測フレーム間符号化を行う。 In order to solve the above-described problem, the present invention provides a moving image in which a coding process including a motion compensated prediction inter-frame coding using at least one decoded frame as a reference frame is performed on a coding target frame of a moving image. In encoding, the inter-frame prediction structure is set to a plurality of hierarchical prediction group structures, and the encoding target frame is allocated to a prediction group of any one of a plurality of prediction groups to which a plurality of reference frames belong, Motion compensation prediction interframe coding is performed using reference frames belonging to a prediction group of at least one layer below the layer to which the encoding target frame is distributed.
また、符号化対象フレームが振り分けられた階層の予測グループを示す第1の識別情報及び動き補償予測フレーム間符号化に使用された参照フレームを示す第2の識別情報を、該符号化対象フレームに対する動き補償予測フレーム間符号化の結果と共に符号化データとして出力する。 Also, the first identification information indicating the prediction group of the layer to which the encoding target frame is distributed and the second identification information indicating the reference frame used for the motion compensated prediction interframe encoding are set for the encoding target frame. The result is output as encoded data together with the result of the motion compensation prediction interframe encoding.
一方、動画像の符号化対象フレームに対して動き補償予測フレーム間符号化を含む符号化処理を行って得られた符号化データを復号化して動画像を再生する動画像復号化においては、符号化データに含まれる符号化対象フレームが振り分けられた階層の予測グループを示す第1の識別情報及び動き補償予測フレーム間符号化に使用された参照フレームを示す第2の識別情報を復号化し、復号化された第1の識別情報及び第2の識別情報に従って、符号化対象フレームが振り分けられた階層の予測グループ又はそれより下位の階層の予測グループに属する少なくとも一つの参照フレームを選択し、選択した参照フレームを用いて符号化データに含まれる動き補償予測フレーム間符号化の結果を復号化する。 On the other hand, in the moving picture decoding in which the encoded data obtained by performing the encoding process including the motion compensated prediction inter-frame encoding on the encoding target frame of the moving picture is decoded to reproduce the moving picture, Decoding the first identification information indicating the prediction group of the layer to which the encoding target frame included in the encoded data is distributed and the second identification information indicating the reference frame used for the motion compensated prediction interframe encoding In accordance with the first identification information and the second identification information, the at least one reference frame belonging to the prediction group of the layer to which the encoding target frame is distributed or the prediction group of the lower layer is selected and selected. The result of the motion compensation prediction interframe coding included in the coded data is decoded using the reference frame.
このように各階層の予測グループに振り分けられた符号化対象フレームは、該階層以下の予測グループに属する参照フレームを用いて動き補償予測フレーム間符号化が行われることにより、復号化に際しては上位階層の予測グループに属する符号化対象フレームの符号化結果を復号化することなしに、正常に復号化することが可能となる。従って、復号化する予測グループの最上位階層を変化させることで、復号化されるフレーム数を変化させることが可能となり、階層に応じて再生されるフレームレートを可変としたり、あるいは復号化したフレームの表示フレームレートを変更することで、速度可変の早送り再生を行うことなどが容易に実現できる。また、特定の階層以下の符号化データのみを選択して送出することで、伝送帯域に応じたビットレート可変のストリーミングを行うことも可能となる。 In this way, the encoding target frames allocated to the prediction groups of each layer are subjected to motion compensation prediction interframe encoding using reference frames belonging to the prediction groups below the layer, so that an upper layer is used for decoding. It is possible to normally decode without decoding the encoding result of the encoding target frame belonging to the prediction group. Therefore, it is possible to change the number of frames to be decoded by changing the highest layer of the prediction group to be decoded. The frame rate to be reproduced can be made variable according to the layer or the decoded frame can be changed. By changing the display frame rate, fast-forward playback with variable speed can be easily realized. In addition, by selecting and transmitting only encoded data below a specific layer, it is possible to perform streaming with variable bit rate according to the transmission band.
この場合、複数階層の予測グループにそれぞれ属する前記参照フレームの最大フレーム数を予め前記予測グループ毎に個別に定めておき、この最大参照フレーム数に従って、各階層の予測グループの参照フレームのメモリ管理を行うようにしてもよい。 In this case, the maximum number of reference frames belonging to each of the prediction groups of a plurality of hierarchies is determined separately for each prediction group in advance, and memory management of the reference frames of the prediction groups of each hierarchy is performed according to the maximum reference frame number. You may make it perform.
このようにすると、復号化に必要となる参照フレームの最大フレーム数を、復号化する最上位階層の予測グループ以下の予測グループにおける最大参照フレーム数の総和から一意に決定できる。従って、動画像復号化において限られたメモリ資源の中で、復号化可能な予測グループの最上位階層が一意に求められ、また上述したように復号化する予測グループの最上位階層を変化させて早送り再生や伝送ビットレートを変更する際に、復号化で用いる参照メモリの必要最小限の量を一意に決定することができ、復号化時の必要最小限のメモリ確保を容易に行うことか可能となる。 In this way, the maximum number of reference frames required for decoding can be uniquely determined from the sum of the maximum number of reference frames in the prediction group below the prediction group of the highest hierarchy to be decoded. Accordingly, the highest hierarchy of a predictable prediction group is uniquely determined in a limited memory resource in moving picture decoding, and the highest hierarchy of the prediction group to be decoded is changed as described above. When changing fast-forward playback or transmission bit rate, the minimum amount of reference memory used for decoding can be uniquely determined, and it is possible to easily secure the minimum memory required for decoding. It becomes.
さらに、複数階層の予測グループにそれぞれ属する参照フレームの最大フレーム数の総和を一定とし、該最大フレーム数を示す情報を第1の識別情報と第2の識別情報及び動き補償予測フレーム間符号化の結果と共に符号化データとして出力し、各階層の予測グループの参照フレームのメモリ管理を行うようにしてもよい。 Furthermore, the total sum of the maximum number of reference frames belonging to each of the prediction layers of a plurality of hierarchies is made constant, and information indicating the maximum number of frames is used for the first identification information, the second identification information, and the motion compensated prediction interframe coding. It may be output as encoded data together with the result, and memory management of reference frames of prediction groups in each layer may be performed.
このようにすると、総容量が固定の参照メモリを各階層の予測グループに動的に配分させることが可能となるため、動画像信号の性質の変化に応じて各階層の予測グループの参照メモリ数の比が最適になるように動的にフレームメモリを配分することで、符号化効率を向上させることが可能となる。また、総参照フレーム数が一定であるため、符号化及び復号化に必要な参照フレーム数は常に固定量を確保すればよく、メモリ管理を容易にすることができる。さらに、各階層の予測グループに属する参照フレーム数を示す情報をヘッダ情報として符号化することで、符号化側と復号化側で各階層の予測グループの参照フレーム数を一致させることが可能となり、各階層の予測グループの動的な参照フレーム数の変化が発生しても、破綻無く復号化することが可能となる。 In this way, the reference memory having a fixed total capacity can be dynamically allocated to the prediction groups in each hierarchy, so the number of reference memories in the prediction group in each hierarchy according to the change in the nature of the video signal By dynamically allocating the frame memory so that the ratio is optimal, it is possible to improve the coding efficiency. In addition, since the total number of reference frames is constant, the number of reference frames necessary for encoding and decoding only needs to be secured at all times, and memory management can be facilitated. Furthermore, by encoding information indicating the number of reference frames belonging to the prediction group of each layer as header information, it is possible to match the number of reference frames of the prediction group of each layer on the encoding side and the decoding side, Even if a dynamic change in the number of reference frames in the prediction group of each layer occurs, decoding can be performed without failure.
さらに、符号化処理として符号化対象フレームのフレーム毎にフレーム内符号化、前方予測フレーム間符号化及び両方向予測フレーム間符号化に切り替えて行い、フレーム内符号化及び前方予測フレーム間符号化を行う符号化対象フレーム及び該符号化対象フレームに対応する参照フレームを第1階層の予測グループに振り分け、両方向予測フレーム間符号化を行う符号化対象フレーム及び該符号化対象フレームに対応する参照フレームを該第1階層よりも上位の第2階層の予測グループに振り分けるようにしてもよい。 Further, as the encoding process, intra-frame encoding, forward prediction inter-frame encoding, and bidirectional prediction inter-frame encoding are switched for each frame of the encoding target frame, and intra-frame encoding and forward prediction inter-frame encoding are performed. An encoding target frame and a reference frame corresponding to the encoding target frame are allocated to a prediction group of the first layer, and an encoding target frame for bi-directional prediction interframe encoding and a reference frame corresponding to the encoding target frame are You may make it distribute to the prediction group of the 2nd hierarchy higher than the 1st hierarchy.
このようにすると、従来のMPEG等の符号化と同様に、Iピクチャのみ、あるいはIピクチャ及びPピクチャのみを復号化する早送り再生を、Bピクチャを復号化すること無しに行うことが可能となる。さらに、Bピクチャにおいては復号化されたIピクチャまたはPピクチャに加えて、さらに1つまたは複数の復号化されたBピクチャも参照フレームとして用いることが可能となり、Bピクチャの予測効率を従来よりも改善することが可能となる。 In this way, as with conventional encoding such as MPEG, it is possible to perform fast-forward playback for decoding only I pictures or only I pictures and P pictures without decoding B pictures. . Further, in addition to the decoded I picture or P picture, in addition to the decoded I picture or P picture, one or more decoded B pictures can be used as a reference frame. It becomes possible to improve.
さらに、本発明によると上述した動画像符号化及び動画像復号化の処理をコンピュータに行わせるためのプログラムを提供することができる。 Furthermore, according to the present invention, it is possible to provide a program for causing a computer to perform the above-described video encoding and video decoding processes.
本発明によればフレーム間予測構造を複数の階層化されたグループ構造とし、上位階層の予測グループの参照フレームからのフレーム間予測を禁止し、また総参照フレーム数が一定の下で各階層の予測グループの参照フレーム数を動的に変化させることで、符号化効率を従来より向上させ、かつより自由度の高い早送り再生を可能とすることができる。 According to the present invention, the inter-frame prediction structure is formed into a plurality of hierarchized group structures, inter-frame prediction from reference frames of a higher-level prediction group is prohibited, and each layer has a fixed total number of reference frames. By dynamically changing the number of reference frames in the prediction group, it is possible to improve the encoding efficiency as compared with the prior art and enable fast-forward playback with a higher degree of freedom.
以下、図面を参照して本発明の一実施形態について説明する。
(符号化側について)
図1は、本実施形態に係る動画像符号化装置の構成を示すブロック図である。図2は、動き補償予測フレーム間符号化に関する概略的な手順を示すフローチャートである。図1に示す動画像符号化装置は、ハードウェアで実現してもよいし、コンピュータを用いてソフトウェアにより実行してもよい。一部の処理をハードウェアで実現し、他の処理をソフトウェアにより行ってもよい。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
(About encoding side)
FIG. 1 is a block diagram showing a configuration of a video encoding apparatus according to the present embodiment. FIG. 2 is a flowchart showing a schematic procedure for motion compensated prediction interframe coding. The moving picture encoding apparatus shown in FIG. 1 may be realized by hardware, or may be executed by software using a computer. Some processing may be realized by hardware, and other processing may be performed by software.
本実施形態は、従来のMPEG方式に代表されるような、動き補償予測と直交変換及び可変長符号化を組み合わせた動画像符号化をベースとしている。以下の説明では、予測グループが2階層の場合について説明する。 The present embodiment is based on video coding that combines motion compensated prediction, orthogonal transform, and variable length coding, as represented by the conventional MPEG system. In the following description, a case where the prediction group has two layers will be described.
フレーム毎に入力される動画像信号100(符号化対象フレーム)は、まず動き補償予測器111によって2階層の予測グループのうちの何れかの階層の予測グループに振り分けられる(ステップS11)。次に、符号化対象フレームが振り分けられた階層以下の少なくとも一つの階層の予測グループに属する少なくとも一つの参照フレームとして動き補償予測フレーム間符号化が行われる(ステップS12)。 The moving image signal 100 (encoding target frame) input for each frame is first distributed to a prediction group of any one of the two layers of prediction groups by the motion compensation predictor 111 (step S11). Next, motion compensated prediction interframe coding is performed as at least one reference frame belonging to a prediction group of at least one layer below the layer to which the encoding target frame is distributed (step S12).
各階層の予測グループに対する符号化対象フレームの振り分けは、例えば偶数フレームは第1階層の予測グループ、奇数フレームは第2階層の予測グループといったように、時間方向で変化するように行われる。各階層の予測グループに属する参照フレームも、参照フレームとなる符号化済みフレームの元となった符号化対象フレームが属する予測グループに応じて決定される。すなわち、ある符号化対象フレームがある階層の予測グループに振り分けられるとすると、その符号化対象フレームを符号化し局部復号化して得られた符号化済みフレームも、同じ階層の予測グループに属する。ステップS11〜S12の処理は、具体的には次のようにして行われる。 The allocation of the encoding target frame to the prediction group of each layer is performed so as to change in the time direction, for example, an even frame is a first layer prediction group and an odd frame is a second layer prediction group. The reference frames that belong to the prediction group of each layer are also determined according to the prediction group to which the encoding target frame that is the source of the encoded frame that becomes the reference frame belongs. That is, if a certain encoding target frame is allocated to a prediction group in a certain hierarchy, an already encoded frame obtained by encoding and local decoding the encoding target frame also belongs to a prediction group in the same hierarchy. Specifically, the processes of steps S11 to S12 are performed as follows.
上述のように第1階層及び第2階層の予測グループには、予め複数の符号化済みフレームが参照フレームとして属している。符号化済みフレームを参照フレームとして一時保存するために、二組の参照メモリセット118,119が用意されている。第1の参照メモリセット118には、既に符号化され且つ復号化された複数の動画像フレーム(これらを符号化済みフレームという)のうち、第1階層の予測グループに属する複数の符号化済みフレームが参照フレームとして一時保存されている。第2の参照メモリセット119には、複数の符号化済みフレームのうち、第2階層の予測グループに属する複数の符号化済みフレームが参照フレームとして一時保存されている。 As described above, a plurality of encoded frames belong to the first layer and second layer prediction groups in advance as reference frames. In order to temporarily store the encoded frame as a reference frame, two sets of reference memory sets 118 and 119 are prepared. The first reference memory set 118 stores a plurality of encoded frames belonging to the prediction group of the first hierarchy among a plurality of already encoded and decoded moving image frames (these are referred to as encoded frames). Is temporarily stored as a reference frame. In the second reference memory set 119, among the plurality of encoded frames, a plurality of encoded frames belonging to the second layer prediction group are temporarily stored as reference frames.
第1階層の予測グループに振り分けられた符号化対象フレームは、第1の参照メモリセット118に保存されている、第1階層の予測グループに属する参照フレームを用いて動き補償予測フレーム間符号化が行われる。一方、第2階層の予測グループに振り分けられた符号化対象フレームは、第1及び第2の参照メモリセット118,119に保存されている、第1及び第2階層の予測グループ両方に属する参照フレームを用いて動き補償予測フレーム間符号化が行われる。 The frame to be encoded distributed to the prediction group of the first layer is subjected to motion compensation prediction interframe encoding using the reference frame belonging to the prediction group of the first layer, which is stored in the first reference memory set 118. Done. On the other hand, the encoding target frame allocated to the second layer prediction group is a reference frame that is stored in the first and second reference memory sets 118 and 119 and belongs to both the first and second layer prediction groups. Is used to perform motion-compensated prediction interframe coding.
動き補償予測フレーム符号化について具体的に説明すると、まず入力動画像信号100である符号化対象フレームが第1階層の予測グループに属する場合、第1の参照メモリセット118に一時保存されている一つまたは複数の参照フレームが読み出され、動き補償予測器111に入力される。このときスイッチ120はオフ状態にあり、第1の参照メモリセット119からの参照フレームは動き補償予測器111に入力されない。動き補償予測器111では、第1の参照メモリセット118から読み出される一つまたは複数の参照フレームを用いて動き補償予測が行われることにより、予測画像信号104が生成される。予測画像信号104は減算器110に入力され、ここで入力動画像信号100に対する予測画像信号104の誤差信号である予測誤差信号101が生成される。
The motion compensated prediction frame encoding will be described in detail. First, when the encoding target frame that is the input moving
入力動画像信号100である符号化対象フレームが第2階層の予測グループに属する場合、スイッチ120はオン状態にあり、第1の参照メモリセット118及び第2の参照メモリセット119に一時保存されている一つまたは複数の参照フレームが読み出され、動き補償予測器111に入力されることにより、上記と同様に動き補償予測器111により予測画像信号104が生成され、さらに減算器110によって予測誤差信号101が生成される。
When the encoding target frame that is the input moving
予測誤差信号101は、DCT変換器112により離散コサイン変換され、これによって得られたDCT係数が量子化器113により量子化される。量子化されたDCT係数データ102は二分岐され、一方において可変長符号化器114により符号化される。量子化され二分岐されたDCT係数データ102は、他方において逆量子化器115及び逆DCT変換器116を経て予測誤差信号として再生される。この再生された予測誤差信号が予測画像信号104と加算されることにより、局部復号化画像信号103が生成される。
The
局部復号化画像信号103である符号化済みフレームは、該符号化済みフレームの元となった入力動画像信号100である符号化対象フレームに振り分けられた階層の予測グループに応じて第1及び第2の参照メモリセット118,119のいずれかに一時保存される(ステップS13)。すなわち、符号化済みフレームは該符号化済みフレームの元となった符号化対象フレームが第1階層の予測グループに属する場合には、第1の参照メモリセット118に一時保存され、該符号化対象フレームが第2階層の予測グループに属する場合には、第2の参照メモリセット119に一時保存される。
The encoded frame that is the locally decoded
動き補償予測器111からは、動き補償予測のために用いた動きベクトルと、符号化対象フレームが所属する予測グループを識別するインデックス(第1の識別情報)、及び動き補償予測フレーム間符号化に使用した参照フレームを特定するインデックス(第2の識別情報)を含むいわゆるサイド情報105が出力され、可変長符号化器114によって符号化される(ステップS14)。この場合、予測グループを識別するインデックスは、例えば予測構造を表すピクチャタイプとして符号化され、参照フレームを特定するインデックスはマクロブロック毎に符号化される。
From the
これらのサイド情報は、動き補償予測フレーム間符号化の結果である量子化されたDCT係数データと共に可変長符号の符号化データ106として出力される(ステップS15)。例えば、サイド情報は符号化データ106にヘッダ情報として符号化される。さらに、各階層の予測グループに属する参照フレーム数の総和を予め規定して、各階層の予測グループに割り当てる参照フレームの最大フレーム数を設定する後述の第2の参照フレーム数設定方法を採用した場合には、該最大フレーム数を示す情報も符号化データ106のヘッダ情報として符号化される。符号化データ106は、図示しない蓄積媒体や伝送媒体に送出される。
The side information is output as encoded
参照メモリセット118,119では、新しい復号化済みフレームが参照フレームとして順次書き込まれ、また時間的に最も古い参照フレームから順次削除される、いわゆるFIFO(First-In First-Out)型の制御がフレーム単位で行われる。ただし、参照フレームが読み出されるときには、各参照メモリセット118,119内の任意の参照フレームへのランダムアクセスが行われる。 In the reference memory sets 118 and 119, a so-called FIFO (First-In First-Out) type control in which new decoded frames are sequentially written as reference frames and sequentially deleted from the oldest reference frame in time is used as a frame. Done in units. However, when a reference frame is read, random access to any reference frame in each reference memory set 118, 119 is performed.
参照メモリセット118,119にそれぞれ一時保存される参照フレームの数(言い換えれば、参照メモリセット118,119にそれぞれ含まれる参照メモリの数)は、次に示す2つの方法の何れかにより設定される。 The number of reference frames temporarily stored in the reference memory sets 118 and 119 (in other words, the number of reference memories included in the reference memory sets 118 and 119, respectively) is set by one of the following two methods. .
第1の参照フレーム数設定方法では、符号化の方法あるいはプロファイルやレベルといった符号化仕様に応じて、予め各階層の予測グループに属する参照フレームの最大フレーム数を個別に定める。動画像符号化装置及び動画像復号化装置においては、こうして予め定められた最大フレーム数の参照フレームを予測グループ毎に確保して符号化及び復号化を行う。この場合、符号化仕様を動画像符号化装置及び動画像復号化装置で一致させることにより、必要な数の参照フレームを自動的に確保することが可能である。 In the first reference frame number setting method, the maximum number of reference frames belonging to the prediction group of each layer is individually determined in advance according to the encoding method or encoding specifications such as profile and level. In the moving picture coding apparatus and the moving picture decoding apparatus, the reference frame having the maximum number of frames determined in this way is ensured for each prediction group to perform coding and decoding. In this case, it is possible to automatically secure the necessary number of reference frames by matching the encoding specifications between the video encoding device and the video decoding device.
第2の参照フレーム数設定方法では、符号化の方法あるいはプロファイルやレベルといった符号化仕様に応じて、各階層の予測グループに属する参照フレーム数の総和を予め規定し、各階層の予測グループにどれだけの参照フレーム数を割り当てるかという配分に関する情報、すなわち最大フレーム数を示す情報を符号化データ106のヘッダ情報として符号化する。
In the second reference frame number setting method, the total number of reference frames belonging to the prediction group of each layer is defined in advance according to the encoding method or encoding specifications such as profile and level, Information relating to the distribution of whether to allocate only the number of reference frames, that is, information indicating the maximum number of frames is encoded as header information of the encoded
このように第2の参照フレーム数設定方法では、符号化側で各階層の予測グループにそれぞれ最適な参照フレームの最大フレーム数を動的に割り当て、その割り当てた最大フレーム数を示す情報を符号化することで、符号化側と復号化側で各階層の予測グループに属する参照フレームの最大フレーム数を動的に一致させることが可能となる。従って、各階層の予測グループに属する参照フレームの最大フレーム数の割合を入力動画像信号100の画像の性質の変化に応じて最適に変更することにより、符号化効率を向上させることが可能となる。
As described above, in the second reference frame number setting method, the encoding side dynamically assigns the optimum maximum number of reference frames to the prediction group of each layer, and encodes information indicating the assigned maximum number of frames. By doing so, it is possible to dynamically match the maximum number of reference frames belonging to the prediction group of each layer on the encoding side and the decoding side. Therefore, it is possible to improve the encoding efficiency by optimally changing the ratio of the maximum number of reference frames belonging to the prediction group of each layer according to the change in the image properties of the input moving
(復号化側について)
図3は、本実施形態に係る図1に示した動画像符号化装置に対応する動画像復号化装置の構成を示すブロック図である。図4は、動き補償予測フレーム間符号化に対応する復号化に関する概略的な手順を示すフローチャートである。図3に示す動画像復号化装置も、ハードウェアで実現してもよいし、ソフトウェアにより実行してもよく、また一部の処理をハードウェアで実現し、他の処理をソフトウェアにより行ってもよい。
(About decryption side)
FIG. 3 is a block diagram showing a configuration of a moving picture decoding apparatus corresponding to the moving picture encoding apparatus shown in FIG. 1 according to the present embodiment. FIG. 4 is a flowchart showing a schematic procedure for decoding corresponding to motion compensated prediction interframe coding. The moving picture decoding apparatus shown in FIG. 3 may also be realized by hardware or may be executed by software, or some processes may be realized by hardware and other processes may be performed by software. Good.
図3に示す動画像復号化装置には、図1に示した動画像符号化装置から出力された符号化データ106が、図示しない蓄積媒体または伝送媒体を介して入力される。入力された符号化データ200は、可変長復号化器214により可変長符号の復号化が行われ、量子化DCT係数データ201とサイド情報202が出力される。量子化DCT係数データ201は、逆量子化器215及び逆DCT変換器216を経て復号されることにより、予測誤差信号が再生される。
The encoded
一方、サイド情報202としてマクロブロック毎に符号化された動きベクトルと、符号化対象フレーム毎に所属する予測グループを識別するインデックス(第1の識別情報)、及び参照フレームを特定するインデックス(第2の識別情報)が復号化される(ステップ21)。これらのサイド情報に従って、符号化時と同様に参照フレームの選択及び動き補償が行われることにより予測画像信号203が生成される。
On the other hand, a motion vector encoded for each macroblock as the
すなわち、符号化対象フレーム毎に所属する予測グループを識別するインデックス(第1の識別情報)と参照フレームを特定するインデックス(第2の識別情報)に従って参照フレームが選択され(ステップS22)、この選択された参照フレームを用いて動き補償予測フレーム間符号化の結果が復号化される(ステップS23)。さらに、予測画像信号203と逆DCT変換器216からの予測誤差信号が加算されることにより、復号化画像信号204が生成される
復号化画像信号204である復号化済みフレームは、該復号化済みフレームの元となった符号化済みフレームが所属する予測グループに応じて、第1及び第2の参照メモリセット219の何れか一方に一時保存され、参照フレームとして用いられる(ステップS24)。これらの参照メモリセット218,219は、動画像符号化装置と同様にFIFO型の制御が行われる。ここで、各階層の予測グループに属する参照フレームの数については、先の動画像符号化装置において説明した第1または第2の参照フレーム数設定方法に従って設定される。
That is, a reference frame is selected according to an index (first identification information) for identifying a prediction group belonging to each encoding target frame and an index (second identification information) for identifying a reference frame (step S22). The result of the motion compensation prediction interframe coding is decoded using the reference frame thus set (step S23). Further, the decoded
すなわち、第1の参照フレーム数設定方法に従って符号化仕様に応じて予め各階層の予測グループに属する参照フレームの最大フレーム数を個別に定めている場合には、各階層の予測グループに属する参照フレームの数は符号化仕様毎に固定の値とされる。また、第2の参照フレーム数設定方法に従って符号化仕様に応じて各階層の予測グループに属する参照フレーム数の総和を予め規定し、各階層の予測グループに参照フレームの最大フレーム数を割り当てている場合には、参照フレームの総和のみ固定で、符号化データのヘッダ情報から復号化される参照フレームの最大数を示す情報に基づいて動的に各階層の予測グループに属する参照フレームの数が制御される。 That is, when the maximum number of reference frames belonging to the prediction group of each layer is determined in advance according to the encoding specification according to the first reference frame number setting method, the reference frame belonging to the prediction group of each layer Is a fixed value for each encoding specification. Further, according to the second reference frame number setting method, the total number of reference frames belonging to the prediction group of each layer is defined in advance according to the coding specification, and the maximum number of reference frames is assigned to the prediction group of each layer. In this case, only the sum of reference frames is fixed, and the number of reference frames belonging to the prediction group of each layer is dynamically controlled based on information indicating the maximum number of reference frames decoded from header information of encoded data. Is done.
図5は、図1に示した動画像符号化装置における動き補償予測器111、及び図3に示した動画像復号化装置における動き補償予測器211として用いられる動き補償予測器の詳細な構成を示したものである。前述した通り、符号化あるいは復号化すべきフレームが属する階層の予測グループに応じて、使用可能な参照フレームが異なる。図5におけるフレームメモリ302から304は、1つの階層の予測グループに属する符号化フレームに対する参照フレームとして使用可能な参照フレームを保存しいるものとする。
FIG. 5 shows a detailed configuration of the motion compensated
この動き補償予測器では、マクロブロック毎に使用可能な参照フレームの中から1つを選択するか、あるいは線形予測器301により使用可能な参照フレームの線形和をとってその線形和による予測の何れかを選択し、動き補償を行って予測マクロブロックを生成する。
In this motion compensation predictor, either one of the reference frames that can be used for each macroblock is selected, or a linear sum of the reference frames that can be used by the
動画像符号化装置では、予測誤差が小さく符号化効率の最も高い予測マクロブロックが選択されるように、参照フレーム及び動きベクトルがマクロブロック毎に選択される。選択された参照フレームの情報及び動きベクトルの情報は、マクロブロック毎に符号化される。 In the moving picture coding apparatus, the reference frame and the motion vector are selected for each macroblock so that the prediction macroblock with the smallest prediction error and the highest coding efficiency is selected. The selected reference frame information and motion vector information are encoded for each macroblock.
動画像復号化装置では、受信した動きベクトル及び参照フレームの情報に応じて動き補償器で予測マクロブロックを生成し、復号化を行う。線形和による予測を行う場合は、線形予測係数に関する情報を符号化データのヘッダ情報として符号化を行い、符号化と復号化で線形予測係数を一致させる。 In the moving picture decoding apparatus, a prediction macroblock is generated by a motion compensator in accordance with the received motion vector and reference frame information, and decoding is performed. In the case of performing prediction by linear sum, encoding is performed using information on the linear prediction coefficient as header information of the encoded data, and the linear prediction coefficient is matched between encoding and decoding.
図6及び図7は、従来のMPEG動画像符号化におけるフレーム間予測構造及び参照メモリ制御の例を示す図である。横軸は時間を示しており、I0,P1,P2等は表示順のフレームを示している。例えば、I0はIピクチャでフレーム番号が0番、P1はPピクチャでフレーム番号が1番、B2はBピクチャでフレーム番号が2番ということをそれぞれ示している。図中の矢印はフレーム間の予測構造を示しており、参照フレームから符号化対象フレームへの向きを示している。例えば、図6において符号化対象フレームP1 に対して、I0が参照フレームであることを示している。以下、図6及び図7のそれぞれの例について詳しく説明する。
まず、図6はIピクチャ及びPピクチャのみから構成される予測構造を示している。MPEG符号化では、Pピクチャは直前に符号化されたIピクチャまたはPピクチャのみを参照フレームとする。図中FM1及びFM2は、復号化における参照メモリ(フレームメモリ)の使い回しを示している。ここで、各フレームは1フレーム期間かけて復号化するものとする。
6 and 7 are diagrams showing an example of an inter-frame prediction structure and reference memory control in conventional MPEG moving image coding. The horizontal axis indicates time, and I0, P1, P2, etc. indicate frames in display order. For example, I0 indicates an I picture and the frame number is 0, P1 indicates a P picture and the frame number is 1, and B2 indicates a B picture and the frame number is 2, respectively. The arrows in the figure indicate the prediction structure between frames, and indicate the direction from the reference frame to the encoding target frame. For example, FIG. 6 shows that I0 is a reference frame for the encoding target frame P1. Hereinafter, each example of FIGS. 6 and 7 will be described in detail.
First, FIG. 6 shows a prediction structure composed of only an I picture and a P picture. In MPEG coding, only the I picture or P picture coded immediately before is used as a reference frame for the P picture. FM1 and FM2 in the figure indicate how the reference memory (frame memory) is used in decoding. Here, each frame is decoded over one frame period.
I0の復号化は、図中I0フレームからP1フレームまでの間の期間に行われるものとし、復号化画像信号は参照メモリFM1に順次書き込まれ、次にP1の復号化が終了するまで参照メモリFM1に保存される。P1の復号化は、参照メモリFM1に保存されたI0フレームを参照フレームとして行われ、復号化されたP1フレームは順次参照フレームFM2に書き込まれ、次にP2の復号化が終了するまでFM2に保存される。P2の復号化は、参照メモリFM2に保存されたP1フレームを参照フレームとして行われ、復号化されたP2フレームは参照メモリFM1に既に保存されたI0フレームを上書きしながら書き込まれる。以上のように、Iピクチャ及びPピクチャから構成される符号化データの復号化は2フレーム分の参照メモリを用いて行われる。 It is assumed that the decoding of I0 is performed in the period from the I0 frame to the P1 frame in the figure, and the decoded image signal is sequentially written in the reference memory FM1, and then the reference memory FM1 until the decoding of P1 is completed. Saved in. Decoding of P1 is performed using the I0 frame stored in the reference memory FM1 as a reference frame, and the decoded P1 frame is sequentially written in the reference frame FM2, and then stored in FM2 until the decoding of P2 is completed. Is done. P2 is decoded using the P1 frame stored in the reference memory FM2 as a reference frame, and the decoded P2 frame is written while overwriting the I0 frame already stored in the reference memory FM1. As described above, decoding of encoded data composed of an I picture and a P picture is performed using a reference memory for two frames.
図7は、従来のMPEG動画像符号化でBピクチャを含む場合の例である。Bピクチャは、後方フレームからの予測も用いられるため、表示順と異なる順序にフレームの並べ替えが行われ、符号化及び復号化が行われる。図7の上段は表示順のフレーム及びフレーム間予測構造を示し、下段は符号化及び復号化におけるフレーム順を示している。FM1及びFM2は復号化における参照メモリの使い回しを示している。 FIG. 7 is an example in the case of including a B picture in the conventional MPEG moving image coding. Since the B picture is also used for prediction from the rear frame, the frames are rearranged in an order different from the display order, and encoded and decoded. The upper part of FIG. 7 shows the frames in the display order and the inter-frame prediction structure, and the lower part shows the frame order in encoding and decoding. FM1 and FM2 indicate the use of the reference memory for decoding.
図7に示すフレーム間予測構造を持つ符号化データの復号化時には、まずI0フレームが復号化され、参照メモリF1に書き込まれる。続いて、参照メモリFM1に保存された復号化されたI0フレームを参照フレームとしてP3フレームの復号化が行われ、復号化されたP3フレームは参照メモリFM2に書き込まれる。次に、参照メモリFM1に保存された復号化されたI0フレームを前方予測の参照フレームとし、また参照メモリFM2に保存された復号化されたP3フレームを後方予測の参照フレームとして、BピクチャB1及びB2の復号化が順次行われる。次に、P6フレームが参照メモリFM2に保存されたP3フレームを参照フレームとして復号化され、復号化されたP6フレームは参照メモリFM1に既に保存されたI0フレームを上書きしながら書き込まれる。Bピクチャは、参照フレームとしては用いられないため、Bピクチャの復号化画像は参照メモリには保存されず、順次出力して表示される。 When decoding the encoded data having the inter-frame prediction structure shown in FIG. 7, the I0 frame is first decoded and written to the reference memory F1. Subsequently, the P3 frame is decoded using the decoded I0 frame stored in the reference memory FM1 as a reference frame, and the decoded P3 frame is written in the reference memory FM2. Next, the decoded I0 frame stored in the reference memory FM1 is used as a reference frame for forward prediction, and the decoded P3 frame stored in the reference memory FM2 is used as a reference frame for backward prediction. Decoding of B2 is sequentially performed. Next, the P6 frame is decoded using the P3 frame stored in the reference memory FM2 as a reference frame, and the decoded P6 frame is written while overwriting the I0 frame already stored in the reference memory FM1. Since the B picture is not used as a reference frame, the decoded picture of the B picture is not stored in the reference memory, but is sequentially output and displayed.
Iピクチャ及びPピクチャの復号化時は、参照メモリに保存されている1つ前のIピクチャまたはPピクチャが出力され表示される。例えば、P3のデコード時には参照メモリFM1に保存されたI0が表示され、P6のデコード時には参照メモリFM2に保存されたP3が表示される。このようにIピクチャ及びPピクチャの表示を1周期遅らせることで、復号化順が正しい表示順に並べ替えられる。以上のように、Bピクチャを含む場合においても、2フレームの参照フレームで復号化が行われる。 When decoding an I picture and a P picture, the previous I picture or P picture stored in the reference memory is output and displayed. For example, I0 stored in the reference memory FM1 is displayed when P3 is decoded, and P3 stored in the reference memory FM2 is displayed when P6 is decoded. Thus, by delaying the display of the I picture and P picture by one cycle, the decoding order is rearranged in the correct display order. As described above, even when a B picture is included, decoding is performed with two reference frames.
図8から図13は、本実施形態におけるフレーム間予測構造及び参照メモリ制御の例を示す図である。以下、それぞれの例について説明する。図8は、図6と同様にIピクチャ及びPピクチャから構成されるが、各フレームを予測グループaと予測グループbとの交互に切り替える例であり、予測グループbは予測グループaの上位階層とする。また、予測グループa及び予測グループbの参照メモリ数はそれぞれ1フレームであるとする。 8 to 13 are diagrams illustrating examples of the inter-frame prediction structure and the reference memory control in the present embodiment. Each example will be described below. FIG. 8 is composed of an I picture and a P picture as in FIG. 6, but is an example in which each frame is alternately switched between the prediction group a and the prediction group b. The prediction group b is an upper layer of the prediction group a. To do. Further, it is assumed that the number of reference memories of the prediction group a and the prediction group b is 1 frame.
図中Ia0,Pa2,Pa4で示されるように、サフィックスaの付加されたピクチャは予測グループaであることを示し、また、Pb1,Pb3,Pb5のようにサフィックスbの付加されたピクチャは予測グループbであることを示している。これらの予測グループの属性は、ピクチャタイプの拡張、または独立したインデックスとして符号化対象フレームのヘッダ情報として符号化される。予測グループaに属する符号化対象フレームは、予測フレームaに属する既に復号化されたフレームのみを参照フレームとして用いることが可能であり、また、上位階層の予測フレームbでは、既に復号化された予測グループa及び予測グループbの何れかに属する1フレームまたは両方の復号化フレームの線形和を用いて予測画像を生成することが可能である。 As shown by Ia0, Pa2, and Pa4 in the figure, the picture to which the suffix a is added indicates the prediction group a, and the pictures to which the suffix b is added such as Pb1, Pb3, and Pb5 are prediction groups. b. The attributes of these prediction groups are encoded as header information of the encoding target frame as an extension of the picture type or as an independent index. For the encoding target frame belonging to the prediction group a, it is possible to use only the already decoded frame belonging to the prediction frame a as a reference frame, and in the upper layer prediction frame b, the already decoded prediction is used. It is possible to generate a predicted image using a linear sum of one frame or both decoded frames belonging to either group a or prediction group b.
各階層の予測グループともに1フレームの参照メモリを持っているため、予測グループaの符号化対象フレームの参照フレーム数は最大1フレームとなり、予測グループbの符号化対象フレームの参照フレーム数は最大2フレームが使用可能である。例えば、予測グループaに属するPa2フレームは、復号化されたIa0フレームのみを参照フレームとして用いるが、予測グループbに属するPb3は、予測グループaに属する復号化されたPa2フレームと、予測グループbに属する復号化されたPb1フレームの2フレームを参照フレームとして用いる。 Since each prediction group in each layer has one frame of reference memory, the reference frame number of the encoding target frame of the prediction group a is 1 frame at maximum, and the reference frame number of the encoding target frame of the prediction group b is 2 at maximum. The frame is usable. For example, the Pa2 frame belonging to the prediction group a uses only the decoded Ia0 frame as the reference frame, but the Pb3 belonging to the prediction group b is assigned to the decoded Pa2 frame belonging to the prediction group a and the prediction group b. Two of the decoded Pb1 frames to which it belongs belong to the reference frame.
図8において、FM1,FM2及びFM3は図6あるいは図7と同様の物理的な参照メモリの使い回しを示している。また、DEC,REFa及びREFbはそれぞれ論理的な参照メモリの使い回しを示している。換言すると、DEC,REFa及びREFbは仮想アドレスで表現したフレームメモリであり、FM1,FM2及びFM3は同フレームメモリを物理アドレスで表現したものである。仮想アドレス表現では、DECは現在復号化中のフレームを一時保存するためのフレームメモリであり、またREFa及びREFbはそれぞれ予測グループa及び予測グループbの参照メモリを示している。従って、REFaには復号化された予測グループaに属するフレームが順次一時保存され、REBbには復号化された予測グループbに属するフレームが順次一時保存される。 In FIG. 8, FM1, FM2, and FM3 indicate the use of physical reference memory as in FIG. 6 or FIG. In addition, DEC, REFa, and REFb indicate the usage of the logical reference memory. In other words, DEC, REFa, and REFb are frame memories expressed by virtual addresses, and FM1, FM2, and FM3 are the frame memories expressed by physical addresses. In the virtual address expression, DEC is a frame memory for temporarily storing a frame currently being decoded, and REFa and REFb indicate reference memories of the prediction group a and the prediction group b, respectively. Therefore, the frames belonging to the decoded prediction group a are temporarily stored in REFa, and the frames belonging to the decoded prediction group b are temporarily stored in REBb.
図8の例では、例えば上位階層の予測グループbに属する符号化対象フレームを破棄して、予測グループaに属するフレームのみを復号化することが可能である。この場合、必要な参照メモリ数は、現在復号化中のフレームを一時保存するためのフレームメモリDECと、予測グループaの参照メモリREFaの2フレーム分があれば復号化が可能である。 In the example of FIG. 8, for example, it is possible to discard only the frames belonging to the prediction group a by discarding the encoding target frame belonging to the upper layer prediction group b. In this case, the required number of reference memories can be decoded if there are two frames of the frame memory DEC for temporarily storing the currently decoded frame and the reference memory REFa of the prediction group a.
予測グループaに属するフレームのみを復号化することで、フレーム周期を半分にした復号化を予測構造に破綻をきたすことなく行うことができる。例えば、予測グループaに属する復号化フレームを2倍のフレームレートで再生することで、滑らかな早送り再生を行うことが可能である。また、映像ストリーミング等において伝送路の帯域幅が時間変動する場合に、通常は全ての符号化データを送出し、伝送路の有効帯域幅が低下した場合は、予測グループbに属する符号化データを破棄して、下位階層の予測グループa属する符号化データのみを送出しても、受信側では破綻無く再生することが可能である。 By decoding only the frames belonging to the prediction group a, decoding with half the frame period can be performed without causing a failure in the prediction structure. For example, it is possible to perform smooth fast-forward playback by playing back decoded frames belonging to the prediction group a at twice the frame rate. In addition, when the bandwidth of the transmission path fluctuates with time in video streaming or the like, normally all encoded data is sent out, and when the effective bandwidth of the transmission path decreases, the encoded data belonging to the prediction group b is Even if it is discarded and only the encoded data belonging to the prediction group a in the lower layer is transmitted, the reception side can reproduce it without failure.
図9は、図8の例を変形した例であり、予測グループaに属するフレームの間に予測グループbに属するフレームが2フレーム挿入された予測構造であり、また各階層の予測グループの参照メモリ数は何れも1フレームである。この場合も、図8と同様に3フレーム分のフレームメモリを使いまわすことで、図6と同様の復号化を行うことが可能である。図9の例では、例えば予測グループaのフレームのみを復号化し、符号化されたフレームを本来のフレームレートで再生することで、滑らかな3倍速再生を行うことも可能である。 FIG. 9 is a modified example of the example of FIG. 8, and is a prediction structure in which two frames belonging to the prediction group b are inserted between frames belonging to the prediction group a, and the reference group reference memory of each layer Each number is one frame. Also in this case, it is possible to perform the same decoding as in FIG. 6 by using the frame memory for three frames as in FIG. In the example of FIG. 9, for example, only the frame of the prediction group “a” is decoded, and the encoded frame is reproduced at the original frame rate, whereby smooth 3 × speed reproduction can be performed.
図10では、図6と同様にIピクチャ及びPピクチャから構成され、また、予測グループはa,b,cの3階層とし、入力フレーム4フレーム毎に予測グループaのフレームが割り当てられ、予測グループaのフレーム間に予測グループbの1フレームと予測グループcの2フレームが配置された予測構造としている。 In FIG. 10, similarly to FIG. 6, the prediction group is composed of an I picture and a P picture, and the prediction group has three hierarchies a, b, and c. The prediction structure is such that one frame of the prediction group b and two frames of the prediction group c are arranged between the frames of a.
各階層の予測グループa,b,cの参照フレーム数はぞれぞれ1フレームであり、a,b,cの順で階層が上がるものとする。つまり、予測グループaに属するのフレームは、復号化された予測グループaの1フレームのみを参照フレームとし、予測グループbに属するのフレームは、復号化された予測グループa及び予測グループbの2フレームを参照フレームとし、予測グループcに属するのフレームは、復号化された予測グループa,b及びcの3フレームを参照フレームとして用いることができる。 It is assumed that the number of reference frames of the prediction groups a, b, and c in each hierarchy is one frame, and the hierarchy goes up in the order of a, b, and c. That is, the frame belonging to the prediction group a uses only one frame of the decoded prediction group a as a reference frame, and the frame belonging to the prediction group b includes two frames of the decoded prediction group a and prediction group b. Can be used as the reference frame, and the three frames of the decoded prediction groups a, b and c can be used as the reference frame.
図10において、DEC,REFa,REFb及びREFcは復号化フレームの一時保存フレームメモリ、予測グループaの参照フレーム、予測グループbの参照フレーム、及び予測グループcの参照フレームを示す論理的なフレームメモリの使い回しを示すものであり、またFM1,FM2,FM3及びFM4は、上記4フレーム分のフレームメモリの物理的な使い回しを示している。各階層の予測グループ毎に、直前に復号化された1フレームが、参照メモリREFa,REFb及びREFcに一時保存され、また、現在復号中のフレームは復号化フレームメモリDECに書き込まれる。 In FIG. 10, DEC, REFa, REFb and REFc are logical frame memories indicating temporarily stored frame memories of decoded frames, reference frames of the prediction group a, reference frames of the prediction group b, and reference frames of the prediction group c. Reuse is indicated, and FM1, FM2, FM3, and FM4 indicate physical reuse of the frame memory for the four frames. For each prediction group in each layer, one frame decoded immediately before is temporarily stored in the reference memories REFa, REFb, and REFc, and the frame currently being decoded is written in the decoded frame memory DEC.
図10の構成では、予測グループが3階層で構成されるため、予測グループc以下の全ての符号化フレームを復号化すると通常の再生が行われ、また予測グループb以下の符号化フレームを復号化すると、通常の1/2のフレームが復号化され、また予測グループaの符号化フレームのみを復号化すると、通常の1/4のフレームが復号化されることになる。また、上記何れの復号化においても、予測構造の破綻は発生せずに、正常に復号化画像を生成することが可能である。復号化する階層を動的に制御することで、滑らかな可変速の早送り再生を実現したり、あるいは送出する階層を動的に制御することで、送出ビットレートを動的に変更することが可能となる。 In the configuration of FIG. 10, since the prediction group is composed of three layers, normal decoding is performed when all the encoded frames below the prediction group c are decoded, and the encoded frames below the prediction group b are decoded. Then, a normal half frame is decoded, and if only a coded frame of the prediction group a is decoded, a normal quarter frame is decoded. In any of the above decoding, a decoded image can be normally generated without causing a failure of the prediction structure. It is possible to realize smooth variable-speed fast-forward playback by dynamically controlling the decoding layer or dynamically changing the sending bit rate by dynamically controlling the sending layer. It becomes.
図11では、図7と同様にIピクチャ、Pピクチャ及びBピクチャから構成され、Iピクチャ及びPピクチャを予測グループaとし、Bピクチャを予測グループbとしている。予測グループbは予測グループaの上位階層とする。また、予測グループaの参照メモリ数は2フレーム、予測グループbの参照メモリ数は1フレームである。図11の例では、予測グループaのIピクチャ及びPピクチャの参照メモリ数を2フレームとしているので、Pピクチャにおいて、直前に符号化あるいは復号化されたIピクチャまたはPピクチャと、さらにその前に符号化された符号化あるいは復号化されたIピクチャまたはPピクチャの2フレームを参照フレームとして用いることが可能である。また、Bピクチャにおいては、予測グループbが参照フレームを1フレーム持つため、直前に符号化あるいは復号化されたBピクチャ1フレームを参照フレームとし、さらに下位階層の予測グループである過去2フレームのIピクチャ及びPピクチャと合わせて、3フレームの参照フレームを用いることが可能である。
In FIG. 11, similar to FIG. 7, the picture is composed of an I picture, a P picture, and a B picture. The I picture and the P picture are set as a prediction group a, and the B picture is set as a prediction group b. The prediction group b is a higher hierarchy than the prediction group a. The number of reference memories in the prediction group a is 2 frames, and the number of reference memories in the prediction group b is 1 frame. In the example of FIG. 11, the number of reference memories of the I picture and P picture of the prediction group a is two frames. Therefore, in the P picture, the I picture or P picture coded or decoded immediately before, and further before that Two frames of an encoded or decoded I picture or P picture can be used as a reference frame. In addition, in the B picture, since the prediction group b has one reference frame, the
図8から図10と同様に、FM1,FM2,FM3及びFM4が物理的なフレームメモリの使い回しを示しており、DEC,REFa1,REFa2及びREFbが論理的なフレームメモリの使い回しを示している。DECは復号化中のフレームの一時保存フレームメモリであり、REFa1及びREFa2は予測グループaの2フレーム分の参照メモリであり、REFbは予測グループbの1フレーム分の参照メモリを示している。 As in FIGS. 8 to 10, FM1, FM2, FM3, and FM4 indicate physical frame memory usage, and DEC, REFa1, REFa2, and REFb indicate logical frame memory usage. . DEC is a temporarily stored frame memory of a frame being decoded, REFa1 and REFa2 are reference memories for two frames of the prediction group a, and REFb is a reference memory for one frame of the prediction group b.
図11におけるIdx0,Idx1及びIdx2は、復号化中のフレームの参照フレームを特定するためのインデックスを示している。例えば、Pa6フレームの復号化においては、予測グループaに属する直前の2フレームPa3,Ia0が参照フレームの候補であり、参照フレームのインデックスは符号化対象フレームに時間的に近いものから順次番号を割り当てる。参照フレームを示すインデックスは、マクログロック毎に符号化するものとし、マクロブロック毎に参照フレームの選択を行われる。インデックス0のマクロブロックは、直前のIピクチャまたはPピクチャから予測画像が生成され、インデックス1のマクロブロックは、2つ前のIピクチャまたはPピクチャから予測画像を生成する。また、直前のIピクチャまたはPピクチャ、及び2つ前のIピクチャまたはPピクチャの線形和によって予測画像を生成する場合、インデックス0及びインデック1の組み合わせであることを識別するインデックスがマクロブックのヘッダ情報として符号化される。
Idx0, Idx1, and Idx2 in FIG. 11 indicate indexes for specifying the reference frame of the frame being decoded. For example, in the decoding of the Pa6 frame, the immediately preceding two frames Pa3 and Ia0 belonging to the prediction group a are reference frame candidates, and the reference frame index is assigned sequentially from the one closest in time to the encoding target frame. . The index indicating the reference frame is encoded for each macro block, and the reference frame is selected for each macro block. The macroblock with index 0 generates a predicted image from the immediately preceding I picture or P picture, and the macroblock with
さらに、図11におけるBWrefはBピクチャにおける後方予測の参照フレームを示している。図11の例では、例えばBb1及びBb2の後方参照フレームはPa3,Bb4及びBb5の後方参照フレームはPa6となる。後方予測の参照フレームは、フレーム並べ替えの制約から、直前に符号化あるいは復号化されたIピクチャまたはPピクチャに制限されるため、参照フレームは一意に決定される。従って、後方予測の参照フレームBWrefについては、ヘッダ情報として符号化する必要はない。 Further, BWref in FIG. 11 indicates a reference frame for backward prediction in a B picture. In the example of FIG. 11, for example, the backward reference frames of Bb1 and Bb2 are Pa3, and the backward reference frames of Bb4 and Bb5 are Pa6. The reference frame for backward prediction is limited to the I picture or the P picture that has been encoded or decoded immediately before due to the restriction of the frame rearrangement, so that the reference frame is uniquely determined. Therefore, it is not necessary to encode the backward prediction reference frame BWref as header information.
また、Bピクチャにおける前方予測については、図11の例では最大2フレームの中から選択可能である。例えば、Bb4の符号化及び復号化においては、時間的に直前のフレームであり予測グループaに属するPa3及び時間的にさらにその前のフレームであり予測グループbに属するBb2を参照フレームとして用いることが可能であり、マクロブロック毎に何れの参照フレームを選択されたか、あるいは両者の線形和に予測を行うかを示すインデックスが符号化される。Bb5についても同様に、Bb4及びPa3の2種類が参照フレームとして用いられる。 Further, forward prediction in a B picture can be selected from a maximum of two frames in the example of FIG. For example, in encoding and decoding of Bb4, Pa3 that is the previous frame in time and belonging to the prediction group a and Bb2 that is temporally previous and that belongs to the prediction group b are used as reference frames. This is possible, and an index indicating which reference frame is selected for each macroblock or whether a prediction is performed on the linear sum of both is encoded. Similarly for Bb5, two types Bb4 and Pa3 are used as reference frames.
参照フレームのインデックスは、符号化対象フレーム毎に前方予測の参照フレームとして使用可能な参照フレームに対して、時間的に近いものから順次番号を振る。図11の例では、Pピクチャの符号化及び復号化においては参照メモリに保存されているIまたはPピクチャを時間順に並べて番号を振る。Bピクチャの符号化及び復号化においては、後方予測の参照フレームとして用いられる直前に符号化あるいは復号化されたIピクチャまたはPピクチャを除く、参照メモリに保存されている全ての参照フレームを時間順に並べて番号を振る。図11におけるIdx0及びIdx1は、上述ルールに従って生成したインデックスである。 For reference frame indexes, numbers are assigned sequentially from the closest to the reference frame that can be used as a reference frame for forward prediction for each encoding target frame. In the example of FIG. 11, in encoding and decoding of a P picture, I or P pictures stored in the reference memory are arranged in time order and numbered. In the encoding and decoding of a B picture, all reference frames stored in the reference memory except for an I picture or a P picture encoded or decoded immediately before being used as a reference frame for backward prediction are sorted in time order. Number them side by side. Idx0 and Idx1 in FIG. 11 are indexes generated according to the above rules.
図12は図11の例の拡張であり、予測グループbつまりBピクチャについても参照フレーム数を2フレームに設定し、総フレームメモリ数を5フレームとした場合を示している。FM1〜FM5は、物理的な参照フレームの使い回しを示しており、DECは復号化時の一時保存バッファ、REFa1及びREFa2は予測グループa、すなわちIピクチャ及びPピクチャの参照メモリ、REFb1及びREFb2は予測グループb、すなわちBピクチャの参照メモリの論理的な使い回しをそれぞれ示している。また、Idx0,Idx1及びIdx2は前方予測における、参照フレームインデックスの割り付け、BWrefはBピクチャにおける後方予測の参照フレームをそれぞれ示している。図11の例と同様に前方予測における参照フレームインデックスは、マクログロック毎にヘッダ情報として符号化される。 FIG. 12 is an extension of the example of FIG. 11 and shows a case where the reference frame number is set to 2 frames and the total frame memory number is 5 frames for the prediction group b, that is, the B picture. FM1 to FM5 indicate the reuse of physical reference frames, DEC is a temporary storage buffer at the time of decoding, REFa1 and REFa2 are prediction groups a, that is, reference memories of I and P pictures, and REFb1 and REFb2 are The logical use of the reference memory of the prediction group b, that is, the B picture is shown. Idx0, Idx1, and Idx2 are reference frame index assignments in forward prediction, and BWref is a reference frame for backward prediction in a B picture. Similar to the example of FIG. 11, the reference frame index in the forward prediction is encoded as header information for each macro clock.
図8から図12の例では、各階層の予測グループの参照メモリ数は固定としたが、参照フレーム数の総数が一定の下で、各階層の予測グループの参照メモリ数の配分を動的に変更する構成としてもよい。例えば、図8の構成であるタイミングで予測グループbの参照メモリ数を0として、同時に予測グループaの参照メモリ数を2とする再配分を行い、その配分変更を符号化データのヘッダ情報で符号化側から復号化側へ通知する構成とすればよい。その際、符号化側では予測グループaのフレームについては、予測グループaの過去2フレームからの予測を使用可能とし、また、予測グループbのフレームについては、予測グループbの過去のフレームからの予測は禁止し、予測グループaの過去2フレームからの予測を行うように、動き補償予測の選択を制御する。 In the examples of FIGS. 8 to 12, the number of reference memories in the prediction group in each layer is fixed. However, the distribution of the reference memory numbers in the prediction group in each layer is dynamically distributed under a fixed total number of reference frames. It is good also as a structure to change. For example, at the timing shown in FIG. 8, the redistribution is performed by setting the number of reference memories of the prediction group b to 0 and simultaneously the number of reference memories of the prediction group a to 2, and the distribution change is encoded with the header information of the encoded data. The configuration may be such that notification is made from the encryption side to the decoding side. At this time, on the encoding side, prediction from the past two frames of the prediction group a can be used for the frame of the prediction group a, and prediction from the past frames of the prediction group b for the frame of the prediction group b. Is prohibited and the selection of motion compensation prediction is controlled so that prediction from the past two frames of the prediction group a is performed.
図13は、図8の例に対して上記のように参照メモリ数の配分を変化させた場合の予測構造及びフレームメモリの使い回しを示している。このようにすることで、限られた参照フレーム数の中で入力動画像に適した最適な予測構造を動的に設定することが可能となり、予測効率を向上させて高能率の符号化を行うことが可能となる。 FIG. 13 shows the prediction structure and the reuse of the frame memory when the distribution of the number of reference memories is changed as described above with respect to the example of FIG. In this way, it becomes possible to dynamically set an optimal prediction structure suitable for an input moving image within a limited number of reference frames, and to improve prediction efficiency and perform highly efficient encoding. It becomes possible.
100…入力動画像信号
101…予測誤差信号
102…量子化DCT係数データ
103…局部復号化画像信号
104…予測画像信号
105…サイド情報
106…符号化データ
111…動き補償予測器
112…DCT変換器
113…量子化器
114…可変長符号化器
115…逆量子化器
116…逆DCT器
117…参照フレーム書き込み制御スイッチ
118,119…参照メモリセット
120…参照フレーム読み出し制御器
200…符号化データ
201…量子化DCT係数データ
202…サイド情報
203…予測画像信号
204…復号化画像信号
211…動き補償予測器
214…可変長復号化器
215…逆量子化器
216…逆DCT変換器
217…参照フレーム書き込み制御スイッチ
218,219…参照メモリセット
220…参照フレーム読み出し制御スイッチ
300…予測マクロブロック選択器
301…線形予測器
302,303,204…参照メモリ
DESCRIPTION OF
Claims (3)
前記符号化データに含まれる前記符号化対象フレームが振り分けられた階層のグループを示す第1の識別情報、前記動き補償予測フレーム間符号化に使用された参照フレームを示す第2の識別情報、及び前記符号化対象フレームのピクチャタイプを示す情報を復号化し、
復号化された前記第1の識別情報及び第2の識別情報に従って、前記符号化対象フレームが振り分けられた階層以下の階層のグループに属する少なくとも一つの参照フレームを選択し、
選択した参照フレームを用いて前記符号化データに含まれる前記動き補償予測フレーム間符号化の結果を復号化する動画像復号化方法。 A moving picture decoding method for reproducing a moving picture by decoding coded data obtained by performing a coding process including motion compensated prediction interframe coding on a coding target frame of a moving picture,
First identification information indicating a group of layers to which the encoding target frame included in the encoded data is distributed, second identification information indicating a reference frame used for the motion compensation prediction interframe encoding, and Decoding information indicating a picture type of the encoding target frame;
In accordance with the decoded first identification information and second identification information, select at least one reference frame belonging to a group of layers below the layer to which the encoding target frame is distributed,
A moving picture decoding method for decoding a result of the motion compensated prediction interframe coding included in the coded data using a selected reference frame.
前記符号化データに含まれる前記符号化対象フレームが振り分けられた階層のグループを示す第1の識別情報、前記動き補償予測フレーム間符号化に使用された参照フレームを示す第2の識別情報、及び前記符号化対象フレームのピクチャタイプを示す情報を復号化する手段と、
復号化された前記第1の識別情報及び第2の識別情報に従って、前記符号化対象フレームが振り分けられた階層以下の階層のグループに属する少なくとも一つの参照フレームを選択する手段と、
選択した参照フレームを用いて前記符号化データに含まれる前記動き補償予測フレーム間符号化の結果を復号化する手段とを具備する動画像復号化装置。 A moving image decoding apparatus that decodes encoded data obtained by performing an encoding process including motion compensated prediction inter-frame encoding on a moving image encoding target frame and reproduces a moving image,
First identification information indicating a group of layers to which the encoding target frame included in the encoded data is distributed, second identification information indicating a reference frame used for the motion compensation prediction interframe encoding, and Means for decoding information indicating a picture type of the encoding target frame;
Means for selecting at least one reference frame belonging to a group of layers below the layer to which the encoding target frame is distributed according to the decoded first identification information and second identification information;
A moving picture decoding apparatus comprising: means for decoding a result of the motion compensated prediction interframe coding included in the coded data using a selected reference frame.
前記符号化データに含まれる前記符号化対象フレームが振り分けられた階層のグループを示す第1の識別情報、前記動き補償予測フレーム間符号化に使用された参照フレームを示す第2の識別情報、及び前記符号化対象フレームのピクチャタイプを示す情報を復号化する処理と、
復号化された前記第1の識別情報及び第2の識別情報に従って、前記符号化対象フレームが振り分けられた階層のグループ又はそれより下位の階層のグループに属する少なくとも一つの参照フレームを選択する処理と、
選択した参照フレームを用いて前記符号化データに含まれる前記動き補償予測フレーム間符号化の結果を復号化する処理とを含む動画像復号化処理を前記コンピュータに行わせるためのプログラム。 A program for causing a computer to perform a process of reproducing a moving image by decoding encoded data obtained by performing an encoding process including motion compensated prediction inter-frame encoding on a moving image encoding target frame. There,
First identification information indicating a group of layers to which the encoding target frame included in the encoded data is distributed, second identification information indicating a reference frame used for the motion compensation prediction interframe encoding, and A process of decoding information indicating a picture type of the encoding target frame;
A process of selecting at least one reference frame belonging to a group in a layer to which the encoding target frame is distributed or a group in a lower layer according to the decoded first identification information and second identification information; ,
A program for causing the computer to perform a moving picture decoding process including a process of decoding a result of the motion compensated prediction interframe encoding included in the encoded data using a selected reference frame.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006155050A JP2006311589A (en) | 2006-06-02 | 2006-06-02 | Moving image decoding method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006155050A JP2006311589A (en) | 2006-06-02 | 2006-06-02 | Moving image decoding method and apparatus |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002097892A Division JP2003299103A (en) | 2001-12-19 | 2002-03-29 | Moving picture encoding and decoding processes and devices thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006311589A true JP2006311589A (en) | 2006-11-09 |
Family
ID=37477807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006155050A Abandoned JP2006311589A (en) | 2006-06-02 | 2006-06-02 | Moving image decoding method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006311589A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022257474A1 (en) * | 2021-06-11 | 2022-12-15 | 荣耀终端有限公司 | Image prediction method, electronic device and storage medium |
-
2006
- 2006-06-02 JP JP2006155050A patent/JP2006311589A/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022257474A1 (en) * | 2021-06-11 | 2022-12-15 | 荣耀终端有限公司 | Image prediction method, electronic device and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7298913B2 (en) | Video encoding method and apparatus employing motion compensated prediction interframe encoding, and corresponding video decoding method and apparatus | |
US5305113A (en) | Motion picture decoding system which affords smooth reproduction of recorded motion picture coded data in forward and reverse directions at high speed | |
JP4769717B2 (en) | Image decoding method | |
TW589898B (en) | Methods and systems for video streaming with VCR functionality | |
TWI514856B (en) | Image decoding apparatus, image coding apparatus, image decoding method, image coding method, and program product | |
US20090010334A1 (en) | Decoding device, decoding method, recording medium, and program | |
JPH06261303A (en) | Picture signal encoding method/decoding method and picture signal recording medium | |
US5739862A (en) | Reverse playback of MPEG video | |
KR20060047952A (en) | Reverse presentation of digital media streams | |
KR20040106823A (en) | Apparatus and method for controlling frame buffer memory in reverse play mode of digital video data | |
US20090279614A1 (en) | Apparatus and method for managing reference frame buffer in layered video coding | |
US20050018915A1 (en) | Image processing apparatus and image processing method | |
US8155186B2 (en) | Bit stream recording medium, video encoder, and video decoder | |
JP2009506626A (en) | Trick playback using temporal layering | |
US9591319B2 (en) | Video encoder | |
KR20070110406A (en) | Image processing apparatus, image processing method and television receiver | |
JP2006311589A (en) | Moving image decoding method and apparatus | |
US7620293B2 (en) | Method and apparatus for controlling a bit rate of digital video data | |
JP4906197B2 (en) | Decoding device and method, and recording medium | |
WO2013114826A1 (en) | Image decoding device | |
US8649617B2 (en) | Image decoding apparatus and non-transitory computer readable medium | |
KR100780844B1 (en) | A multi-view image decoder, a multi-view image data processing system, a multi-view image data processing method and a recording medium recording a program for performing the same | |
JP4462559B2 (en) | Trick playback content creation method and device, trick playback compressed video data transmission method and device, and trick playback content creation program | |
JP2003052020A (en) | Picture processing method and picture processor capable of using the same and television receiver | |
JPH08163570A (en) | Method and device for decoding low delay mode picture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20090223 |