JPH0998434A - Image encoding device and image decoding device - Google Patents
Image encoding device and image decoding deviceInfo
- Publication number
- JPH0998434A JPH0998434A JP27718195A JP27718195A JPH0998434A JP H0998434 A JPH0998434 A JP H0998434A JP 27718195 A JP27718195 A JP 27718195A JP 27718195 A JP27718195 A JP 27718195A JP H0998434 A JPH0998434 A JP H0998434A
- Authority
- JP
- Japan
- Prior art keywords
- layer
- circuit
- signal
- image
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 146
- 230000009466 transformation Effects 0.000 claims description 115
- 238000013139 quantization Methods 0.000 claims description 78
- 230000001131 transforming effect Effects 0.000 claims description 19
- 230000015556 catabolic process Effects 0.000 abstract 1
- 230000007423 decrease Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 230000015654 memory Effects 0.000 description 66
- 238000010586 diagram Methods 0.000 description 45
- 238000000034 method Methods 0.000 description 39
- 230000010354 integration Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 10
- 230000006866 deterioration Effects 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000011426 transformation method Methods 0.000 description 3
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 2
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- MXBCYQUALCBQIJ-RYVPXURESA-N (8s,9s,10r,13s,14s,17r)-13-ethyl-17-ethynyl-11-methylidene-1,2,3,6,7,8,9,10,12,14,15,16-dodecahydrocyclopenta[a]phenanthren-17-ol;(8r,9s,13s,14s,17r)-17-ethynyl-13-methyl-7,8,9,11,12,14,15,16-octahydro-6h-cyclopenta[a]phenanthrene-3,17-diol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1.C1CC[C@@H]2[C@H]3C(=C)C[C@](CC)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 MXBCYQUALCBQIJ-RYVPXURESA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/004—Predictors, e.g. intraframe, interframe coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、画像信号を高能率
に符号化し伝送・蓄積に供すると共に、また復号するた
めの画像符号化装置および復号化装置にかかわり、特
に、スケーラビリティ機能を有する画像符号化装置およ
び復号化装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image coding apparatus and a decoding apparatus for highly efficiently coding and transmitting / accumulating an image signal, and also for decoding the image signal, and more particularly to an image code having a scalability function. The present invention relates to an encryption device and a decoding device.
【0002】[0002]
【従来の技術】画像信号は膨大な情報量を持つため、伝
送や蓄積に供する場合には圧縮符号化するのが一般的で
ある。画像信号を高能率に符号化するには、フレーム単
位の画像を、所要画素数単位でブロック分けし、その各
ブロック毎に直交変換して画像の持つ空間周波数を各周
波数成分に分離し、変換係数として取得してこれを符号
化する。2. Description of the Related Art Since an image signal has an enormous amount of information, it is generally compressed and encoded for transmission and storage. In order to encode an image signal with high efficiency, an image in a frame unit is divided into blocks in units of a required number of pixels, and each block is subjected to orthogonal transform to separate a spatial frequency of the image into each frequency component, and to perform a transform. It is obtained as a coefficient and encoded.
【0003】ところで、画像符号化の機能として、ビッ
トストリームを部分的に復号することで、画質(SN
R; Signal to Noise Ratio)、空間解像度、時間解像
度を段階的に可変とすることを可能にするスケーラビリ
ティの機能が要求されている。By the way, as a function of image encoding, image quality (SN
R: Signal to Noise Ratio), spatial resolution, and temporal resolution can be made variable step by step.
【0004】図7は、N段階に空間解像度を可変にし、
M段階に画質を可変にするようにしたスケーラビリティ
機能を有するビットストリームのイメージである。図7
における斜線部で示されたビットストリームをデコード
することで、空間解像度がn(=1〜N)、画質がm
(=1〜M)の再生画像が得られる。FIG. 7 shows that the spatial resolution is variable in N steps,
It is an image of a bitstream having a scalability function in which the image quality is made variable in M steps. Figure 7
By decoding the bit stream indicated by the shaded area in FIG. 1, the spatial resolution is n (= 1 to N) and the image quality is m.
A reproduced image of (= 1 to M) is obtained.
【0005】ISO/IECにおいて標準化されたメデ
ィア統合系動画像符号化標準であるMPEG2のビデオ
パート(IS13818‐2)にも、スケーラビリティ
の機能が取り入れられている。The scalability function is also incorporated in the video part (IS13818-2) of MPEG2, which is a media-integrated video coding standard standardized in ISO / IEC.
【0006】このスケーラビリティは、図15、図16
に示されるような階層的な符号化法により実現される。
図15は、SNRスケーラビリティの、また、図16
は、空間スケーラビリティの、エンコーダの例とそのデ
コーダの構成をそれぞれ示したものである。This scalability is shown in FIGS.
It is realized by the hierarchical coding method as shown in.
FIG. 15 shows the SNR scalability and FIG.
Shows an example of the encoder of spatial scalability and the configuration of its decoder, respectively.
【0007】図15、図16において、Dは遅延手段で
あって、ベースレイヤからの予測値が得られるまでの遅
延を与えるためのものであり、DCTは離散コサイン変
換(直交変換)を行う手段、Qは量子化を行う量子化
器、IQは逆量子化を行う逆量子化器、IDCTは逆D
CTを行う手段、FMはフレームメモリ、MCは動き補
償予測を行う手段、VLCは可変長符号化を行う手段、
VLDは可変長復号化を行う手段、DSはダウンサンプ
リングする手段、USはアップサンプリングを行う手
段、wは重み付けパラメータ(0,0.5,1)をそれ
ぞれ示している。In FIGS. 15 and 16, D is a delay means for giving a delay until a predicted value is obtained from the base layer, and DCT is means for performing a discrete cosine transform (orthogonal transform). , Q is a quantizer for quantization, IQ is an inverse quantizer for inverse quantization, IDCT is an inverse D
CT means, FM is a frame memory, MC is motion compensated prediction, VLC is variable length coding,
VLD is a means for performing variable length decoding, DS is means for downsampling, US is means for upsampling, and w is a weighting parameter (0, 0.5, 1).
【0008】図15の(a)は符号化のためのエンコー
ダを、そして、(b)はデコーダの構成例を示してい
る。エンコーダにおいては、画質の低いレイヤであるベ
ースレイヤと、画質の高いレイヤであるエンハンスレー
ヤに別れている。FIG. 15A shows an example of the structure of an encoder for encoding, and FIG. 15B shows an example of the structure of a decoder. The encoder is divided into a base layer, which is a layer with low image quality, and an enhancer, which is a layer with high image quality.
【0009】そして、ベースレイヤではMPEG1ある
いはMPEG2で符号化され、エンハンスレーヤでは、
ベースレイヤで符号化されたデータを再現し、元のデ−
タからこの再現されたものを引き、その結果得られる誤
差分だけをベースレイヤの量子化ステップ・サイズより
も小さな量子化ステップ・サイズで量子化して符号化す
る。すなわち、より細かく量子化して符号化する。そし
て、ベースレイヤ情報にエンハンスレーヤの情報を加え
ることで、精細さを向上させることができ、高画質の画
像の伝送・蓄積が可能になる。The base layer is encoded by MPEG1 or MPEG2, and the enhancer is
Reproduce the data encoded in the base layer, and
This reproduced value is subtracted from the data, and only the resulting error is quantized and encoded with a quantization step size smaller than the quantization step size of the base layer. That is, it is quantized and encoded more finely. Then, by adding the information of the enhancer to the base layer information, it is possible to improve the definition and to transmit / store a high quality image.
【0010】このように画像をベースレイヤとエンハン
スレーヤに分け、ベースレイヤで符号化されたデータを
再現し、元のデ−タからこの再現されたものを引き、そ
の結果得られる誤差分だけをベースレイヤの量子化ステ
ップ・サイズよりも小さな量子化ステップ・サイズで量
子化して符号化することで、高精細な画像の符号化/復
号化できるようにする技術をSNRスケーラビリティと
いう。In this way, the image is divided into the base layer and the enhancer, the data encoded in the base layer is reproduced, the reproduced data is subtracted from the original data, and only the resulting error is obtained. SNR scalability is a technique that enables high-definition image encoding / decoding by performing quantization and encoding with a quantization step size smaller than the base layer quantization step size.
【0011】図15の(a)のエンコーダでは、入力画
像をベースレイヤとエンハンスレーヤにそれぞれ入力
し、ベースレイヤではこれを前フレームの画像から得た
動き補償予測値との誤差分を得る処理をした後に直交変
換し(DCT)、その変換係数を量子化して可変長復号
化し、ベースレイヤ出力とする。また、量子化出力は、
逆量子化した後、逆DCTし、これに前フレームの動き
補償予測値を加えてフレーム画像を得、このフレーム画
像から動き補償予測を行い、前フレームの動き補償予測
値とする。In the encoder shown in FIG. 15A, the input image is input to the base layer and the enhancer respectively, and the base layer performs a process of obtaining an error amount between the input image and the motion compensation prediction value obtained from the image of the previous frame. After that, orthogonal transform (DCT) is performed, and the transform coefficient is quantized and variable-length decoded to be a base layer output. Also, the quantized output is
After inverse quantization, inverse DCT is performed, the motion compensation prediction value of the previous frame is added to this to obtain a frame image, and motion compensation prediction is performed from this frame image to obtain the motion compensation prediction value of the previous frame.
【0012】一方、エンハンスレーヤでは入力画像を、
ベースレイヤからの予測値が得られるまでの遅延を与え
たのちに、前フレームの画像から得たエンハンスレイヤ
での動き補償予測値との誤差分を得る処理をし、その後
に直交変換し(DCT)、その変換係数にベースレイヤ
の逆量子化出力分の補正を加えてからこれを量子化して
可変長復号化し、エンハンスレイヤ出力とする。また、
量子化出力は、逆量子化した後、ベースレイヤにて得た
前フレームの動き補償予測値を加えて逆DCTし、これ
にエンハンスレイヤで得た前フレームの動き補償予測値
を加えてフレーム画像を得、このフレーム画像から動き
補償予測を行い、エンハンスレイヤでの前フレームの動
き補償予測値とする。On the other hand, in the enhancer, the input image is
After giving a delay until the prediction value from the base layer is obtained, a process for obtaining an error from the motion compensation prediction value in the enhancement layer obtained from the image of the previous frame is performed, and then orthogonal transformation (DCT) is performed. ), The inverse quantization output of the base layer is added to the transform coefficient, and then this is quantized and variable length decoding is performed to output the enhanced layer. Also,
The quantized output is inversely quantized and then inverse DCT is performed by adding the motion compensation prediction value of the previous frame obtained in the base layer, and the motion compensation prediction value of the previous frame obtained in the enhancement layer is added to this to obtain a frame image. Then, motion compensation prediction is performed from this frame image to obtain the motion compensation prediction value of the previous frame in the enhancement layer.
【0013】これにより、SNRスケーラビリティを使
用した動画像の符号化を行うことができる。By this means, it is possible to encode a moving image using SNR scalability.
【0014】図15のSNRスケーラビリティは、図1
5では2階層で表現しているが、更に階層数を増やすこ
とで、様々なSNRの再生画像が得られる。The SNR scalability of FIG. 15 is shown in FIG.
In FIG. 5, the image is represented by two layers, but by further increasing the number of layers, reproduced images with various SNRs can be obtained.
【0015】図15の(b)に示すデコーダでは、それ
ぞれ別個に与えられるエンハンスレイヤとベースレイヤ
の可変長復号化データを、それぞれ別個に可変長復号化
し、逆量子化してから両者を加え、これを逆DCTした
後、前フレームの動き補償予測値を加えて画像信号を復
元すると共に、復元した画像信号から得た1フレーム前
の画像から動き補償予測を行い、前フレームの動き補償
予測値とする。In the decoder shown in FIG. 15 (b), the variable length decoded data of the enhancement layer and the base layer, which are given separately, are subjected to the variable length decoding separately and after dequantization, both are added, and After inverse DCT, the motion compensation prediction value of the previous frame is added to restore the image signal, and the motion compensation prediction is performed from the image one frame before obtained from the restored image signal to obtain the motion compensation prediction value of the previous frame. To do.
【0016】以上が、SNRスケーラビリティを採用し
た符号化と復号化の例である。The above is an example of encoding and decoding that employs SNR scalability.
【0017】一方、空間スケーラビリティは、空間解像
度からみたものであり、空間解像度の低いベースレイヤ
と空間解像度の高いエンハンスレイヤに分けて符号化す
る。ベースレイヤは通常のMPEG2の符号化方法を使
用して符号化し、エンハンスレイヤではベースレイヤの
画像をアップサンプリング(低解像度画像の画素間に平
均値等の画素を付加し、高解像度画像を作成すること)
してエンハンスレイヤと同じサイズの画像を作成し、エ
ンハンスレイヤの画像からの動き補償予測と、このアッ
プサンプリングされた画像からの動き補償予測とから適
応的に予測をすることで、効率の良い符号化をすること
ができるようにするものであり、エンコーダの構成例は
図16の(a)の如きであり、デコーダの構成例は図1
6の(b)の如きで実現できるものである。On the other hand, the spatial scalability is viewed from the spatial resolution, and is coded separately for a base layer having a low spatial resolution and an enhanced layer having a high spatial resolution. The base layer is encoded using a normal MPEG2 encoding method, and the enhance layer upsamples the image of the base layer (pixels such as an average value are added between pixels of the low resolution image to create a high resolution image). thing)
To create an image of the same size as the enhanced layer and perform adaptive prediction from the motion-compensated prediction from the image of the enhanced layer and the motion-compensated prediction from this up-sampled image to obtain an efficient code. The configuration example of the encoder is as shown in FIG. 16A, and the configuration example of the decoder is shown in FIG.
It can be realized as in (b) of 6.
【0018】図16の空間スケーラビリティは、例え
ば、MPEG2のビットストリームの一部を取り出すと
MPEG1でデコードすることができるという後方互換
性を実現するために存在しており、様々な解像度の画像
を再生することができるようにする機能ではない(参考
文献:“特集 MPEG”テレビ誌、Vol.49,N
o.4,pp.458−463,1993)。The spatial scalability shown in FIG. 16 exists for realizing backward compatibility that, for example, a part of the bit stream of MPEG2 can be extracted and decoded by MPEG1, and images of various resolutions are reproduced. It is not a function that enables the operation (reference: “Special feature MPEG” TV magazine, Vol. 49, N.
o. 4, pp. 458-463, 1993).
【0019】すなわち、MPEG2における動画像の符
号化技術においては、高画質の画像の高能率符号化と高
画質再生を目指しており、符号化した画像に忠実な画像
が再現できるようにしている。That is, the moving picture coding technique in MPEG2 aims at high-efficiency coding and high-quality reproduction of a high-quality image, and is capable of reproducing an image faithful to the coded image.
【0020】しかしながら、マルチメディアの普及に伴
い、再生側のシステムでは、高能率符号化された高画質
画像のデータをフルデコードすることができる再生装置
の要求の他、携帯用のシステムなどのように、画質はと
もかくとして画面が再生できれば良いような用途や、シ
ステム価格を抑制するために、簡易型とするシステムの
要求などがある。However, with the spread of multimedia, in the system on the reproducing side, in addition to the demand for the reproducing apparatus capable of fully decoding the data of the high-efficiency-encoded high-quality image, the system on the reproducing side is also required. In addition, there are demands such as applications in which the screen can be reproduced regardless of the image quality, and demands for a simplified system in order to suppress the system price.
【0021】このような要求に応えるためには、例え
ば、画像を8×8画素のマトリックスにブロック分け
し、各ブロック単位でDCTを行った場合に、8×8の
変換係数が得られるわけであるから、本来ならば第1低
周波項から第8低周波項までの分を復号化しなければな
らないところを、第1低周波項から第4低周波項までの
分を復号化したり、第1低周波項から第6低周波項まで
の分を復号化したりといった具合に、再生は8×8では
なく、4×4とか、6×6の情報で復元するといったよ
うに簡素化することで対応できることになる。In order to meet such a demand, for example, when an image is divided into a matrix of 8 × 8 pixels and DCT is performed for each block, an 8 × 8 transform coefficient is obtained. Therefore, if the first low frequency term to the eighth low frequency term should be decoded, the first low frequency term to the fourth low frequency term should be decoded, For example, decoding from the low-frequency term to the sixth low-frequency term, such as decoding, can be simplified by restoring 4x4 or 6x6 information instead of 8x8. You can do it.
【0022】しかし、本来、8×8であるものを4×4
とか、6×6の情報で復元すると、動き補償予測値都の
ミスマッチが生じ、誤差が累積するため、画像が著しく
劣化する。このような符号化側と復号化側とのミスマッ
チを如何に克服するかが大きな課題となる。However, what is originally 8 × 8 is 4 × 4
For example, if the data is restored with 6 × 6 information, a mismatch between the motion compensation prediction values occurs, and errors are accumulated, so that the image is significantly deteriorated. A major issue is how to overcome such a mismatch between the encoding side and the decoding side.
【0023】なお、標準化はされてはいないが、符号化
側と復号化側との空間解像度の違いに対処すべく、空間
解像度を変換する方法として直交変換(例えばDCT
(離散コサイン変換))係数の一部を、元の次数よりも
小さな次数で逆変換することにより、空間解像度を可変
にする方法もある。Although not standardized, orthogonal transformation (eg DCT) is used as a method for transforming the spatial resolution in order to deal with the difference in spatial resolution between the encoding side and the decoding side.
(Discrete Cosine Transform) There is also a method of varying the spatial resolution by inversely transforming a part of the coefficients with an order smaller than the original order.
【0024】しかし、解像度変換された画像で動き補償
予測を行う際に、動き補償予測に起因したドリフトと呼
ばれる画質劣化が再生画像に発生してしまう(参考文
献:岩橋他、“スケーラブル・デコーダにおけるドリフ
ト低減のための動き補償”、信学技報IE94−97,
1994)。However, when performing motion-compensated prediction on a resolution-converted image, image quality deterioration called drift caused by motion-compensated prediction occurs in a reproduced image (reference document: Iwahashi et al., "Scalable Decoder Motion Compensation for Drift Reduction ", IEICE Technical Report IE94-97,
1994).
【0025】従って、符号化側と復号化側とのミスマッ
チ克服のための技術としては問題がある。Therefore, there is a problem as a technique for overcoming the mismatch between the encoding side and the decoding side.
【0026】また、動画像の符号化技術として、J.
Y.A.Wang et.al.“Applying
Mid−level Vision Techniqu
esfor Video Data Compress
ion and Manipulation”,M.
I.T.MediaLab.Tech.ReportN
o.263,Feb.1994、において、ミッドレベ
ル符号化と呼ばれる範疇に属する画像符号化法が提案さ
れている。As a moving picture coding technique, J.
Y. A. Wang et. al. "Applying
Mid-level Vision Technology
esfor Video Data Compress
Ion and Manipulation ", M.I.
I. T. MediaLab. Tech. ReportN
o. 263, Feb. In 1994, an image coding method belonging to a category called mid-level coding has been proposed.
【0027】この方式では、図17の(a)のような画
像があったとして、これを図17の(b),(c)のよ
うに、背景と被写体(以降、これをオブジェクトと呼
ぶ)を分けて符号化している。In this method, assuming that there is an image as shown in FIG. 17A, this is shown in FIGS. 17B and 17C, and the background and the subject (hereinafter, this is referred to as an object). Are encoded separately.
【0028】そして、この方式では、背景(図17の
(c))やオブジェクト(図17の(b))を別々に符
号化するために、オブジェクトの形状や画面内の位置を
表すための情報であるアルファマップ信号(図17の
(d)における白画素がオブジェクトの画素を示す)が
必要となる。In this system, in order to separately encode the background ((c) of FIG. 17) and the object ((b) of FIG. 17), information for representing the shape of the object and the position on the screen is displayed. The alpha map signal (white pixel in (d) of FIG. 17 indicates the pixel of the object) is required.
【0029】なお、背景のアルファマップ信号(図17
の(e))は、オブジェクトのアルファマップ信号から
一意に求められる。The background alpha map signal (see FIG. 17).
(E)) is uniquely obtained from the alpha map signal of the object.
【0030】このような符号化法では、任意形状の画像
を符号化する必要があり、また、解像度の異なる画像を
再生するためには解像度変換が可能でなければならな
い。In such an encoding method, it is necessary to encode an image having an arbitrary shape, and resolution conversion must be possible in order to reproduce images having different resolutions.
【0031】任意形状画像の符号化法および解像度変換
法の技術としては、本件発明者らが特願平7‐9707
3号にて既に提案した任意形状画像信号の直交変換法な
る手法がある。この技術は、背景と被写体とを含む画像
に対して、例えば、符号化装置においてオブジェクト
(被写体;(コンテント))の位置および形状を表すマ
ップ信号に従って、画像信号のうち、オブジェクトの内
部に位置するブロック(内部ブロック)は全画素の信
号、オブジェクトの境界部を含むブロック(エッジブロ
ック)はオブジェクトの内部に含まれる画素の信号のみ
を、それぞれ2次元直交変換して変換係数を符号化する
と共に、マップ信号を符号化し、復号化装置においては
復号し解像度変換したマップ信号に基づいて、復号した
直交変換係数から所望解像度の画像を再生するために必
要な直交変換係数を選択し、内部ブロックは全ての係数
を、そして、エッジブロックはオブジェクトの内部に含
まれる係数のみを、それぞれ2次元逆直交変換して、解
像度変換された再生画像信号を得るというものであり、
これにより、任意形状のオブジェクトを含むエッジブロ
ックについて解像度変換を行うことができるようにした
ものである。As a technique for encoding an arbitrary shape image and a resolution converting method, the inventors of the present invention filed Japanese Patent Application No. 7-9707.
There is a method called an orthogonal transformation method of an arbitrarily shaped image signal already proposed in No. 3. In this technique, for an image including a background and a subject, for example, according to a map signal representing the position and shape of an object (subject; (content)) in an encoding device, the image signal is positioned inside the object in the image signal. The block (internal block) encodes the transform coefficient by two-dimensional orthogonal transforming only the signal of the pixel contained in the object, and the block containing the boundary of the object (edge block), respectively The map signal is encoded, and in the decoding device, the orthogonal transform coefficient necessary for reproducing the image of the desired resolution is selected from the decoded orthogonal transform coefficients based on the decoded and resolution-converted map signal, and all internal blocks are selected. , And the edge block inverses only the coefficients contained inside the object. And exchange conversion are those that obtain a reproduced image signal resolution conversion,
As a result, the resolution conversion can be performed on the edge block including the object of an arbitrary shape.
【0032】図18は、当該任意形状画像信号の直交変
換法の一例であり、任意形状画像を正方ブロックで等分
割した際に、形状の境界部を含むエッジブロックに対す
る変換と、解像度変換の様子を図示したものである。FIG. 18 shows an example of the orthogonal transformation method for the arbitrary shape image signal. When the arbitrary shape image is equally divided into square blocks, the conversion of the edge block including the boundary of the shape and the resolution conversion are performed. Is illustrated.
【0033】図18は形状の境界部を含むエッジブロッ
クに対する変換の手順を説明する図である。図18に示
すように、[i] 入力されたエッジブロック信号の中で、
[ii]まず、斜線で示されるコンテントの内部に含まれる
画素を左端に寄せ集める。FIG. 18 is a diagram for explaining the conversion procedure for an edge block including a boundary portion of a shape. As shown in FIG. 18, [i] Among the input edge block signals,
[ii] First, the pixels included in the shaded content are gathered at the left end.
【0034】[iii] 次に斜線に示される画素を水平方向
に1次元DCTする。[iv]次に、網線で示される変換係
数を上端に寄せ集める。[v] 最後に、網線で示される変
換係数を垂直方向に1次元DCTする。[Iii] Next, the pixels indicated by diagonal lines are subjected to one-dimensional DCT in the horizontal direction. [iv] Next, the conversion coefficients indicated by halftone lines are gathered at the upper end. [v] Finally, one-dimensional DCT is performed in the vertical direction on the transform coefficient indicated by the mesh line.
【0035】このような手順を踏むことにより、任意形
状の2次元変換係数([v] における黒塗りの部分)が得
られる。By following these steps, a two-dimensional conversion coefficient (black part in [v]) of an arbitrary shape can be obtained.
【0036】図19は解像度変換手順である。図19で
は、[i] 元のアルファマップ信号を、[ii]水平・垂直共
に5/8に解像度が変換されたアルファマップ信号に
し、[iii] これを図18(a)の変換手順と同様に、水
平方向に並べ換えた後、[iv]垂直方向に並べ換えること
で、水平・垂直共に5/8の解像度の再生画像を得るの
に必要な変換係数の位置を求める。[v] 次に、この位置
情報を用いて必要な帯域の係数を選択する(黒塗りの部
分)。ここで選択された変換係数を、解像度変換された
アルファマップ信号にしたがって、図18(a)の変換
手段と逆の仮定を施すことで、解像度変換された画像を
得る。FIG. 19 shows a resolution conversion procedure. In FIG. 19, the original [i] alpha map signal is converted into an [ii] alpha map signal whose resolution has been converted to 5/8 in both horizontal and vertical directions, and [iii] as in the conversion procedure of FIG. 18 (a). Then, by rearranging in the horizontal direction and then rearranging in the [iv] vertical direction, the position of the conversion coefficient necessary to obtain a reproduced image with a resolution of 5/8 in both the horizontal and vertical directions is obtained. [v] Next, the coefficient of the required band is selected using this position information (black portion). A resolution-converted image is obtained by applying the inverse conversion to the conversion means of FIG. 18A to the conversion coefficient selected here according to the resolution-converted alpha map signal.
【0037】[0037]
【発明が解決しようとする課題】動画像の符号化/復号
化を行う場合、利用形態によっては符号化側での解像度
より低い解像度で復号化したいという要求がある。しか
し、符号化側での解像度と、復号化側での解像度が異な
ると、ミスマッチによる再生画像の劣化があり、これを
抑制できるようにすると共に、符号化側では効率の良い
符号化を可能にする技術の開発が必要である。When encoding / decoding a moving image, there is a demand for decoding at a resolution lower than the resolution on the encoding side, depending on the form of use. However, if the resolution on the encoding side and the resolution on the decoding side are different, there will be deterioration of the reproduced image due to mismatch, and this can be suppressed, and efficient encoding is possible on the encoding side. It is necessary to develop the technology to do so.
【0038】また、背景とオブジェクトを分離して符号
化する符号化技術があるが、このような符号化技術にお
いても、解像度と画質を可変とすることが可能なスケー
ラブル符号化が必要となる。Further, there is a coding technique for coding the background and the object separately, but such a coding technique also requires scalable coding capable of varying the resolution and the image quality.
【0039】しかし、これらの要求に応えることのでき
る技術はまだない。However, there is still no technology that can meet these demands.
【0040】そこで、この発明の目的とするところは、
第1には、符号化側での解像度と、復号化側での解像度
が異なる場合においても、ミスマッチが生じることがな
く、良質の画像を符号化/復号化できると共に、符号化
効率を保つことができるようにした画像符号化/復号化
装置を提供することにある。Therefore, the object of the present invention is to
First, even if the resolution on the encoding side and the resolution on the decoding side are different, a mismatch does not occur, a high-quality image can be encoded / decoded, and the encoding efficiency is maintained. Another object of the present invention is to provide an image encoding / decoding device capable of performing the above.
【0041】また、この発明の第2の目的とするところ
は、背景とオブジェクトを分離して符号化する符号化技
術において、ミスマッチが生じることがなく、解像度と
画質を可変とすることができるようにした画像符号化/
復号化装置を提供することにある。A second object of the present invention is to make it possible to make the resolution and the image quality variable without causing a mismatch in the coding technique for separately coding the background and the object. Image coding /
It is to provide a decoding device.
【0042】[0042]
【課題を解決するための手段】本発明は、前記第1の目
的を達成するため、第1には、N×N個(N:自然数)
の変換係数毎に変換係数領域での動き補償予測が用いら
れる動き補償予測+変換符号化装置において、局部復号
された変換係数を低域からn×n個(n=1〜N)選択
することにより、N階層の変換係数ピラミッドを作成す
る手段と、N階層の変換係数ピラミッドを各階層毎に逆
変換を施すことにより、N階層の再生画像ピラミッドを
作成する手段と、N階層の再生画像ピラミッドを各階層
毎に蓄積する手段と、前記蓄積手段に蓄積されている画
像を参照して、各階層毎に動き補償予測信号を作成する
手段と、前記動き補償予測信号を各階層毎に変換係数に
変換する手段と、前記変換係数を統合することにより動
き補償予測値を作成する手段を有する動画像符号化装置
を提供する。In order to achieve the first object of the present invention, firstly, N × N (N: natural number)
In the motion-compensated prediction + transform coding apparatus in which the motion-compensated prediction in the transform coefficient region is used for each transform coefficient of n, n × n (n = 1 to N) locally decoded transform coefficients are selected from the low band. Thus, means for creating a conversion coefficient pyramid of N layers, means for creating a reproduced image pyramid of N layers by performing inverse conversion of the conversion coefficient pyramid of N layers for each layer, and reproduced image pyramid of N layers For each layer, a unit for creating a motion compensation prediction signal for each layer by referring to the image stored in the storage unit, and a conversion coefficient for each motion compensation prediction signal for each layer. There is provided a moving picture coding apparatus having a means for converting to, and a means for creating a motion compensation prediction value by integrating the conversion coefficient.
【0043】また、本発明は、前記第1の目的を達成す
るため、第2には、前記第1の構成の符号化装置におい
て符号化された符号化ビットストリームの中から、第n
階層(n=1〜N)までの符号を取り出す手段と、復号
されたn×n個の変換係数から、n階層の変換係数ピラ
ミッドを作成する手段と、n階層の変換係数ピラミッド
を各階層毎に逆変換を施すことにより、n階層の再生画
像ピラミッドを作成する手段と、n階層の再生画像ピラ
ミッドを各階層毎に蓄積する手段と、前記蓄積手段に蓄
積されている画像を参照して、各階層毎に動き補償予測
信号を作成する手段と、前記動き補償予測信号を各階層
毎に変換係数に変換する手段と、前記変換係数を統合す
ることにより動き補償予測値を作成する手段を有し、第
n階層の再生画像を再生することを特徴とする動画像復
号化装置を提供する。In order to achieve the first object of the present invention, secondly, from the encoded bit stream encoded by the encoding device of the first configuration, the nth one is selected.
Means for extracting codes up to layers (n = 1 to N), means for creating transform coefficient pyramids for n layers from decoded n × n transform coefficients, and transform coefficient pyramids for n layers for each hierarchy By performing an inverse transformation on, the means for creating a reproduced image pyramid of n layers, the means for accumulating the reproduced image pyramid of n layers for each layer, and the image accumulated in the accumulating means are referred to, There are means for creating a motion compensation prediction signal for each layer, means for converting the motion compensation prediction signal into a transform coefficient for each layer, and means for creating a motion compensation prediction value by integrating the transform coefficients. Then, a moving picture decoding device is provided which reproduces a reproduced image of the nth layer.
【0044】また、本発明は、前記第1の目的を達成す
るため、第3には、前記第1の構成の符号化装置を用い
た、M階層(M:自然数)のSNRスケーラビリティを
実現する符号化装置であって、第m階層(m=2〜N)
の予測誤差信号と、第m−1階層の予測誤差信号の局部
再生値との差分信号を求める手段と、第m階層におい
て、前記差分信号を第m−1階層の量子化ステップサイ
ズよりも小さいステップサイズで量子化する手段と、逆
量子化された前記差分信号と、第m−1階層の予測誤差
信号の局部再生値を加算することで、第m階層の予測誤
差信号の局部再生値を求めることを特徴とする動画像符
号化装置を提供する。Further, in order to achieve the first object, the present invention thirdly realizes MNR (M: natural number) SNR scalability using the encoding device of the first configuration. An encoding device, which is the m-th layer (m = 2 to N)
Means for obtaining a difference signal between the prediction error signal of the M-th layer and the local reproduction value of the prediction error signal of the (M-1) -th layer, and the difference signal is smaller than the quantization step size of the (M-1) -th layer in the m-th layer. A unit for quantizing with the step size, the dequantized difference signal, and the local reproduction value of the prediction error signal of the m-1 th layer are added to obtain the local reproduction value of the prediction error signal of the m th layer. Provided is a moving picture coding device characterized by obtaining.
【0045】また、本発明は、前記第1の目的を達成す
るため、第4には、前記第3の構成の符号化装置で符号
化された符号化ビットストリームの中から、第m階層
(m=1〜M)までの符号を取り出す手段と、第m階層
までの各階層の符号を復号する手段と、前記手段により
復号された量子化値を各階層において逆量子化する手段
と、第m階層までの逆量子化値を加算する手段を、第2
の構成に付加した動画像復号化装置を提供する。Further, in order to achieve the first object of the present invention, fourthly, an m-th layer (from the coded bit stream coded by the coding device of the third structure) (m = 1 to M), means for extracting the codes of the respective layers up to the m-th layer, means for dequantizing the quantized value decoded by the means in each layer, The means for adding the inverse quantized values up to m layers is the second
A moving picture decoding device added to the above configuration.
【0046】また、本発明は、前記第2の目的を達成す
るため、第5には、N×N個の変換係数毎に変換係数領
域での動き補償予測が用いられる動き補償予測+変換符
号化装置において、入力画像の背景とオブジェクトを識
別するアルファマップ信号があって、アルファマップを
符号化する手段と、アルファマップにしたがって任意形
状画像を変換係数に変換する手段と、アルファマップに
したがって前記変換係数を逆変換することにより、任意
形状画像を再生する手段を有することを特徴とした画像
符号化装置を提供する。Further, in order to achieve the above-mentioned second object, the present invention, fifthly, motion-compensated prediction + transform code in which motion-compensated prediction in a transform coefficient region is used for each of N × N transform coefficients. In the digitizing device, there is an alpha map signal for identifying the background and the object of the input image, means for encoding the alpha map, means for converting the arbitrarily shaped image into conversion coefficients according to the alpha map, and the means according to the alpha map Provided is an image encoding device having a unit for reproducing an image of an arbitrary shape by inversely transforming a transform coefficient.
【0047】また、本発明は、前記第2の目的を達成す
るため、第6には、前記第5の構成の動画像符号化装置
において、アルファマップ信号を解像度変換してN階層
のアルファマップ信号ピラミッドを作成する手段と、各
階層毎に、アルファマップ信号にしたがって局部復号さ
れた変換係数を低域からn階層分(n=1〜N)選択す
ることにより、N階層の変換係数ピラミッドを作成する
手段と、N階層の変換係数ピラミッドを各階層毎にアル
ファマップ信号にしたがって逆変換を施すことにより、
N階層の再生画像ピラミッドを作成する手段と、N階層
の再生画像ピラミッドを各階層毎に蓄積する手段と、前
記蓄積手段に蓄積されている画像を参照して、各階層毎
にアルファマップ信号にしたがって動き補償予測信号を
作成する手段と、前記動き補償予測信号を各階層毎にア
ルファマップ信号にしたがって変換係数に変換する手段
と、アルファマップ信号ピラミッドにしたがって前記変
換係数を統合することにより、動き補償予測値を作成す
る手段を有する動画像符号化装置を提供する。In order to achieve the second object of the present invention, sixthly, in the moving picture coding apparatus of the fifth construction, sixthly, the resolution of the alpha map signal is converted to the alpha map of the N layer. A conversion coefficient pyramid of N layers is created by selecting a means for creating a signal pyramid and a conversion coefficient locally decoded according to an alpha map signal for n layers (n = 1 to N) for each hierarchy. By creating means and inverse transforming the transform coefficient pyramid of N layers according to the alpha map signal for each layer,
A means for creating a reproduced image pyramid of N layers, a means for accumulating the reproduced image pyramid of N layers for each layer, and an image stored in the accumulating means are referred to an alpha map signal for each layer. Therefore, by combining means for creating a motion-compensated prediction signal, means for converting the motion-compensated prediction signal into transform coefficients according to an alpha map signal for each layer, and integration of the transform coefficients according to an alpha map signal pyramid, Provided is a moving picture coding device having means for creating a compensation prediction value.
【0048】また、本発明は、前記第2の目的を達成す
るため、第7には、前記第5の構成の符号化装置で符号
化された符号化ビットストリームを復号化する動画像復
号化装置であって、アルファマップを復号化する手段
と、アルファマップにしたがって任意形状画像を変換係
数に変換する手段と、アルファマップにしたがって前記
変換係数を逆変換することにより、任意形状画像を再生
する手段を有することを特徴とした画像復号化装置を提
供する。In order to achieve the second object of the present invention, seventhly, moving picture decoding for decoding the coded bitstream coded by the coding apparatus of the fifth configuration is provided. An apparatus for reproducing an arbitrary shape image by decoding an alpha map, converting an arbitrary shape image into a conversion coefficient according to the alpha map, and inversely converting the conversion coefficient according to the alpha map. There is provided an image decoding device characterized by having means.
【0049】また、本発明は、前記第2の目的を達成す
るため、第8には、前記第6の構成の符号化装置におい
て符号化された符号化ビットストリームの中から、第n
階層(n=1〜N)までの符号を取り出す手段と、アル
ファマップ信号を復号する手段と、復号されたアルファ
マップ信号を解像度変換してN階層のアルファマップ信
号ピラミッドを作成する手段と、復号された変換係数か
ら、アルファマップ信号ピラミッドにしたがってn階層
の変換係数ピラミッドを作成する手段と、n階層の変換
係数ピラミッドを各階層毎にアルファマップ信号にした
がって逆変換を施すことにより、n階層の再生画像ピラ
ミッドを作成する手段と、n階層の再生画像ピラミッド
を各階層毎に蓄積する手段と、前記蓄積手段に蓄積され
ている画像を参照して、各階層毎にアルファマップ信号
にしたがって動き補償予測信号を作成する手段と、前記
動き補償予測信号を各階層毎にアルファマップ信号にし
たがって変換係数に変換する手段と、アルファマップ信
号ピラミッドにしたがって前記変換係数を統合すること
により動き補償予測値を作成する手段を有し、第n階層
の再生画像を再生することを特徴とする動画像復号化装
置を提供する。In order to achieve the second object of the present invention, eighthly, from the coded bit stream coded by the coding device of the sixth configuration, the nth coded stream is selected.
Means for extracting codes up to the hierarchy (n = 1 to N), means for decoding the alpha map signal, means for converting the resolution of the decoded alpha map signal to create an alpha map signal pyramid for the N hierarchy, and decoding A means for creating a conversion coefficient pyramid of n layers from the converted conversion coefficients according to the alpha map signal pyramid, and an inverse conversion of the conversion coefficient pyramid of the n layers according to the alpha map signal for each layer, A means for creating a reproduced image pyramid, a means for accumulating reproduced image pyramids of n layers for each layer, and a motion compensation according to an alpha map signal for each layer by referring to the images accumulated in the accumulating means. Means for creating a prediction signal, and a conversion coefficient for the motion-compensated prediction signal for each layer according to an alpha map signal A moving picture decoding apparatus having a converting means and a means for creating a motion-compensated prediction value by integrating the conversion coefficients according to the alpha map signal pyramid, and reproducing a reproduced image of the nth layer. I will provide a.
【0050】また、本発明は、前記第2の目的を達成す
るため、第9には、前記第5の構成の符号化装置を用い
た、M階層(M:自然数)のSNRスケーラビリティを
実現する符号化装置であって、第m階層(m=2〜N)
の予測誤差信号と、第m−1階層の予測誤差信号の局部
再生値との差分信号を求める手段と、第m階層におい
て、前記差分信号を第m−1階層の量子化ステップサイ
ズよりも小さいステップサイズで量子化する手段と、逆
量子化された前記差分信号と、第m−1階層の予測誤差
信号の局部再生値を加算することで、第m階層の予測誤
差信号の局部再生値を求めることを特徴とする動画像符
号化装置を提供する。In order to achieve the second object, the present invention, ninthly, realizes SNR scalability of M layers (M: natural number) using the encoding device of the fifth configuration. An encoding device, which is the m-th layer (m = 2 to N)
Means for obtaining a difference signal between the prediction error signal of the M-th layer and the local reproduction value of the prediction error signal of the (M-1) -th layer, and the difference signal is smaller than the quantization step size of the (M-1) -th layer in the m-th layer. A unit for quantizing with the step size, the dequantized difference signal, and the local reproduction value of the prediction error signal of the m-1 th layer are added to obtain the local reproduction value of the prediction error signal of the m th layer. Provided is a moving picture coding device characterized by obtaining.
【0051】また、本発明は、前記第2の目的を達成す
るため、第10には、前記第9の構成の符号化装置で符
号化された符号化ビットストリームの中から、第m階層
(m=1〜M)までの符号を取り出す手段と、第m階層
までの各階層の符号を復号する手段と、前記手段により
復号された量子化値を各階層において逆量子化する手段
と、第m階層までの逆量子化値を加算する手段を、前記
第7の構成に付加した構成の動画像復号化装置を提供す
る。In order to achieve the second object of the present invention, tenthly, from the coded bit stream coded by the coding device of the ninth configuration, the m-th layer ( (m = 1 to M), means for extracting the codes of the respective layers up to the m-th layer, means for dequantizing the quantized value decoded by the means in each layer, There is provided a moving picture decoding device having a configuration in which means for adding dequantized values up to m layers is added to the seventh configuration.
【0052】また、本発明は、前記第2の目的を達成す
るため、第11には、前記第6の構成の符号化装置を用
いた、M階層(M:自然数)のSNRスケーラビリティ
を実現する符号化装置であって、第m階層(m=2〜
N)の予測誤差信号と、第m−1階層の予測誤差信号の
局部再生値との差分信号を求める手段と、第m階層にお
いて、前記差分信号を第m−1階層の量子化ステップサ
イズよりも小さいステップサイズで量子化する手段と、
逆量子化された前記差分信号と、第m−1階層の予測誤
差信号の局部再生値を加算することで、第m階層の予測
誤差信号の局部再生値を求めることを特徴とする動画像
符号化装置を提供する。In order to achieve the second object, the present invention, eleventhly, realizes MNR (M: natural number) SNR scalability using the encoding device of the sixth configuration. An encoding device, wherein the m-th layer (m = 2 to
N) means for obtaining a difference signal between the prediction error signal and the local reproduction value of the prediction error signal of the (m-1) th layer, and in the mth layer, the difference signal is based on the quantization step size of the (m-1) th layer. And a means to quantize with a small step size,
A moving image code characterized by obtaining a local reproduction value of the prediction error signal of the m-th layer by adding the dequantized difference signal and the local reproduction value of the prediction error signal of the (m-1) th layer. To provide a rectification device.
【0053】また、本発明は、前記第2の目的を達成す
るため、第12には、前記第11の構成の符号化装置で
符号化された符号化ビットストリームの中から、第m階
層(m=1〜M)までの符号を取り出す手段と、第m階
層までの各階層の符号を復号する手段と、前記手段によ
り復号された量子化値を各階層において逆量子化する手
段と、第m階層までの逆量子化値を加算する手段とを第
8の構成に付加したことを特徴とする動画像復号化装置
を提供する。In the twelfth aspect of the present invention, in order to achieve the second object, the twelfth layer from the encoded bit stream encoded by the encoding apparatus having the eleventh configuration is (m = 1 to M), means for extracting the codes of the respective layers up to the m-th layer, means for dequantizing the quantized value decoded by the means in each layer, There is provided a moving picture decoding device characterized in that means for adding dequantized values up to m layers is added to the eighth configuration.
【0054】また、本発明は、前記第1の目的を達成す
るため、第13には、N×N個の変換係数毎に変換係数
領域での動き補償予測が用いられる動き補償予測+変換
符号化装置において、M階層のSNRスケーラビリティ
を実現する符号化装置であって、第m階層(m=2〜
M)の動き補償予測値と第m−1階層の局部再生値とを
変換係数毎に切り換えることで、第m階層の予測値を求
める手段と、第m−1階層における、予測誤差信号の量
子化値の絶対値がしきい値以下となる変換係数は第m階
層の動き補償予測値を、しきい値以上となる変換係数は
第m−1階層の局部再生値を出力するセレクタを有する
ことを特徴とする動画像符号化装置を提供する。In order to achieve the first object, the present invention, thirteenthly, is motion compensation prediction + conversion code in which motion compensation prediction in a conversion coefficient region is used for every N × N conversion coefficients. In the coding device, the coding device realizes SNR scalability of the M layer, which is the m-th layer (m = 2 to m = 2).
M) means for obtaining the prediction value of the m-th layer by switching the motion compensation prediction value and the local reproduction value of the (m-1) -th layer for each transform coefficient, and the quantum of the prediction error signal in the (m-1) -th layer. The conversion coefficient having an absolute value of the converted value less than or equal to the threshold value has a selector for outputting the motion-compensated prediction value of the m-th layer, and the conversion coefficient having the absolute value of the absolute value greater than or equal to the threshold value has a selector for outputting the local reproduction value of the m-1th layer. (EN) Provided is a moving picture coding device.
【0055】また、本発明は、前記第1の目的を達成す
るため、第14には、前記第13の構成の符号化装置で
符号化された符号化ビットストリームから、第m階層
(m=2〜M)までの符号を取り出す手段と、第m階層
までの各階層の符号を復号する手段と、前記手段により
復号された予測誤差信号の量子化値を各階層において逆
量子化する手段と、第m階層の動き補償予測値と第m−
1階層の再生値とを変換係数毎に切り換えることで、第
m階層の予測値を求める手段と、第m−1階層におけ
る、予測誤差信号の量子化値の絶対値がしきい値以下と
なる変換係数は第m階層の動き補償予測値を、しきい値
以上となる変換係数は第m−1階層の再生値を出力する
セレクタを有することを特徴とする動画像復号化装置を
提供する。Further, in order to achieve the first object of the present invention, fourteenth, from the coded bit stream coded by the coding apparatus of the thirteenth structure, the m-th layer (m = 2 to M), means for decoding the codes of each layer up to the m-th layer, and means for dequantizing the quantized value of the prediction error signal decoded by the means in each layer. , M-th layer motion compensation prediction value and m-th layer
Means for obtaining the prediction value of the m-th layer by switching the reproduction value of one layer for each transform coefficient, and the absolute value of the quantized value of the prediction error signal in the (m-1) -th layer becomes less than or equal to the threshold value. There is provided a moving picture decoding device characterized in that it has a selector for outputting a motion compensation prediction value of the m-th layer as a transform coefficient and a reproduction value of the m-1 th layer as a transform coefficient that is equal to or more than a threshold value.
【0056】このような構成の本発明によれば、N×N
個の変換係数毎に変換係数の領域で、動き補償を行う際
に、動き補償予測値をN階層の解像度毎に求めることで
ドリフトによる画質劣化を伴わずに、解像度の異なる再
生画像を得ることができる。According to the present invention having such a configuration, N × N
When motion compensation is performed in each transform coefficient region, a motion compensation prediction value is obtained for each resolution of N layers to obtain reproduced images with different resolutions without deterioration of image quality due to drift. You can
【0057】更に、本発明では、前記符号化装置とSN
Rスケーラビリティを組み合わせることにより解像度と
画質を多階層に分割したスケーラブル符号化が実現され
る。Further, in the present invention, the encoding device and the SN are
By combining R scalability, scalable coding is realized in which resolution and image quality are divided into multiple layers.
【0058】また、本発明では前記符号化装置におい
て、アルファマップ信号にしたがって、任意形状直交変
換を施すことにより、任意形状画像の解像度と画質を可
変とした再生画像が得られる。Further, according to the present invention, in the above-mentioned encoding device, a reproduced image in which the resolution and the image quality of the arbitrary shape image are variable is obtained by performing the arbitrary shape orthogonal transformation according to the alpha map signal.
【0059】[0059]
【発明の実施の形態】以下、図面を参照して本発明の具
体例を説明する。本発明は、図1の画像伝送システムに
おける送受信装置(図1のA、B)内の、画像符号化・
復号化装置に関するものである。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT A specific example of the present invention will be described below with reference to the drawings. The present invention is directed to image coding / reception in a transmitter / receiver (A and B in FIG. 1) in the image transmission system in FIG.
The present invention relates to a decoding device.
【0060】(第1の具体例)図2、図3および図4を
用いて、本発明の第1の具体例を説明する。第1の具体
例は、エンコード側とデコード側との解像度の違いによ
るミスマッチ防止をはかり、どのような解像度でもエン
コーダと同じ予測値が得られるようにして、ドリフトの
ない品位の高い画像を復元できるようにするシステムを
説明する。(First Specific Example) A first specific example of the present invention will be described with reference to FIGS. 2, 3 and 4. In the first specific example, mismatches due to the difference in resolution between the encoding side and the decoding side are prevented, and the same predicted value as that of the encoder can be obtained at any resolution, so that a high-quality image without drift can be restored. A system for doing so will be described.
【0061】《第1の具体例の符号化装置》図2(a)
は本発明を適用した画像符号化/復号化装置のエンコー
ド側のブロック図、図2(b)は、この図2(a)の構
成において用いる局部復号化回路の具体的構成例を示す
ブロック図である。<< Encoding Device of First Specific Example >> FIG. 2A
Is a block diagram on the encoding side of an image encoding / decoding device to which the present invention is applied, and FIG. 2B is a block diagram showing a specific configuration example of a local decoding circuit used in the configuration of FIG. 2A. Is.
【0062】はじめに、画像符号化装置から説明する。
図2(a)は、本発明が適用される、直交変換係数領域
での動き補償予測を用いた動き補償予測+直交変換符号
化装置(変換後差分構成)のブロック図である。First, the image coding apparatus will be described.
FIG. 2A is a block diagram of a motion compensation prediction + orthogonal transform coding device (post-transformation differential configuration) using motion compensation prediction in an orthogonal transform coefficient domain to which the present invention is applied.
【0063】図2(a)において、100は直交変換回
路、110は差分回路、120は量子化回路、130は
可変長符号化回路、140は逆量子化回路、200は局
部復号回路である。In FIG. 2A, reference numeral 100 is an orthogonal transformation circuit, 110 is a difference circuit, 120 is a quantization circuit, 130 is a variable length coding circuit, 140 is an inverse quantization circuit, and 200 is a local decoding circuit.
【0064】これらのうち、直交変換回路100は、画
像信号を直交変換処理するものであり、線10を介して
供給される画像信号をN×N画素毎にブロック分けし、
このブロック単位で例えば、DCT(離散コサイン変
換)により直交変換して、N×N個の変換係数を得るも
のである。Of these, the orthogonal transform circuit 100 is for performing an orthogonal transform process on the image signal, and divides the image signal supplied through the line 10 into N × N pixel blocks.
In this block unit, for example, DCT (discrete cosine transform) is used for orthogonal transform to obtain N × N transform coefficients.
【0065】また、差分回路110は、直交変換回路1
00より供給される直交変換係数と、局部復号回路20
0より線20を介して供給されるN×N個の変換係数の
予測値との予測誤差を計算するものである。量子化回路
120は、この差分回路110の求めた予測誤差を量子
化するものであり、可変長符号化回路130はこの量子
化回路120にて量子化された予測誤差信号を可変長符
号化するものであり、予測誤差信号の量子化値を可変長
符号化して、符号化した画像信号として線30を介して
出力するものである。The difference circuit 110 is the orthogonal transformation circuit 1
Orthogonal transform coefficient supplied from 00 and the local decoding circuit 20.
The prediction error is calculated from the prediction values of the N × N transform coefficients supplied through the twisted line 0. The quantizing circuit 120 quantizes the prediction error obtained by the difference circuit 110, and the variable length coding circuit 130 variable length codes the prediction error signal quantized by the quantizing circuit 120. That is, the quantized value of the prediction error signal is variable length coded and is output as a coded image signal via the line 30.
【0066】逆量子化回路140は、量子化回路120
からの量子化された予測誤差信号を受けてこれを逆量子
化して予測誤差信号の再生値を得る回路であり、当該予
測誤差信号の再生値を線40を介して局部復号回路20
0に供給する構成としてある。The inverse quantizer circuit 140 includes the quantizer circuit 120.
Is a circuit for receiving a quantized prediction error signal from the device and dequantizing the prediction error signal to obtain a reproduction value of the prediction error signal.
It is configured to supply 0.
【0067】局部復号回路200は、逆量子化回路14
0から得た予測誤差信号の再生値と前の画像から得た動
き補償予測値とを加算して変換係数の再生値を得、これ
を逆変換して局部復号信号を得ると共に、この得た局部
復号画像信号から動き補償予測値を生成し、この動き補
償予測値をN×N画素毎に直交変換して、N×N個の変
換係数の予測値を得るものである。The local decoding circuit 200 includes an inverse quantization circuit 14
The reproduced value of the prediction error signal obtained from 0 and the motion compensated predicted value obtained from the previous image are added to obtain the reproduced value of the transform coefficient, which is inversely transformed to obtain the local decoded signal, and this obtained value is obtained. A motion-compensated prediction value is generated from a locally decoded image signal, and this motion-compensated prediction value is orthogonally transformed for every N × N pixels to obtain N × N transform coefficient predicted values.
【0068】局部復号回路200は、加算回路201、
逆直交変換回路202、フレームメモリ203、動き補
償予測回路204、直交変換回路205から構成されて
いる。そして、局部復号回路200においては、逆量子
化回路140から得られた予測誤差信号の再生値と線2
0を介して供給される予測値とを加算回路201にて加
算することにより変換係数の再生値を得、逆直交変換回
路202はこの加算回路201にて得た変換係数を逆変
換してN×N画素毎の局部復号信号を得、フレームメモ
リ203は、この逆直交変換回路202より供給される
N×N画素毎の局部復号信号を蓄積することにより局部
復号画像を保持するものである。また、動き補償予測回
路204は、このフレームメモリ203に保持されてい
る局部復号画像の画像信号を用いて動き補償予測値を生
成するものであり、直交変換回路205は、この動き補
償予測回路204の生成した動き補償予測値をN×N画
素毎に直交変換し、変換係数を線20を介して出力する
構成である。The local decoding circuit 200 includes an adding circuit 201,
It is composed of an inverse orthogonal transform circuit 202, a frame memory 203, a motion compensation prediction circuit 204, and an orthogonal transform circuit 205. Then, in the local decoding circuit 200, the reproduction value of the prediction error signal obtained from the inverse quantization circuit 140 and the line 2
The predicted value supplied via 0 is added in the adder circuit 201 to obtain the reproduction value of the transform coefficient, and the inverse orthogonal transform circuit 202 inversely transforms the transform coefficient obtained in the adder circuit 201 to obtain N. The locally decoded signal for each × N pixel is obtained, and the frame memory 203 holds the locally decoded image by accumulating the locally decoded signal for each N × N pixel supplied from the inverse orthogonal transform circuit 202. Further, the motion compensation prediction circuit 204 is for generating a motion compensation prediction value using the image signal of the locally decoded image held in the frame memory 203, and the orthogonal transformation circuit 205 is for the motion compensation prediction circuit 204. This is a configuration in which the motion-compensated prediction value generated by is orthogonally transformed for each N × N pixel, and the transformation coefficient is output via the line 20.
【0069】このような構成の画像符号化装置におい
て、線10を介して画像信号を供給すると、この画像信
号は直交変換回路100により線N×N画素毎に直交変
換される。これによりN×N個の変換係数が得られる。
この得られた変換係数は差分回路110に入力される。In the image coding apparatus having such a configuration, when an image signal is supplied via the line 10, the image signal is orthogonally transformed for each line N × N pixels by the orthogonal transformation circuit 100. As a result, N × N transform coefficients are obtained.
The obtained conversion coefficient is input to the difference circuit 110.
【0070】差分回路110では、直交変換回路100
より供給される直交変換係数と、局部復号回路200よ
り線20を介して供給されるN×N個の変換係数の予測
値との予測誤差が計算される。そして、その計算結果は
量子化回路120に供給される。量子化回路120はこ
の予測誤差値を量子化する。量子化回路120にて量子
化された予測誤差信号は、可変長符号化回路130と逆
量子化回路140に供給される。In the difference circuit 110, the orthogonal transformation circuit 100
A prediction error between the orthogonal transform coefficient supplied from the local decoding circuit 200 and the predicted value of the N × N transform coefficients supplied from the local decoding circuit 200 via the line 20 is calculated. Then, the calculation result is supplied to the quantization circuit 120. The quantization circuit 120 quantizes this prediction error value. The prediction error signal quantized by the quantization circuit 120 is supplied to the variable length coding circuit 130 and the inverse quantization circuit 140.
【0071】可変長符号化回路130では予測誤差信号
の量子化値が可変長符号化され、線30を介して出力さ
れる。逆量子化回路140では、予測誤差信号を逆量子
化して予測誤差信号の再生値を得た後、線40を介して
局部復号回路200に供給する。In the variable length coding circuit 130, the quantized value of the prediction error signal is variable length coded and output via the line 30. The dequantization circuit 140 dequantizes the prediction error signal to obtain a reproduced value of the prediction error signal, and then supplies the reproduced value to the local decoding circuit 200 via the line 40.
【0072】局部復号回路200では、線40を介して
供給される予測誤差信号の再生値と線20を介して供給
される予測値とを加算回路201にて加算することによ
り変換係数の再生値を得た後、逆直交変換回路202に
供給する。逆直交変換回路202では加算回路201よ
り供給された変換係数を逆変換して局部復号信号を出力
する。In the local decoding circuit 200, the reproduction value of the conversion coefficient is added by adding the reproduction value of the prediction error signal supplied via the line 40 and the prediction value supplied via the line 20 in the addition circuit 201. Is obtained and then supplied to the inverse orthogonal transform circuit 202. The inverse orthogonal transform circuit 202 inversely transforms the transform coefficient supplied from the adder circuit 201 and outputs a locally decoded signal.
【0073】フレームメモリ203では、逆直交変換回
路202より供給されるN×N画素毎の局部復号信号を
蓄積して局部復号画像を得る。動き補償予測回路204
では、フレームメモリ203に蓄積されている局部復号
画像信号を用いて動き補償予測値を生成し、直交変換回
路205に供給する。直交変換回路205では、動き補
償予測値をN×N画素毎に直交変換し、変換係数を線2
0を介して出力する。In the frame memory 203, the locally decoded signal for each N × N pixel supplied from the inverse orthogonal transform circuit 202 is accumulated to obtain a locally decoded image. Motion compensation prediction circuit 204
Then, the motion-compensated prediction value is generated using the locally decoded image signal stored in the frame memory 203, and is supplied to the orthogonal transform circuit 205. The orthogonal transformation circuit 205 orthogonally transforms the motion-compensated prediction value for each N × N pixel, and transforms the transform coefficient into line 2
Output through 0.
【0074】このようにして、画像信号を圧縮符号化す
る場合に、直交変換したのち、局部復号回路200によ
り局部復号画像信号を用いて動き補償予測値を生成し、
これと画像信号を直交変換して得た変換係数との差分を
得て、予測誤差を得、この予測誤差を量子化した後、可
変長符号化するようにした。In this way, when the image signal is compression-encoded, after orthogonal transformation, the local decoding circuit 200 generates a motion compensation prediction value using the locally decoded image signal,
The difference between this and a transform coefficient obtained by orthogonally transforming the image signal is obtained, a prediction error is obtained, the prediction error is quantized, and then variable length coding is performed.
【0075】つぎに、局部復号回路200の具体例を図
2(b)に示す。Next, a concrete example of the local decoding circuit 200 is shown in FIG.
【0076】図2(b)において、211は加算回路、
220は係数選択回路、212は逆直交変換回路、21
3はフレームメモリ、214は動き補償予測回路、21
5は直交変換回路、230は係数統合回路である。In FIG. 2B, 211 is an adder circuit,
220 is a coefficient selection circuit, 212 is an inverse orthogonal transform circuit, 21
3 is a frame memory, 214 is a motion compensation prediction circuit, 21
5 is an orthogonal transformation circuit, and 230 is a coefficient integration circuit.
【0077】逆直交変換回路212、フレームメモリ2
13、動き補償予測回路214、直交変換回路215各
々は、変換係数がN×Nの構成であるとすれば、変換係
数が“1×1”〜“N×N”の構成のものをそれぞれ取
得できるようにするために、“1×1”用、“2×2”
用、〜“N−1×N−1”用、“N×N”用のそれぞれ
独立した系統を用意してあり、合計N系統分の構成とし
てある。Inverse orthogonal transform circuit 212, frame memory 2
13, the motion compensation prediction circuit 214, and the orthogonal transform circuit 215 each obtain a transform coefficient of “1 × 1” to “N × N”, assuming that the transform coefficient has an N × N configuration. To be able to do so, for "1x1", "2x2"
, .About. "N-1.times.N-1", and "N.times.N" independent systems are prepared for a total of N systems.
【0078】図2(b)の局部復号回路200におい
て、加算回路211は、線40を介して供給される予測
誤差信号の再生値と線20を介して供給される予測値
(動き補償予測値)とを加算することにより動き補償済
み変換係数の再生値(図3の(A))を得る回路であ
り、係数選択回路220は、この動き補償済み変換係数
の再生値である図3(A)のN×Nの変換係数の中か
ら、低域のn×n(n=1〜N)の変換係数を選択し、
図3(B)に示す“1×1”〜“N×N”のN階層のピ
ラミッドを構成し、各々の階層の変換係数を、対応の階
層の逆直交変換回路212に供給する機能を有するもの
である。In the local decoding circuit 200 of FIG. 2B, the adder circuit 211 uses the reproduction value of the prediction error signal supplied via the line 40 and the prediction value (motion compensation prediction value) supplied via the line 20. ) Is added to the motion-compensated conversion coefficient reproduction value ((A) in FIG. 3), and the coefficient selection circuit 220 is a reproduction value of the motion-compensated conversion coefficient in FIG. ), From the N × N conversion coefficients, the low-frequency n × n (n = 1 to N) conversion coefficients are selected,
A pyramid of N layers of “1 × 1” to “N × N” shown in FIG. 3B is formed, and it has a function of supplying the transform coefficient of each layer to the inverse orthogonal transform circuit 212 of the corresponding layer. It is a thing.
【0079】つまり、図3(A)のN×Nの変換係数の
中から、N×Nの変換係数組、N−1×N−1の変換係
数組、N−2×N−2の変換係数組、〜2×2の変換係
数組、1×1の変換係数組、の計N種の変換係数の組を
得、N系統分ある逆直交変換回路212のうち、それぞ
れの階層別の該当の系統の逆直交変換回路に入力する
(なお、変換係数の組はN種より少なくとも良い。例え
ば、“N×N”,“3N/4×3N/4”,“N/2×
N/2”,“N/4×N/4”,“1×1”の計5種の
変換係数の組とするといった具合である)。That is, among the N × N transform coefficients of FIG. 3A, N × N transform coefficient sets, N−1 × N−1 transform coefficient sets, and N−2 × N−2 transforms. A total of N types of conversion coefficient sets, that is, a coefficient set, a 2 × 2 conversion coefficient set, and a 1 × 1 conversion coefficient set, are obtained, and each of the N groups of inverse orthogonal transform circuits 212 has a corresponding level. Input to the inverse orthogonal transform circuit of the system (note that the set of transform coefficients is at least better than N. For example, “N × N”, “3N / 4 × 3N / 4”, “N / 2 ×”).
(N / 2 ”,“ N / 4 × N / 4 ”, and“ 1 × 1 ”, that is, a set of five conversion coefficients in total).
【0080】これは、図3(A)のN×Nの変換係数の
中から、単純に該当の係数部分を抽出することで足り
る。例えば、1×1の変換係数組は、1×1用の系統の
逆直交変換回路212(IOT1 )に与えられ、2×2
の変換係数組は、2×2用の系統の逆直交変換回路21
2(IOT2 )に与えられ、N−1×N−1の変換係数
組は、N−1×N−1用の系統の逆直交変換回路212
(IOTN-1 )に与えられ、N×Nの変換係数組は、N
×N用の系統の逆直交変換回路212(IOTN)に与
えられるといった具合である。This is sufficient by simply extracting the corresponding coefficient portion from the N × N conversion coefficients shown in FIG. For example, the 1 × 1 transform coefficient set is given to the inverse orthogonal transform circuit 212 (IOT 1 ) of the 1 × 1 system, and 2 × 2.
The transform coefficient set of is the inverse orthogonal transform circuit 21 of the 2 × 2 system.
2 (IOT 2 ), and the N−1 × N−1 transform coefficient set is the inverse orthogonal transform circuit 212 of the N−1 × N−1 system.
(IOT N-1 ), the set of N × N transform coefficients is N
It is given to the inverse orthogonal transform circuit 212 (IOT N ) of the × N system.
【0081】各系統別の逆直交変換回路212では、各
階層別に係数選択回路220より自己に供給された変換
係数を逆変換して局部復号信号を得るものであり、各系
統別の局部復号信号を示すと図3の(C)如きである。
1乃至N系統、それぞれで得た局部復号信号は、これら
を合わせて局部復号信号ピラミッドと呼ぶことにする。
この局部復号信号ピラミッド(図3の(C))は、直交
変換を用いて構成されたガウシアンピラミッドに相当す
る(ガウシアンピラミッドに関する参考文献:P.J.
Burt et.al“The Laplacian
Pyramidas a Compact Image
Code”,IEEE Trans. COM Vo
l.31,No.4,pp.532−540,Apri
l 1983)。The inverse orthogonal transform circuit 212 for each system obtains a locally decoded signal by inversely transforming the transform coefficient supplied to itself from the coefficient selection circuit 220 for each hierarchy, and the locally decoded signal for each system is obtained. Is shown in FIG. 3 (C).
The locally decoded signals obtained in each of the 1 to N systems will be collectively referred to as a locally decoded signal pyramid.
This locally decoded signal pyramid ((C) in FIG. 3) corresponds to a Gaussian pyramid constructed by using orthogonal transform (reference on Gaussian pyramid: PJ.
Burt et. al "The Laplacian
Pyramidas a Compact Image
Code ”, IEEE Trans. COM Vo
l. 31, No. 4, pp. 532-540, Apri
1983).
【0082】1乃至N系統の各系統別フレームメモリ2
13は、逆直交変換回路212より供給される該当の系
統の局部復号信号を蓄積して自系統の局部復号画像を得
るものであり、1乃至N系統の各フレームメモリ213
において蓄積して得られた各階層毎の局部復号画像を、
合わせて局部復号画像ピラミッドと呼ぶことにする。Frame memory 2 for each system of 1 to N systems
Reference numeral 13 is a unit for accumulating locally decoded signals of the relevant system supplied from the inverse orthogonal transform circuit 212 to obtain a locally decoded image of its own system, and each frame memory 213 of 1 to N systems.
The locally decoded image for each layer obtained by accumulating in
Together, they will be called locally decoded image pyramids.
【0083】これにより、1×1の変換係数組は、1×
1用の系統のフレームメモリ213(FM1 )に蓄積さ
れて直流成分のみの局部復号信号(第1低周波項の局部
復号信号)が得られ、2×2の変換係数組は、2×2用
のフレームメモリ213(FM2 )に蓄積されて直流成
分と交流成分のうちの最も低い周波数成分からなる局部
復号信号(第1および第2低周波項からなる局部復号信
号)が得られ、N×Nの変換係数組は、N×N用のフレ
ームメモリ213(FMN )に蓄積されて直流成分とN
−1次分までの交流成分からなる局部復号信号(第1低
周波項乃至第N低周波項からなる局部復号信号)が得ら
れる。As a result, the set of 1 × 1 transform coefficients is 1 ×
The local decoded signal (local decoded signal of the first low frequency term) of only the DC component is obtained by accumulating in the frame memory 213 (FM 1 ) of the system for 1 and the 2 × 2 transform coefficient set is 2 × 2. A local decoded signal (locally decoded signal composed of first and second low-frequency terms), which is stored in the frame memory 213 (FM 2 ) for use in the video signal and has the lowest frequency component of the DC component and the AC component, is obtained. The conversion coefficient set of × N is stored in the frame memory 213 (FM N ) for N × N to generate the DC component and N.
A locally decoded signal composed of AC components up to the -1st order (a locally decoded signal composed of the first low-frequency term to the Nth low-frequency term) is obtained.
【0084】動き補償予測回路214は、フレームメモ
リ213に蓄積されている局部復号画像信号を用いて各
階層毎に動き補償予測値を生成するものであって、1乃
至N系統の各系統別動き補償予測回路214は、それぞ
れ自系統のフレームメモリ213に蓄積されている局部
復号画像信号を用いて自系統対応の階層の動き補償予測
値を生成する構成となっている。The motion compensation prediction circuit 214 generates a motion compensation prediction value for each layer by using the locally decoded image signal stored in the frame memory 213. The compensation prediction circuit 214 is configured to generate a motion-compensated prediction value of a layer corresponding to its own system by using the locally decoded image signals stored in the frame memory 213 of its own system.
【0085】直交変換回路215は、動き補償予測値を
各階層毎に直交変換し、図3の(D)における網掛け部
の変換係数を係数統合回路230に供給するものであ
る。すなわち、1乃至N系統の各系統別直交変換回路2
15は、各系統別動き補償予測回路214のうちのそれ
ぞれ対応する系統の生成する動き補償予測値を受けて直
交変換するものであり、例えば、第1系統の直交変換回
路215(OT1 )であれば、直流成分の周波数帯(第
1低周波項)の動き補償予測値を、第2系統の直交変換
回路215(OT2 )であれば、直流成分の次の周波数
帯(第2低周波項)の動き補償予測値を、第3系統の直
交変換回路215(OT3 )であれば、直流成分の次々
周波数帯(第3低周波項)の動き補償予測値を、第N系
統の直交変換回路215(OTN )であれば、最上位項
の周波数帯(第N周波項)の動き補償予測値を、出力す
るものである。The orthogonal transformation circuit 215 orthogonally transforms the motion compensation prediction value for each layer and supplies the transformation coefficient of the hatched portion in FIG. 3D to the coefficient integration circuit 230. That is, the orthogonal transform circuit 2 for each system of 1 to N systems
Reference numeral 15 denotes an orthogonal transformation circuit that receives a motion compensation prediction value generated by a system corresponding to each system motion compensation prediction circuit 214 and performs orthogonal transformation, for example, by the first system orthogonal transformation circuit 215 (OT 1 ). If there is, the motion compensation prediction value of the frequency band of the DC component (first low frequency term) is the second frequency band of the DC component (second low frequency) if the orthogonal transformation circuit 215 (OT 2 ) of the second system. If the motion compensation prediction value of the third system is the orthogonal transformation circuit 215 (OT 3 ) of the third system, the motion compensation prediction value of the next frequency band of the DC component (third low frequency term) is the orthogonal system of the Nth system. If it is the conversion circuit 215 (OT N ), it outputs the motion compensation prediction value of the frequency band of the highest order term (Nth frequency term).
【0086】係数統合回路230は、各直交変換回路2
15から出力された各階層の動き補償予測値の直交変換
による変換係数を受けて、帯域毎に統合したN×N個の
変換係数予測値(図3の(E))を線20を介して出力
するものである。The coefficient integration circuit 230 uses the orthogonal transformation circuits 2
15 receives the conversion coefficient by the orthogonal transformation of the motion compensation prediction value of each layer output from 15 and receives N × N conversion coefficient prediction values ((E) in FIG. 3) integrated for each band via the line 20. It is what is output.
【0087】このような構成の局部復号回路200の作
用は、つぎの通りである。線40を介して供給される予
測誤差信号の再生値と線20を介して供給される予測値
(動き補償予測値)とを加算回路211にて加算するこ
とにより、動き補償済み変換係数の再生値(図3の
(A))を得る。この動き補償済み変換係数の再生値は
係数選択回路220に供給され、係数選択回路220で
は、図3(A)のN×Nの変換係数の中から、低域のn
×n(n=1〜N)の変換係数を選択し、図3(B)に
示す“1×1”〜“N×N”のN階層のピラミッドを構
成し、各々の階層の変換係数を逆直交変換回路212に
供給する。The operation of the local decoding circuit 200 having such a configuration is as follows. The addition circuit 211 adds the reproduction value of the prediction error signal supplied via the line 40 and the prediction value (motion compensation prediction value) supplied via the line 20 to reproduce the motion-compensated conversion coefficient. A value ((A) in FIG. 3) is obtained. The reproduction value of the motion-compensated conversion coefficient is supplied to the coefficient selection circuit 220, and in the coefficient selection circuit 220, the low-frequency n is selected from the N × N conversion coefficients of FIG.
The conversion coefficients of × n (n = 1 to N) are selected, the pyramids of N layers of “1 × 1” to “N × N” shown in FIG. The signal is supplied to the inverse orthogonal transform circuit 212.
【0088】つまり、図3(A)のN×Nの変換係数の
中から、N×Nの変換係数組、N−1×N−1の変換係
数組、N−2×N−2の変換係数組、〜2×2の変換係
数組、1×1の変換係数組、の計N種の変換係数の組を
得る。これは図3(A)のN×Nの変換係数の中から、
単純に該当の係数部分を抽出することで足りる。That is, from among the N × N transform coefficients of FIG. 3A, N × N transform coefficient sets, N−1 × N−1 transform coefficient sets, and N−2 × N−2 transforms. A total of N types of conversion coefficient sets, that is, a coefficient set, a 2 × 2 conversion coefficient set, and a 1 × 1 conversion coefficient set are obtained. From the N × N conversion coefficients in FIG.
It suffices to simply extract the relevant coefficient part.
【0089】逆直交変換回路212では、各階層毎に係
数選択回路220より供給された変換係数を逆変換して
局部復号信号ピラミッド(図3の(C))を出力する。The inverse orthogonal transform circuit 212 inversely transforms the transform coefficient supplied from the coefficient selection circuit 220 for each layer and outputs a local decoded signal pyramid ((C) in FIG. 3).
【0090】この局部復号信号ピラミッド(図3の
(C))は、直交変換を用いて構成されたガウシアンピ
ラミッドに相当する。This locally decoded signal pyramid ((C) of FIG. 3) corresponds to a Gaussian pyramid constructed by using orthogonal transform.
【0091】フレームメモリ213では、逆直交変換回
路212より供給される局部復号信号ピラミッドを各階
層毎に蓄積して局部復号画像ピラミッドを得る。In the frame memory 213, the locally decoded signal pyramid supplied from the inverse orthogonal transform circuit 212 is accumulated for each layer to obtain a locally decoded image pyramid.
【0092】動き補償予測回路214では、フレームメ
モリ213に蓄積されている局部復号画像信号を用いて
各階層毎に動き補償予測値を生成し、直交変換回路21
5に供給する。直交変換回路215では、動き補償予測
値を各階層毎に直交変換し、図3の(D)における斜線
部の変換係数を係数統合回路230に供給する。The motion compensation prediction circuit 214 generates a motion compensation prediction value for each layer using the locally decoded image signal stored in the frame memory 213, and the orthogonal transformation circuit 21.
5 The orthogonal transform circuit 215 orthogonally transforms the motion compensation prediction value for each layer, and supplies the transform coefficient in the shaded area in FIG. 3D to the coefficient integration circuit 230.
【0093】係数統合回路230では、各階層の変換係
数を帯域毎に統合したN×N個の変換係数予測値を線2
0を介して出力する。なお、動き補償に用いる動きベク
トルは、各階層毎に求めても良いし、第N階層で求めて
きた動きベクトルをn/Nに縮小して、第n階層に用い
てもドリフトは生じない。また、図2(b)中での点A
〜Eは、各々図3の(A)〜(E)に対応する。In the coefficient integration circuit 230, the N × N conversion coefficient prediction values obtained by integrating the conversion coefficients of the respective layers for each band are drawn in line 2.
Output through 0. The motion vector used for motion compensation may be obtained for each layer, or even if the motion vector obtained in the Nth layer is reduced to n / N and used in the nth layer, no drift occurs. In addition, point A in FIG.
3E correspond to (A) to (E) of FIG. 3, respectively.
【0094】このようにして、画像信号を圧縮符号化す
る場合に、直交変換した後、局部復号回路200により
局部復号画像信号を用いて動き補償予測値を生成し、こ
れと画像信号を直交変換して得た変換係数との差分を得
て、予測誤差を得、この予測誤差を量子化した後、可変
長符号化するようにした。特に、局部復号画像信号は、
画像信号をN×N画素でブロック分けして直交変換し、
圧縮符号化する場合に、1×1,2×2,3×3,〜N
×Nの変換係数からなる各階層毎に、それぞれ変換係数
を逆変換して局部復号信号ピラミッドを得、これを各階
層別にフレームメモリに蓄積して各階層別局部復号画像
を得、これより各階層別にその階層での最大の周波項の
成分についての動き補償予測値を求め、これをそれぞれ
直交変換して統合することにより、N×Nの変換係数構
成の階層における動き補償予測値を求めるようにした。
そのため、各階層別に動き補償予測値とn×n対応階層
に対応する逆直交変換出力が、ミスマッチを伴うことな
く再生可能になる(但し、n=1〜Nの自然数)。In this way, when the image signal is compression-encoded, after orthogonal transformation, the local decoding circuit 200 generates a motion compensation prediction value using the locally decoded image signal, and orthogonally transforms this and the image signal. The difference from the obtained transform coefficient is obtained to obtain the prediction error, and the prediction error is quantized and then variable-length coded. In particular, the locally decoded image signal is
The image signal is divided into blocks by N × N pixels and orthogonally transformed,
When compression-encoded, 1 × 1, 2 × 2, 3 × 3, ... N
For each layer consisting of × N transform coefficients, the transform coefficient is inversely transformed to obtain a locally decoded signal pyramid, which is stored in a frame memory for each layer to obtain a locally decoded image for each layer. The motion compensation prediction value for the component of the maximum frequency term in the hierarchy is obtained for each hierarchy, and the motion compensation prediction value in the hierarchy having the N × N transform coefficient configuration is obtained by orthogonally transforming and integrating the motion compensation prediction values. I chose
Therefore, the motion-compensated prediction value for each layer and the inverse orthogonal transform output corresponding to the n × n corresponding layer can be reproduced without any mismatch (however, n = 1 to N is a natural number).
【0095】《第1の具体例の復号化装置》図4は、図
2の符号化装置は符号化されたビットストリームを復号
化して再生画像を得る復号化装置のブロック図である。<< Decoding Device of First Specific Example >> FIG. 4 is a block diagram of a decoding device for decoding a coded bit stream to obtain a reproduced image in the coding device of FIG.
【0096】図4(a)において、150は可変長復号
化回路、160は逆量子化回路、300は復号回路であ
る。復号回路300は、加算回路301、逆直交変換回
路302、フレームメモリ303、動き補償予測回路3
04、直交変換回路305から構成される。In FIG. 4A, 150 is a variable length decoding circuit, 160 is an inverse quantization circuit, and 300 is a decoding circuit. The decoding circuit 300 includes an adder circuit 301, an inverse orthogonal transform circuit 302, a frame memory 303, and a motion compensation prediction circuit 3.
04, the orthogonal transformation circuit 305.
【0097】可変長復号化回路150は、符号化ビット
ストリームを予測誤差信号に復号するものであり、逆量
子化回路160は、この復号された予測誤差信号を逆量
子化して予測誤差信号の再生値を得るものであり、復号
回路300は、この予測誤差信号の再生値と前のフレー
ムから得られる予測誤差の予測値とを加算することによ
り変換係数の再生値を得た後、これを直交変換の逆変換
をして得た信号を復号信号として出力するものである。The variable length decoding circuit 150 decodes the coded bit stream into a prediction error signal, and the dequantization circuit 160 dequantizes the decoded prediction error signal to reproduce the prediction error signal. The decoding circuit 300 adds the reproduction value of this prediction error signal and the prediction value of the prediction error obtained from the previous frame to obtain the reproduction value of the transform coefficient, and then orthogonalizes this. The signal obtained by performing the inverse conversion of the conversion is output as a decoded signal.
【0098】具体的には、この復号回路300は、逆量
子化回路160から与えられる予測誤差信号の再生値と
直交変換回路305より供給される予測値とを加算回路
301にて加算することにより変換係数の再生値を得た
後、この変換係数再生値を逆直交変換回路302におい
て逆変換して得た信号を復号信号として出力すると共
に、この復号信号をフレームメモリ303に蓄積し、フ
レームメモリ303ではN×N画素毎の復号信号を蓄積
することにより復号画像を得、さらに動き補償予測回路
304において、フレームメモリ303に蓄積されてい
る復号画像信号を用いて動き補償予測値を生成し、これ
を直交変換回路305にて、N×N画素毎に直交変換
し、得られた変換係数を加算回路301に供給する。Specifically, the decoding circuit 300 adds the reproduced value of the prediction error signal supplied from the dequantization circuit 160 and the prediction value supplied from the orthogonal transformation circuit 305 by the addition circuit 301. After obtaining the reproduced value of the transform coefficient, the signal obtained by inversely transforming the reproduced value of the transform coefficient in the inverse orthogonal transform circuit 302 is output as a decoded signal, and the decoded signal is accumulated in the frame memory 303, In 303, a decoded image is obtained by accumulating the decoded signal for each N × N pixel, and in the motion compensation prediction circuit 304, a motion compensated prediction value is generated using the decoded image signal accumulated in the frame memory 303, The orthogonal transformation circuit 305 performs orthogonal transformation for each N × N pixels, and the obtained transformation coefficient is supplied to the addition circuit 301.
【0099】このような構成において、その作用を説明
する。図2の符号化装置にて符号化されたビットストリ
ームが、線50を介して可変長復号化回路150に供給
されると、この符号化ビットストリームはこの可変長復
号化回路150で、予測誤差信号に復号された後、逆量
子化回路160に供給される。逆量子化回路160で
は、予測誤差信号を逆量子化して予測誤差信号の再生値
を得た後、線60を介して復号回路300に供給する。
復号回路300では、線60を介して供給される予測誤
差信号の再生値と直交変換回路305より供給される予
測値とを加算回路301にて加算することにより変換係
数の再生値を得た後、逆直交変換回路302に供給す
る。The operation of this structure will be described. When the bitstream coded by the coding apparatus of FIG. 2 is supplied to the variable length decoding circuit 150 via the line 50, the coding bitstream is predicted by the variable length decoding circuit 150. After being decoded into a signal, it is supplied to the inverse quantization circuit 160. The dequantization circuit 160 dequantizes the prediction error signal to obtain a reproduction value of the prediction error signal, and then supplies it to the decoding circuit 300 via the line 60.
In the decoding circuit 300, after the reproduction value of the prediction error signal supplied via the line 60 and the prediction value supplied from the orthogonal transformation circuit 305 are added by the addition circuit 301, the reproduction value of the transform coefficient is obtained. , To the inverse orthogonal transform circuit 302.
【0100】逆直交変換回路302では加算回路301
より供給された変換係数を逆変換して復号信号を線70
を介して出力する。フレームメモリ303では、逆直交
変換回路302より供給されるN×N画素毎の復号信号
を蓄積して復号画像を得る。動き補償予測回路304で
は、フレームメモリ303に蓄積されている復号画像信
号を用いて動き補償予測値を生成し、直交変換回路30
5に供給する。直交変換回路305では、動き補償予測
値をN×N画素毎に直交変換し、変換係数を加算回路3
01に供給する。In the inverse orthogonal transformation circuit 302, the addition circuit 301
The transform coefficient supplied by the inverse transform is applied to the decoded signal on the line 70.
Output via. The frame memory 303 accumulates the decoded signal for each N × N pixel supplied from the inverse orthogonal transform circuit 302 to obtain a decoded image. The motion compensation prediction circuit 304 generates a motion compensation prediction value using the decoded image signal stored in the frame memory 303, and the orthogonal transformation circuit 30
5 The orthogonal transformation circuit 305 orthogonally transforms the motion-compensated predicted value for each N × N pixels, and adds the transformation coefficient to the addition circuit 3.
01.
【0101】《第1の具体例における復号回路300の
構成例》図4(b)は、本発明の具体例である局部復号
回路200に対応する復号回路300の具体例である。
本具体例では、N階層に階層化されたデータのうち、低
域からn階層分のデータを復号して、水平・垂直共にn
/Nの解像度の再生画像を得る場合について述べる。<< Configuration Example of Decoding Circuit 300 in First Specific Example >> FIG. 4B is a specific example of the decoding circuit 300 corresponding to the local decoding circuit 200 which is a specific example of the present invention.
In this specific example, out of the data hierarchically divided into N layers, data for n layers from the low frequency band is decoded to obtain n in both horizontal and vertical directions.
A case of obtaining a reproduced image with a resolution of / N will be described.
【0102】図4(b)に示すように、復号回路300
は、加算回路311、係数選択回路320、逆直交変換
回路312、フレームメモリ313、動き補償予測回路
314、直交変換回路315、係数統合回路330より
構成される。As shown in FIG. 4B, the decoding circuit 300
Is composed of an addition circuit 311, a coefficient selection circuit 320, an inverse orthogonal transformation circuit 312, a frame memory 313, a motion compensation prediction circuit 314, an orthogonal transformation circuit 315, and a coefficient integration circuit 330.
【0103】この例では、逆直交変換回路312、フレ
ームメモリ313、動き補償予測回路314、直交変換
回路315各々は、N階層に階層化されたデータのう
ち、低域からn階層分のデータを復号して、水平・垂直
共にn/Nの解像度の再生画像を得るようにする場合
に、変換係数が“1×1”〜“n×n”(但し、n=1
〜N)の構成のものをそれぞれ取得できるようにするた
めに、“1×1”用、“2×2”用、〜“n−1×n−
1”用、“n×n”用のそれぞれ独立した系統を用意し
てあり、合計n系統分の構成としてある。In this example, each of the inverse orthogonal transform circuit 312, the frame memory 313, the motion compensation prediction circuit 314, and the orthogonal transform circuit 315 converts the data of the lower layer to the nth layer among the data layered in the N layer. When decoding is performed to obtain a reproduced image with a resolution of n / N in both horizontal and vertical directions, conversion coefficients are "1 × 1" to "n × n" (where n = 1.
~ N), so that each of the configurations can be acquired, "1x1", "2x2", "n-1xn-"
Independent systems for "1" and "n × n" are prepared, and a total of n systems are provided.
【0104】加算回路311は、逆量子化回路160か
ら与えられる予測誤差信号の再生値と、係数統合回路3
30より供給される予測値とを加算することにより、変
換係数の再生値を得るものであり、係数選択回路320
は、加算回路311により得られる変換係数の再生値を
n階層のピラミッドに編成し、各階層別に分配するもの
であって、本具体例では第1階層からn階層までを使用
して画像復号することを目指すので、“1×1”〜“n
×n”の各階層分を分離分配する構成である。The adder circuit 311 is provided with the reproduction value of the prediction error signal supplied from the inverse quantization circuit 160 and the coefficient integration circuit 3
The predicted value supplied from 30 is added to obtain the reproduction value of the conversion coefficient, and the coefficient selection circuit 320
Is to organize the reproduced values of the transform coefficient obtained by the adder circuit 311 into pyramids of n layers and distribute them to each layer. In this specific example, image decoding is performed using the first layer to the nth layer. "1 x 1" to "n" because we aim to
In this configuration, each layer of “× n” is separated and distributed.
【0105】逆直交変換回路312は、変換係数を逆直
交変換するものであり、各階層別に設けられていて、係
数選択回路320により各階層分に分離分配されたもの
のうち、対応する階層のものを逆直交変換して復号する
構成としてある。The inverse orthogonal transform circuit 312 is for performing an inverse orthogonal transform on the transform coefficient, is provided for each hierarchical layer, and of the hierarchically separated layers distributed by the coefficient selection circuit 320 for each hierarchical layer, the corresponding hierarchical layer. Is inversely orthogonally transformed and decoded.
【0106】すなわち、係数選択回路320により“1
×1”〜“n×n”の各階層のものが分配されるが、
“1×1”の階層のものは、1×1用の系統の逆直交変
換回路312(IOT1 )に与えられ、“2×2”の階
層のものは、2×2用の系統の逆直交変換回路312
(IOT2 )に与えられ、“n−1×n−1”の階層の
ものは、n−1×n−1用の系統の逆直交変換回路31
2(IOTN-1 )に与えられ、“n×n”の階層のもの
は、n×n用の系統の逆直交変換回路312(IO
TN )に与えられるといった具合である。That is, the coefficient selection circuit 320 sets the value to "1".
The ones in each layer of "x1" to "nxn" are distributed,
The “1 × 1” hierarchy is given to the inverse orthogonal transformation circuit 312 (IOT 1 ) for the 1 × 1 system, and the “2 × 2” hierarchy is the inverse of the 2 × 2 system. Orthogonal transformation circuit 312
(IOT 2 ), the one of the hierarchy of “n−1 × n−1” is the inverse orthogonal transform circuit 31 of the system for n−1 × n−1.
2 (IOT N-1 ) and the "n × n" hierarchy is the inverse orthogonal transform circuit 312 (IO) of the n × n system.
T N ).
【0107】n系統分ある逆直交変換回路312では、
各階層毎に係数選択回路320より供給された変換係数
を逆変換して復号信号ピラミッドをフレームメモリ31
3に供給するが、n×n用の系統の逆直交変換回路31
2(IOTN )の逆変換出力である復号信号は線70を
介して最終的な画像信号出力とする。In the inverse orthogonal transform circuit 312 having n systems,
The transform signal supplied from the coefficient selection circuit 320 is inversely transformed for each layer to convert the decoded signal pyramid to the frame memory 31.
3, the inverse orthogonal transform circuit 31 of the n × n system is supplied.
The decoded signal which is the inverse transform output of 2 (IOT N ) is the final image signal output via line 70.
【0108】n系統分あるフレームメモリ313は、対
応する系統の逆直交変換回路312より供給される復号
信号を各階層毎に蓄積して復号画像ピラミッドを得る。The frame memory 313 for n systems accumulates the decoded signals supplied from the inverse orthogonal transform circuit 312 of the corresponding system for each layer to obtain a decoded image pyramid.
【0109】すなわち、“1×1”の階層の復号信号
は、1×1用の系統のフレームメモリ313(FM1 )
に蓄積されて直流成分のみによる画像の復号信号(第1
低周波項からなる復号信号)が得られ、“2×2”の階
層の復号信号は、2×2用のフレームメモリ313(F
M2 )に蓄積されて直流成分と交流成分のうちの最も低
い周波数成分からなる画像の復号信号(第1および第2
低周波項からなる復号信号)が得られ、“n×n”の階
層の復号信号は、n×n用の系統のフレームメモリ31
3(FMN )に蓄積されて直流成分から交流成分のうち
のn−1次分までの成分からなる復号信号(第1低周波
項乃至第n低周波項からなる復号信号)が得られる。That is, the decoded signal of the "1 × 1" layer is the frame memory 313 (FM 1 ) of the 1 × 1 system.
The image decoded signal (first
A decoded signal composed of a low frequency term) is obtained, and the decoded signal of the “2 × 2” hierarchy is the 2 × 2 frame memory 313 (F
The decoded signal (first and second ) of the image, which is accumulated in M 2 ) and has the lowest frequency component of the DC component and the AC component
A decoded signal composed of low-frequency terms is obtained, and the decoded signal of the “n × n” hierarchy is the frame memory 31 of the n × n system.
3 (FM N ) to obtain a decoded signal (decoded signal including the first low-frequency term to the n-th low-frequency term) including the components from the direct current component to the alternating current component up to the (n-1) th order.
【0110】動き補償予測回路314は、フレームメモ
リ313に蓄積されている復号画像信号を用いて各階層
毎に動き補償予測値を生成するものであって、1乃至n
系統の各系統別動き補償予測回路314は、それぞれ自
系統のフレームメモリ313に蓄積されている復号画像
信号を用いて自系統対応の階層の動き補償予測値を生成
する構成となっている。The motion compensation prediction circuit 314 generates a motion compensation prediction value for each layer using the decoded image signal stored in the frame memory 313.
The motion compensation prediction circuit 314 for each system of the system is configured to generate a motion compensation prediction value of a hierarchy corresponding to the system using the decoded image signal accumulated in the frame memory 313 of the system.
【0111】直交変換回路315は、動き補償予測値を
各階層毎に直交変換し、図3の(D)における網掛け表
示部の領域の変換係数を係数統合回路330に供給する
ものである。すなわち、1乃至n系統の各系統別直交変
換回路315は、各系統別動き補償予測回路314のう
ちのそれぞれ対応する系統の生成する動き補償予測値を
受けて直交変換するものであり、例えば、第1系統の直
交変換回路315(OT1 )であれば、直流成分の周波
数帯(第1低周波項)の動き補償予測値を、第2系統の
直交変換回路315(OT2 )であれば、直流成分の次
の周波数帯(第2低周波項)の動き補償予測値を、第3
系統の直交変換回路315(OT3 )であれば、直流成
分の次々周波数帯(第3低周波項)の動き補償予測値
を、第n系統の直交変換回路315(OTN )であれ
ば、n位項の周波数帯(第n低周波項)の動き補償予測
値を、出力するものである。The orthogonal transformation circuit 315 orthogonally transforms the motion compensation prediction value for each layer and supplies the transformation coefficient of the area of the hatched display portion in FIG. 3D to the coefficient integration circuit 330. That is, the 1- to n-system orthogonal transform circuits 315 receive the motion-compensated prediction values generated by the respective systems of the motion-compensation prediction circuits 314 and perform orthogonal transform. In the case of the first system orthogonal transformation circuit 315 (OT 1 ), the motion compensation prediction value of the frequency band of the DC component (first low frequency term) is calculated in the case of the second system orthogonal transformation circuit 315 (OT 2 ). , The motion compensation prediction value of the frequency band next to the DC component (second low frequency term)
In the case of the orthogonal transformation circuit 315 (OT 3 ) of the system, the motion compensation prediction value of the next frequency band of the DC component (third low frequency term) is calculated by the orthogonal transformation circuit 315 (OT N ) of the n-th system. The motion compensation prediction value in the frequency band of the nth term (nth low frequency term) is output.
【0112】係数統合回路330は、各階層の変換係数
を帯域毎に統合したn×n個の変換係数予測値を加算回
路311に供給するものである。The coefficient integrating circuit 330 supplies n × n transform coefficient prediction values, which are obtained by integrating the transform coefficients of each layer for each band, to the adding circuit 311.
【0113】このような構成において、加算回路311
では、線60を介して供給される予測誤差信号の再生値
と、係数統合回路330より供給される予測値とを加算
することにより、変換係数の再生値を得た後、係数選択
回路320に供給する。係数選択回路320では、“1
×1”〜“n×n”のn階層のピラミッドを構成し、各
々の階層の変換係数を階層別に設けた逆直交変換回路3
12のうちの対応するものに供給する。In such a configuration, the adder circuit 311
Then, the reproduction value of the prediction error signal supplied via the line 60 and the prediction value supplied from the coefficient integration circuit 330 are added to obtain the reproduction value of the conversion coefficient, and then the coefficient selection circuit 320 is supplied. Supply. In the coefficient selection circuit 320, “1
An inverse orthogonal transform circuit 3 which constitutes a pyramid of n layers of "x1" to "nxn", and transform coefficients of each layer are provided for each layer.
Feed to the corresponding of twelve.
【0114】逆直交変換回路312では、各階層毎に係
数選択回路320より供給された変換係数を逆変換して
復号信号ピラミッドを各階層別に対応するフレームメモ
リ313に供給すると共に、第n階層の復号信号を線7
0を介して復元された画像信号として出力する。The inverse orthogonal transform circuit 312 inversely transforms the transform coefficient supplied from the coefficient selection circuit 320 for each layer and supplies the decoded signal pyramid to the corresponding frame memory 313 for each layer, and also for the nth layer. Decode signal on line 7
It is output as a restored image signal via 0.
【0115】各階層別のフレームメモリ313では、そ
れぞれ自系統の対応する階層の逆直交変換回路312よ
り供給される復号信号を蓄積することにより、階層別の
復号画像を得て、復号画像ピラミッドを得る。In the frame memory 313 for each hierarchical layer, the decoded signal supplied from the inverse orthogonal transform circuit 312 of the corresponding hierarchical layer of its own system is accumulated to obtain a decoded image for each hierarchical layer, and a decoded image pyramid is obtained. obtain.
【0116】各階層別の動き補償予測回路314では、
自系統の対応するフレームメモリ313に蓄積されてい
る復号画像信号を用いてそれぞれ動き補償予測値を生成
し、各階層別の動き補償予測値を得る。そして、これを
各階層別の直交変換回路315のうちの、対応する階層
の直交変換回路に供給する。各階層別の直交変換回路3
15では、対応する階層の動き補償予測値を受けてこれ
を直交変換することにより、図3の(D)における網掛
け表示部の領域の変換係数を得てこれを係数統合回路3
30に供給する。In the motion compensation prediction circuit 314 for each layer,
Motion compensation prediction values are generated using the decoded image signals stored in the corresponding frame memory 313 of the own system, and the motion compensation prediction values for each layer are obtained. Then, this is supplied to the orthogonal transformation circuit of the corresponding layer among the orthogonal transformation circuits 315 for each layer. Orthogonal transform circuit 3 for each layer
In FIG. 15, the motion compensation prediction value of the corresponding layer is received and orthogonally transformed to obtain the conversion coefficient of the area of the shaded display portion in FIG.
Supply to 30.
【0117】係数統合回路330では、各階層別の変換
係数を帯域毎に統合したn×n個の変換係数予測値を得
て、これを加算回路311に供給する。また、図4
(b)中での点A〜Eは、図2(b)と同様に、各々図
3の(A)〜(E)に対応する。なお、線70を介して
復号回路300より出力される画像は第n階層の再生画
像のみでも良い。The coefficient integration circuit 330 obtains n × n conversion coefficient prediction values in which the conversion coefficients for each layer are integrated for each band, and supplies this to the addition circuit 311. Also, FIG.
Points A to E in (b) correspond to (A) to (E) in FIG. 3, respectively, as in FIG. 2 (b). The image output from the decoding circuit 300 via the line 70 may be only the reproduced image of the nth layer.
【0118】このようにして、画像信号をN×N画素で
ブロック分けして直交変換し、圧縮符号化した信号のビ
ットストリームを、N×Nより小さいn×nで復号化す
る場合に、ビットストリームから得た予測誤差信号の再
生値を1×1〜n×nの変換係数構成の階層に対応する
形態となるように分配し、それぞれ逆直交変換してこれ
らのうちのn×n対応階層に対応する逆直交変換出力を
復号信号として用い、画像再生に使用するようにした。In this way, when the image signal is divided into blocks by N × N pixels and orthogonally transformed, and the bit stream of the compression-encoded signal is decoded by n × n smaller than N × N, The reproduction value of the prediction error signal obtained from the stream is distributed so as to have a form corresponding to the hierarchy of the transform coefficient configuration of 1 × 1 to n × n, and each is subjected to inverse orthogonal transform, and the hierarchy corresponding to n × n of these is obtained. The inverse orthogonal transform output corresponding to is used as a decoded signal for use in image reproduction.
【0119】また、各階層対応の変換係数について、そ
れぞれ逆直交変換して得た出力を蓄積して各階層対応の
フレーム画像を得、これを各階層別にそれぞれ動き補償
予測値を生成し、各階層別の動き補償予測値を得、これ
を各階層別に直交変換して各階層別にその階層での最大
周波項の成分についての動き補償予測値を求め、これを
それぞれ統合することにより、n×nの変換係数構成の
階層における動き補償予測値を求めるようにした。そし
て、予測誤差信号の再生値に対して、この動き補償予測
値分を補償するようにした。Further, with respect to the transform coefficient corresponding to each layer, outputs obtained by inverse orthogonal transform are accumulated to obtain a frame image corresponding to each layer, and a motion compensation prediction value is generated for each layer, respectively. A motion compensation prediction value for each layer is obtained, orthogonal transformation is performed for each layer to obtain a motion compensation prediction value for a component of the maximum frequency term in that layer for each layer, and the motion compensation prediction values for each layer are integrated. The motion compensation prediction value in the hierarchy of n transform coefficient structures is obtained. Then, the motion compensation prediction value is compensated for the reproduction value of the prediction error signal.
【0120】そのため、各階層別にその階層での最大周
波項の成分についての動き補償がなされることと、予測
誤差信号の再生値(動き補償済み)をn×nの変換係数
構成の階層に対応する変換係数についてのみ、逆直交変
換してその出力を画像再生に使用することで、符号化側
と復号化側での解像度の違いによるミスマッチが全くな
くなる。すなわち、符号化側と復号化側での使用する直
交変換低周波項の次数の違いによる画質劣化を防止でき
る。Therefore, motion compensation is performed for the component of the maximum frequency term in each layer, and the reproduction value (motion compensated) of the prediction error signal corresponds to the layer of n × n transform coefficient structure. By performing inverse orthogonal transform only on the transform coefficients to be used and using the output for image reproduction, there is no mismatch due to the difference in resolution between the encoding side and the decoding side. That is, it is possible to prevent image quality deterioration due to the difference in the order of the orthogonal transform low frequency terms used on the encoding side and the decoding side.
【0121】これは符号化側では、画像信号を圧縮符号
化する場合に、直交変換したのち、局部復号回路200
により局部復号画像信号を用いて動き補償予測値を生成
し、これと画像信号を直交変換して得た変換係数との差
分を得て、予測誤差を得、この予測誤差を量子化した
後、可変長符号化するようにした。特に、局部復号画像
信号は、画像信号をN×N画素でブロック分けして直交
変換し、圧縮符号化する場合に、1×1,2×2,3×
3,〜N×Nの変換係数からなる各階層毎に、それぞれ
変換係数を逆変換して局部復号信号ピラミッドを得、こ
れを各階層別にフレームメモリに蓄積して各階層別局部
復号画像を得、これより各階層別にその階層での最大周
波項の成分についての動き補償予測値を求め、これをそ
れぞれ直交変換して統合することにより、N×Nの変換
係数構成の階層における動き補償予測値を求めるように
して、各階層別に動き補償予測値とn×n対応階層に対
応する逆直交変換出力をミスマッチを伴うことなく再生
可能にしたことによる(但し、n=1〜Nの自然数)。On the encoding side, when the image signal is compression-encoded, the local decoding circuit 200 is used after orthogonal transformation.
By using the locally decoded image signal to generate a motion-compensated prediction value, obtain a difference between this and a transform coefficient obtained by orthogonally transforming the image signal, obtain a prediction error, and quantize this prediction error. Variable length coding is used. In particular, the locally decoded image signal is 1 × 1, 2 × 2, 3 × when the image signal is divided into blocks by N × N pixels, orthogonally transformed, and compression-coded.
For each layer consisting of 3, to N × N transform coefficients, the transform coefficient is inversely transformed to obtain a locally decoded signal pyramid, which is accumulated in a frame memory for each layer to obtain a locally decoded image for each layer. From this, the motion compensation prediction value for the component of the maximum frequency term in that hierarchy is obtained for each hierarchy, and the motion compensation prediction value in the hierarchy of the N × N transform coefficient configuration is obtained by orthogonally transforming and integrating the motion compensation prediction values. As described above, it is possible to reproduce the motion compensation prediction value and the inverse orthogonal transform output corresponding to the n × n corresponding layer for each layer without causing a mismatch (however, n = 1 to N is a natural number).
【0122】(第2の具体例)図5および図6を用い
て、本発明の第2の具体例の説明をする。第2の具体例
はSNRスケーラビリティに関するものであり、量子化
ステップを初めに粗く、段々細かくすることにより画質
を向上させるようにするものである。(Second Specific Example) A second specific example of the present invention will be described with reference to FIGS. 5 and 6. The second specific example relates to SNR scalability, in which the image quality is improved by making the quantization step coarse initially and gradually finer.
【0123】図5は、本発明が適用される直交変換係数
領域での動き補償予測を用いた動き補償予測+直交変換
符号化装置(変換後差分構成)であり、図6はこの符号
化装置で得たビットストリームからSNRスケーラビリ
ティを実現する復号化装置のブロック図である。FIG. 5 shows a motion-compensated prediction + orthogonal-transform coding apparatus (differential structure after transformation) using motion-compensated prediction in the orthogonal transform coefficient domain to which the present invention is applied, and FIG. 6 shows this coding apparatus. It is a block diagram of the decoding apparatus which implement | achieves SNR scalability from the bit stream obtained by.
【0124】図5は、M階層に分けて量子化を行う符号
化装置の例を示しており、図5において、100は直交
変換回路、121,122,123は量子化回路、13
1〜133は可変長符号化回路、420,421は加算
回路、200a,200b,〜200Mは局部復号回
路、400,401は遅延回路、111,112,11
3,410,411は差分回路、132,141,14
2,143は逆量子化回路である。FIG. 5 shows an example of a coding device for performing quantization by dividing into M layers. In FIG. 5, 100 is an orthogonal transform circuit, 121, 122 and 123 are quantization circuits, and 13 is a quantization circuit.
1 to 133 are variable length coding circuits, 420 and 421 are addition circuits, 200a and 200b, to 200M are local decoding circuits, 400 and 401 are delay circuits, 111, 112 and 11
3, 410, 411 are difference circuits, 132, 141, 14
Reference numerals 2 and 143 are inverse quantization circuits.
【0125】局部復号回路200aを持つ第1階層L1
の構成要素は、ベースレイヤの符号化信号を得るための
ものであり、局部復号回路200bを持つ第2階層L2
の構成要素は、エンハンスレイヤの符号化信号を得るた
めのものであり、局部復号回路200Mを持つ第M階層
LMの構成要素は、エンハンスレイヤの符号化信号を得
るためのものである。First layer L1 having local decoding circuit 200a
Is for obtaining the base layer encoded signal, and has the second layer L2 having the local decoding circuit 200b.
The constituent element of is for obtaining the encoded signal of the enhancement layer, and the constituent element of the Mth layer LM having the local decoding circuit 200M is for obtaining the encoded signal of the enhancement layer.
【0126】図5の如き構成の符号化装置において、画
像信号はまずはじめに直交変換回路100において直交
変換するが、その符号化対象の画像信号は、線10を介
して供給される。この供給される画像信号は直交変換回
路100においてN×N画素毎に直交変換され、N×N
個の変換係数が得られる。この直交変換係数は各階層L
1〜LMに与えられる。In the encoding device having the configuration as shown in FIG. 5, the image signal is first orthogonally transformed by the orthogonal transformation circuit 100, and the image signal to be encoded is supplied via the line 10. The supplied image signal is orthogonally transformed for each N × N pixel in the orthogonal transformation circuit 100 to obtain N × N.
Are obtained. This orthogonal transformation coefficient is for each layer L
1 to LM.
【0127】第1階層L1においては、直交変換回路1
00からの直交変換係数は、差分回路111に入力され
る。そして、この差分回路111では、直交変換回路1
00より供給される直交変換係数と、局部復号回路20
0aより線21を介して供給されるN×N個の変換係数
の予測値との予測誤差が計算され、量子化回路121に
供給される。量子化回路121にて量子化された予測誤
差信号は、可変長符号化回路131と逆量子化回路14
1に供給される。In the first layer L1, the orthogonal transformation circuit 1
The orthogonal transform coefficient from 00 is input to the difference circuit 111. Then, in the difference circuit 111, the orthogonal transformation circuit 1
Orthogonal transform coefficient supplied from 00 and the local decoding circuit 20.
A prediction error with respect to the prediction values of the N × N transform coefficients supplied via the line 21 from 0a is calculated and supplied to the quantization circuit 121. The prediction error signal quantized by the quantization circuit 121 is supplied to the variable length coding circuit 131 and the dequantization circuit 14.
1 is supplied.
【0128】可変長符号化回路131では予測誤差信号
の量子化値が可変長符号化され、線31を介して出力さ
れる。逆量子化回路141では、予測誤差信号を逆量子
化して予測誤差信号の再生値を得た後、線41を介して
局部復号回路200aと第2階層L2に供給する。In the variable length coding circuit 131, the quantized value of the prediction error signal is variable length coded and output via the line 31. The dequantization circuit 141 dequantizes the prediction error signal to obtain a reproduction value of the prediction error signal, and then supplies it via the line 41 to the local decoding circuit 200a and the second layer L2.
【0129】第2階層L2において、遅延回路400で
は、線41を介して第1階層L1における該ブロックの
予測誤差信号の再生値が得られるまで、直交変換回路1
00より供給された直交変換係数が差分回路112に供
給されるタイミングを遅延させる。In the second layer L2, the delay circuit 400 operates in the orthogonal transform circuit 1 until the reproduction value of the prediction error signal of the block in the first layer L1 is obtained via the line 41.
Delays the timing at which the orthogonal transform coefficient supplied from 00 is supplied to the difference circuit 112.
【0130】差分回路112では、遅延回路400より
供給される直交変換係数と、局部復号回路200bより
線22を介して供給される変換係数の予測値との予測誤
差が計算され、差分回路410に供給される。差分回路
410では、差分回路112より供給される第2階層L
2での予測誤差と、線41を介して供給される第1階層
L1での予測誤差の再生値との差分が計算され、量子化
回路122に供給され、ここで当該差分は量子化され
る。The difference circuit 112 calculates a prediction error between the orthogonal transform coefficient supplied from the delay circuit 400 and the predicted value of the transform coefficient supplied from the local decoding circuit 200b via the line 22, and the difference circuit 410 calculates it. Supplied. In the difference circuit 410, the second layer L supplied from the difference circuit 112.
The difference between the prediction error at 2 and the reproduction value of the prediction error at the first layer L1 supplied via the line 41 is calculated and supplied to the quantization circuit 122, where the difference is quantized. .
【0131】量子化回路122にて量子化された予測誤
差信号の差分は、可変長符号化回路132と逆量子化回
路142に供給される。可変長符号化回路132では予
測誤差信号の差分の量子化値が可変長符号化され、線3
2を介して出力される。The difference between the prediction error signals quantized by the quantization circuit 122 is supplied to the variable length coding circuit 132 and the inverse quantization circuit 142. In the variable length coding circuit 132, the quantized value of the difference of the prediction error signal is variable length coded, and the line 3
2 is output.
【0132】逆量子化回路142では、予測誤差信号の
差分を逆量子化して予測誤差信号の差分の再生値を得た
後、加算回路420において線41を介して供給される
第1階層L1の予測誤差信号の再生値を加算して、第2
階層L2の予測誤差信号の再生値を得た後、線42を介
して局部復号回路200bに供給する。The dequantization circuit 142 dequantizes the difference between the prediction error signals to obtain the reproduced value of the difference between the prediction error signals, and then the addition circuit 420 supplies the reproduced value via the line 41 of the first layer L1. The reproduction value of the prediction error signal is added, and the second
After obtaining the reproduction value of the prediction error signal of the layer L2, it is supplied to the local decoding circuit 200b via the line 42.
【0133】第M階層LMにおいては、遅延回路401
では、線43を介して第M−1階層LM-1 における該ブ
ロックの予測誤差信号の再生値が得られるまで、直交変
換回路100より供給された直交変換係数が差分回路1
13に供給されるタイミングを遅延させる。そして、差
分回路113では、遅延回路401より供給される直交
変換係数と、局部復号回路200Mより線23を介して
供給される変換係数の予測値との予測誤差が計算され、
差分回路411に供給される。In the Mth layer LM, the delay circuit 401
Then, until the reproduction value of the prediction error signal of the block in the (M-1) th layer LM-1 is obtained via the line 43, the orthogonal transform coefficient supplied from the orthogonal transform circuit 100 remains unchanged.
The timing supplied to 13 is delayed. Then, the difference circuit 113 calculates a prediction error between the orthogonal transform coefficient supplied from the delay circuit 401 and the predicted value of the transform coefficient supplied from the local decoding circuit 200M via the line 23,
It is supplied to the difference circuit 411.
【0134】差分回路411では、差分回路113より
供給される第M階層での予測誤差と、線43を介して供
給される第M−1階層LM-1 での予測誤差の再生値との
差分が計算され、量子化回路123に供給されてここで
量子化される。そして、この量子化回路123にて量子
化された予測誤差信号の差分は、可変長符号化回路13
3と逆量子化回路143に供給される。In the difference circuit 411, the difference between the prediction error in the M-th layer supplied from the difference circuit 113 and the reproduced value of the prediction error in the (M-1) -th layer LM-1 supplied via the line 43. Is calculated and supplied to the quantization circuit 123, where it is quantized. Then, the difference between the prediction error signals quantized by the quantization circuit 123 is the variable length coding circuit 13.
3 and the inverse quantization circuit 143.
【0135】可変長符号化回路133では予測誤差信号
の差分の量子化値が可変長符号化され、線33を介して
出力される。逆量子化回路143では、予測誤差信号の
差分を逆量子化して予測誤差信号の差分の再生値を得た
後、これに加算回路421において線43を介して供給
される第M−1階層LM-1 の予測誤差信号の再生値を加
算することで、第M階層LMの予測誤差信号の再生値を
得、これを線44を介して局部復号回路200Mに供給
する。In the variable length coding circuit 133, the quantized value of the difference of the prediction error signal is variable length coded and output via the line 33. The dequantization circuit 143 dequantizes the difference between the prediction error signals to obtain a reproduced value of the difference between the prediction error signals, and then the addition circuit 421 supplies the reproduced value to the M-1th layer LM supplied via the line 43. The reproduction value of the prediction error signal of the M-th layer LM is obtained by adding the reproduction value of the prediction error signal of −1, and this is supplied to the local decoding circuit 200M via the line 44.
【0136】ここで、第m(m=1〜M)階層Lmにお
ける量子化ステップサイズは、第m−1階層Lm-1 より
も小さくする。つまり、前段階層のものよりも量子化ス
テップサイズを小さくする。しかし、動き補償に用いる
動きベクトルは各階層とも同じものを用いた方が良い。
なお、可変長符号化回路131,132,133で用い
られる可変長符号は、各々同じものでも良いし、各々別
のものでも良い。Here, the quantization step size in the m-th (m = 1 to M) layer Lm is smaller than that in the (m-1) -th layer Lm-1. That is, the quantization step size is made smaller than that of the previous stage layer. However, it is better to use the same motion vector for each layer in motion compensation.
The variable length codes used in the variable length coding circuits 131, 132, 133 may be the same or different.
【0137】このようにして、第2階層以上では自己よ
り1段、下位までの各階層の局部復号信号を直交変換回
路100から得られる変換係数から差し引くことで、自
己の階層対応の次数の変換係数のうちの最高次の、すな
わち、各階層別にその階層での最高次領域の周波項成分
についての予測誤差信号値を求め、これを量子化して可
変長符号化して出力することで、M階層に分けられてそ
れぞれ階層別にその階層での最大の周波項の成分につい
ての予測誤差信号値を符号化したビットストリームを得
る。In this way, in the second and higher layers, by subtracting the locally decoded signal of each layer from the self to the first and lower layers from the transform coefficient obtained from the orthogonal transform circuit 100, the order conversion corresponding to the own layer is performed. By obtaining the prediction error signal value of the highest-order coefficient among the coefficients, that is, the frequency-term component of the highest-order area in that hierarchy for each hierarchy, quantizing this, and performing variable-length coding for output, the M-layer A bitstream is obtained by coding the prediction error signal value for the component of the maximum frequency term in each layer.
【0138】これら各階層別のビットストリームは、伝
送等に供する場合、例えば、多重化して出力するように
する。そして、復号化側では、これを分離化して各階層
別のビットストリームに戻して使用する。The bit stream for each layer is, for example, multiplexed and output when it is used for transmission or the like. Then, on the decoding side, this is separated and returned to a bit stream for each layer for use.
【0139】図6は、図5の符号化装置でM階層に分け
られて符号化されたビットストリームの中から、第m階
層までのビットストリームを復号化して再生画像を得る
復号化装置のブロック図である。FIG. 6 is a block diagram of a decoding device for decoding a bit stream up to the m-th layer from a bit stream divided into M layers and encoded by the encoding device of FIG. 5 to obtain a reproduced image. It is a figure.
【0140】図6において、151,152,153は
可変長復号化回路であり、161,162,163は逆
量子化回路であり、430,431は加算回路であり、
300はである。In FIG. 6, 151, 152 and 153 are variable length decoding circuits, 161, 162 and 163 are dequantization circuits, 430 and 431 are addition circuits,
300 is.
【0141】可変長復号化回路151と逆量子化回路1
61で第1階層L1のビットストリームを復号化し、可
変長復号化回路152、逆量子化回路162で第2階層
L2のビットストリームを復号化し、 可変長復号化回
路153、逆量子化回路163で第n階層Lnのビット
ストリームを復号化する。Variable length decoding circuit 151 and inverse quantization circuit 1
At 61, the bit stream of the first layer L1 is decoded, at the variable length decoding circuit 152 and the inverse quantization circuit 162, the bit stream of the second layer L2 is decoded, and at the variable length decoding circuit 153 and the inverse quantization circuit 163. The bitstream of the nth layer Ln is decoded.
【0142】このような構成において、符号化装置で符
号化された各階層対応の符号化ビットストリームは、線
51,52,53を介して対応する階層用の可変長復号
化回路151,152,153に供給される。そして、
各々供給された対応階層の符号化ビットストリームは、
これら可変長復号化回路151,152,153にてそ
れぞれ予測誤差信号あるいは予測誤差信号の差分に復号
された後、対応する階層の逆量子化回路161,16
2,163に供給される。In such a configuration, the coded bit stream corresponding to each layer coded by the coding device is transmitted via the lines 51, 52 and 53 to the variable length decoding circuits 151, 152 for the corresponding layers. 153. And
The coded bitstreams of the corresponding layers respectively supplied are
These variable length decoding circuits 151, 152 and 153 respectively decode the prediction error signal or the difference between the prediction error signals, and then the inverse quantization circuits 161, 16 of the corresponding layers.
2, 163.
【0143】逆量子化回路162,163では、予測誤
差信号の差分を逆量子化して予測誤差信号の差分の再生
値を得る。そして、加算回路430において、第m階層
から第2階層までの予測誤差の差分の再生値を加算し
て、加算回路431に供給する。また、逆量子化回路1
61では、第1階層の予測誤差信号を逆量子化して予測
誤差信号の再生値を得た後、加算回路431に供給す
る。そして、この加算回路431で加算回路430が求
めた第m階層から第2階層までの予測誤差の差分の再生
値の加算値と加算されて、m階層分の合計の予測誤差信
号の再生値が求められ、これは線60を介して復号回路
300に供給される。The dequantization circuits 162 and 163 dequantize the difference between the prediction error signals to obtain the reproduced value of the difference between the prediction error signals. Then, in the adder circuit 430, the reproduction values of the differences in the prediction error from the m-th layer to the second layer are added and supplied to the adder circuit 431. In addition, the inverse quantization circuit 1
In 61, the prediction error signal of the first layer is inversely quantized to obtain a reproduction value of the prediction error signal, which is then supplied to the adding circuit 431. Then, in this addition circuit 431, the reproduction value of the total prediction error signal for m layers is added with the addition value of the reproduction value of the difference in the prediction error from the m-th layer to the second layer obtained by the addition circuit 430. It is determined and is provided to decoding circuit 300 via line 60.
【0144】ここで、局部復号回路200a,200
b,〜200M-1 および復号回路300に本発明の第1
の具体例を適用したとすると、画質がM階層に、そし
て、解像度がN階層に分割されたビットストリームが構
成され、その一部をデコードすることで所望の画質mと
解像度nの再生画像が得られるようになる(図7参
照)。Here, the local decoding circuits 200a, 200
b, ~ 200M-1 and decoding circuit 300 according to the first embodiment of the present invention.
If a specific example of is applied, a bit stream whose image quality is divided into M layers and resolution is divided into N layers is formed, and by decoding a part of the bit stream, a reproduced image with a desired image quality m and resolution n can be obtained. It can be obtained (see FIG. 7).
【0145】(第3の具体例)図8、図9および図10
を用いて、本発明の第3の具体例の説明をする。第3の
具体例は、画像中から注目像の部分の像だけを所望の解
像度で符号化することができるようにした技術であっ
て、本具体例では、前記第1の具体例をアルファマップ
信号で示された任意形状の画像に適用するものである。(Third Concrete Example) FIGS. 8, 9 and 10
The third specific example of the present invention will be described with reference to FIG. The third specific example is a technique in which only the image of the part of the image of interest in the image can be encoded with a desired resolution. In this specific example, the first specific example is an alpha map. It is applied to an image of an arbitrary shape indicated by a signal.
【0146】図8(a)は任意形状の画像を符号化する
符号化装置の構成例であり、図において、180はアル
ファマップ符号化回路、181は多重化回路、105は
直交変換回路、115は差分回路、125は量子化回
路、135は可変長復号化回路、145は逆量子化回
路、500は局部復号化回路、501は加算回路、50
2は逆直交変換回路、503はフレームメモリ、504
は動き補償予測回路、505は直交変換回路である。FIG. 8A shows an example of the configuration of an encoding apparatus for encoding an image of an arbitrary shape. In the figure, 180 is an alpha map encoding circuit, 181 is a multiplexing circuit, 105 is an orthogonal transformation circuit, and 115. Is a difference circuit, 125 is a quantization circuit, 135 is a variable length decoding circuit, 145 is an inverse quantization circuit, 500 is a local decoding circuit, 501 is an addition circuit, 50
2 is an inverse orthogonal transform circuit, 503 is a frame memory, 504
Is a motion compensation prediction circuit, and 505 is an orthogonal transformation circuit.
【0147】この具体例では、画像信号の他に、この画
像信号の画像に対応するアルファマップ情報(画像の位
置を示す情報で例えば、画像を二値化したもの)をも作
成して本システムに入力されるものとする。In this specific example, in addition to the image signal, alpha map information (information indicating the position of the image, for example, the image being binarized) corresponding to the image of this image signal is also created and the present system is created. Shall be entered in.
【0148】アルファマップ符号化回路180は、前記
画像のアルファマップ情報を入力として受け、これを符
号化して線82に出力するものであり、また、符号化し
たアルファマップ信号を復号する機能を有していてこれ
によって復号したアルファマップ信号の局部復号信号を
線81を介して出力する機能を有する。The alpha map encoding circuit 180 receives the alpha map information of the image as an input, encodes it and outputs it to the line 82, and has a function of decoding the encoded alpha map signal. It has a function of outputting the locally decoded signal of the alpha map signal decoded by this through the line 81.
【0149】直交変換回路105は前記画像信号と、線
81を介して供給されるアルファマップ信号の局部復号
信号が入力され、アルファマップ信号の局部復号信号を
参照して画像の抽出すべき部分の画像信号について直交
変換して出力するものである。The orthogonal transformation circuit 105 receives the image signal and the locally decoded signal of the alpha map signal supplied via the line 81, and refers to the locally decoded signal of the alpha map signal to determine the portion of the image to be extracted. The image signal is orthogonally transformed and output.
【0150】アルファマップは画像の注目部分を示す二
値デ−タであり、これを参照することで、画像のどの部
分が注目部分であるかがわかる仕組みである。The alpha map is binary data indicating a target portion of the image, and by referring to this, it is a mechanism to know which portion of the image is the target portion.
【0151】局部復号回路500は、直交変換回路10
5で直交変換され、動き補償予測値分を差し引いた差分
である予測誤差値の信号(予測誤差信号)を、予測値分
補償した画像から、アルファマップの局部復号信号に基
づいて動き補償予測値を求めて直交変換し、予測値とし
て出力するものである。The local decoding circuit 500 includes the orthogonal transformation circuit 10
The signal of the prediction error value (prediction error signal), which is the difference obtained by orthogonally transforming in 5 and subtracting the motion compensation prediction value, is compensated from the image for which the prediction value has been compensated, based on the locally decoded signal of the alpha map. Is obtained, subjected to orthogonal transformation, and output as a predicted value.
【0152】多重化回路181はアルファマップ符号化
回路180から出力される前記画像のアルファマップ情
報の符号化信号と、可変長復号化回路135の出力する
画像誤差信号の符号化信号を多重化して出力するもので
ある。The multiplexing circuit 181 multiplexes the coded signal of the alpha map information of the image output from the alpha map coding circuit 180 and the coded signal of the image error signal output from the variable length decoding circuit 135. It is what is output.
【0153】このような構成おいて、アルファマップ符
号化回路180では、入力されるアルファマップの情報
を符号化する。そして、符号化されたアルファマップ信
号を線82を介して出力し、また、この符号化されたア
ルファマップ信号を復号化してこれをアルファマップ信
号の局部復号信号として線81を介し、局部復号回路5
00と直交変換回路105に出力する。With such a configuration, the alpha map coding circuit 180 codes the input alpha map information. Then, the encoded alpha map signal is output via the line 82, the encoded alpha map signal is decoded, and the decoded alpha map signal is used as the local decoded signal of the alpha map signal via the line 81. 5
00 and the orthogonal transformation circuit 105.
【0154】一方、直交変換回路105においては、線
10を介して画像信号が入力されるが、この画像信号
を、線81を介して供給されるアルファマップの局部復
号信号に基づいて直交変換する。そして、この直交変換
されて得られた係数は、差分回路115に与えられる。On the other hand, in the orthogonal transform circuit 105, an image signal is input via the line 10, but this image signal is orthogonally transformed based on the locally decoded signal of the alpha map supplied via the line 81. . Then, the coefficient obtained by this orthogonal transformation is given to the difference circuit 115.
【0155】差分回路115では、直交変換回路105
より供給される直交変換係数と、局部復号回路500よ
り線25を介して供給される変換係数の予測値との予測
誤差が計算され、量子化回路125に供給されて、ここ
で量子化される。In the difference circuit 115, the orthogonal transformation circuit 105
The prediction error between the orthogonal transform coefficient supplied from the local decoding circuit 500 and the predicted value of the transform coefficient supplied from the local decoding circuit 500 via the line 25 is calculated, supplied to the quantization circuit 125, and quantized here. .
【0156】そして、この量子化回路125にて量子化
された予測誤差信号は、可変長符号化回路135と逆量
子化回路145に供給される。可変長復号化回路135
では予測誤差信号の量子化値を可変長符号化する。そし
て、この可変長符号化した信号は線35へと出力するこ
とになる。The prediction error signal quantized by the quantization circuit 125 is supplied to the variable length coding circuit 135 and the dequantization circuit 145. Variable length decoding circuit 135
Then, the quantized value of the prediction error signal is variable length coded. Then, the variable-length coded signal is output to the line 35.
【0157】一方、逆量子化回路145では、予測誤差
信号を逆量子化して予測誤差信号の再生値を得た後、線
45を介して局部復号回路500に供給する。On the other hand, the dequantization circuit 145 dequantizes the prediction error signal to obtain the reproduced value of the prediction error signal, and then supplies it to the local decoding circuit 500 via the line 45.
【0158】局部復号回路500では、線45を介して
供給される予測誤差信号の再生値と線25を介して供給
される予測値とを加算回路501にて加算することによ
り、変換係数の再生値を得た後、逆直交変換回路502
に供給する。In the local decoding circuit 500, the reproduction value of the conversion coefficient is reproduced by adding the reproduction value of the prediction error signal supplied via the line 45 and the prediction value supplied via the line 25 in the addition circuit 501. After obtaining the value, the inverse orthogonal transform circuit 502
To supply.
【0159】逆直交変換回路502では、線81を介し
て供給されるアルファマップの局部復号信号に基づいて
加算回路501より供給された変換係数を逆変換し、局
部復号信号を出力してフレームメモリ503に与える。The inverse orthogonal transform circuit 502 inversely transforms the transform coefficient supplied from the adder circuit 501 based on the locally decoded signal of the alpha map supplied via the line 81, outputs the locally decoded signal, and outputs it to the frame memory. Give to 503.
【0160】そして、フレームメモリ503では、この
逆直交変換回路502より供給される局部復号画像を蓄
積する。動き補償予測回路504では、フレームメモリ
503に蓄積されている局部復号画像信号を用い、これ
より、線81を介して供給されるアルファマップの局部
復号信号に基づいて注目画像部分についてのみの動き補
償予測値を生成し、直交変換回路505に供給する。直
交変換回路505では、線81を介して供給されるアル
ファマップの局部復号信号に基づいて動き補償予測値を
直交変換し、変換係数を線25を介して出力する。Then, the frame memory 503 stores the locally decoded image supplied from the inverse orthogonal transform circuit 502. The motion compensation prediction circuit 504 uses the locally decoded image signal stored in the frame memory 503, and from this, based on the locally decoded signal of the alpha map supplied via the line 81, the motion compensation for only the image portion of interest is performed. A predicted value is generated and supplied to the orthogonal transformation circuit 505. The orthogonal transform circuit 505 orthogonally transforms the motion compensation prediction value based on the locally decoded signal of the alpha map supplied via the line 81, and outputs the transform coefficient via the line 25.
【0161】なお、直交変換回路105,505、およ
び逆直交変換回路502には、例えば、特願平7‐97
073号に開示した技術である任意形状画像信号の直交
変換法を適用すると良い。The orthogonal transform circuits 105 and 505 and the inverse orthogonal transform circuit 502 are provided in, for example, Japanese Patent Application No. 7-97.
It is advisable to apply the orthogonal transform method for arbitrary shape image signals, which is the technique disclosed in No. 073.
【0162】符号化されたアルファマップ信号は線82
を介して、符号化された変換係数は線35を介して、各
々多重化回路181に供給されて多重化された後、線8
5を介してビットストリームとして出力される。The encoded alpha map signal is line 82.
Via the line 35, the coded transform coefficients are supplied to the multiplexing circuit 181 to be multiplexed and then the line 8
5 is output as a bit stream.
【0163】このようにして、注目画像部分を抽出して
可変長符号化したものと、注目画像部分を示す符号化さ
れたアルファマップ信号とを多重化して、ビットストリ
ーム化する。In this manner, the target image portion extracted and variable-length coded and the encoded alpha map signal indicating the target image portion are multiplexed to form a bit stream.
【0164】図8(b)は、注目画像の動き補償予測値
を、目的とする解像度で精度良く得ることができるよう
にする局部復号回路500の具体例である。ここでは、
階層別にそれぞれ誤差信号を得て最後に統合することで
精度の良い予測値を得るようにしたものであり、511
は加算回路、512は逆直交変換回路、513はフレー
ムメモリ、514は動き補償予測回路、515は直交変
換回路、520は係数選択回路、530は係数統合回
路、540は解像度変換回路である。FIG. 8B shows a specific example of the local decoding circuit 500 which enables the motion-compensated predicted value of the target image to be accurately obtained at the target resolution. here,
An error signal is obtained for each layer and integrated at the end to obtain a highly accurate predicted value.
Is an addition circuit, 512 is an inverse orthogonal transformation circuit, 513 is a frame memory, 514 is a motion compensation prediction circuit, 515 is an orthogonal transformation circuit, 520 is a coefficient selection circuit, 530 is a coefficient integration circuit, and 540 is a resolution conversion circuit.
【0165】逆直交変換回路512、フレームメモリ5
13、動き補償予測回路514各々は、変換係数がN×
Nの構成であるとすれば、変換係数が“1×1”〜“N
×N”の構成のものをそれぞれ取得できるようにするた
めに、“1×1”用、“2×2”用、〜“N−1×N−
1”用、“N×N”用のそれぞれ独立した系統を用意し
てあり、合計N系統分(N階層分)の構成としてある。Inverse orthogonal transform circuit 512, frame memory 5
13, the motion compensation prediction circuit 514 has a conversion coefficient of N ×
If the configuration is N, the conversion coefficients are “1 × 1” to “N”.
In order to be able to acquire each of the × N ”configurations, for“ 1 × 1 ”,“ 2 × 2 ”, to“ N−1 × N− ”.
Independent systems for "1" and "N × N" are prepared, and the total N systems (N layers) are configured.
【0166】解像度変換回路540は線81を介して与
えられるアルファマップの局部復号信号を水平・垂直共
にn/N倍(n=1〜N)に解像度変換してN階層ピラ
ミッドの信号として線83に出力するものである。The resolution conversion circuit 540 converts the resolution of the locally decoded signal of the alpha map given through the line 81 to n / N times (n = 1 to N) both in the horizontal and vertical directions, and the line 83 as a signal of the N layer pyramid. Is output to.
【0167】加算回路511は線45を介して供給され
る予測誤差信号の再生値と線25を介して供給される予
測値とを加算する回路であり、この加算により変換係数
の再生値を得るものである。The adder circuit 511 is a circuit for adding the reproduction value of the prediction error signal supplied via the line 45 and the prediction value supplied via the line 25, and the reproduction value of the conversion coefficient is obtained by this addition. It is a thing.
【0168】係数選択回路520は、加算回路511か
らの変換係数の再生値を受け、線83を介して供給され
るN階層のアルファマップ信号ピラミッドにしたがっ
て、変換係数を選択して第1〜第N階層各々の相当する
変換係数を得ることにより、N階層ピラミッドを得るも
のである。The coefficient selection circuit 520 receives the reproduction value of the conversion coefficient from the addition circuit 511, selects the conversion coefficient according to the alpha map signal pyramid of the N layer supplied through the line 83, and selects the first to the first conversion coefficients. By obtaining the corresponding transform coefficient for each of the N layers, the N layer pyramid is obtained.
【0169】逆直交変換回路512は、この各々の階層
の変換係数のうち、対応の階層の変換係数を逆直交変換
して出力するものであって、各階層別の逆直交変換回路
512では、各階層毎に線83を介して供給されるアル
ファマップ信号ピラミッドにしたがって、係数選択回路
520より供給された変換係数を逆変換して局部復号信
号を得ることにより、局部復号信号ピラミッドを得る。The inverse orthogonal transform circuit 512 inversely orthogonally transforms and outputs the transform coefficient of the corresponding layer among the transform coefficients of the respective layers. In the inverse orthogonal transform circuit 512 for each layer, A locally decoded signal pyramid is obtained by inversely transforming the transform coefficient supplied from the coefficient selection circuit 520 to obtain a locally decoded signal according to the alpha map signal pyramid supplied via the line 83 for each layer.
【0170】各々の階層のフレームメモリ513は、対
応する階層の逆直交変換回路512より供給される局部
復号信号を蓄積して局部復号画像を得るものである。各
々の階層の動き補償予測回路514は、対応する階層の
フレームメモリ513に蓄積されている局部復号画像信
号を用い、各階層毎に線83を介して供給されるアルフ
ァマップ信号ピラミッドにしたがって、その階層におけ
る動き補償予測値を生成して対応する階層の直交変換回
路515に供給するものである。The frame memory 513 of each layer accumulates the locally decoded signal supplied from the inverse orthogonal transform circuit 512 of the corresponding layer to obtain a locally decoded image. The motion compensation prediction circuit 514 of each layer uses the locally decoded image signal accumulated in the frame memory 513 of the corresponding layer, and according to the alpha map signal pyramid supplied via the line 83 for each layer, The motion compensation prediction value in each layer is generated and supplied to the orthogonal transformation circuit 515 of the corresponding layer.
【0171】また、各々の階層の直交変換回路515
は、対応する階層の動き補償予測値を、各階層毎に線8
3を介して供給されるアルファマップ信号にしたがっ
て、直交変換するものであり、この直交変換した変換係
数のうち、その階層における最大周波項での変換係数を
係数統合回路530に供給するものである。Further, the orthogonal transformation circuit 515 of each layer
Is a line 8 for the motion compensation prediction value of the corresponding layer.
The orthogonal transform is performed in accordance with the alpha map signal supplied via 3, and the transform coefficient at the maximum frequency term in the hierarchy among the transform coefficients subjected to the orthogonal transform is supplied to the coefficient integrating circuit 530. .
【0172】係数統合回路530は、各階層の直交変換
回路515から出力された変換係数を統合して線25に
出力するものである。The coefficient integrating circuit 530 integrates the transform coefficients output from the orthogonal transform circuit 515 of each layer and outputs the integrated result to the line 25.
【0173】すなわち、第1乃至第N階層の各階層別直
交変換回路515は、各階層別動き補償予測回路514
のうちのそれぞれ対応する階層の生成する動き補償予測
値を受けて直交変換するものであり、例えば、第1階層
用の系統の直交変換回路515(OT1 )であれば、直
流成分の周波数帯(第1低周波項)の動き補償予測値
を、第2階層用の系統の直交変換回路515(OT2 )
であれば、直流成分の次の周波数帯(第2低周波項)の
動き補償予測値を、第3階層用の系統の直交変換回路5
15(OT3 )であれば、直流成分の次々周波数帯(第
3低周波項)の動き補償予測値を、第N階層用の系統の
直交変換回路515(OTN )であれば、最上位項の周
波数帯(第N周波項)の動き補償予測値を、出力するも
のである。That is, the orthogonal transformation circuit 515 for each layer of the first to Nth layers is the motion compensation prediction circuit 514 for each layer.
Of the DC layers of the DC component in the frequency band of the DC component, for example, in the case of the orthogonal transformation circuit 515 (OT 1 ) of the system for the first layer. The motion compensation prediction value of (first low frequency term) is converted into the orthogonal transformation circuit 515 (OT 2 ) of the system for the second layer.
If so, the motion compensation prediction value in the frequency band (second low frequency term) next to the DC component is converted to the orthogonal transformation circuit 5 of the system for the third layer.
If it is 15 (OT 3 ), the motion compensation prediction value of the next frequency band (third low frequency term) of the DC component is the highest if it is the orthogonal transformation circuit 515 (OT N ) of the system for the Nth layer. The motion compensation prediction value of the term frequency band (Nth frequency term) is output.
【0174】そして、係数統合回路530は、各直交変
換回路515から出力された各階層の動き補償予測値の
直交変換による変換係数を受けて、帯域毎に統合したN
×N個の変換係数予測値を線25を介して出力するもの
である。Then, the coefficient integrating circuit 530 receives the transform coefficients by the orthogonal transform of the motion compensation prediction values of the respective layers outputted from the orthogonal transform circuits 515, and integrates them for each band.
It outputs the × N transform coefficient prediction values via the line 25.
【0175】このような構成において、アルファマップ
符号化回路180より線81を介して解像度変換回路5
40に供給されたアルファマップの局部復号信号は、こ
の解像度変換回路540において解像度変換され、水平
・垂直共にn/N倍(n=1〜N)に解像度変換されて
第1階層から第N階層までの各階層相当の変換係数を得
ることにより、変換係数についてのN階層のピラミッド
が作成される。In such a configuration, the resolution converting circuit 5 is connected via the line 81 from the alpha map encoding circuit 180.
The locally decoded signal of the alpha map supplied to the unit 40 is resolution-converted in the resolution conversion circuit 540, and the resolution is converted to n / N times (n = 1 to N) both in the horizontal and vertical directions, and the first layer to the Nth layer. By obtaining the conversion coefficients corresponding to the respective layers up to, a pyramid of N layers of conversion coefficients is created.
【0176】この解像度変換されたN階層のピラミッド
は、それぞれ階層対応の動き補償予測回路514(MC
1 〜MCN )に線83を介して出力される。また、線8
3を介して出力されるN階層のピラミッドは、係数選択
回路520,逆直交変換回路512,直交変換回路51
5,係数統合回路530にも入力される。The resolution-converted N-layer pyramid has a motion-compensated prediction circuit 514 (MC
1 to MC N ) via line 83. Also, line 8
The N-layered pyramid output via the 3 is a coefficient selection circuit 520, an inverse orthogonal transformation circuit 512, and an orthogonal transformation circuit 51.
5, also input to the coefficient integration circuit 530.
【0177】一方、逆量子化回路145で逆量子化され
た出力(予測誤差信号の再生値)は、係数統合回路53
0から出力される変換係数予測値(各階層の変換係数を
帯域毎に統合した変換係数予測値)と加算回路511に
て加算されることにより、変換係数の再生値が得られ
る。そして、このようにして得た変換係数の再生値は、
係数選択回路520に供給される。On the other hand, the output (reproduction value of the prediction error signal) dequantized by the dequantization circuit 145 is the coefficient integration circuit 53.
The conversion coefficient prediction value output from 0 (conversion coefficient prediction value obtained by integrating the conversion coefficients of the respective layers for each band) is added by the addition circuit 511 to obtain a reproduction value of the conversion coefficient. Then, the reproduction value of the conversion coefficient thus obtained is
It is supplied to the coefficient selection circuit 520.
【0178】係数選択回路520では、線83を介して
供給されるN階層のアルファマップ信号ピラミッドにし
たがって、変換係数を選択してN階層のピラミッドを構
成し、各々の階層の変換係数を各階層対応の逆直交変換
回路512に供給する。各階層の逆直交変換回路512
では、各階層毎に線83を介して供給されるアルファマ
ップ信号ピラミッドにしたがって、係数選択回路520
より供給された変換係数を逆変換して局部復号信号を得
ることにより、局部復号信号ピラミッドを得る。The coefficient selection circuit 520 selects transform coefficients in accordance with the alpha map signal pyramid of the N layers supplied via the line 83 to form pyramids of the N layers, and the transform coefficients of each layer are converted into the respective layers. The signal is supplied to the corresponding inverse orthogonal transform circuit 512. Inverse orthogonal transform circuit 512 of each layer
Then, according to the alpha map signal pyramid supplied via the line 83 for each layer, the coefficient selection circuit 520
A locally decoded signal pyramid is obtained by inversely transforming the supplied transform coefficient to obtain a locally decoded signal.
【0179】この局部復号信号はそれぞれ対応の階層の
フレームメモリ513に与えられ、これらフレームメモ
リ513では、対応する階層の逆直交変換回路512よ
り供給される局部復号信号を蓄積して局部復号画像を得
る。これにより、局部復号信号ピラミッドを各階層毎に
蓄積して局部復号画像ピラミッドを得ることができる。The local decoded signals are applied to the frame memories 513 of the corresponding layers, and in these frame memories 513, the local decoded signals supplied from the inverse orthogonal transform circuit 512 of the corresponding layers are accumulated to form a locally decoded image. obtain. As a result, the locally decoded signal pyramid can be accumulated for each layer to obtain the locally decoded image pyramid.
【0180】局部復号画像ピラミッドは動き補償予測回
路514に与えられる。各階層別の動き補償予測回路5
14では、対応する階層のフレームメモリ513に蓄積
されている局部復号画像信号を用い、各階層毎に線83
を介して供給されるアルファマップ信号ピラミッドにし
たがって、動き補償予測値を生成して対応する階層の直
交変換回路515に供給する。The locally decoded image pyramid is given to the motion compensation prediction circuit 514. Motion compensation prediction circuit 5 for each layer
14, the locally decoded image signal stored in the frame memory 513 of the corresponding layer is used, and the line 83 is used for each layer.
In accordance with the alpha map signal pyramid supplied via, the motion compensation prediction value is generated and supplied to the orthogonal transform circuit 515 of the corresponding layer.
【0181】各階層の直交変換回路515では、入力さ
れる動き補償予測値をアルファマップ信号にしたがって
直交変換することにより、各階層別の変換係数を得る。
すなわち、直交変換回路515では各階層毎に線83を
介して供給されるアルファマップ信号ピラミッドにした
がって直交変換し、この変換により各階層で得たそれぞ
れの最高次数の周波数項における変換係数を係数統合回
路530に供給する。係数統合回路530では、これら
各階層の変換係数を帯域毎に統合した変換係数予測値を
線25を介して出力する。The orthogonal transform circuit 515 of each layer orthogonally transforms the input motion-compensated prediction value according to the alpha map signal to obtain a transform coefficient for each layer.
That is, in the orthogonal transform circuit 515, orthogonal transform is performed according to the alpha map signal pyramid supplied via the line 83 for each layer, and the transform coefficients in the highest-order frequency terms obtained in each layer by this transform are integrated. Supply to the circuit 530. The coefficient integration circuit 530 outputs a conversion coefficient prediction value obtained by integrating the conversion coefficients of the respective layers for each band through the line 25.
【0182】なお、直交変換回路515、逆直交変換回
路512、および係数選択回路520には、特願平7‐
97073号に開示した技術である解像度変換が可能な
任意形状画像信号の直交変換法を適用すると良い。The orthogonal transformation circuit 515, the inverse orthogonal transformation circuit 512, and the coefficient selection circuit 520 are provided in Japanese Patent Application No.
It is advisable to apply the orthogonal transformation method of the arbitrary shape image signal capable of resolution conversion, which is the technology disclosed in No. 97073.
【0183】係数統合回路530から出力されたこれら
各階層の変換係数を、帯域毎に統合した変換係数予測値
は局部復号回路500の出力として線25を介して図8
(a)の差分回路115に与えることにより、当該差分
回路115では、直交変換回路105より供給される直
交変換係数と、局部復号回路500より線25を介して
供給される変換係数の予測値との予測誤差が計算され、
量子化回路125に供給されて、ここで量子化される。The transform coefficient prediction value obtained by integrating the transform coefficients of the respective layers output from the coefficient integrating circuit 530 for each band is output as the output of the local decoding circuit 500 via the line 25 as shown in FIG.
By giving it to the difference circuit 115 of (a), in the difference circuit 115, the orthogonal transform coefficient supplied from the orthogonal transform circuit 105 and the predicted value of the transform coefficient supplied from the local decoding circuit 500 via the line 25. The prediction error of
It is supplied to the quantization circuit 125 and is quantized here.
【0184】そして、この量子化回路125にて量子化
された予測誤差信号は、可変長符号化回路135と逆量
子化回路145に供給され、可変長復号化回路135で
は予測誤差信号の量子化値が可変長符号化され、線35
を介して出力される。The prediction error signal quantized by the quantization circuit 125 is supplied to the variable length coding circuit 135 and the dequantization circuit 145, and the variable length decoding circuit 135 quantizes the prediction error signal. The value is variable length coded and the line 35
Is output via.
【0185】一方、逆量子化回路145では、予測誤差
信号を逆量子化して予測誤差信号の再生値を得た後、線
45を介して局部復号回路500に供給することにな
り、これを元に局部復号回路500において、動き補償
予測を行って変換係数予測値を求め、差分回路115に
返されることになる。On the other hand, in the dequantization circuit 145, after dequantizing the prediction error signal to obtain the reproduced value of the prediction error signal, it is supplied to the local decoding circuit 500 via the line 45. In addition, the local decoding circuit 500 performs motion compensation prediction to obtain a transform coefficient prediction value, which is returned to the difference circuit 115.
【0186】このようにして、画像の注目画像部分を抽
出して注目画像部分についてのみの動き補償予測値に対
する前フレーム画面の当該注目画像部分の動き補償予測
値との誤差分を得、これを可変長符号化したものと、注
目画像部分を示す符号化されたアルファマップ信号とを
多重化して、ビットストリーム化して出力する。In this way, the image-of-interest portion of the image is extracted, and the error amount between the motion-compensated prediction value of only the image-of-interest portion and the motion-compensated prediction value of the image-of-interest portion of the preceding frame screen is obtained. The variable-length coded signal and the coded alpha map signal indicating the image of interest are multiplexed, converted into a bit stream, and output.
【0187】このビットストリーム化したものを再生す
るには、次のようにする。To reproduce the bit stream, the following is done.
【0188】図9は、図8の符号化装置で符号化された
ビットストリームを復号化して再生画像を得る、復号化
装置のブロック図である。FIG. 9 is a block diagram of a decoding device for decoding the bit stream coded by the coding device of FIG. 8 to obtain a reproduced image.
【0189】図9(a)において、190は分離化回
路、191はアルファマップ復号化回路、155は可変
長復号化回路、165は逆量子化回路、600は復号回
路である。これらのうち、分離化回路190はアルファ
マップに関する符号と、変換係数に関する符号に分離す
るものであり、アルファマップ復号化回路191はこの
分離されたアルファマップ信号を再生し、線92を介し
て復号回路600に供給するものである。In FIG. 9A, reference numeral 190 is a separation circuit, 191 is an alpha map decoding circuit, 155 is a variable length decoding circuit, 165 is an inverse quantization circuit, and 600 is a decoding circuit. Of these, the separation circuit 190 separates the code relating to the alpha map and the code relating to the transform coefficient, and the alpha map decoding circuit 191 reproduces the separated alpha map signal and decodes it via the line 92. It is supplied to the circuit 600.
【0190】可変長復号化回路155は、分離化回路1
90にて分離して供給された予測誤差信号に関する符号
の符号化ビットストリームを、予測誤差信号に復号する
ものであり、逆量子化回路165はこの復号された予測
誤差信号を逆量子化して予測誤差信号の再生値を得るも
のであり、復号回路600はこの予測誤差信号の再生値
とアルファマップの復号信号に基づいて、再生値を求め
て出力するものである。The variable length decoding circuit 155 is the separation circuit 1
The coded bit stream of the code relating to the prediction error signal separated and supplied at 90 is decoded into a prediction error signal, and the dequantization circuit 165 dequantizes the decoded prediction error signal to perform prediction. The decoder circuit 600 obtains a reproduced value of the error signal, and the decoding circuit 600 obtains and outputs a reproduced value based on the reproduced value of the prediction error signal and the decoded signal of the alpha map.
【0191】復号回路600は、加算回路601、逆直
交変換回路602(IOTN )、フレームメモリ603
(FMN )、動き補償予測回路604(MCN )、直交
変換回路605(OTN )とより構成される。The decoding circuit 600 includes an adder circuit 601, an inverse orthogonal transform circuit 602 (IOT N ), a frame memory 603.
(FM N ), a motion compensation prediction circuit 604 (MC N ) and an orthogonal transformation circuit 605 (OT N ).
【0192】加算回路601は線65を介して与えられ
る信号と直交変換回路605(OTN )の出力を加算す
る回路であり、逆直交変換回路602(IOTN )は、
この加算回路601出力を、アルファマップ復号化回路
191からのアルファマップにしたがって逆直交変換し
て再生信号を得、これを線75に出力するものである。The adder circuit 601 is a circuit for adding the signal given through the line 65 and the output of the orthogonal transform circuit 605 (OT N ), and the inverse orthogonal transform circuit 602 (IOT N ) is
The output of the adder circuit 601 is inversely orthogonally transformed according to the alpha map from the alpha map decoding circuit 191 to obtain a reproduction signal, which is output to the line 75.
【0193】また、フレームメモリ603(FMN )
は、逆直交変換回路602(IOTN)からの信号を蓄
積してフレーム画像を得るものであり、動き補償予測回
路604(MCN )は、このフレーム画像から動き補償
予測を行うものであり、直交変換回路605(OTN )
はこの動き補償予測されて得られた値をアルファマップ
信号にしたがって直交変換して変換係数を得、加算回路
601に与えるものである。The frame memory 603 (FM N )
Is for accumulating signals from the inverse orthogonal transform circuit 602 (IOT N ) to obtain a frame image, and the motion compensation prediction circuit 604 (MC N ) is for performing motion compensation prediction from this frame image. Orthogonal transformation circuit 605 (OT N )
Is a value that is obtained by the motion compensation prediction and is orthogonally transformed according to the alpha map signal to obtain a transformation coefficient, which is given to the addition circuit 601.
【0194】このような構成において、図8の多重化回
路181からの出力である多重化された符号化ビットス
トリームは、線90を介して分離化回路190に供給さ
れる。In such a configuration, the multiplexed coded bit stream output from the multiplexing circuit 181 of FIG. 8 is supplied to the demultiplexing circuit 190 via the line 90.
【0195】すると分離化回路190においてはこの符
号化ビットストリームを、アルファマップに関する符号
と、変換係数に関する符号に分離する。そして、アルフ
ァマップに関する符号は、線91を介してアルファマッ
プ復号化回路191に供給され、また、予測誤差信号に
関する符号については線55を介して可変長復号化回路
155に供給される。Then, the separating circuit 190 separates the coded bit stream into a code related to the alpha map and a code related to the transform coefficient. The code relating to the alpha map is supplied to the alpha map decoding circuit 191 via the line 91, and the code relating to the prediction error signal is supplied to the variable length decoding circuit 155 via the line 55.
【0196】アルファマップ復号化回路191では、ア
ルファマップに関する符号からアルファマップ信号を再
生し、線92を介して復号回路600に供給する。The alpha map decoding circuit 191 reproduces the alpha map signal from the code relating to the alpha map and supplies it to the decoding circuit 600 via the line 92.
【0197】一方、線55を介して可変長復号化回路1
55に供給された符号化ビットストリームは、ここで予
測誤差信号に復号されたのち、逆量子化回路165に供
給される。逆量子化回路165では、予測誤差信号を逆
量子化して予測誤差信号の再生値を得た後、線65を介
して復号回路600に供給する。そして、復号回路60
0では、線92を介して供給されるアルファマップの復
号信号に基づいて、再生値を求めて線75を介して出力
する。On the other hand, the variable length decoding circuit 1 is connected via the line 55.
The encoded bit stream supplied to 55 is decoded into a prediction error signal here and then supplied to the inverse quantization circuit 165. The dequantization circuit 165 dequantizes the prediction error signal to obtain a reproduction value of the prediction error signal, and then supplies it to the decoding circuit 600 via the line 65. Then, the decoding circuit 60
At 0, the reproduction value is obtained based on the decoded signal of the alpha map supplied via the line 92 and is output via the line 75.
【0198】復号回路600の具体例を図9(b)に示
す。図において、640は解像度変換回路、610は係
数選択回路、611は加算回路、612は逆直交変換回
路、613はフレームメモリ、514は動き補償予測回
路、615は直交変換回路、630は係数統合回路であ
る。A concrete example of the decoding circuit 600 is shown in FIG. In the figure, 640 is a resolution conversion circuit, 610 is a coefficient selection circuit, 611 is an addition circuit, 612 is an inverse orthogonal transformation circuit, 613 is a frame memory, 514 is a motion compensation prediction circuit, 615 is an orthogonal transformation circuit, and 630 is a coefficient integration circuit. Is.
【0199】これらのうち、逆直交変換回路612、フ
レームメモリ613、動き補償予測回路514、直交変
換回路615各々は、変換係数が符号化装置側での変換
係数がN×Nの構成であり、復号化はこのうちの所望構
成“n×n”(n=1〜N;Nは自然数)を復元すると
して、この場合、変換係数が“1×1”〜“n×n”の
構成のものをそれぞれ取得できるようにするために、
“1×1”用、“2×2”用、〜“n×n”用のそれぞ
れ独立した系統を用意してあり、合計N系統分(N階層
分)の構成としてある。Of these, each of the inverse orthogonal transform circuit 612, the frame memory 613, the motion compensation prediction circuit 514, and the orthogonal transform circuit 615 has a transform coefficient of N × N on the encoder side. It is assumed that the decoding restores the desired configuration “n × n” (n = 1 to N; N is a natural number) of these, and in this case, the conversion coefficient is “1 × 1” to “n × n”. To be able to get each
Independent systems for “1 × 1”, “2 × 2”, and “n × n” are prepared, and have a total of N systems (N layers).
【0200】解像度変換回路640は線92を介して与
えられるアルファマップの局部復号信号を水平・垂直共
にn/N倍(n=1〜N)に解像度変換してn階層ピラ
ミッドの信号として逆直交変換回路612,直交変換回
路615に出力するものである。逆直交変換回路61
2,直交変換回路615は各階層対応に設けられてお
り、従って、解像度変換された信号はその信号の対応す
る階層対応のものに入力される構成である。The resolution conversion circuit 640 converts the resolution of the locally decoded signal of the alpha map given through the line 92 to n / N times (n = 1 to N) both in the horizontal and vertical directions and inversely orthogonalizes it as a signal of the n-layer pyramid. The data is output to the conversion circuit 612 and the orthogonal conversion circuit 615. Inverse orthogonal transform circuit 61
The two-orthogonal transformation circuit 615 is provided for each layer, and therefore the resolution-converted signal is input to the corresponding layer corresponding to the signal.
【0201】加算回路611は線65を介して与えられ
る信号と係数統合回路630の出力を加算する回路であ
り、係数選択回路610はこの加算回路611からの変
換係数の再生値を受け、解像度変換回路640より供給
されるN階層のアルファマップ信号ピラミッドにしたが
って、変換係数を選択して第1〜第N階層各々の相当す
る変換係数を得ることにより、N階層ピラミッドを得る
ものである。The adder circuit 611 is a circuit for adding the signal given through the line 65 and the output of the coefficient integration circuit 630. The coefficient selection circuit 610 receives the reproduction value of the conversion coefficient from the adder circuit 611 and converts the resolution. According to the N-layer alpha map signal pyramid supplied from the circuit 640, the N-layer pyramid is obtained by selecting the transform coefficient and obtaining the corresponding transform coefficient of each of the first to N-th layers.
【0202】また、階層毎の逆直交変換回路612は係
数選択回路610より与えられる第1〜第N階層各々の
相当する変換係数のうち、対応する階層のものを受けて
それぞれ変換係数を逆変換し、復元して再生信号を得る
ものであり、本システムではこのうち、目的の解像度に
対応する階層の出力を最終的な再生信号として用いる構
成である。Also, the inverse orthogonal transform circuit 612 for each layer receives the corresponding transform coefficient of the corresponding transform coefficients of the first to Nth layers provided from the coefficient selecting circuit 610, and inversely transforms each transform coefficient. Then, the reproduction signal is restored to obtain the reproduction signal, and in this system, the output of the layer corresponding to the target resolution is used as the final reproduction signal.
【0203】各階層のフレームメモリ613は、各階層
毎の逆直交変換回路612のうち、自己対応の階層の逆
直交変換回路の出力を得てこれを蓄積し、その階層対応
の解像度のフレーム画像を得るものであり、動き補償予
測回路514は各階層毎のフレームメモリ613のう
ち、自己対応の階層用のフレームメモリからの画像を得
てこれよりその階層における画像の動き補償予測値を得
るものであり、直交変換回路615は各階層別に設けら
れており、それぞれ対応の階層の動き補償予測値を直交
変換すると共に、この直交変換した変換係数のうち、そ
の階層における最大周波項での変換係数を出力するもの
である。The frame memory 613 of each layer obtains the output of the inverse orthogonal transform circuit of the self-corresponding layer of the inverse orthogonal transform circuit 612 of each layer, accumulates the output, and stores the frame image of the resolution corresponding to the layer. The motion compensation prediction circuit 514 obtains the image from the frame memory for the layer corresponding to each layer of the frame memories 613 for each layer and obtains the motion compensation prediction value of the image in the layer from this. The orthogonal transform circuit 615 is provided for each hierarchical layer, and the motion compensation prediction value of the corresponding hierarchical layer is orthogonally transformed, and among the orthogonally transformed transform coefficients, the transform coefficient at the maximum frequency term in the hierarchical layer is obtained. Is output.
【0204】係数統合回路630は、各階層の直交変換
回路615から出力された変換係数を統合して加算回路
611に出力するものである。The coefficient integrating circuit 630 integrates the transform coefficients output from the orthogonal transform circuits 615 of the respective layers and outputs the integrated coefficients to the adder circuit 611.
【0205】すなわち、第1乃至第N階層用の各階層別
直交変換回路615は、各階層別動き補償予測回路61
4のうちのそれぞれ対応する階層の生成する動き補償予
測値を受けて直交変換し、その階層での最大周波項の変
換係数を出力するものであり、例えば、第1階層用の系
統の直交変換回路515(OT1 )であれば、直流成分
の周波数帯(第1低周波項)の動き補償予測値を、第2
階層用の系統の直交変換回路515(OT2 )であれ
ば、直流成分の次の周波数帯(第2低周波項)の動き補
償予測値を、第3階層用の系統の直交変換回路515
(OT3 )であれば、直流成分の次々周波数帯(第3低
周波項)の動き補償予測値を、第N階層用の系統の直交
変換回路515(OTN )であれば、最上位項の周波数
帯(第N周波項)の動き補償予測値を出力する。That is, the orthogonal transformation circuit 615 for each layer for the first to Nth layers is the motion compensation prediction circuit 61 for each layer.
4 is for receiving the motion-compensated prediction values generated by the respective corresponding layers of the four layers, and performing orthogonal transformation, and outputting the transform coefficient of the maximum frequency term in that layer. For example, the orthogonal transformation of the system for the first layer. In the case of the circuit 515 (OT 1 ), the motion compensation prediction value in the frequency band (first low frequency term) of the DC component is set to the second value.
If it is the orthogonal transformation circuit 515 (OT 2 ) of the hierarchy system, the motion compensation prediction value of the frequency band (second low frequency term) next to the DC component is converted to the orthogonal transformation circuit 515 of the hierarchy system of the third hierarchy.
If it is (OT 3 ), the motion compensation prediction value of the next frequency band of DC components (third low frequency term) is the highest term if it is the orthogonal transformation circuit 515 (OT N ) of the system for the Nth layer. The motion compensation prediction value in the frequency band (N-th frequency term) is output.
【0206】そして、係数統合回路630は、各直交変
換回路515から出力された各階層の動き補償予測値の
直交変換による変換係数を受けて、帯域毎に統合したn
×n個の変換係数予測値を加算回路611に与えるもの
である。Then, the coefficient integrating circuit 630 receives the transform coefficients by the orthogonal transform of the motion compensation prediction values of the respective layers outputted from the orthogonal transform circuits 515, and integrates them for each band.
This is to provide × n transform coefficient prediction values to the adder circuit 611.
【0207】このような構成において、解像度変換回路
640は線92を介して与えられるアルファマップの局
部復号信号を水平・垂直共にn/N倍に解像度変換して
n階層ピラミッドの信号として逆直交変換回路612,
直交変換回路615に出力する。逆直交変換回路61
2,直交変換回路615は各階層対応に設けられてお
り、従って、解像度変換された信号はその信号の対応す
る階層対応のものに入力される。In such a configuration, the resolution conversion circuit 640 converts the locally decoded signal of the alpha map given through the line 92 to horizontal / vertical resolution n / N times and inversely orthogonally converts it as an n-layer pyramid signal. Circuit 612
It outputs to the orthogonal transformation circuit 615. Inverse orthogonal transform circuit 61
The two-orthogonal transformation circuit 615 is provided for each layer, and therefore, the resolution-converted signal is input to the corresponding layer corresponding to the signal.
【0208】一方、加算回路611には線65を介して
逆量子化回路165から与えられる信号と係数統合回路
630の出力が与えられ、加算回路611は両者を加算
して変換係数の再生値を得てこれを係数選択回路610
に与える。係数選択回路610はこの加算回路611か
らの変換係数の再生値を受け、解像度変換回路640よ
り供給されるN階層のアルファマップ信号ピラミッドに
したがって、変換係数を選択して第1〜第N階層各々の
相当する変換係数を得ることにより、N階層ピラミッド
を得る。このN階層ピラミッドは、階層毎の逆直交変換
回路612のうちの対応する階層のものに入力される。On the other hand, the addition circuit 611 receives the signal given from the dequantization circuit 165 and the output of the coefficient integration circuit 630 via the line 65, and the addition circuit 611 adds both signals to obtain the reproduction value of the conversion coefficient. The coefficient selection circuit 610
Give to. The coefficient selection circuit 610 receives the reproduction value of the conversion coefficient from the addition circuit 611, selects the conversion coefficient in accordance with the N-layer alpha map signal pyramid supplied from the resolution conversion circuit 640, and selects each of the first to Nth layers. By obtaining the corresponding transform coefficient of, an N hierarchical pyramid is obtained. This N-layer pyramid is input to the corresponding layer of the inverse orthogonal transform circuit 612 for each layer.
【0209】すなわち、階層毎の逆直交変換回路612
では係数選択回路610より与えられる第1〜第N階層
各々の相当する変換係数のうち、対応する階層のものを
受けることになり、それぞれ受けた変換係数を逆変換
し、再生信号を得る。そして、本システムではこのう
ち、目的の解像度に対応する階層の出力を最終的な再生
信号として用いる。That is, the inverse orthogonal transform circuit 612 for each layer.
Then, among the corresponding conversion coefficients of the first to Nth layers provided from the coefficient selection circuit 610, those of the corresponding layers are received, and the received conversion coefficients are inversely transformed to obtain a reproduction signal. In this system, the output of the layer corresponding to the target resolution is used as the final reproduction signal.
【0210】階層毎の逆直交変換回路612の出力は、
また、各階層別に設けられたフレームメモリ613のう
ちの対応する階層のものに入力される。これにより各階
層別のフレームメモリ613は、それぞれ各階層毎の逆
直交変換回路612のうち、自己対応の階層の逆直交変
換回路の出力を得てこれを蓄積し、その階層対応の解像
度のフレーム画像を得る。The output of the inverse orthogonal transform circuit 612 for each layer is
Further, it is input to the corresponding layer of the frame memory 613 provided for each layer. As a result, the frame memory 613 for each layer obtains and stores the output of the inverse orthogonal transform circuit of the self-corresponding layer of the inverse orthogonal transform circuits 612 of each layer, and stores the output. Get the image.
【0211】各階層別の動き補償予測回路514は各階
層毎のフレームメモリ613のうち、自己対応の階層用
のフレームメモリからの画像を得てこれよりその階層に
おける画像の動き補償予測値を得る。そして、これを各
階層別に設けられた直交変換回路615の対応する階層
のものに入力する。各階層別の直交変換回路615で
は、それぞれ対応の階層の動き補償予測値を直交変換す
ると共に、この直交変換した変換係数のうち、その階層
における最大周波項での変換係数を係数統合回路630
に出力する。The motion compensation prediction circuit 514 for each layer obtains an image from the frame memory for the layer corresponding to each layer among the frame memories 613 for each layer and obtains the motion compensation prediction value of the image in that layer from this. . Then, this is input to the corresponding layer of the orthogonal transformation circuit 615 provided for each layer. The orthogonal transform circuit 615 for each layer orthogonally transforms the motion compensation prediction value of the corresponding layer, and the transform coefficient at the maximum frequency term in that layer among the transformed coefficients of this orthogonal transform is the coefficient integration circuit 630.
Output to
【0212】そして、係数統合回路630は、各階層の
直交変換回路615から出力された変換係数を統合して
加算回路611に出力する。Then, the coefficient integrating circuit 630 integrates the transform coefficients output from the orthogonal transform circuit 615 of each layer and outputs the integrated transform coefficient to the adder circuit 611.
【0213】このように、図9(b)の構成に関して
は、図8(b)と同様のプロセスで、N階層ピラミッド
のうちの第n階層までの再生画像を求める。そして、所
望とする再生画像の解像度が第n階層対応のものであれ
ば、各階層毎の逆直交変換回路612の出力のうち、第
n階層用の出力を再生信号として用いる。As described above, with regard to the configuration of FIG. 9B, the reproduced images up to the nth layer of the N layer pyramid are obtained by the same process as that of FIG. 8B. Then, if the resolution of the desired reproduced image is compatible with the nth layer, the output for the nth layer among the outputs of the inverse orthogonal transform circuit 612 for each layer is used as the reproduced signal.
【0214】なお、解像度変換回路540,解像度変換
回路640における縮小・拡大変換に利用できる技術と
しては、例えば、“尾上編:画像処理ハンドブック、
p.630,昭晃堂”に記載されている“2値画像の解
像度変換法”を用いれば良い。[0214] Note that, as a technique that can be used for the reduction / enlargement conversion in the resolution conversion circuit 540 and the resolution conversion circuit 640, for example, "Onoe: Image Processing Handbook,
p. 630, Shokoido ”,“ binary image resolution conversion method ”may be used.
【0215】以上第3の具体例においては、画像中から
注目像の部分の像だけを所望の解像度で符号化すること
ができると共に、再生側ではこれと同等もしくはそれ以
下の解像度での画像を得ることができるようになる。In the above third specific example, only the image of the image of interest can be coded at a desired resolution from the image, and at the reproducing side, an image at a resolution equal to or lower than this can be obtained. You will be able to get it.
【0216】(第4の具体例)次に、図10を用いて本
発明の第4の具体例を説明する。第4の具体例は図5で
説明した第2の具体例の技術において、任意形状の画像
を符号化することができるようにする技術である。(Fourth Specific Example) Next, a fourth specific example of the present invention will be described with reference to FIG. The fourth specific example is a technique that enables an image of an arbitrary shape to be encoded in the technique of the second specific example described with reference to FIG.
【0217】図10は、第4の具体例が適用されるSN
Rスケーラビリティ実現のための符号化回路部の構成を
示すブロック図である。図において、105は直交変換
回路、180はアルファマップ符号化回路、181は多
重化回路、126,127,128は量子化回路、13
6,137,138は可変長符号化回路、500a,5
00b,〜500Mは局部復号回路、405〜408は
遅延回路、116,117,118,415,416は
差分回路、146,147,148は逆量子化回路、4
25,426は加算回路である。FIG. 10 shows an SN to which the fourth specific example is applied.
It is a block diagram which shows the structure of the encoding circuit part for implement | achieving R scalability. In the figure, 105 is an orthogonal transformation circuit, 180 is an alpha map coding circuit, 181 is a multiplexing circuit, 126, 127 and 128 are quantization circuits, 13
6, 137, 138 are variable length coding circuits, 500a, 5
00b, to 500M are local decoding circuits, 405 to 408 are delay circuits, 116, 117, 118, 415 and 416 are difference circuits, 146, 147 and 148 are inverse quantization circuits, 4
25 and 426 are adder circuits.
【0218】アルファマップ符号化回路180は、前記
画像のアルファマップ情報を入力として受け、これを符
号化して線82に出力するものであり、また、符号化し
たアルファマップ信号を復号する機能を有していてこれ
によって復号したアルファマップ信号の局部復号信号を
線81を介して出力する機能を有する。The alpha map encoding circuit 180 receives the alpha map information of the image as an input, encodes it and outputs it to the line 82, and has a function of decoding the encoded alpha map signal. It has a function of outputting the locally decoded signal of the alpha map signal decoded by this through the line 81.
【0219】また、局部復号回路500aを持つ第1階
層L1の構成要素は、ベースレイヤの符号化信号を得る
ためのものであり、局部復号回路500bを持つ第2階
層L2の構成要素は、エンハンスレイヤの符号化信号を
得るためのものであり、局部復号回路500Mを持つ第
M階層LMの構成要素は、エンハンスレイヤの符号化信
号を得るためのものである。The constituent elements of the first layer L1 having the local decoding circuit 500a are for obtaining the encoded signal of the base layer, and the constituent elements of the second layer L2 having the local decoding circuit 500b are the enhanced ones. This is for obtaining a coded signal of a layer, and a constituent element of the M-th layer LM having the local decoding circuit 500M is for obtaining a coded signal of an enhanced layer.
【0220】図10の直交変換回路105には、線10
を介して画像信号が供給され、また、線81を介してア
ルファマップの局部復号信号が供給される。そして、直
交変換回路105は、画像信号をアルファマップの局部
復号信号に基づいて直交変換する。The orthogonal transform circuit 105 of FIG.
, And the locally decoded signal of the alpha map is supplied via line 81. Then, the orthogonal transformation circuit 105 orthogonally transforms the image signal based on the locally decoded signal of the alpha map.
【0221】図10のアルファマップ符号化回路180
には、線80を介してアルファマップ符号が入力され、
一方、直交変換回路105には、線10を介して画像信
号が供給される。そして、アルファマップ符号化回路1
80はこれを符号化して多重化回路181に出力すると
共に、符号化したアルファマップを復号化し、線81を
介して直交変換回路105に与える。The alpha map encoding circuit 180 of FIG.
Is input with the alpha map code via line 80,
On the other hand, the image signal is supplied to the orthogonal transformation circuit 105 via the line 10. Then, the alpha map encoding circuit 1
80 encodes this and outputs it to the multiplexing circuit 181, decodes the encoded alpha map, and gives it to the orthogonal transformation circuit 105 via the line 81.
【0222】多重化回路181では、アルファマップ符
号化回路180からのアルファマップ符号化出力と、可
変長符号化回路136からの出力を多重化して出力す
る。The multiplexing circuit 181 multiplexes the alpha map encoded output from the alpha map encoding circuit 180 and the output from the variable length encoding circuit 136 and outputs the multiplexed result.
【0223】直交変換回路105では、線10を介して
供給された画像信号を、線81を介してアルファマップ
の局部復号信号に基づいて直交変換し、この直交変換し
たことにより得られた直交変換係数を、第1階層L1の
差分回路116と第2階層L2の遅延回路405,40
6と 〜第M階層LMの遅延回路407,408とに
与える。In the orthogonal transformation circuit 105, the image signal supplied via the line 10 is orthogonally transformed based on the locally decoded signal of the alpha map via the line 81, and the orthogonal transformation obtained by this orthogonal transformation is performed. The coefficients are calculated by using the difference circuit 116 of the first layer L1 and the delay circuits 405, 40 of the second layer L2.
6 to the delay circuits 407 and 408 of the Mth layer LM.
【0224】そして、第1階層L1における差分回路1
16では、直交変換回路105より供給される直交変換
係数と、局部復号回路500aより線26を介して供給
される変換係数の予測値との予測誤差が計算され、量子
化回路126に供給される。そして、この量子化回路1
26にて量子化される。量子化された予測誤差信号は、
可変長符号化回路136と逆量子化回路146に供給さ
れる。可変長符号化回路136では予測誤差信号の量子
化値が可変長符号化され、線36を介して出力される。The differential circuit 1 in the first layer L1
In 16, the prediction error between the orthogonal transform coefficient supplied from the orthogonal transform circuit 105 and the predicted value of the transform coefficient supplied from the local decoding circuit 500 a via the line 26 is calculated and supplied to the quantization circuit 126. . And this quantization circuit 1
It is quantized at 26. The quantized prediction error signal is
It is supplied to the variable length coding circuit 136 and the dequantization circuit 146. In the variable length coding circuit 136, the quantized value of the prediction error signal is variable length coded and output via the line 36.
【0225】また、逆量子化回路146では、予測誤差
信号を逆量子化して予測誤差信号の再生値を得た後、線
46を介して局部復号回路500と第2階層L2に供給
する。そして、第2階層においては、まず遅延回路40
6にて、線46を介して第1階層L1における該ブロッ
クの予測誤差信号の再生値が得られるまで、直交変換回
路105より供給された直交変換係数が差分回路117
に供給されるタイミングを遅延させる。Further, the dequantization circuit 146 dequantizes the prediction error signal to obtain the reproduced value of the prediction error signal, and then supplies it via the line 46 to the local decoding circuit 500 and the second layer L2. Then, in the second layer, first, the delay circuit 40
At 6, the orthogonal transform coefficient supplied from the orthogonal transform circuit 105 continues until the reproduction value of the prediction error signal of the block in the first layer L1 is obtained via the line 46.
Delay the timing supplied to.
【0226】また、遅延回路405では、遅延回路40
6と同様に線81を介して供給されるアルファマップ信
号を遅延させた後、線86を介して第2階層L2の局部
復号回路500に供給する。In the delay circuit 405, the delay circuit 40
Similarly to 6, after delaying the alpha map signal supplied via the line 81, it is supplied to the local decoding circuit 500 of the second layer L2 via the line 86.
【0227】差分回路117では、遅延回路406より
供給される直交変換係数と、局部復号回路500bより
線27を介して供給される変換係数の予測値との予測誤
差が計算され、差分回路415に供給される。そして、
差分回路415では、差分回路117より供給される第
2階層L2での予測誤差と、線46を介して供給される
第1階層L1での予測誤差の再生値との差分が計算さ
れ、量子化回路127に供給される。そして、量子化回
路127ではこれを量子化する。The difference circuit 117 calculates a prediction error between the orthogonal transform coefficient supplied from the delay circuit 406 and the predicted value of the transform coefficient supplied from the local decoding circuit 500b through the line 27, and the difference circuit 415 calculates the prediction error. Supplied. And
In the difference circuit 415, the difference between the prediction error in the second layer L2 supplied from the difference circuit 117 and the reproduced value of the prediction error in the first layer L1 supplied via the line 46 is calculated and quantized. It is supplied to the circuit 127. Then, the quantizing circuit 127 quantizes this.
【0228】量子化回路127にて量子化された予測誤
差信号の差分は、可変長符号化回路137と逆量子化回
路147に供給される。The difference between the prediction error signals quantized by the quantization circuit 127 is supplied to the variable length coding circuit 137 and the inverse quantization circuit 147.
【0229】可変長符号化回路137では予測誤差信号
の差分の量子化値が可変長符号化され、線37を介して
第2階層L2の可変長符号化信号として出力されること
になる。In the variable length coding circuit 137, the quantized value of the difference between the prediction error signals is variable length coded and is output as the variable length coded signal of the second layer L2 via the line 37.
【0230】また、予測誤差信号の差分の量子化出力を
受けた逆量子化回路147では、これを逆量子化し、予
測誤差信号の差分の再生値に戻した後、加算回路425
において線46を介して供給される第1階層L1の予測
誤差信号の再生値を加算することにより、第2階層の予
測誤差信号の再生値を得る。そして、この第2階層の予
測誤差信号の再生値を、線47を介して局部復号回路5
00bに供給する。Further, the dequantization circuit 147 which has received the quantized output of the difference of the prediction error signal dequantizes it and returns it to the reproduced value of the difference of the prediction error signal, and then the addition circuit 425.
The reproduction value of the prediction error signal of the first layer L1 is added by the line 46 to obtain the reproduction value of the prediction error signal of the second layer. Then, the reproduced value of the prediction error signal of the second layer is supplied to the local decoding circuit 5 via the line 47.
Supply to 00b.
【0231】また、第M階層LMにおいては、直交変換
回路105の出力は、まず遅延回路408において所定
の時間、遅延される。すなわち、ここでの遅延量は、線
48を介して第M−1階層LM-1 における該ブロックの
予測誤差信号の再生値が得られるまでに相当する遅延時
間であり、直交変換回路105より供給された直交変換
係数が差分回路118に供給されるまでのタイミング分
が遅延される。In the M-th layer LM, the output of orthogonal transform circuit 105 is first delayed by delay circuit 408 for a predetermined time. That is, the delay amount here is a delay time corresponding to the time when the reproduction value of the prediction error signal of the block in the (M-1) th layer LM-1 is obtained via the line 48, and is supplied from the orthogonal transform circuit 105. The timing until the selected orthogonal transform coefficient is supplied to the difference circuit 118 is delayed.
【0232】また、遅延回路407では、遅延回路40
8と同様に線81を介して供給されるアルファマップ信
号を遅延させた後、線87を介して第M階層LMの局部
復号回路500Mに供給される。In the delay circuit 407, the delay circuit 40
After delaying the alpha map signal supplied via the line 81 as in the case of 8, it is supplied to the local decoding circuit 500M of the Mth layer LM via the line 87.
【0233】差分回路118では、遅延回路408より
供給される直交変換係数と、局部復号回路500Mより
線28を介して供給される変換係数の予測値との予測誤
差が計算され、差分回路416に供給される。そして、
差分回路416では、差分回路118より供給される第
M階層LMでの予測誤差と、線48を介して供給される
第M−1階層LM-1 での予測誤差の再生値との差分が計
算され、量子化回路128に供給されて、ここで量子化
される。The difference circuit 118 calculates the prediction error between the orthogonal transform coefficient supplied from the delay circuit 408 and the predicted value of the transform coefficient supplied from the local decoding circuit 500M via the line 28, and the difference circuit 416 calculates the error. Supplied. And
The difference circuit 416 calculates the difference between the prediction error in the Mth layer LM supplied from the difference circuit 118 and the reproduction value of the prediction error in the M−1th layer LM−1 supplied via the line 48. And is supplied to the quantization circuit 128 where it is quantized.
【0234】量子化回路128にて量子化された予測誤
差信号の差分は、可変長符号化回路138と逆量子化回
路148に供給される。可変長符号化回路138では予
測誤差信号の差分の量子化値が可変長符号化され、第M
階層LMでの可変長符号化信号として線38を介して出
力されることになる。The difference between the prediction error signals quantized by the quantization circuit 128 is supplied to the variable length coding circuit 138 and the dequantization circuit 148. In the variable length coding circuit 138, the quantized value of the difference of the prediction error signal is variable length coded,
It will be output via the line 38 as a variable length coded signal in the layer LM.
【0235】また、一方、逆量子化回路148では、予
測誤差信号の差分を逆量子化して予測誤差信号の差分の
再生値を得た後、加算回路426において線48を介し
て供給される第M−1階層の予測誤差信号の再生値を加
算して、第M階層LMの予測誤差信号の再生値を得た
後、線49を介して局部復号回路500Mに供給する。On the other hand, in the dequantization circuit 148, after the difference of the prediction error signal is dequantized to obtain the reproduction value of the difference of the prediction error signal, it is supplied to the adder circuit 426 via the line 48. The reproduction value of the prediction error signal of the M−1th layer is added to obtain the reproduction value of the prediction error signal of the Mth layer LM, and then the reproduction value is supplied to the local decoding circuit 500M via the line 49.
【0236】このようにして第2の具体例の技術におい
て、任意形状の画像を符号化することができるようにな
る。In this way, in the technique of the second specific example, it becomes possible to code an image of an arbitrary shape.
【0237】つぎに、復号化装置を説明する。Next, the decoding device will be described.
【0238】図11は第4の具体例において符号化され
た信号を復号化する装置の構成図である。図において、
190は分離化回路、191はアルファマップ復号化回
路、156,157,158は可変長復号化回路、16
6,167,168は逆量子化回路、435,436は
加算回路、600は復号回路である。FIG. 11 is a block diagram of an apparatus for decoding the coded signal in the fourth specific example. In the figure,
Reference numeral 190 is a separation circuit, 191 is an alpha map decoding circuit, 156, 157 and 158 are variable length decoding circuits, 16
6, 167 and 168 are inverse quantization circuits, 435 and 436 are addition circuits, and 600 is a decoding circuit.
【0239】分離化回路190は多重化回路181で多
重化された第1階層の符号化信号とアルファマップの符
号化信号との多重化信号を分離化して、第1階層の符号
化信号とアルファマップの符号化信号に戻すものであ
り、アルファマップ復号化回路191は分離化回路19
0で分離されたアルファマップの符号化信号を復号して
元のアルファマップを得るものであり、可変長復号化回
路156は分離化回路190で分離された第1階層の符
号化信号を復号化するものであり、逆量子化回路166
はこの復号化された信号を逆量子化して元の誤差値に戻
すものであり、可変長復号化回路157は、復号化装置
側の第2階層L2の可変長符号化回路137で符号化さ
れたものを復号化するものであり、逆量子化回路167
はこれを逆量子化して第2階層L2用の元の誤差値に戻
すものであり、可変長復号化回路158は、復号化装置
側の第m階層Lmの可変長符号化回路138で符号化さ
れたものを復号化するものであり、逆量子化回路168
はこれを逆量子化して第m階層Lm用の元の誤差値に戻
すものである。The demultiplexing circuit 190 demultiplexes the multiplexed signal of the coded signal of the first layer and the coded signal of the alpha map multiplexed by the multiplexing circuit 181, and separates the coded signal of the first layer and the alpha signal. The alpha map decoding circuit 191 is for returning to the encoded signal of the map.
The encoded signal of the alpha map separated by 0 is decoded to obtain the original alpha map, and the variable length decoding circuit 156 decodes the encoded signal of the first layer separated by the separation circuit 190. Inverse quantization circuit 166
Is for dequantizing the decoded signal to return it to the original error value. The inverse quantization circuit 167.
Dequantizes this to return to the original error value for the second layer L2, and the variable length decoding circuit 158 encodes it with the variable length encoding circuit 138 of the mth layer Lm on the decoding device side. The inverse quantization circuit 168
Is to dequantize this and return it to the original error value for the m-th layer Lm.
【0240】また、加算回路435は第3階層L3用の
元の誤差値と第2階層L2用の元の誤差値とを加算する
ものであり、加算回路436は加算回路435の出力と
第1階層L1用の元の誤差値とを加算するものである。The adder circuit 435 is for adding the original error value for the third layer L3 and the original error value for the second layer L2, and the adder circuit 436 is the output of the adder circuit 435 and the first error value. The original error value for the layer L1 is added.
【0241】復号回路600は加算回路436の出力と
アルファマップ復号化回路191の出力であるアルファ
マップとから、注目画像部分の再生信号を復号化して出
力するものである。The decoding circuit 600 decodes and outputs the reproduction signal of the image portion of interest from the output of the addition circuit 436 and the alpha map output from the alpha map decoding circuit 191.
【0242】図11において、線90を介して分離化回
路190に供給された第1階層L1の符号化ビットスト
リームは、アルファマップに関する符号と、変換係数に
関する符号に分離され、各々線91と線56を介して出
力される。線56,57,58を介して可変長復号化回
路156,157,158に各々供給された符号化ビッ
トストリームは、予測誤差信号あるいは予測誤差信号の
差分に復号されたのち逆量子化回路166,167,1
68に各々供給される。In FIG. 11, the coded bit stream of the first layer L1 supplied to the demultiplexing circuit 190 via the line 90 is separated into a code relating to the alpha map and a code relating to the transform coefficient. It is output via 56. The encoded bit streams supplied to the variable length decoding circuits 156, 157, 158 via the lines 56, 57, 58 are decoded into the prediction error signal or the difference between the prediction error signals, and then the dequantization circuit 166. 167,1
68 respectively.
【0243】逆量子化回路167,168では、予測誤
差信号の差分を逆量子化して予測誤差信号の差分の再生
値を得る。そして、加算回路435において、第m階層
Lmから第2階層L2までの予測誤差の差分の再生値を
加算して、加算回路436に供給する。第1階層L1用
の逆量子化回路166では、第1階層L1の予測誤差信
号を逆量子化して予測誤差信号の再生値を得た後、加算
回路436に供給して、ここで第m階層Lmから第2階
層L2までの分の予測誤差信号の再生値を加算する。加
算回路436で求められた第m階層Lmから第1階層L
1までの分の予測誤差信号の再生値の合計値は線65を
介して復号回路600に供給される。The dequantization circuits 167 and 168 dequantize the difference between the prediction error signals to obtain the reproduced value of the difference between the prediction error signals. Then, the adder circuit 435 adds the reproduced values of the differences in the prediction errors from the m-th layer Lm to the second layer L2 and supplies them to the adder circuit 436. The dequantization circuit 166 for the first layer L1 dequantizes the prediction error signal of the first layer L1 to obtain a reproduction value of the prediction error signal, and then supplies it to the adder circuit 436 where the mth layer. The reproduction values of the prediction error signal for Lm to the second layer L2 are added. From the m-th layer Lm obtained by the adder circuit 436 to the first-layer L
The sum of the reproduced values of the prediction error signal up to 1 is supplied to the decoding circuit 600 via the line 65.
【0244】そして、復号回路600はこれらの再生値
の合計値とアルファマップとを元に、注目画像部分の画
像の再生信号を得る。Then, the decoding circuit 600 obtains the reproduction signal of the image of the target image portion based on the sum of these reproduction values and the alpha map.
【0245】このようにして、任意形状の画像を符号化
すると共に、これを復号化することができるようにな
る。In this way, an image of arbitrary shape can be coded and decoded.
【0246】(第5の具体例)図12、図13および図
14を用いて、本発明の第5の具体例の説明をする。第
5の具体例は第m階層の符号化効率を向上させる技術で
ある。(Fifth Concrete Example) A fifth concrete example of the present invention will be described with reference to FIGS. 12, 13 and 14. The fifth specific example is a technique for improving the coding efficiency of the m-th layer.
【0247】本具体例は、前記第2の具体例および第4
の具体例において、第m階層での予測信号を、第m−1
階層の復号信号と第m階層の動き補償予測信号とを適用
的に切り換えることにより求めることで、第m階層の符
号化効率を向上させるものである。This example is the same as the second example and the fourth example.
In the specific example of, the prediction signal in the m-th layer is
The coding efficiency of the m-th layer is improved by adaptively switching between the decoded signal of the hierarchical layer and the motion-compensated prediction signal of the m-th layer.
【0248】以下では、ベースレイヤとエンハンスレイ
ヤの2階層にした場合の、本具体例を第2の具体例に適
用した例を示す。第4の具体例に付いても同様に適用す
ることができる。In the following, an example in which the present specific example is applied to the second specific example in the case of two layers of a base layer and an enhancement layer will be shown. The same applies to the fourth specific example.
【0249】《第5の具体例における符号化装置の構成
例》図12は、本発明の符号化装置のブロック図であ
る。この符号化装置は直交変換回路100、局部復号回
路200および700、遅延回路409、差分回路11
0および119、量子化回路120および129、可変
長符号化回路130および139、逆量子化回路140
および149とから構成される。<< Example of Configuration of Encoding Device in Fifth Specific Example >> FIG. 12 is a block diagram of an encoding device of the present invention. This encoding device includes an orthogonal transformation circuit 100, local decoding circuits 200 and 700, a delay circuit 409, and a difference circuit 11.
0 and 119, quantization circuits 120 and 129, variable length coding circuits 130 and 139, dequantization circuit 140
And 149.
【0250】局部復号回路700は、加算回路701と
逆直交変換回路(IOTN )、フレームメモリ703
(FMN )、動き補償予測回路704(MCN )、直交
変換回路705(OTN )、セレクタ706とより構成
される。The local decoding circuit 700 includes an adder circuit 701, an inverse orthogonal transform circuit (IOT N ), a frame memory 703.
(FM N ), a motion compensation prediction circuit 704 (MC N ), an orthogonal transformation circuit 705 (OT N ), and a selector 706.
【0251】直交変換回路100において、線10を介
して供給される画像信号は、N×N画素毎に直交変換さ
れ、N×N個の変換係数が得られる。ベースレイヤは第
1、第3の具体例と同一の構成であり、局部復号信号2
00における加算回路201の出力信号である該ブロッ
クの変換係数の再生信号と、量子化回路120の出力で
ある該ブロックの変換係数の動き補償予測誤差信号の量
子化値が、各々線BDと線PQ を介してエンハンスレイ
ヤに供給される。In the orthogonal transform circuit 100, the image signal supplied through the line 10 is orthogonally transformed for each N × N pixel, and N × N transform coefficients are obtained. The base layer has the same configuration as in the first and third concrete examples, and the locally decoded signal 2
00, the reproduced signal of the transform coefficient of the block which is the output signal of the adder circuit 201 and the quantized value of the motion compensation prediction error signal of the transform coefficient of the block which is the output of the quantization circuit 120 are respectively the line BD and the line BD. It is supplied to the enhancement layer via PQ.
【0252】エンハンスレイヤにおいては、当該レイヤ
における遅延回路409において、線BD を介して該ブ
ロックの再生信号が得られるまでの時間分、直交変換回
路100より供給された直交変換係数が差分回路119
に供給されるタイミングを遅延させる。In the enhancement layer, in the delay circuit 409 in the layer, the orthogonal transform coefficient supplied from the orthogonal transform circuit 100 corresponds to the difference circuit 119 for the time until the reproduction signal of the block is obtained via the line BD.
Delay the timing supplied to.
【0253】差分回路119では、直交変換回路100
より供給される直交変換係数と、局部復号回路700よ
り線29を介して供給されるN×N個の変換係数の予測
値との予測誤差が計算され、量子化回路129に供給さ
れる。量子化回路129にて量子化された予測誤差信号
は、可変長符号化回路139と逆量子化回路149に供
給される。In the difference circuit 119, the orthogonal transformation circuit 100
A prediction error between the orthogonal transform coefficient supplied from the local decoding circuit 700 and the predicted values of the N × N transform coefficients supplied from the local decoding circuit 700 via the line 29 is calculated and supplied to the quantization circuit 129. The prediction error signal quantized by the quantization circuit 129 is supplied to the variable length coding circuit 139 and the inverse quantization circuit 149.
【0254】可変長符号化回路139では予測誤差信号
の量子化値が可変長符号化され、線39を介して出力さ
れる。逆量子化回路149では、予測誤差信号を逆量子
化することにより得た予測誤差信号の再生値を、局部復
号回路700に供給する。In the variable length coding circuit 139, the quantized value of the prediction error signal is variable length coded and output via the line 39. The dequantization circuit 149 supplies the reproduced value of the prediction error signal obtained by dequantizing the prediction error signal to the local decoding circuit 700.
【0255】局部復号回路700では、逆量子化回路1
49より供給される予測誤差信号の再生値と線29を介
して供給される予測値とを加算回路701にて加算する
ことにより、変換係数の再生値を得、これを逆直交変換
回路702に供給する。In the local decoding circuit 700, the inverse quantization circuit 1
The reproduction value of the prediction error signal supplied from S.49 and the prediction value supplied via the line 29 are added by the adder circuit 701 to obtain the reproduction value of the transform coefficient, which is supplied to the inverse orthogonal transform circuit 702. Supply.
【0256】逆直交変換回路702では加算回路701
より供給された変換係数を逆変換して局部復号信号を出
力する。そして、フレームメモリ703では、逆直交変
換回路702より供給されるN×N画素毎の局部復号信
号を蓄積して局部復号画像を得る。動き補償予測回路7
04では、フレームメモリ703に蓄積されている局部
復号画像信号を用いて動き補償予測値を生成し、直交変
換回路705に供給する。In the inverse orthogonal transformation circuit 702, the addition circuit 701 is used.
The supplied transform coefficient is inversely transformed and a locally decoded signal is output. Then, the frame memory 703 accumulates the locally decoded signal for each N × N pixel supplied from the inverse orthogonal transform circuit 702 to obtain a locally decoded image. Motion compensation prediction circuit 7
In 04, a motion-compensated prediction value is generated using the locally decoded image signal stored in the frame memory 703, and is supplied to the orthogonal transform circuit 705.
【0257】直交変換回路705では、動き補償予測値
をN×N画素毎に直交変換し、変換係数を線EMCを介し
てセレクタ706に出力する。セレクタ706では、線
BDと線EMCを介して供給された変換係数を、線PQ を
介して供給されるベースレイヤでの動き補償予測誤差信
号の変換係数の量子化値にしたがって、適応的に切り換
える。The orthogonal transform circuit 705 orthogonally transforms the motion compensation prediction value for each N × N pixel, and outputs the transform coefficient to the selector 706 via the line EMC. The selector 706 adaptively switches the transform coefficient supplied via the line BD and the line EMC according to the quantized value of the transform coefficient of the motion compensation prediction error signal in the base layer supplied via the line PQ. .
【0258】図13は、セレクタ706に適用している
文献(T.K.Tan et.al.“A Frequ
ency Scalable Coding Sche
meEmploying Pyramid and S
ubband Techniques”,IEEE T
rans.CAS for Video Techno
logy,Vol.4,No.2,Apr.1994)
に記載されている切り換え手段の例である。FIG. 13 shows a document (TK Tan et. Al. “A Frequ” applied to the selector 706.
engy Scalable Coding Sche
meEmploying Pyramid and S
UBUBAN TECHNIQUES ”, IEEE T
rans. CAS for Video Techno
logic, Vol. 4, No. 2, Apr. 1994)
It is an example of the switching means described in.
【0259】図13において、PQ は量子化回路120
の出力、BD は局部復号回路200における加算回路2
01の出力、EMCは局部復号回路700における直交変
換回路705の出力であり、量子化回路120の出力P
Q である量子化値の中で、“0”で無い係数(白丸で囲
んだもの)は動き補償予測が当たらなかった係数であ
る。ここで、動き補償予測回路704においてベースレ
イヤと同じ動きベクトルを用いて動き補償予測を行って
いるため、エンハンスレイヤにおいても同じ係数の動き
補償予測は当たらない。In FIG. 13, PQ is the quantization circuit 120.
, BD is an adder circuit 2 in the local decoding circuit 200.
The output of 01, EMC is the output of the orthogonal transformation circuit 705 in the local decoding circuit 700, and the output P of the quantization circuit 120.
Among the quantized values that are Q, the coefficients that are not “0” (enclosed by white circles) are the coefficients that motion compensation prediction did not hit. Here, since the motion-compensated prediction circuit 704 performs motion-compensated prediction using the same motion vector as that of the base layer, motion-compensated prediction with the same coefficient does not apply to the enhanced layer.
【0260】一方、エンハンスレイヤを符号化する前に
ベースレイヤの符号化を終了させておけば、ベースレイ
ヤの再生信号を用いることができる。従って、図13に
おける出力PQ の量子化値の中で、この白丸で囲んであ
る係数は、ベースレイヤの再生信号をセレクタ706に
おいて選択して線29を介して出力するようにする。な
お、出力PQ を用いてセレクタ706を係数毎に切り換
える点は前記文献と同じである。しかし、本具体例では
ベースレイヤの再生を予測値に用いている点が異なる。On the other hand, if the coding of the base layer is completed before the coding of the enhancement layer, the reproduction signal of the base layer can be used. Therefore, in the quantized value of the output PQ in FIG. 13, the coefficient surrounded by the white circle causes the reproduction signal of the base layer to be selected by the selector 706 and output via the line 29. Incidentally, the point that the selector 706 is switched for each coefficient by using the output PQ is the same as the above-mentioned document. However, this specific example is different in that the reproduction of the base layer is used as the prediction value.
【0261】《第5の具体例における復号化装置の構成
例》図14は、図12の符号化装置で2階層に分けられ
て符号化されたビットストリームを復号化して再生画像
を得るための復号化装置のブロック図である。この復号
化装置は、可変長復号回路150および159、逆量子
化回路160および169、復号回路300および80
0とより構成される。<< Structural Example of Decoding Device in Fifth Specific Example >> FIG. 14 is a diagram for obtaining a reproduced image by decoding the bit stream coded by being divided into two layers in the encoding device of FIG. It is a block diagram of a decoding device. This decoding device includes variable length decoding circuits 150 and 159, dequantization circuits 160 and 169, and decoding circuits 300 and 80.
0.
【0262】エンハンスレイヤの復号回路800は、加
算回路801、逆直交変換回路802、フレームメモリ
803、動き補償予測回路804、直交変換回路80
5、フセレクタ806とより構成される。The enhancement layer decoding circuit 800 includes an adder circuit 801, an inverse orthogonal transform circuit 802, a frame memory 803, a motion compensation prediction circuit 804, and an orthogonal transform circuit 80.
5, and a selector 806.
【0263】図14において、ベースレイヤは第1、第
3の具体例と同一の構成であり、加算回路301の出力
信号である該ブロックの変換係数の再生信号BD と、可
変長復号回路150の出力である該ブロックの変換係数
の動き補償予測誤差信号の量子化値PQ が、エンハンス
レイヤのセレクタ806に供給される。In FIG. 14, the base layer has the same structure as the first and third concrete examples, and the reproduction signal BD of the conversion coefficient of the block which is the output signal of the adder circuit 301 and the variable length decoding circuit 150. The quantized value PQ of the motion compensation prediction error signal of the transform coefficient of the block, which is the output, is supplied to the selector 806 of the enhancement layer.
【0264】エンハンスレイヤにおいては、線59を介
して可変長復号化回路159に供給された符号化ビット
ストリームは、予測誤差信号に復号された後、逆量子化
回路169に供給される。逆量子化回路169では、予
測誤差信号を逆量子化して予測誤差信号の再生値を得た
後、線69を介して復号回路800に供給する。In the enhancement layer, the coded bit stream supplied to the variable length decoding circuit 159 via the line 59 is decoded into a prediction error signal and then supplied to the inverse quantization circuit 169. The dequantization circuit 169 dequantizes the prediction error signal to obtain a reproduced value of the prediction error signal, and then supplies it to the decoding circuit 800 via the line 69.
【0265】復号回路800では、線69を介して供給
される予測誤差信号の再生値とセレクタ806より供給
される予測値とを加算回路801にて加算することによ
り変換係数の再生値を得た後、逆直交変換回路802に
供給する。そして、逆直交変換回路802では加算回路
801より供給された変換係数を逆変換して復号信号を
線79を介して出力する。In the decoding circuit 800, the reproduction value of the conversion coefficient is obtained by adding the reproduction value of the prediction error signal supplied via the line 69 and the prediction value supplied from the selector 806 in the addition circuit 801. Then, it is supplied to the inverse orthogonal transform circuit 802. Then, the inverse orthogonal transform circuit 802 inversely transforms the transform coefficient supplied from the adder circuit 801, and outputs the decoded signal via the line 79.
【0266】フレームメモリ803では、逆直交変換回
路802より供給されるN×N画素毎の復号信号を蓄積
して復号画像を得る。動き補償予測回路804では、フ
レームメモリ803に蓄積されている復号画像信号を用
いて動き補償予測値を生成し、直交変換回路805に供
給する。In the frame memory 803, the decoded signal for each N × N pixel supplied from the inverse orthogonal transform circuit 802 is accumulated to obtain a decoded image. The motion compensation prediction circuit 804 uses the decoded image signal stored in the frame memory 803 to generate a motion compensation prediction value and supplies it to the orthogonal transform circuit 805.
【0267】直交変換回路805では、動は補償予測値
をN×N画素毎に直交変換し、変換係数を線EMCを介し
て出力する。セレクタ806では、再生信号BD と直交
変換回路805の出力である変換係数EMCを、ベースレ
イヤでの動き補償予測誤差信号の変換係数の量子化値P
Q (可変長復号回路150の出力)にしたがって、適応
的に切り換える。ここで、セレクタ806はセレクタ7
06と同じ動作をする。The orthogonal transform circuit 805 orthogonally transforms the compensation prediction value for every N × N pixels, and outputs the transform coefficient via the line EMC. In the selector 806, the reproduced signal BD and the transform coefficient EMC output from the orthogonal transform circuit 805 are used as the quantized value P of the transform coefficient of the motion compensation prediction error signal in the base layer.
It is adaptively switched according to Q (output of the variable length decoding circuit 150). Here, the selector 806 is the selector 7
The same operation as 06 is performed.
【0268】以上、本具体例は、前記第2の具体例およ
び第4の具体例において、第m階層での予測信号を、第
m−1階層の復号信号と第m階層の動き補償予測信号と
を適用的に切り換えることにより求めるようにしたもの
であり、これにより、第m階層の符号化効率を向上させ
ることができるようになる。As described above, in the present concrete example, in the second concrete example and the fourth concrete example, the prediction signal in the m-th layer is the decoded signal in the m-1 th layer and the motion-compensated prediction signal in the m-th layer. Are obtained by adaptively switching between and, and by this, it becomes possible to improve the coding efficiency of the m-th layer.
【0269】上記の具体例では、変換基底がブロック間
でオーバラップしていない例を示した。In the above specific example, an example in which the conversion bases do not overlap between blocks has been shown.
【0270】一方、“文献:如澤他、動き補償フィルタ
バンク構造を用いた画像符号化、PCSJ92,8−
5,1992”では、基底がオーバラップしている場合
でも変換後差分構成を取ることで符号化効率の低下の少
ない動き補償フィルタバンク構造を用いた符号化法を提
案している。本発明のように直交変換係数領域での予測
符号化装置(変換後差分構成)には、上記文献の考え方
が適用できるので、動き補償フィルタバンク構造を、第
1〜第5の具体例に適用しても良い。On the other hand, “Reference: Nyozawa et al., Image Coding Using Motion Compensation Filter Bank Structure, PCSJ92, 8-
5, 1992 "proposes an encoding method using a motion compensation filter bank structure in which a reduction in encoding efficiency is small by adopting a differential structure after conversion even when bases overlap. As described above, since the idea of the above-mentioned document can be applied to the predictive coding apparatus (differential structure after conversion) in the orthogonal transform coefficient domain, even if the motion compensation filter bank structure is applied to the first to fifth specific examples. good.
【0271】以上種々の例を説明したが、本発明は、多
階層に解像度や画質を可変にすることが可能なスケーラ
ブル符号化法において、ドリフトによる画質劣化や、大
幅な符号化効率低下の無い動画像符号化・復号化装置を
提供することを目的としたものであり、N×N個(N:
自然数)の変換係数毎に変換係数領域での動き補償予測
を用いた動き補償予測+変換符号化において、局部復号
された変換係数を低域からn×n個(n=1〜N)選択
することにより、N階層の変換係数ピラミッドを作成
し、このN階層の変換係数ピラミッドを各階層毎に逆変
換を施すことにより、N階層の再生画像ピラミッドを作
成し、このN階層の再生画像ピラミッドを各階層別に蓄
積してそれぞれフレーム画像を得、この各フレーム画像
を参照して、各階層毎に動き補償予測信号を作成し、こ
の動き補償予測信号を各階層毎にそれぞれ変換係数に変
換し、それぞれの階層での最高次の変換係数を抽出して
これを統合することにより、動き補償予測値を作成する
ようにした。そして、これを符号化するようにした。Although various examples have been described above, the present invention is a scalable coding method capable of varying resolution and image quality in multiple hierarchies without causing deterioration of image quality due to drift and significant reduction of coding efficiency. The purpose of the present invention is to provide a moving picture coding / decoding device, and N × N (N:
N × n (n = 1 to N) locally decoded transform coefficients are selected from the low frequency band in the motion compensation prediction + transform coding using the motion compensation prediction in the transform coefficient region for each transform coefficient (natural number). As a result, an N-layer conversion coefficient pyramid is created, and the N-layer conversion coefficient pyramid is inversely converted for each layer to create an N-layer reproduction image pyramid. Each frame is accumulated to obtain each frame image, and with reference to each frame image, a motion compensation prediction signal is created for each layer, and the motion compensation prediction signal is converted into a transform coefficient for each layer, The motion-compensated prediction value is created by extracting the highest-order transform coefficients in each layer and integrating them. Then, this is encoded.
【0272】また、復号化は復号化して得た変換係数の
うち、必要な解像度対応の階層における最高次の変換係
数を含むそれ以下の低次の変換係数を抽出してこれを逆
変換することにより必要な解像度対応の階層における動
き補償予測値を得て再生信号とするようにした。Decoding is performed by extracting, from the transform coefficients obtained by decoding, lower-order transform coefficients including the highest-order transform coefficient in the hierarchy corresponding to the required resolution and lower, and inversely transforming them. Thus, the motion compensation prediction value in the layer corresponding to the required resolution is obtained and used as the reproduction signal.
【0273】従って、符号化側での分解能より低い任意
の分解能で復号化する場合においても、ミスマッチが生
じることがなく、多階層に解像度や画質を可変にするこ
とが可能なスケーラブル符号化法において、ドリフトに
よる画質劣化や、大幅な符号化効率低下の無い動画像符
号化・復号化装置が得られることになる。Therefore, even when decoding is performed at an arbitrary resolution lower than the resolution on the encoding side, a scalable encoding method capable of varying resolution and image quality in multiple layers without causing a mismatch Therefore, it is possible to obtain a moving image coding / decoding device without deterioration of image quality due to drift and significant reduction of coding efficiency.
【0274】[0274]
【発明の効果】以上、本発明によれば、ドリフトの影響
や、大幅や符号化効率の低下無しに、任意形状画像の解
像度と画質を多段階に可変可能なスケーラブル符号化が
実現される。As described above, according to the present invention, the scalable coding in which the resolution and the image quality of an arbitrarily shaped image can be changed in multiple stages is realized without the influence of drift and the deterioration of the coding efficiency.
【図1】本発明を説明するための図であって、本発明に
よる画像符号化装置および画像復号化装置が適用される
画像伝送システムの一例を示す図。FIG. 1 is a diagram for explaining the present invention, showing an example of an image transmission system to which an image encoding device and an image decoding device according to the present invention are applied.
【図2】本発明を説明するための図であって、本発明の
第1の具体例における符号化装置の構成例を示すブロッ
ク図。[Fig. 2] Fig. 2 is a diagram for explaining the present invention and is a block diagram showing a configuration example of an encoding device in a first concrete example of the present invention.
【図3】本発明を説明するための図であって、本発明の
第1の具体例における局部復号回路を説明するための
図。FIG. 3 is a diagram for explaining the present invention and is a diagram for explaining a local decoding circuit in the first example of the present invention.
【図4】本発明を説明するための図であって、本発明の
第1の具体例における復号化装置の構成例を示すブロッ
ク図。FIG. 4 is a diagram for explaining the present invention and is a block diagram showing a configuration example of a decoding device in the first example of the present invention.
【図5】本発明を説明するための図であって、本発明の
第2の具体例の構成例を示すブロック図。FIG. 5 is a diagram for explaining the present invention and is a block diagram showing a configuration example of a second specific example of the present invention.
【図6】図5の符号化装置でM階層に分けられて符号化
されたビットストリームの中から、第m階層までのビッ
トストリームを復号化して再生画像を得る復号化装置の
ブロック図。6 is a block diagram of a decoding device that decodes bitstreams up to the m-th layer from the bitstreams that have been divided into M layers and encoded by the encoding device in FIG. 5 to obtain a reproduced image.
【図7】スケーラビリティを説明する図。FIG. 7 is a diagram for explaining scalability.
【図8】本発明を説明するための図であって、本発明の
第3の具体例における符号化装置の構成例を示すブロッ
ク図。[Fig. 8] Fig. 8 is a diagram for explaining the present invention and is a block diagram showing a configuration example of an encoding device in a third concrete example of the present invention.
【図9】本発明を説明するための図であって、本発明の
第3の具体例における復号化装置の構成例を示すブロッ
ク図。FIG. 9 is a diagram for explaining the present invention and is a block diagram showing a configuration example of a decoding device in a third example of the present invention.
【図10】本発明を説明するための図であって、本発明
の第4の具体例における符号化回路部の構成を示すブロ
ック図。FIG. 10 is a diagram for explaining the present invention and is a block diagram showing a configuration of an encoding circuit unit in a fourth example of the present invention.
【図11】本発明を説明するための図であって、本発明
の第4の具体例における復号化回路部の構成例を示すブ
ロック図。FIG. 11 is a diagram for explaining the present invention and is a block diagram showing a configuration example of a decoding circuit unit in a fourth concrete example of the present invention.
【図12】本発明を説明するための図であって、本発明
の第5の具体例における符号化装置の構成例を示すブロ
ック図。[Fig. 12] Fig. 12 is a diagram for explaining the present invention and is a block diagram showing a configuration example of an encoding device in a fifth concrete example of the present invention.
【図13】本発明を説明するための図であって、本発明
の第5の具体例における予測値切り換え法を説明する
図。FIG. 13 is a diagram for explaining the present invention, which is a diagram for explaining a prediction value switching method in the fifth example of the present invention.
【図14】本発明を説明するための図であって、本発明
の第5の具体例における復号化装置の構成例を示すブロ
ック図。FIG. 14 is a diagram for explaining the present invention, which is a block diagram showing a configuration example of a decoding device in a fifth example of the present invention.
【図15】従来技術を説明するための図であって、MP
EG2のSNRスケーラビリティのブロック図。FIG. 15 is a diagram for explaining a conventional technique, in which MP
Block diagram of SNR scalability of EG2.
【図16】従来技術を説明するための図であって、MP
EG2の空間スケーラビリティのブロック図。FIG. 16 is a diagram for explaining a conventional technique,
Block diagram of the spatial scalability of EG2.
【図17】アルファマップを説明する図。FIG. 17 is a diagram illustrating an alpha map.
【図18】先行技術である任意形状画像の直交変換を説
明する図。FIG. 18 is a diagram illustrating orthogonal transformation of an arbitrarily shaped image, which is a prior art.
【図19】先行技術である任意形状画像の解像度変換を
説明する図。FIG. 19 is a diagram for explaining resolution conversion of an arbitrarily shaped image which is a prior art.
100,105,205,305,505,605,7
05,805…直交変換回路 110〜113,115〜119,410,411,4
15,416…差分回路 120〜123,125〜129…量子化回路 130〜133,135〜139…可変長符号化回路 140〜149,160〜169…逆量子化回路 150〜153,155〜159…可変長復号化回路 180…アルファマップ符号化回路 181…多重化回路 190…分離化回路 191…アルファマップ復号化回路 200,200a〜200M,500,500a〜50
0M,700…局部復号回路 300,600,800…復号回路 201,211,301,311,420,421,4
25,426,430,431,435,436,50
1,511,601,611,701,801…加算回
路 202,302,502,602,702,802…逆
直交変換回路 203,303,503,603,703,803…フ
レームメモリ 204,304,504,604,704,804…動
き補償予測回路 212,312,512,612…逆直交変換回路ピラ
ミッド 213,313,513,613…フレームメモリピラ
ミッド 214,314,514,614…動き補償予測回路ピ
ラミッド 215,315,515,615…直交変換回路ピラミ
ッド 220,320,520,620…係数選択回路 230,330,530,630…係数統合回路 400,401,405,406,407,408…遅
延回路。100, 105, 205, 305, 505, 605, 7
05,805 ... Orthogonal transformation circuit 110-113,115-119,410,411,4
15, 416 ... Difference circuit 120 to 123, 125 to 129 ... Quantization circuit 130 to 133, 135 to 139 ... Variable length coding circuit 140 to 149, 160 to 169 ... Inverse quantization circuit 150 to 153, 155 to 159 ... Variable length decoding circuit 180 ... Alpha map encoding circuit 181 ... Multiplexing circuit 190 ... Separation circuit 191 ... Alpha map decoding circuit 200, 200a to 200M, 500, 500a to 50
0M, 700 ... Local decoding circuit 300, 600, 800 ... Decoding circuit 201, 211, 301, 311, 420, 421, 4
25,426,430,431,435,436,50
1, 511, 601, 611, 701, 801 ... Addition circuit 202, 302, 502, 602, 702, 802 ... Inverse orthogonal transformation circuit 203, 303, 503, 603, 703, 803 ... Frame memory 204, 304, 504 604, 704, 804 ... Motion compensation prediction circuit 212, 312, 512, 612 ... Inverse orthogonal transformation circuit pyramid 213, 313, 513, 613 ... Frame memory pyramid 214, 314, 514, 614 ... Motion compensation prediction circuit pyramid 215, 315 , 515, 615 ... Orthogonal transformation circuit pyramid 220, 320, 520, 620 ... Coefficient selection circuit 230, 330, 530, 630 ... Coefficient integration circuit 400, 401, 405, 406, 407, 408 ... Delay circuit.
Claims (14)
の変換係数毎に変換係数領域での動き補償予測値を用
い、画像信号を直交変換によるN×N個の変換係数に変
換してこれに前記動き補償予測値分の補正を加えた予測
誤差信号を得、これを符号化してビットストリームを得
る動画像の符号化装置において、 局部復号された変換係数を低域からn×n個(n=1〜
N)選択することにより、第1階層から第N階層までの
N階層のうち、少なくとも2つの変換係数ピラミッドを
作成する手段と、 前記N階層の変換係数ピラミッドを各階層毎に逆変換を
施すことにより、N階層の再生画像ピラミッドを作成す
る手段と、 N階層の再生画像ピラミッドを各階層毎に蓄積する手段
と、 前記蓄積手段に蓄積されている各階層毎の画像を参照し
て、各階層毎に動き補償予測信号を作成する手段と、 前記動き補償予測信号を各階層毎に変換係数に変換する
と共に、各階層毎にその階層での最高次領域の変換係数
をそれぞれ得る手段と、 前記各階層での最高次領域の変換係数を統合することに
より前記動き補償予測値を得る手段と、を有することを
特徴とする画像符号化装置。1. N × N pieces (N: natural number) by orthogonal transformation
A prediction error signal obtained by converting the image signal into N × N conversion coefficients by orthogonal transformation using the motion-compensated prediction value in the conversion coefficient region for each conversion coefficient and correcting the motion-compensated prediction value. In a moving picture coding apparatus for obtaining a bit stream by coding the same, the locally decoded transform coefficients are n × n (n = 1 to 1) from the low band.
N) means for creating at least two transform coefficient pyramids among the N hierarchies from the first hierarchy to the N th hierarchy by selecting, and performing inverse transformation for each of the transformation coefficient pyramids of the N hierarchies With reference to the means for creating the N-layer reproduced image pyramid, the means for accumulating the N-layer reproduced image pyramid for each layer, and the image for each layer accumulated in the accumulating means, each layer is referred to. A unit for creating a motion compensation prediction signal for each layer, a unit for converting the motion compensation prediction signal into a transform coefficient for each layer, and a unit for obtaining the transform coefficient of the highest-order area in each layer for each layer, Means for obtaining the motion-compensated prediction value by integrating the transform coefficients of the highest-order area in each layer.
た符号化ビットストリームを復号する復号化装置におい
て、 前記符号化ビットストリームを復号して変換係数に再生
する手段と、 この再生した変換係数に動き補償予測値分の補正を施し
た変換係数を得る手段と、 この動き補償予測値分の補正を施した変換係数から、第
1乃至第n階層(n=1〜N)までの各階層対応の符号
を階層別に取り出して、n階層の変換係数ピラミッドを
作成する手段と、 n階層の変換係数ピラミッドを各階層毎に逆変換を施す
ことにより、n階層の再生画像ピラミッドを作成すると
共に、第n階層の再生画像の情報を目的の再生画像とす
る手段と、 n階層の再生画像ピラミッドを各階層毎に蓄積する手段
と、 前記蓄積手段に蓄積されている画像を参照して、各階層
毎に動き補償予測信号を作成する手段と、 前記動き補償予測信号を各階層毎に変換係数に変換する
と共に、各階層毎にその階層での最高次領域の変換係数
をそれぞれ得る手段と、 前記それぞれ得た最高次領域の変換係数を統合すること
により前記動き補償予測値を得る手段とを有し、第n階
層の再生画像を再生することを特徴とする画像復号化装
置。2. A decoding device for decoding the coded bitstream obtained by the coding device according to claim 1, wherein the decoding device decodes the coded bitstream and regenerates it into transform coefficients, and the regenerated transform. Means for obtaining a conversion coefficient in which a motion compensation prediction value is corrected for the coefficient, and conversion coefficients in which the motion compensation prediction value is corrected for each of the first to nth layers (n = 1 to N) A means for creating a conversion coefficient pyramid of n layers by extracting the codes corresponding to the layers and a conversion coefficient pyramid of the n layers is subjected to inverse conversion for each layer to create a reproduced image pyramid of n layers. , Means for making the reproduced image information of the n-th layer a target reproduced image, means for accumulating an n-layer reproduced image pyramid for each layer, and referring to the images accumulated in the accumulating means, Means for creating a motion-compensated prediction signal for each layer, means for converting the motion-compensated prediction signal into transform coefficients for each layer, and obtaining, for each layer, a transform coefficient of the highest-order area in that layer, An image decoding apparatus for reproducing a reproduced image of the n-th layer, which has means for obtaining the motion-compensated prediction value by integrating the obtained conversion coefficients of the highest-order areas.
階層(M:自然数)のSNRスケーラビリティを実現す
る符号化装置であって、 第m階層(m=2〜N)の予測誤差信号と、第m−1階
層の予測誤差信号の局部再生値との差分信号を求める手
段と、 この差分信号を符号化して第m階層の符号化ビットスト
リームを得る符号化手段と、 第m階層において、前記差分信号を第m−1階層の量子
化ステップサイズより小さいステップサイズで量子化す
る手段と、 前記差分信号と、第m−1階層の予測誤差信号の局部再
生値を加算することで、第m階層の予測誤差信号の局部
再生値を求める加算手段と、 この局部再生値を蓄積して画像を得、これより第m階層
の動き補償値を求めて前記第m階層用の予測誤差信号を
得る局部復号手段とを備えることを特徴とする動画像符
号化装置。3. An M using the encoding device according to claim 1.
An encoding device that realizes SNR scalability of a layer (M: natural number), comprising a prediction error signal of the m-th layer (m = 2 to N) and a local reproduction value of the prediction error signal of the (m-1) -th layer. A means for obtaining a difference signal; an encoding means for encoding the difference signal to obtain an m-th layer encoded bit stream; and, in the m-th layer, the difference signal is smaller than the quantization step size of the (m-1) -th layer. Means for quantizing with a step size; adding means for obtaining a local reproduction value of the prediction error signal of the m-th layer by adding a local reproduction value of the prediction error signal of the (m-1) th layer; And a local decoding means for accumulating the local reproduction value to obtain an image, obtaining a motion compensation value of the m-th layer from the image, and obtaining a prediction error signal for the m-th layer. apparatus.
された符号化ビットストリームを復号する復号化装置に
おいて、 前記符号化ビットストリームのうち、第1乃至第m階層
(m=1〜M)までの符号を用い、これらを復号して第
m階層までの各階層別の量子化値を得る復号手段と、 この復号手段により復号された各階層別の量子化値をそ
れぞれ逆量子化する逆量子化手段と、 この逆量子化手段による第m階層までの逆量子化値を加
算して出力する手段と、 この加算出力を復号して画像再生に供する復号手段とを
備えることを特徴とする動画像復号化装置。4. A decoding device for decoding an encoded bitstream encoded by the encoding device according to claim 3, wherein among the encoded bitstreams, first to m-th layers (m = 1 to M). Decoding means for obtaining the quantized value for each layer up to the m-th layer, and the quantized value for each layer decoded by this decoding means are respectively dequantized. Inverse quantizing means, means for adding and outputting the dequantized values up to the m-th layer by the dequantizing means, and decoding means for decoding the added output and providing it for image reproduction Video decoding device.
変換係数領域での動き補償予測値を用い、画像信号を直
交変換によるN×N個の変換係数に変換してこれに前記
動き補償予測値分の補正を加えた予測誤差信号を得、こ
れを符号化してビットストリームを得る動画像符号化を
用いる装置において、 入力画像の背景とオブジェクトを識別するアルファマッ
プ信号を受けてこれを符号化する手段と、 前記入力画像のうち、前記アルファマップにしたがった
対応領域の画像について直交変換することにより、任意
形状画像を変換係数に変換して出力する手段と、 前記アルファマップにしたがって前記変換係数を逆変換
することにより、任意形状画像を再生する手段を有する
ことを特徴とした動画像符号化復号化装置。5. A motion compensation prediction value in a transform coefficient region is used for each of N × N transform coefficients by orthogonal transform, the image signal is transformed into N × N transform coefficients by orthogonal transform, and the motion is converted into the transform coefficient. Obtain a prediction error signal that has been compensated for the compensation prediction value, and encode it to obtain a bit stream.In a device that uses moving picture coding, the alpha map signal that identifies the background and object of the input image is received and A unit for encoding, a unit for transforming an image of an arbitrary shape into a transform coefficient by orthogonally transforming an image of a corresponding region according to the alpha map in the input image, and outputting the image according to the alpha map. A moving picture coding / decoding apparatus having means for reproducing an arbitrarily shaped image by inversely transforming a transform coefficient.
のアルファマップ信号ピラミッドを作成する手段と、 各階層毎に、アルファマップ信号にしたがって局部復号
された変換係数を低域からn階層分(n=1〜N)選択
することにより、N階層の変換係数ピラミッドを作成す
る手段と、 このN階層の変換係数ピラミッドを各階層毎にアルファ
マップ信号にしたがって逆変換を施すことにより、N階
層の再生画像ピラミッドを作成する手段と、 前記N階層の再生画像ピラミッドを各階層毎に蓄積する
手段と、 前記蓄積手段に蓄積されている画像を参照し、各階層毎
にアルファマップ信号にしたがって動き補償予測信号を
作成する手段と、 前記動き補償予測信号を各階層毎にアルファマップ信号
にしたがって変換係数に変換する手段と、 アルファマップ信号ピラミッドにしたがって前記変換係
数を統合することにより動き補償予測値を作成する手段
を有する動画像符号化装置。6. The apparatus according to claim 5, wherein means for converting the resolution of the input alpha map signal to create an alpha map signal pyramid of N layers, and local decoding for each hierarchy according to the alpha map signal. A conversion coefficient pyramid for N layers is created by selecting the conversion coefficients for n layers (n = 1 to N) from the low range, and the conversion coefficient pyramid for the N layers is converted into an alpha map signal for each layer. Therefore, by performing an inverse transformation, a unit for creating a reproduced image pyramid of N layers, a unit for accumulating the reproduced image pyramid of N layers for each layer, and an image accumulated in the accumulating unit are referred to, Means for creating a motion compensation prediction signal according to an alpha map signal for each layer, and the motion compensation prediction signal for each layer being an alpha map signal And a means for converting the conversion coefficient into a conversion coefficient according to the alpha map signal pyramid to generate a motion compensation prediction value.
変換係数領域での動き補償予測値を用い、画像信号を直
交変換によるN×N個の変換係数に変換してこれに前記
動き補償予測値分の補正を加えた予測誤差信号を得、こ
れを符号化してビットストリームを得る動画像符号化を
用いる装置であって、入力画像の背景とオブジェクトを
識別するアルファマップ信号を受けてこれを符号化し、 また、前記入力画像のうち、前記アルファマップにした
がった対応領域の画像について直交変換することによ
り、任意形状画像を変換係数に変換すると共に、この変
換係数と前記アルファマップとを符号化してビットスト
リームとして出力するようにした符号化手段により符号
化されたビットストリームを復号するための復号装置と
して、 ビットストリームからアルファマップを復号化する手段
と、 ビットストリームから変換係数を復号化する手段と、 前記アルファマップにしたがって任意形状画像を変換係
数に変換する手段と、 前記アルファマップにしたがって前記変換係数を逆変換
することにより、任意形状画像を再生する手段を有する
ことを特徴とした画像復号化装置。7. A motion compensation prediction value in a transform coefficient region is used for each of N × N transform coefficients by orthogonal transform, the image signal is transformed into N × N transform coefficients by orthogonal transform, and the motion is converted into the transform signal. A device that uses a moving image encoding that obtains a prediction error signal that has been corrected by a compensation prediction value and encodes this to obtain a bit stream, which receives an alpha map signal that identifies an object and a background of an input image. This is encoded, and the image of the corresponding region according to the alpha map of the input image is orthogonally transformed to transform the arbitrary shape image into a transformation coefficient, and the transformation coefficient and the alpha map are converted. As a decoding device for decoding the bitstream encoded by the encoding means that is encoded and output as a bitstream, a bitstream is provided. Means for decoding an alpha map from a program, means for decoding a transform coefficient from a bitstream, means for transforming an arbitrary shape image into a transform coefficient according to the alpha map, and inverse the transform coefficient according to the alpha map. An image decoding apparatus having a unit for reproducing an image of an arbitrary shape by conversion.
化された符号化ビットストリームを復号化する画像復号
化装置であって、 前記符号化ビットストリームから、第n階層(n=1〜
N)までの符号を取り出す手段と、 前記符号化ビットストリームからアルファマップ信号を
復号する手段と、 復号されたアルファマップ信号を解像度変換してN階層
のアルファマップ信号ピラミッドを作成する手段と、 復号された変換係数から、アルファマップ信号ピラミッ
ドにしたがってn階層の変換係数ピラミッドを作成する
手段と、 前記n階層の変換係数ピラミッドを各階層毎にアルファ
マップ信号にしたがって逆変換を施すことにより、n階
層の再生画像ピラミッドを作成する手段と、 前記n階層の再生画像ピラミッドを各階層毎に蓄積する
手段と、 前記蓄積手段に蓄積されている画像を参照し、各階層毎
にアルファマップ信号にしたがって動き補償予測信号を
作成する手段と、 前記動き補償予測信号を各階層毎にアルファマップ信号
にしたがって変換係数に変換する手段と、 前記アルファマップ信号ピラミッドにしたがって前記変
換係数を統合することにより動き補償予測値を作成する
手段とを有し、第n階層の再生画像を再生することを特
徴とする動画像復号化装置。8. An image decoding apparatus for decoding a coded bitstream coded by the coding apparatus according to claim 6, wherein the nth layer (n = 1 to 1) from the coded bitstream.
N) means for extracting codes up to N), means for decoding an alpha map signal from the coded bit stream, means for converting the resolution of the decoded alpha map signal to create an N layer alpha map signal pyramid, Means for creating a conversion coefficient pyramid of n layers from the converted conversion coefficients according to an alpha map signal pyramid; and an inverse conversion of the conversion coefficient pyramid of the n layers according to an alpha map signal for each of the n layers. Of the reproduced image pyramid, the means for accumulating the reproduced image pyramid of the n layers for each layer, the image accumulated in the accumulating unit, and moving in accordance with the alpha map signal for each layer. Means for creating a compensation prediction signal, and the motion compensation prediction signal for each layer by an alpha map. And a unit for converting the conversion coefficient according to the alpha map signal pyramid to create a motion compensation prediction value according to the alpha map signal pyramid. A video decoding device characterized by:
階層(M:自然数)のSNRスケーラビリティを実現す
る符号化装置であって、 第m階層(m=2〜N)の予測誤差信号と、第m−1階
層の予測誤差信号の局部再生値との差分信号を求める手
段と、 第m階層において、前記差分信号を第m−1階層の量子
化ステップサイズよりも小さいステップサイズで量子化
する手段と、 逆量子化された前記差分信号と、第m−1階層の予測誤
差信号の局部再生値を加算することで、第m階層の予測
誤差信号の局部再生値を求めることを特徴とする動画像
符号化装置。9. An M using the encoding device according to claim 5.
An encoding device that realizes SNR scalability of a layer (M: natural number), comprising a prediction error signal of the m-th layer (m = 2 to N) and a local reproduction value of the prediction error signal of the (m-1) -th layer. A means for obtaining a difference signal; a means for quantizing the difference signal with a step size smaller than a quantization step size of the m-1 th layer in the m-th layer; the dequantized difference signal; A moving picture coding apparatus, wherein the local reproduction value of the prediction error signal of the m-th layer is obtained by adding the local reproduction value of the prediction error signal of the -1st layer.
化された符号化ビットストリームを復号する復号化装置
において、 前記符号化ビットストリームから、第m階層(m=1〜
M)までの符号を取り出す手段と、 この取出した第m階層までの各階層の符号を復号する復
号手段と、 前記復号手段により復号された量子化値を各階層におい
て逆量子化する手段と、 第m階層までの逆量子化値を加算する手段とを有する請
求項7の動画像復号化装置。10. A decoding device for decoding an encoded bitstream encoded by the encoding device according to claim 9, wherein the m-th layer (m = 1 to 1) from the encoded bitstream.
M) means for extracting codes up to M), decoding means for decoding the extracted codes for each layer up to the m-th layer, and means for inversely quantizing the quantized value decoded by the decoding means in each layer, The moving picture decoding apparatus according to claim 7, further comprising means for adding dequantized values up to the m-th layer.
階層(M:自然数)のSNRスケーラビリティを実現す
る符号化装置であって、 第m階層(m=2〜N)の予測誤差信号と、第m−1階
層の予測誤差信号の局部再生値との差分信号を求める手
段と、 第m階層において、前記差分信号を第m−1階層の量子
化ステップサイズよりも小さいステップサイズで量子化
する手段と、 逆量子化された前記差分信号と、第m−1階層の予測誤
差信号の局部再生値を加算することで、第m階層の予測
誤差信号の局部再生値を求めることを特徴とする動画像
符号化装置。11. An M using the encoding device according to claim 6.
An encoding device that realizes SNR scalability of a layer (M: natural number), comprising a prediction error signal of the m-th layer (m = 2 to N) and a local reproduction value of the prediction error signal of the (m-1) -th layer. A means for obtaining a difference signal; a means for quantizing the difference signal with a step size smaller than a quantization step size of the m-1 th layer in the m-th layer; the dequantized difference signal; A moving picture coding apparatus, wherein the local reproduction value of the prediction error signal of the m-th layer is obtained by adding the local reproduction value of the prediction error signal of the -1st layer.
号化された符号化ビットストリームを復号する復号化装
置において、 前記符号化ビットストリームからアルファマップ信号を
復号する手段と、 復号されたアルファマップ信号を解像度変換してN階層
のアルファマップ信号ピラミッドを作成する手段と、 復号された変換係数から、アルファマップ信号ピラミッ
ドにしたがってn階層の変換係数ピラミッドを作成する
手段と、 前記符号化ビットストリームから第m階層(m=1〜
M)までの符号を取り出す手段と、 この取出した第m階層までの各階層の符号をアルファマ
ップ信号ピラミッドのうちの対応する階層のアルファマ
ップ信号にしたがって復号する復号手段と、 前記復号手段により復号された量子化値を各階層におい
て逆量子化する逆量子化手段と、 この逆量子化手段により逆量子化された第m階層までの
逆量子化値を加算する手段と、 この加算出力を復号することにより第m階層の再生画像
を再生する復号手段とを有する動画像復号化装置。12. A decoding device for decoding a coded bitstream coded by the coding device according to claim 11, a unit for decoding an alphamap signal from the coded bitstream, and a decoded alphamap. Means for converting the resolution of the signal to create an N-layer alpha map signal pyramid; means for creating an n-layer transform coefficient pyramid from the decoded transform coefficients according to the alpha map signal pyramid; M-th layer (m = 1 to 1
M) for extracting codes up to M), decoding means for decoding the extracted codes for each layer up to the m-th layer according to the alpha map signal of the corresponding layer of the alpha map signal pyramid, and the decoding means for decoding Dequantizing means for dequantizing the quantized values in each layer, means for adding the dequantized values up to the m-th layer dequantized by the dequantizing means, and decoding the addition output And a decoding means for reproducing the reproduced image of the m-th layer by doing so.
に変換係数領域での動き補償予測を用い、画像信号を直
交変換によるN×N個の変換係数に変換してこれに前記
動き補償予測値分の補正を加えた予測誤差信号を得、こ
れを符号化してビットストリームを得る動画像の符号化
装置において、 M階層のSNRスケーラビリティを実現する符号化装置
であって、 第m階層(m=2〜M)の動き補償予測値と第m−1階
層の局部再生値とを変換係数毎に切り換えることで、第
m階層の予測値を求める手段と、 第m−1階層における、予測誤差信号の量子化値の絶対
値がしきい値以下となる変換係数は第m階層の動き補償
予測値を、しきい値以上となる変換係数は第m−1階層
の局部再生値を出力するセレクタを有することを特徴と
する動画像符号化装置。13. A motion compensation prediction in a transform coefficient region is used for each N × N transform coefficients by orthogonal transform, and an image signal is converted into N × N transform coefficients by orthogonal transform and the motion compensation is performed on the image signal. A coding device for a moving picture, which obtains a prediction error signal with a correction for a prediction value and codes the coding error signal to obtain a bit stream, is a coding device which realizes SNR scalability of M layers, and is an m-th layer ( (m = 2 to M) and a means for obtaining a prediction value of the m-th layer by switching the motion compensation prediction value and the local reproduction value of the (m-1) -th layer for each conversion coefficient, The transform coefficient whose absolute value of the quantized value of the error signal is less than or equal to the threshold value outputs the motion compensation prediction value of the m-th layer, and the transform coefficient above the threshold value outputs the local reproduction value of the (m-1) -th layer. Moving image code characterized by having a selector Apparatus.
号化された符号化ビットストリームを復号する復号化装
置において、 前記符号化ビットストリームから、第m階層(m=2〜
M)までの符号を取り出す手段と、 この取出された第m階層までの各階層の符号を復号する
復号手段と、 前記復号手段により復号された予測誤差信号の量子化値
を各階層において逆量子化する手段と、 第m階層の動き補償予測値と第m−1階層の再生値とを
変換係数毎に切り換えることで、第m階層の予測値を求
める手段と、 第m−1階層における予測誤差信号の量子化値の絶対値
がしきい値以下となる変換係数は第m階層の動き補償予
測値を、しきい値以上となる変換係数は第m−1階層の
再生値を出力するセレクタを有することを特徴とする動
画像復号化装置。14. A decoding device for decoding a coded bitstream coded by the coding device according to claim 13, wherein the m-th layer (m = 2 to m) from the coded bitstream.
M) for extracting codes up to M), a decoding unit for decoding the extracted codes for each layer up to the m-th layer, and a quantized value of the prediction error signal decoded by the decoding unit for inverse quantization in each layer. Means, a means for obtaining the predicted value of the m-th layer by switching the motion-compensated predicted value of the m-th layer and the reproduction value of the m-1st layer for each conversion coefficient, and prediction in the m-1st layer. A selector that outputs a motion-compensated prediction value for the m-th layer when the absolute value of the quantized value of the error signal is less than or equal to the threshold value, and a reproduction value for the m-1th layer when the absolute value of the quantized value is less than or equal to the threshold value A moving picture decoding apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27718195A JP3576660B2 (en) | 1995-09-29 | 1995-09-29 | Image encoding device and image decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27718195A JP3576660B2 (en) | 1995-09-29 | 1995-09-29 | Image encoding device and image decoding device |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004073470A Division JP3914214B2 (en) | 2004-03-15 | 2004-03-15 | Image coding apparatus and image decoding apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0998434A true JPH0998434A (en) | 1997-04-08 |
JP3576660B2 JP3576660B2 (en) | 2004-10-13 |
Family
ID=17579942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27718195A Expired - Fee Related JP3576660B2 (en) | 1995-09-29 | 1995-09-29 | Image encoding device and image decoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3576660B2 (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005006766A1 (en) * | 2003-07-09 | 2005-01-20 | Nec Corporation | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program |
KR100480751B1 (en) * | 1998-10-10 | 2005-05-16 | 삼성전자주식회사 | Digital video encoding/decoding method and apparatus |
WO2005055613A1 (en) * | 2003-12-04 | 2005-06-16 | Nec Corporation | Moving picture encoding method and device, and moving picture decoding method and device |
JP2005341076A (en) * | 2004-05-26 | 2005-12-08 | Nippon Telegr & Teleph Corp <Ntt> | Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium |
JP2007312411A (en) * | 2001-01-03 | 2007-11-29 | Nokia Corp | Switching between bitstreams in video transmission |
JPWO2005106850A1 (en) * | 2004-04-28 | 2007-12-13 | 松下電器産業株式会社 | Hierarchical coding apparatus and hierarchical coding method |
JP2008533850A (en) * | 2005-03-10 | 2008-08-21 | クゥアルコム・インコーポレイテッド | Hierarchical video coding with two-layer coding and single-layer decoding |
JP2013081216A (en) * | 2000-08-21 | 2013-05-02 | Core Wireless Licensing S A R L | Video coding method |
-
1995
- 1995-09-29 JP JP27718195A patent/JP3576660B2/en not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100480751B1 (en) * | 1998-10-10 | 2005-05-16 | 삼성전자주식회사 | Digital video encoding/decoding method and apparatus |
JP2013081216A (en) * | 2000-08-21 | 2013-05-02 | Core Wireless Licensing S A R L | Video coding method |
JP2007312411A (en) * | 2001-01-03 | 2007-11-29 | Nokia Corp | Switching between bitstreams in video transmission |
US8306113B2 (en) | 2003-07-09 | 2012-11-06 | Nec Corporation | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program |
WO2005006766A1 (en) * | 2003-07-09 | 2005-01-20 | Nec Corporation | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program |
KR100734790B1 (en) * | 2003-07-09 | 2007-07-03 | 닛본 덴끼 가부시끼가이샤 | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, computer-readable recording medium for storing program |
US8855198B2 (en) | 2003-07-09 | 2014-10-07 | Nec Corporation | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program |
WO2005055613A1 (en) * | 2003-12-04 | 2005-06-16 | Nec Corporation | Moving picture encoding method and device, and moving picture decoding method and device |
JPWO2005106850A1 (en) * | 2004-04-28 | 2007-12-13 | 松下電器産業株式会社 | Hierarchical coding apparatus and hierarchical coding method |
JP4679513B2 (en) * | 2004-04-28 | 2011-04-27 | パナソニック株式会社 | Hierarchical coding apparatus and hierarchical coding method |
JP2005341076A (en) * | 2004-05-26 | 2005-12-08 | Nippon Telegr & Teleph Corp <Ntt> | Image communication system, communication conference system, hierarchical encoding device, server device, image communication method, image communication program, and image communication program recording medium |
US7995656B2 (en) | 2005-03-10 | 2011-08-09 | Qualcomm Incorporated | Scalable video coding with two layer encoding and single layer decoding |
JP2008533850A (en) * | 2005-03-10 | 2008-08-21 | クゥアルコム・インコーポレイテッド | Hierarchical video coding with two-layer coding and single-layer decoding |
Also Published As
Publication number | Publication date |
---|---|
JP3576660B2 (en) | 2004-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2935934B2 (en) | Compressed moving image data generation method and decoding method | |
US12272107B2 (en) | Use of tiered hierarchical coding for point cloud compression | |
US5818531A (en) | Video encoding and decoding apparatus | |
US6898324B2 (en) | Color encoding and decoding method | |
US6130911A (en) | Method and apparatus for compressing reference frames in an interframe video codec | |
US7010043B2 (en) | Resolution scalable video coder for low latency | |
US20060159359A1 (en) | Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking | |
KR20060006313A (en) | A method and apparatus for precoding, decoding a bitstream comprising a base layer | |
WO2006001777A1 (en) | Scalable video coding with grid motion estimation and compensation | |
US20240305834A1 (en) | Video decoding using post-processing control | |
KR20230108286A (en) | Video encoding using preprocessing | |
JP3576660B2 (en) | Image encoding device and image decoding device | |
JP3914214B2 (en) | Image coding apparatus and image decoding apparatus | |
US20250063173A1 (en) | Digital image processing | |
JP2001238220A (en) | Moving picture coding apparatus and moving picture coding method | |
Jean-François | Multiresolution coding schemes with layered bitrate regulation | |
Sevcenco et al. | Combined adaptive and averaging strategies for JPEG-based low bit-rate image coding | |
Boulgouris et al. | Directional interpolation pyramids for still image compression | |
WO2006078107A2 (en) | Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking | |
JP2001231049A (en) | Moving picture decoder and moving picture decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040406 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040706 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040708 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080716 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090716 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |