JP2011049816A - Moving image encoding device, moving image decoding device, moving image encoding method, moving image decoding method, and program - Google Patents
Moving image encoding device, moving image decoding device, moving image encoding method, moving image decoding method, and program Download PDFInfo
- Publication number
- JP2011049816A JP2011049816A JP2009196472A JP2009196472A JP2011049816A JP 2011049816 A JP2011049816 A JP 2011049816A JP 2009196472 A JP2009196472 A JP 2009196472A JP 2009196472 A JP2009196472 A JP 2009196472A JP 2011049816 A JP2011049816 A JP 2011049816A
- Authority
- JP
- Japan
- Prior art keywords
- prediction error
- error signal
- encoding
- moving image
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 42
- 230000009466 transformation Effects 0.000 claims description 21
- 230000001131 transforming effect Effects 0.000 claims description 8
- 230000000007 visual effect Effects 0.000 claims description 6
- 238000013139 quantization Methods 0.000 description 17
- 238000007405 data analysis Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動画像を符号化する動画像符号化装置、動画像符号化方法、およびプログラムと、これらにより符号化された動画像を復号する動画像復号装置、動画像復号方法、およびプログラムと、に関する。 The present invention relates to a moving image encoding apparatus, a moving image encoding method, and a program for encoding a moving image, and a moving image decoding apparatus, a moving image decoding method, and a program for decoding a moving image encoded thereby. , Regarding.
従来より、動画像を符号化する手法として、予測誤差信号(以下、「残差信号」と呼ぶ)に対して直交変換および量子化を行い、変換ブロック内で量子化後のDCT係数が全て「0」であれば、このブロックに1bitの情報(Coded Block Pattern;CBP)を付与し、このブロックにおける残差信号の符号化を省略するものが提案されている(例えば、非特許文献1参照)。この非特許文献1に記載の手法は、零DCT係数が発生しやすい高圧縮符号化において、特に有効である。 Conventionally, as a technique for encoding a moving image, orthogonal transform and quantization are performed on a prediction error signal (hereinafter referred to as “residual signal”), and all the DCT coefficients after quantization in a transform block are “ If “0”, 1-bit information (coded block pattern; CBP) is assigned to this block, and encoding of the residual signal in this block is omitted (for example, see Non-Patent Document 1). . This technique described in Non-Patent Document 1 is particularly effective in high compression encoding in which zero DCT coefficients are likely to occur.
また、動画像を符号化する手法として、高解像度映像における信号エネルギーの低周波成分への集中性を利用して、直交変換ブロックサイズの拡張を許容することで、直交変換および量子化による符号化性能を改善するものも提案されている(例えば、非特許文献2参照)。この非特許文献2に記載の手法は、周波数成分のエネルギーが1箇所に集まりやすい高精細映像に対して、有効である。
In addition, as a method for encoding moving images, encoding by orthogonal transformation and quantization is performed by allowing the expansion of the orthogonal transformation block size by using the concentration of signal energy in low-resolution components in high-resolution video. Some have been proposed to improve performance (see Non-Patent
非特許文献1、2に記載の手法により、動画像を符号化する場合について、図12、13を用いて以下に説明する。
The case where a moving image is encoded by the methods described in
図12は、N×Nの変換ブロックを示しており、ブロックB34にのみ非零DCT係数が含まれているものとする。このため、非特許文献1に記載の手法を用いた場合、DCT係数が全て「0」であるブロックB31、B32、B33では、CBPにより、残差信号の符号化が省略される。 FIG. 12 shows an N × N transform block, and it is assumed that only the block B34 includes a non-zero DCT coefficient. For this reason, when the method described in Non-Patent Document 1 is used, in the blocks B31, B32, and B33 whose DCT coefficients are all “0”, encoding of the residual signal is omitted by CBP.
図13は、図12に示したN×Nの変換ブロックを2N×2Nに拡張したものを示している。この2N×2Nの変換ブロック内には、図12のブロックB31〜B34に相当する周波数成分が含まれている。このため、2N×2Nの変換ブロック内には、図12のブロックB34の非零DCT係数が含まれていることになるので、この2N×2Nの変換ブロック全体が非零DCT係数を含むブロックとして扱われることとなる。このため、2N×2Nの領域に相当するDCT係数が全て符号化されることとなる。 FIG. 13 shows an extension of the N × N conversion block shown in FIG. 12 to 2N × 2N. This 2N × 2N conversion block includes frequency components corresponding to the blocks B31 to B34 in FIG. For this reason, since the non-zero DCT coefficient of the block B34 in FIG. 12 is included in the 2N × 2N transform block, the entire 2N × 2N transform block is a block including the non-zero DCT coefficient. Will be treated. For this reason, all DCT coefficients corresponding to the 2N × 2N region are encoded.
以上のように、非特許文献2に記載の手法では、CBPの適用される頻度が低下し、符号化されるDCT係数が増加することで符号量が増加するため、特に、高解像度、高圧縮符号化において、十分な符号化性能が得られない場合があった。
As described above, in the method described in
そこで、本発明は、上述の課題に鑑みてなされたものであり、CBPの適用頻度を向上させて、符号化性能を向上させることを目的とする。 Therefore, the present invention has been made in view of the above-described problems, and an object of the present invention is to improve the coding performance by improving the application frequency of CBP.
本発明は、上記の課題を解決するために、以下の事項を提案している。 The present invention proposes the following matters in order to solve the above problems.
(1)本発明は、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像符号化装置であって、直交変換後の予測誤差信号を複数に分割する予測誤差信号分割手段(例えば、図2のDCT係数分割部61に相当)と、前記予測誤差信号分割手段により分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定する符号化判定手段(例えば、図2のCBP判定部62A〜62Dに相当)と、前記符号化判定手段による判定結果に応じて、前記予測誤差信号分割手段により分割された各予測誤差信号を符号化する符号化手段(例えば、図2の残差信号エントロピー符号化部63A〜63Dに相当)と、前記符号化手段により符号化された各予測誤差信号を結合して符号化データを生成する符号化データ生成手段(例えば、図2のDCT係数結合部64および符号化データ生成部66に相当)と、を備えることを特徴とする動画像符号化装置を提案している。
(1) The present invention is a moving picture coding apparatus that orthogonally transforms a prediction error signal for each predetermined block size, and a prediction error signal dividing unit that divides the orthogonally transformed prediction error signal into a plurality of pieces. (For example, corresponding to the DCT
この発明によれば、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像符号化装置に、直交変換後の予測誤差信号を複数に分割する予測誤差信号分割手段と、予測誤差信号分割手段により分割された予測誤差信号ごとに直交変換係数に基づいて符号化するか否かを判定する符号化判定手段と、予測誤差信号分割手段により分割された各予測誤差信号を符号化判定手段による判定結果に応じて符号化する符号化手段と、符号化手段により符号化された各予測誤差信号を結合して符号化データを生成する符号化データ生成手段と、を設けた。このため、複数に分割された予測誤差信号ごとに、符号化を省略するか否かを決定し、符号化することができるので、CBPの適用頻度を向上させて、符号化性能を向上させることができる。 According to the present invention, the moving image encoding apparatus that performs orthogonal transform on the prediction error signal for each predetermined block size includes the prediction error signal dividing unit that divides the prediction error signal after orthogonal transformation into a plurality of prediction error signals. An encoding determination unit that determines whether or not each prediction error signal divided by the error signal division unit is encoded based on an orthogonal transform coefficient, and each prediction error signal divided by the prediction error signal division unit is encoded An encoding means for encoding according to a determination result by the determination means and an encoded data generating means for generating encoded data by combining the prediction error signals encoded by the encoding means are provided. For this reason, for each prediction error signal divided into a plurality, it is possible to determine whether or not to omit encoding, and to perform encoding. Therefore, it is possible to improve the encoding performance by improving the frequency of CBP application. Can do.
(2)本発明は、(1)の動画像符号化装置について、前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、矩形状の領域に相当する周波数成分ごとに分割する(例えば、図8に相当)ことを特徴とする動画像符号化装置を提案している。 (2) In the moving image encoding apparatus according to (1), the prediction error signal dividing unit divides the prediction error signal after orthogonal transformation into frequency components corresponding to rectangular regions (for example, , Which corresponds to FIG. 8).
この発明によれば、予測誤差信号分割手段により、直交変換後の予測誤差信号を、矩形状の領域に相当する周波数成分ごとに分割することとした。これによれば、上述した効果と同様の効果を奏することができる。 According to the present invention, the prediction error signal after the orthogonal transformation is divided by the prediction error signal dividing means for each frequency component corresponding to the rectangular region. According to this, an effect similar to the effect mentioned above can be produced.
(3)本発明は、(1)の動画像符号化装置について、前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、周波数帯域に応じた領域に相当する周波数成分ごとに分割する(例えば、図9に相当)ことを特徴とする動画像符号化装置を提案している。 (3) In the moving picture encoding apparatus according to (1), the prediction error signal dividing unit divides the prediction error signal after orthogonal transform into frequency components corresponding to regions corresponding to frequency bands. (For example, it corresponds to FIG. 9).
この発明によれば、予測誤差信号分割手段により、直交変換後の予測誤差信号を、周波数帯域に応じた領域に相当する周波数成分ごとに分割することとした。これによれば、上述した効果と同様の効果を奏することができる。 According to the present invention, the prediction error signal after orthogonal transformation is divided by the prediction error signal dividing means for each frequency component corresponding to the region corresponding to the frequency band. According to this, an effect similar to the effect mentioned above can be produced.
(4)本発明は、(1)の動画像符号化装置について、前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、視覚的な重要度に応じた領域に相当する周波数成分ごとに分割する(例えば、図10に相当)ことを特徴とする動画像符号化装置を提案している。 (4) The present invention relates to the moving picture encoding apparatus according to (1), wherein the prediction error signal dividing means outputs the prediction error signal after orthogonal transform for each frequency component corresponding to a region corresponding to visual importance. Has been proposed (for example, corresponding to FIG. 10).
この発明によれば、予測誤差信号分割手段により、直交変換後の予測誤差信号を、視覚的な重要度に応じた領域に相当する周波数成分ごとに分割することとした。これによれば、上述した効果と同様の効果を奏することができる。 According to the present invention, the prediction error signal dividing means divides the prediction error signal after orthogonal transform into frequency components corresponding to regions corresponding to visual importance. According to this, an effect similar to the effect mentioned above can be produced.
(5)本発明は、(1)の動画像符号化装置について、前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、矩形状の領域に相当する周波数成分ごと、周波数帯域に応じた領域に相当する周波数成分ごと、および視覚的な重要度に応じた領域に相当する周波数成分ごとのうち、いずれに分割するかをフレーム単位で決定し、前記決定した周波数成分ごとに、直交変換後の予測誤差信号を分割することを特徴とする動画像符号化装置を提案している。 (5) The present invention relates to the moving picture encoding apparatus according to (1), wherein the prediction error signal dividing unit determines the prediction error signal after orthogonal transform according to the frequency band for each frequency component corresponding to a rectangular region. For each frequency component corresponding to each region, and for each frequency component corresponding to the visual importance, it is determined on a frame basis whether to divide the frequency component, and orthogonal transform is performed for each determined frequency component. A moving picture coding apparatus that divides a subsequent prediction error signal has been proposed.
この発明によれば、予測誤差信号分割手段により、直交変換後の予測誤差信号を、矩形状の領域に相当する周波数成分ごと、周波数帯域に応じた領域に相当する周波数成分ごと、および視覚的な重要度に応じた領域に相当する周波数成分ごとのうち、いずれに分割するかをフレーム単位で決定し、決定した周波数成分ごとに、直交変換後の予測誤差信号を分割することとした。このため、直交変換後の予測誤差信号を、フレームごとに適した周波数成分ごとに分割することができるので、CBPの適用頻度をさらに向上させて、符号化性能をさらに向上させることができる。 According to this invention, the prediction error signal dividing means converts the orthogonally transformed prediction error signal for each frequency component corresponding to the rectangular region, for each frequency component corresponding to the region corresponding to the frequency band, and visually. Of each frequency component corresponding to the area corresponding to the importance, it is determined in frame units which to divide, and the prediction error signal after orthogonal transformation is divided for each determined frequency component. For this reason, since the prediction error signal after orthogonal transformation can be divided | segmented for every suitable frequency component for every flame | frame, the application frequency of CBP can be improved further and encoding performance can be improved further.
(6)本発明は、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像復号装置であって、(1)〜(5)のいずれかの動画像符号化装置において生成された符号化データを復号し、復号データを生成する復号データ生成部を備えることを特徴とする動画像復号装置を提案している。 (6) The present invention is a video decoding device that performs orthogonal transform on a prediction error signal for each predetermined block size, and is generated in any one of (1) to (5). A moving picture decoding apparatus is provided that includes a decoded data generation unit that decodes the encoded data and generates decoded data.
この発明によれば、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像復号装置に、(1)〜(5)のいずれかの動画像符号化装置において生成された符号化データを復号して復号データを生成する復号データ生成部を設けた。このため、(1)〜(5)のいずれかの動画像符号化装置において生成された符号化データを復号できる。 According to the present invention, a code generated in any one of the video encoding apparatuses (1) to (5) is added to the video decoding apparatus that performs orthogonal transform on the prediction error signal for each predetermined block size. There is provided a decoded data generation unit for decoding decoded data and generating decoded data. For this reason, the encoded data produced | generated in the moving image encoding apparatus in any one of (1)-(5) can be decoded.
(7)本発明は、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像符号化方法であって、直交変換後の予測誤差信号を複数に分割する第1のステップと、前記第1のステップにおいて分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定する第2のステップと、前記第2のステップにおける判定結果に応じて、前記第1のステップにおいて分割された各予測誤差信号を符号化する第3のステップと、前記第3のステップにおいて符号化された各予測誤差信号を結合して符号化データを生成する第4のステップと、を備えることを特徴とする動画像符号化方法を提案している。 (7) The present invention is a moving image coding method for orthogonally transforming a prediction error signal for each predetermined block size, and a first step of dividing the orthogonally transformed prediction error signal into a plurality of steps The second step for determining whether to encode based on the orthogonal transform coefficient for each prediction error signal divided in the first step, and according to the determination result in the second step, A third step for encoding each prediction error signal divided in the first step, and a fourth step for generating encoded data by combining the prediction error signals encoded in the third step. And a moving picture coding method characterized by comprising:
この発明によれば、動画像符号化方法により、直交変換後の予測誤差信号を複数に分割し、分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定することとした。そして、この判定結果に応じて、分割された各予測誤差信号を符号化し、符号化された各予測誤差信号を結合して符号化データを生成することとした。このため、複数に分割された予測誤差信号ごとに、符号化を省略するか否かを決定し、符号化することができるので、CBPの適用頻度を向上させて、符号化性能を向上させることができる。 According to the present invention, the prediction error signal after orthogonal transformation is divided into a plurality of parts by the moving picture encoding method, and it is determined whether or not the divided prediction error signal is encoded based on the orthogonal transformation coefficient. It was decided. Then, according to the determination result, the divided prediction error signals are encoded, and the encoded prediction error signals are combined to generate encoded data. For this reason, for each prediction error signal divided into a plurality, it is possible to determine whether or not to omit encoding, and to perform encoding. Therefore, it is possible to improve the encoding performance by improving the frequency of CBP application. Can do.
(8)本発明は、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像復号方法であって、(7)の動画像符号化方法において生成された符号化データを復号し、復号データを生成するステップを備えることを特徴とする動画像復号方法を提案している。 (8) The present invention is a moving picture decoding method for orthogonally transforming a prediction error signal for each predetermined block size, and decoding encoded data generated in the moving picture coding method of (7) And a moving picture decoding method characterized by comprising a step of generating decoded data.
この発明によれば、(7)の動画像符号化方法において生成された符号化データを復号し、復号データを生成することとした。このため、(7)の動画像符号化方法において生成された符号化データから、復号データを生成できる。 According to the present invention, the encoded data generated in the moving image encoding method of (7) is decoded to generate decoded data. Therefore, decoded data can be generated from the encoded data generated in the moving image encoding method of (7).
(9)本発明は、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像符号化方法を、コンピュータに実行させるためのプログラムであって、直交変換後の予測誤差信号を複数に分割する第1のステップと、前記第1のステップにおいて分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定する第2のステップと、前記第2のステップにおける判定結果に応じて、前記第1のステップにおいて分割された各予測誤差信号を符号化する第3のステップと、前記第3のステップにおいて符号化された各予測誤差信号を結合して符号化データを生成する第4のステップと、をコンピュータに実行させることを特徴とするプログラムを提案している。 (9) The present invention is a program for causing a computer to execute a moving image coding method for orthogonally transforming a prediction error signal for each predetermined block size, and the prediction error signal after orthogonal transformation is obtained. A first step of dividing into a plurality of steps, a second step of determining whether or not each prediction error signal divided in the first step is encoded based on an orthogonal transform coefficient, and the second step A third step of encoding each prediction error signal divided in the first step and a combination of the prediction error signals encoded in the third step according to the determination result in the step A program is proposed that causes a computer to execute a fourth step of generating the digitized data.
この発明によれば、プログラムをコンピュータに実行させることで、直交変換後の予測誤差信号を複数に分割し、分割した予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定することとした。そして、この判定結果に応じて、分割した各予測誤差信号を符号化し、符号化した各予測誤差信号を結合して符号化データを生成することとした。このため、複数に分割した予測誤差信号ごとに、符号化を省略するか否かを決定し、符号化することができるので、CBPの適用頻度を向上させて、符号化性能を向上させることができる。 According to the present invention, by causing a computer to execute the program, the prediction error signal after the orthogonal transformation is divided into a plurality of pieces, and whether or not each divided prediction error signal is encoded based on the orthogonal transformation coefficient is determined. It was decided to. Then, according to the determination result, the divided prediction error signals are encoded, and the encoded prediction error signals are combined to generate encoded data. For this reason, for each prediction error signal divided into a plurality, it is possible to determine whether or not to omit encoding, and to perform encoding. Therefore, it is possible to improve the encoding performance by improving the frequency of CBP application. it can.
(10)本発明は、予め定められたブロックサイズごとに予測誤差信号に対して直交変換する動画像復号方法を、コンピュータに実行させるためのプログラムであって、(9)の動画像符号化方法において生成された符号化データを復号し、復号データを生成するステップをコンピュータに実行させることを特徴とするプログラムを提案している。 (10) The present invention is a program for causing a computer to execute a moving image decoding method for orthogonally transforming a prediction error signal for each predetermined block size, the moving image encoding method according to (9) The program which decodes the coding data produced | generated in 1 and makes a computer perform the step which produces | generates decoded data is proposed.
この発明によれば、プログラムをコンピュータに実行させることで、(9)のプログラムをコンピュータに実行させることで生成された符号化データを復号し、復号データを生成することとした。このため、(9)のプログラムをコンピュータに実行させたことで生成された符号化データから、復号データを生成できる。 According to the present invention, the encoded data generated by causing the computer to execute the program (9) is decoded to generate decoded data. Therefore, decoded data can be generated from the encoded data generated by causing the computer to execute the program (9).
本発明によれば、直交変換後の予測誤差信号を複数に分割し、これら複数の直交変換後の予測誤差信号ごとに、符号化を省略するか否かを決定し、符号化する。このため、CBPの適用頻度を向上させて、符号化性能を向上させることができる。 According to the present invention, the prediction error signal after orthogonal transformation is divided into a plurality of pieces, and for each of the plurality of prediction error signals after orthogonal transformation, it is determined whether or not to omit the coding. For this reason, the application frequency of CBP can be improved and encoding performance can be improved.
また、本発明によれば、画像フレームを、画面間符号化のみ、画面内符号化のみ、または画像間符号化および画面内符号化の併用により、符号化することができる。ここで、画像フレームを画面内符号化のみで符号化する静止画像符号化は、本発明で想定する動画像符号化のサブセットである。このため、本発明を静止画の符号化にも適用することが可能であり、適用することにより、静止画像符号化の符号化性能を向上させることができる。 Further, according to the present invention, an image frame can be encoded by only inter-frame coding, only intra-frame coding, or a combination of inter-picture coding and intra-frame coding. Here, still image coding in which an image frame is coded only by intra-frame coding is a subset of moving picture coding assumed in the present invention. For this reason, the present invention can be applied to still image encoding, and the encoding performance of still image encoding can be improved by applying the present invention.
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. Note that the constituent elements in the following embodiments can be appropriately replaced with existing constituent elements and the like, and various variations including combinations with other existing constituent elements are possible. Accordingly, the description of the following embodiments does not limit the contents of the invention described in the claims.
<第1実施形態>
[動画像符号化装置AAの構成]
図1は、本発明の第1実施形態に係る動画像符号化装置AAの構成を示すブロック図である。動画像符号化装置AAは、イントラ符号化予測値生成部1、インター符号化予測値生成部2、モード判定制御部3、DCT/量子化部4、IDCT/逆量子化部5、エントロピー符号化部6、第1のローカルメモリ7、および第2のローカルメモリ8を備える。
<First Embodiment>
[Configuration of Moving Image Encoding Device AA]
FIG. 1 is a block diagram showing a configuration of a video encoding apparatus AA according to the first embodiment of the present invention. The moving image coding apparatus AA includes an intra-coded prediction value generation unit 1, an inter-coding prediction
イントラ符号化予測値生成部1は、入力映像aと、符号化済みブロックにおける局所復号値cと、符号化済みブロックにおける予測方向情報dと、を入力とする。このイントラ符号化予測値生成部1は、符号化済みブロックにおける局所復号値cに基づいて、予測値を生成し、生成した予測値と入力信号との差分を求めることで、符号化歪みを算出する。そして、算出した符号化歪みと、符号化済みブロックにおける予測方向情報dと、に基づいて、符号化に要するコスト値を算出する。そして、イントラ予測値eと、イントラ予測情報(動きベクトルを含む)fと、符号化コスト値gと、を出力する。 The intra encoded prediction value generation unit 1 receives the input video a, the local decoded value c in the encoded block, and the prediction direction information d in the encoded block. The intra-coded prediction value generation unit 1 generates a prediction value based on the local decoded value c in the encoded block, and calculates a coding distortion by obtaining a difference between the generated prediction value and the input signal. To do. Then, a cost value required for encoding is calculated based on the calculated encoding distortion and the prediction direction information d in the encoded block. Then, an intra prediction value e, intra prediction information (including a motion vector) f, and an encoding cost value g are output.
インター符号化予測値生成部2は、入力映像aと、符号化済みブロックにおける局所復号値cと、符号化済みブロックにおける予測方向情報dと、を入力とし、インター予測値hと、インター予測情報(動きベクトルを含む)iと、符号化コスト値jと、を出力する。
The inter-coded prediction
モード判定制御部3は、イントラ符号化予測値生成部1から出力される符号化コスト値gと、インター符号化予測値生成部2から出力される符号化コスト値jと、を入力とする。このモード判定制御部3は、これら入力されるコスト値g、jの比較を行い、処理ブロックに適する符号化モードを選択する。
The mode
DCT/量子化部4は、入力映像aと、予測値eおよび予測値hのうちモード判定制御部3により選択された符号化モードに応じたものと、の差分を入力とする。このDCT/量子化部4は、入力される信号に対してDCT処理および量子化処理を施し、N×M直交変換を行って、量子化されたDCT係数(残差信号)kとして出力する。
The DCT / quantization unit 4 receives the difference between the input video a and the prediction value e and the prediction value h corresponding to the encoding mode selected by the mode
IDCT/逆量子化部5は、量子化されたDCT係数(残差信号)kを入力とする。このIDCT/逆量子化部5は、入力される信号に対して逆量子化処理および逆DCT処理を施し、逆DCTされた画素信号mとして出力する。
The IDCT /
エントロピー符号化部6は、量子化されたDCT係数(残差信号)kと、予測情報fおよび予測情報iのうちモード判定制御部3により選択された符号化モードに応じたものと、を入力とする。このエントロピー符号化部6は、入力される信号についてエントロピー符号化を行い、符号化データbとして出力する。このエントロピー符号化部6の詳細については、図2を用いて後述する。
The
第1のローカルメモリ7は、予測値eおよび予測値hのうちモード判定制御部3により選択された符号化モードに応じたものと、逆DCTされた画素信号mと、の和をとった信号、すなわち符号化済みブロックにおける局所復号値cを入力とする。そして、符号化済みブロックにおける局所復号値cを蓄積し、適宜、イントラ符号化予測値生成部1およびインター符号化予測値生成部2に供給する。
The first local memory 7 is a signal obtained by summing the prediction value e and the prediction value h according to the encoding mode selected by the mode
第2のローカルメモリ8は、予測情報fおよび予測情報iのうちモード判定制御部3により選択された符号化モードに応じたもの、すなわち符号化済みブロックにおける予測方向情報dを入力とする。そして、符号化済みブロックにおける予測方向情報dを蓄積し、適宜、イントラ符号化予測値生成部1およびインター符号化予測値生成部2に供給する。
The second
[エントロピー符号化部6の構成]
図2は、エントロピー符号化部6の構成を示すブロック図である。本実施形態では、エントロピー符号化部6は、DCT/量子化部4によるN×M直交変換により得られた2次元の直交変換係数について、予め定められた形状で4つに分割するものとする(例えば、後述の図8参照)。このエントロピー符号化部6は、DCT係数分割部61と、CBP判定部62A、62B、62C、62Dと、残差信号エントロピー符号化部63A、63B、63C、63Dと、DCT係数結合部64と、予測情報エントロピー符号化部65と、符号化データ生成部66と、を備える。
[Configuration of Entropy Encoding Unit 6]
FIG. 2 is a block diagram showing a configuration of the
DCT係数分割部61は、N×MのDCTブロックにおける量子化されたDCT係数(残差信号)kを入力とする。このDCT係数分割部61は、量子化されたDCT係数(残差信号)kの信号を、動画像符号化装置AAと動画像復号装置BBとの間で予め定められた形状で4つに分割し、分割セグメントごとに、量子化されたDCT係数(残差信号)na、nb、nc、ndとして出力する。
The DCT
CBP判定部62A〜62Dは、それぞれ、量子化されたDCT係数(残差信号)na〜ndを入力とする。CBP判定部62Aは、DCTブロック内の量子化されたDCT係数(残差信号)naが全て「0」であるか否かを判別する。そして、全て「0」であると判別した場合には、残差信号naをエントロピー符号化しないと判定し、少なくとも1つ以上が「0」以外であると判別した場合には、残差信号naをエントロピー符号化すると判定する。そして、この判定結果であるCBP判定結果を示すフラグ情報(CBP情報)paを出力する。CBP判定部62B〜62Dのそれぞれについても、CBP判定部62Aと同様に、残差信号nb〜ndのそれぞれをエントロピー符号化するか否かを判定し、判定結果であるCBP判定結果を示すフラグ情報(CBP情報)pb〜pdのそれぞれを出力する。
The
残差信号エントロピー符号化部63A、63B、63C、63Dのそれぞれは、量子化されたDCT係数(残差信号)na〜ndのそれぞれと、CBP情報pa〜pdのそれぞれと、を入力とする。残差信号エントロピー符号化部63Aは、残差信号naをエントロピー符号化するとCBP判定部62Aにより判定されたか否かを、CBP情報paに基づいて判別する。そして、残差信号naをエントロピー符号化するとCBP判定部62Aにより判定されたと判別した場合には、残差信号naをエントロピー符号化してDCT係数結合部64に出力し、残差信号naをエントロピー符号化しないとCBP判定部62Aにより判定されたと判別した場合には、DCT係数結合部64には何も出力しない。残差信号エントロピー符号化部63B〜63Dのそれぞれについても、残差信号エントロピー符号化部63Aと同様に、CBP情報pb〜pdのそれぞれに応じて残差信号nb〜ndのそれぞれをエントロピー符号化し、DCT係数結合部64に出力する。
Each of the residual signal
DCT係数結合部64は、残差信号エントロピー符号化部63A〜63Dのそれぞれからの出力を入力とする。このDCT係数結合部64は、入力された信号を結合し、N×Mブロックにおける量子化されたDCT係数のエントロピー符号化データqとして出力する。
The DCT
予測情報エントロピー符号化部65は、予測情報fおよび予測情報iのうちモード判定制御部3により選択された符号化モードに応じたものと、CBP情報pa〜pdと、を入力とする。この予測情報エントロピー符号化部65は、符号化シンタックスにしたがい、予測情報fおよび予測情報iのうちモード判定制御部3により選択された符号化モードに応じたものと、CBP情報pa〜pdと、をエントロピー符号化し、予測情報およびCBP情報に関するエントロピー符号化データrとして出力する。
The prediction information
符号化データ生成部66は、N×Mの量子化されたDCT係数のエントロピー符号化データqと、予測情報およびCBP情報に関するエントロピー符号化データrと、を入力とする。この符号化データ生成部66は、符号化シンタックスにしたがって符号化データbを生成し、出力する。
The encoded
[動画像復号装置BBの構成]
図3は、本発明の第1実施形態に係る動画像復号装置BBの構成を示すブロック図である。動画像復号装置BBは、符号化データ解析部110、イントラ予測値生成部120、インター予測値生成部130、予測手法制御部140、およびメモリ150を備える。
[Configuration of Video Decoding Device BB]
FIG. 3 is a block diagram showing the configuration of the video decoding device BB according to the first embodiment of the present invention. The video decoding device BB includes an encoded
符号化データ解析部110は、符号化データbを入力とする。この符号化データ解析部110は、符号化シンタックスにしたがって、符号化データbに記載されている内容を解析し、エントロピー復号する。そして、エントロピー復号の結果として得られる、エントロピー復号された残差信号Aと、エントロピー復号された予測情報Bと、を出力する。この符号化データ解析部110の詳細については、図4を用いて後述する。
The encoded
予測手法制御部140は、エントロピー復号された予測情報Bを入力とする。この予測手法制御部140は、エントロピー復号された予測情報Bが、イントラ予測に関するものであるのか、インター予測に関するものであるのかを識別し、イントラ予測とインター予測とを切り替えるための制御信号Fを出力する。
The prediction
イントラ予測値生成部120には、制御信号Fに応じて、エントロピー復号された予測情報Bと、復号済み画素値Cと、が入力される。具体的には、イントラ予測値生成部120には、エントロピー復号された予測情報Bがイントラ予測に関するものであると予測手法制御部140により識別された場合に、エントロピー復号された予測情報Bと、復号済み画素値Cと、が入力される。イントラ予測値生成部120は、復号済み画素値Cを元に、エントロピー復号された予測情報Bにしたがってイントラ予測値Dを生成し、出力する。
According to the control signal F, the intra prediction
インター予測値生成部130には、制御信号Fに応じて、エントロピー復号された予測情報Bと、復号済み画素値Cと、が入力される。具体的には、インター予測値生成部130には、エントロピー復号された予測情報Bがインター予測に関するものであると予測手法制御部140により識別された場合に、エントロピー復号された予測情報Bと、復号済み画素値Cと、が入力される。インター予測値生成部130は、復号画素値Cを元に、エントロピー復号された予測情報Bにしたがってインター予測値Eを生成し、出力する。
According to the control signal F, the inter prediction
メモリ150は、エントロピー復号された残差信号Aと、イントラ予測値Dおよびインター予測値Eのうち制御信号Fに応じたものと、の和をとった信号、すなわち復号済み画素値Cを入力とする。ここで、イントラ予測値Dおよびインター予測値Eのうち制御信号Fに応じたものとは、エントロピー復号された予測情報Bがイントラ予測に関するものであると予測手法制御部140により識別された場合には、イントラ予測値Dのことであり、エントロピー復号された予測情報Bがインター予測に関するものであると予測手法制御部140により識別された場合には、インター予測値Eのことである。メモリ150は、入力された復号済み画素値Cを蓄積し、未復号ブロックの復号処理を行う際に、適宜、イントラ予測値生成部120またはインター予測値生成部130に供給する。
The
[符号化データ解析部110の構成]
図4は、符号化データ解析部110の構成を示すブロック図である。符号化データ解析部110は、シンタックス解析部111と、DCT係数分割部112と、予測情報エントロピー復号部113と、CBP情報識別部114と、残差信号エントロピー復号部115A、115B、115C、115Dと、DCT係数結合部116と、逆直交変換/逆量子化部117と、を備える。
[Configuration of Encoded Data Analysis Unit 110]
FIG. 4 is a block diagram illustrating a configuration of the encoded
シンタックス解析部111は、符号化データbを入力とする。このシンタックス解析部111は、符号化シンタックスにしたがい、符号化データbから、エントロピー符号化され量子化されたDCT係数(残差信号)Gと、N×Mブロックにおける4ビットのCBP情報Iと、エントロピー符号化された予測情報Hと、を取り出し、出力する。 The syntax analysis unit 111 receives the encoded data b. The syntax analysis unit 111, according to the encoding syntax, generates DCT coefficients (residual signal) G entropy-coded and quantized from the encoded data b, and 4-bit CBP information I in the N × M block. And the entropy-encoded prediction information H are extracted and output.
DCT係数分割部112は、エントロピー符号化され量子化されたDCT係数(残差信号)Gを入力とする。このDCT係数分割部112は、エントロピー符号化され量子化されたDCT係数(残差信号)Gを、動画像符号化装置AAと動画像復号装置BBとの間で予め定められた形状で4つに分割し、分割セグメントごとに、エントロピー符号化され量子化されたDCT係数(残差信号)Ja、Jb、Jc、Jdとして出力する。
The DCT
予測情報エントロピー復号部113は、エントロピー符号化された予測情報Hを入力とする。この予測情報エントロピー復号部113は、エントロピー符号化された予測情報Hをエントロピー復号し、エントロピー復号された予測情報Bとして出力する。
The prediction information
CBP情報識別部114は、N×Mブロックにおける4ビットのCBP情報Iを入力とする。このCBP情報識別部114は、4ビットのCBP情報Iから、4つに分割されたそれぞれの領域におけるCBP情報を取り出し、分割セグメントごとに、1ビットのCBP情報La、Lb、Lc、Ldとして出力する。
The CBP
残差信号エントロピー復号部115A〜115Dのそれぞれは、エントロピー符号化され量子化されたDCT係数(残差信号)Ja〜Jdのそれぞれと、CBP情報La〜Ldのそれぞれと、を入力とする。残差信号エントロピー復号部115Aは、エントロピー符号化され量子化されたDCT係数(残差信号)Jaが全て「0」であると判定した場合には、DCT係数が全て「0」である信号を、エントロピー復号された残差信号としてDCT係数結合部116に出力する。一方、エントロピー符号化され量子化されたDCT係数(残差信号)Jaの少なくとも1つ以上が「0」以外であると判定した場合には、エントロピー符号化された残差信号Jaをエントロピー復号し、エントロピー復号された残差信号としてDCT係数結合部116に出力する。残差信号エントロピー復号部115B〜115Dのそれぞれについても、残差信号エントロピー復号部115Aと同様に、エントロピー符号化され量子化されたDCT係数(残差信号)Jb〜Jdのそれぞれが「0」であるか否かを判定し、判定結果に応じて、エントロピー符号化され量子化されたDCT係数(残差信号)Jb〜Jdのそれぞれをエントロピー復号し、エントロピー復号された残差信号をDCT係数結合部116に出力する。
Each of the residual signal
DCT係数結合部116は、残差信号エントロピー復号部115A〜115Dのそれぞれからの出力を入力とする。このDCT係数結合部116は、入力された信号を結合し、N×Mブロックにおけるエントロピー復号された残差信号Mとして出力する。
The DCT
逆直交変換/逆量子化部117は、N×Mブロックにおけるエントロピー復号された残差信号Mを入力とする。この逆直交変換/逆量子化部117は、N×Mブロックにおけるエントロピー復号された残差信号Mに対して逆量子化および逆直交変換を行って、エントロピー復号された残差信号Aとして出力する。
The inverse orthogonal transform /
以上の動画像符号化装置AAによれば、量子化されたDCT係数(残差信号)kの信号を、動画像符号化装置AAと動画像復号装置BBとの間で予め定められた形状で4つに分割し、分割した4つの量子化されたDCT係数(残差信号)na、nb、nc、ndごとに、エントロピー符号化するか否かを判定し、判定結果に応じてエントロピー符号化する。このため、4つの量子化されたDCT係数(残差信号)na、nb、nc、ndごとに、符号化を省略するか否かを決定し、符号化することができるので、CBPの適用頻度を向上させて、符号化性能を向上させることができる。 According to the above moving picture coding apparatus AA, the quantized DCT coefficient (residual signal) k signal is shaped in a predetermined shape between the moving picture coding apparatus AA and the moving picture decoding apparatus BB. Divide into four, determine whether entropy encoding is performed for each of the four quantized DCT coefficients (residual signals) na, nb, nc, and nd, and entropy encoding according to the determination result To do. For this reason, it is possible to determine whether or not to omit encoding for each of the four quantized DCT coefficients (residual signals) na, nb, nc, and nd, and to perform encoding. Thus, the encoding performance can be improved.
また、以上の動画像符号化装置AAによれば、画像フレームを、画面間符号化のみ、画面内符号化のみ、または画像間符号化および画面内符号化の併用により、符号化することができる。ここで、画像フレームを画面内符号化のみで符号化する静止画像符号化は、動画像符号化装置AAで想定する動画像符号化のサブセットである。このため、動画像符号化装置AAは、動画像だけでなく静止画も符号化することができ、静止画像符号化の符号化性能を向上させることができる。 Further, according to the above moving image encoding apparatus AA, an image frame can be encoded by only inter-frame encoding, only intra-frame encoding, or a combination of inter-image encoding and intra-screen encoding. . Here, still image coding that encodes an image frame only by intra-frame coding is a subset of moving image coding assumed by the moving image coding apparatus AA. For this reason, the moving image encoding device AA can encode not only moving images but also still images, and can improve the encoding performance of still image encoding.
また、以上の動画像復号装置BBによれば、動画像符号化装置AAでエントロピー符号化された符号化データbを、動画像符号化装置AAと動画像復号装置BBとの間で予め定められた形状で4つに分割し、分割した4つのエントロピー符号化され量子化されたDCT係数(残差信号)Ja、Jb、Jc、Jdごとに、エントロピー復号するか否かを判定し、判定結果に応じてエントロピー復号する。このため、動画像符号化装置AAでエントロピー符号化された符号化データbを復号できる。 Also, according to the above moving picture decoding apparatus BB, the encoded data b entropy-coded by the moving picture encoding apparatus AA is determined in advance between the moving picture encoding apparatus AA and the moving picture decoding apparatus BB. It is determined whether entropy decoding is performed for each of the four entropy-coded and quantized DCT coefficients (residual signals) Ja, Jb, Jc, and Jd. Entropy decoding according to For this reason, the encoded data b entropy-encoded by the moving image encoding device AA can be decoded.
<第2実施形態>
[動画像符号化装置CCの構成]
図5は、本発明の第2実施形態に係る動画像符号化装置CCの構成を示すブロック図である。動画像符号化装置CCは、2次元の直交変換係数を分割する際の分割形状および分割数を、フレーム単位で制御する。この動画像符号化装置CCは、MB単位符号化処理部C1および制御情報エントロピー符号化部C2を備える。
Second Embodiment
[Configuration of Video Encoding Device CC]
FIG. 5 is a block diagram showing a configuration of a video encoding device CC according to the second embodiment of the present invention. The moving image encoding device CC controls the division shape and the number of divisions for dividing a two-dimensional orthogonal transform coefficient in units of frames. This moving image encoding device CC includes an MB unit encoding processing unit C1 and a control information entropy encoding unit C2.
制御情報エントロピー符号化部C2は、フレーム単位制御情報tを入力とする。この制御情報エントロピー符号化部C2は、フレーム単位制御情報tをエントロピー符号化し、フレーム単位制御情報符号化データvとして出力する。 The control information entropy encoding unit C2 receives the frame unit control information t. The control information entropy encoding unit C2 entropy encodes the frame unit control information t and outputs it as frame unit control information encoded data v.
MB単位符号化処理部C1は、入力映像aおよびフレーム単位制御情報tを入力とする。このMB単位符号化処理部C1は、フレーム単位制御情報tを用いて入力映像aをMB単位で符号化し、各MBにおける符号化データを生成し、MB単位符号化データuとして出力する。 The MB unit encoding processing unit C1 receives the input video a and the frame unit control information t. The MB unit encoding processing unit C1 encodes the input video a in MB units using the frame unit control information t, generates encoded data in each MB, and outputs the encoded data as MB unit encoded data u.
[MB単位符号化処理部C1の構成]
図6は、MB単位符号化処理部C1の構成を示すブロック図である。MB単位符号化処理部C1は、図1に示した本発明の第1実施形態に係る動画像符号化装置AAとは、フレーム単位制御情報tを入力される点と、エントロピー符号化部6の代わりにエントロピー符号化部6Aを備える点と、が異なる。なお、MB単位符号化処理部C1において、動画像符号化装置AAと同一構成要件については、同一符号を付し、その説明を省略する。
[Configuration of MB Unit Encoding Processing Unit C1]
FIG. 6 is a block diagram showing a configuration of the MB unit encoding processing unit C1. The MB unit coding processing unit C1 is different from the moving image coding apparatus AA according to the first embodiment of the present invention shown in FIG. 1 in that the frame unit control information t is input, and the
エントロピー符号化部6Aは、量子化されたDCT係数kと、予測情報fおよび予測情報iのうちモード判定制御部3により選択された符号化モードに応じたものと、に加えて、フレーム単位制御情報tを入力とする。このエントロピー符号化部6Aは、入力される信号についてエントロピー符号化を行い、MB単位符号化データuとして出力する。
In addition to the quantized DCT coefficient k and the encoding mode selected by the mode
[エントロピー符号化部6Aの構成]
図7は、エントロピー符号化部6Aの構成を示すブロック図である。エントロピー符号化部6Aは、図2に示した本発明の第1実施形態に係るエントロピー符号化部6とは、DCT係数分割部61の代わりにDCT係数分割部61Aを備える点が異なる。
[Configuration of
FIG. 7 is a block diagram showing a configuration of the
DCT係数分割部61Aは、N×MのDCTブロックにおける量子化されたDCT係数(残差信号)kに加えて、フレーム単位制御情報tを入力とする。このDCT係数分割部61Aは、量子化されたDCT係数(残差信号)kの信号を、フレーム単位制御情報tに応じた分割形状および分割数に分割し、分割セグメントごとに、量子化されたDCT係数(残差信号)として出力する。
The DCT
DCT係数分割部61Aによる量子化されたDCT係数(残差信号)kの分割について、図8、9、10を用いて以下に説明する。図8は、量子化されたDCT係数(残差信号)kを、4つの正方形の領域B1、B2、B3、B4に相当する周波数成分ごとに分割する場合を示す。図9は、量子化されたDCT係数(残差信号)kを、4つの周波数帯域に応じた領域B11、B12、B13、B14に相当する周波数成分ごとに分割する場合を示す。図10は、量子化されたDCT係数(残差信号)kを、4つの視覚的な重要度に応じた領域B21、B22、B23、B24に相当する周波数成分ごとに分割する場合を示す。
The division of the quantized DCT coefficient (residual signal) k by the DCT
DCT係数分割部61Aは、フレーム単位制御情報tに基づいて、フレームごとに、図8〜10に示した分割形状および分割数のいずれかを選択し、選択した分割形状および分割数に量子化されたDCT係数(残差信号)kを分割する。
The DCT
[動画像復号装置DDの構成]
本発明の第2実施形態に係る動画像復号装置DDは、図5に示した本発明の第2実施形態に係る動画像符号化装置CCにより符号化されたMB単位符号化データuを復号する。この動画像復号装置DDは、図3に示した本発明の第1実施形態に係る動画像復号装置BBとは、符号化データ解析部110の代わりに符号化データ解析部110Aを備える点が異なる。なお、動画像復号装置DDにおいて、動画像復号装置BBと同一構成要件については、同一符号を付し、その説明を省略する。
[Configuration of Video Decoding Device DD]
The video decoding device DD according to the second embodiment of the present invention decodes the MB unit encoded data u encoded by the video encoding device CC according to the second embodiment of the present invention shown in FIG. . This video decoding device DD is different from the video decoding device BB according to the first embodiment of the present invention shown in FIG. 3 in that it includes an encoded
図11は、符号化データ解析部110Aの構成を示すブロック図である。符号化データ解析部110Aは、図4に示した本発明の第1実施形態に係る符号化データ解析部110とは、シンタックス解析部111、DCT係数分割部112、予測情報エントロピー復号部113、およびCBP情報識別部114の代わりに、それぞれ、シンタックス解析部111A、DCT係数分割部112A、予測情報エントロピー復号部113A、およびCBP情報識別部114Aを備える点が異なる。
FIG. 11 is a block diagram illustrating a configuration of the encoded
シンタックス解析部111Aは、符号化データbを入力とする。このシンタックス解析部11Aは、符号化シンタックスにしたがい、符号化データbから、エントロピー符号化され量子化されたDCT係数(残差信号)Gと、エントロピー符号化された予測情報Hと、を取り出すとともに、CBPの分割形状および分割数に関する情報を得る。そして、エントロピー符号化され量子化されたDCT係数(残差信号)Gと、エントロピー符号化された予測情報Hと、を出力するとともに、CBPの分割形状および分割数に関する情報をCBP分割情報Iとして出力する。
The
DCT係数分割部112Aは、エントロピー符号化され量子化されたDCT係数(残差信号)Gに加えて、CBP分割情報Iを入力とする。このDCT係数分割部112Aは、フレーム単位で制御されるCBP分割情報Iにしたがって、エントロピー符号化され量子化されたDCT係数(残差信号)Gを、動画像符号化装置CCのDCT係数分割部61Aで選択された分割形状および分割数と同一の分割形状および分割数に分割する。そして、分割セグメントごとに、エントロピー符号化され量子化されたDCT係数(残差信号)Ja、Jb、Jc、Jdとして出力する。
The DCT
予測情報エントロピー復号部113Aは、エントロピー符号化された予測情報Hを入力とする。この予測情報エントロピー復号部113Aは、エントロピー符号化された予測情報Hをエントロピー復号し、エントロピー復号された予測情報Bに加えて、CBP分割情報Kを得て、これらエントロピー復号された予測情報Bと、CBP情報Iと、を出力する。 The prediction information entropy decoding unit 113A receives as input the prediction information H that has been entropy-coded. The prediction information entropy decoding unit 113A entropy-decodes the entropy-coded prediction information H, obtains CBP division information K in addition to the entropy-decoded prediction information B, and the entropy-decoded prediction information B and , CBP information I is output.
CBP情報識別部114Aは、N×Mブロックにおける4ビットのCBP情報Iに加えて、CBP分割情報Kを入力とする。このCBP情報識別部114Aは、4ビットのCBP情報Kから、4つに分割されたそれぞれの領域におけるCBP情報を取り出し、取り出したCBP情報およびCBP分割情報Kに基づいて、1ビットのCBP情報La、Lb、Lc、Ldを生成する。そして、分割セグメントごとに、CBP情報La、Lb、Lc、Ldを出力する。
In addition to the 4-bit CBP information I in the N × M block, the CBP
以上の動画像符号化装置CCによれば、フレームごとに、図8〜10に示した分割形状および分割数のいずれかを選択し、選択した分割形状および分割数に量子化されたDCT係数(残差信号)kの信号を分割する。そして、分割した量子化されたDCT係数(残差信号)na、nb、nc、ndごとに、エントロピー符号化するか否かを判定し、判定結果に応じてエントロピー符号化する。このため、量子化されたDCT係数(残差信号)kを、フレームごとに適した分割形状および分割数に分割することができるので、図1に示した本発明の第1実施形態に係る動画像符号化装置AAと比べて、CBPの使用頻度をさらに向上させて、符号化性能をさらに向上させることができる。 According to the above moving picture coding device CC, for each frame, one of the division shape and the number of divisions shown in FIGS. 8 to 10 is selected, and the DCT coefficient (QT coefficient quantized to the selected division shape and the number of divisions ( The residual signal (k) is divided. Then, for each of the divided quantized DCT coefficients (residual signals) na, nb, nc, and nd, it is determined whether to perform entropy encoding, and entropy encoding is performed according to the determination result. For this reason, since the quantized DCT coefficient (residual signal) k can be divided into division shapes and division numbers suitable for each frame, the moving image according to the first embodiment of the present invention shown in FIG. Compared with the image coding apparatus AA, the use frequency of CBP can be further improved, and the coding performance can be further improved.
また、以上の動画像符号化装置CCによれば、画像フレームを、画面間符号化のみ、画面内符号化のみ、または画像間符号化および画面内符号化の併用により、符号化することができる。ここで、画像フレームを画面内符号化のみで符号化する静止画像符号化は、動画像符号化装置CCで想定する動画像符号化のサブセットである。このため、動画像符号化装置CCは、動画像だけでなく静止画も符号化することができ、静止画像符号化の符号化性能も向上させることができる。 Further, according to the above moving image encoding device CC, an image frame can be encoded only by inter-frame coding, only intra-frame coding, or a combination of inter-frame coding and intra-frame coding. . Here, still image coding that encodes an image frame only by intra-frame coding is a subset of moving image coding assumed by the moving image coding device CC. For this reason, the moving image encoding device CC can encode not only a moving image but also a still image, and can improve the encoding performance of still image encoding.
また、以上の動画像復号装置DDによれば、動画像符号化装置CCでエントロピー符号化された符号化データbを、動画像符号化装置CCのDCT係数分割部61Aで選択された分割形状および分割数と同一の分割形状および分割数に分割する。そして、分割したエントロピー符号化され量子化されたDCT係数(残差信号)Ja、Jb、Jc、Jdごとに、エントロピー復号するか否かを判定し、判定結果に応じてエントロピー復号する。このため、動画像符号化装置CCでエントロピー符号化された符号化データbを復号できる。
Also, according to the above moving picture decoding device DD, the coded data b entropy-coded by the moving picture coding device CC is divided into the divided shape selected by the DCT
なお、本発明の動画像符号化装置AA、CCの処理や、動画像復号装置BB、DDの処理を、コンピュータ読み取り可能な記録媒体に記憶し、記録媒体に記録されたプログラムを動画像符号化装置AA、CCや、動画像復号装置BB、DDに読み込ませ、実行することによって、本発明を実現できる。 The processing of the moving image encoding devices AA and CC of the present invention and the processing of the moving image decoding devices BB and DD are stored in a computer-readable recording medium, and the program recorded on the recording medium is encoded with moving images. The present invention can be realized by causing the devices AA and CC and the video decoding devices BB and DD to read and execute the devices.
また、上述のプログラムは、このプログラムを記憶装置等に格納した動画像符号化装置AA、CCや動画像復号装置BB、DDから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。 Further, the above-described program can be transmitted from the moving image encoding devices AA, CC and the moving image decoding devices BB, DD storing the program in a storage device or the like via a transmission medium or by a transmission wave in the transmission medium. May be transmitted to other computer systems. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を動画像符号化装置AA、CCや動画像復号装置BB、DDにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 Further, the above-described program may be for realizing a part of the above-described function. Furthermore, what can implement | achieve the above-mentioned function in combination with the program already recorded on moving image encoder AA, CC, moving image decoder BB, DD, what is called a difference file (difference program) may be sufficient.
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。 The embodiments of the present invention have been described in detail with reference to the drawings. However, the specific configuration is not limited to the embodiments, and includes designs and the like that do not depart from the gist of the present invention.
例えば、上述の各実施形態では、量子化されたDCT係数(残差信号)を4つに分割したが、分割数はこれに限らない。 For example, in each of the above-described embodiments, the quantized DCT coefficient (residual signal) is divided into four, but the number of divisions is not limited to this.
例えば、動画像符号化装置AAのDCT係数分割部61で3つに分割する場合には、分割セグメントごとに、量子化されたDCT係数(残差信号)na、nb、ncを出力し、量子化されたDCT係数(残差信号)ndとしては何も出力しないものとする。この場合には、動画像復号装置BBのDCT係数分割部112は、CBP情報La、Lb、Lcを出力し、CBP情報Ldとしては何も出力しないものとする。
For example, when the DCT
一方、動画像符号化装置AAのDCT係数分割部61で5つに分割する場合には、エントロピー符号化部6に、CBP判定部62A〜62Dに加えてCBP判定部62Eを設けるとともに、残差信号エントロピー符号化部63A〜63Dに加えて残差信号エントロピー符号化部63Eを設ければよい。この場合には、動画像復号装置BBの符号化データ解析部110に、残差信号エントロピー復号部115A〜115Dに加えて残差信号エントロピー復号部115Eを設ければよい。
On the other hand, when the DCT
6、6A・・・エントロピー符号化部
61、61A・・・DCT係数分割部
62A〜62D・・・CBP判定部
63A〜63D・・・残差信号エントロピー符号化部
64・・・DCT係数結合部
65・・・予測情報エントロピー符号化部
66・・・符号化データ生成部
110、110A・・・符号化データ解析部
111、111A・・・シンタックス解析部
112、112A・・・DCT係数分割部
113・・・予測情報エントロピー復号部
114、114A・・・CBP情報識別部
115A〜115D・・・残差信号エントロピー復号部
116、116A・・・DCT係数結合部
117・・・逆直交変換/逆量子化部
AA、CC・・・動画像符号化装置
C1・・・MB単位符号化処理部
BB、DD・・・動画像復号装置
6, 6A ...
Claims (10)
直交変換後の予測誤差信号を複数に分割する予測誤差信号分割手段と、
前記予測誤差信号分割手段により分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定する符号化判定手段と、
前記符号化判定手段による判定結果に応じて、前記予測誤差信号分割手段により分割された各予測誤差信号を符号化する符号化手段と、
前記符号化手段により符号化された各予測誤差信号を結合して符号化データを生成する符号化データ生成手段と、
を備えることを特徴とする動画像符号化装置。 A video encoding device that performs orthogonal transform on a prediction error signal for each predetermined block size,
A prediction error signal dividing means for dividing the prediction error signal after the orthogonal transformation into a plurality of;
Encoding determination means for determining whether to encode based on orthogonal transform coefficients for each prediction error signal divided by the prediction error signal dividing means;
Encoding means for encoding each prediction error signal divided by the prediction error signal dividing means in accordance with a determination result by the encoding determination means;
Encoded data generating means for combining the prediction error signals encoded by the encoding means to generate encoded data;
A moving picture encoding apparatus comprising:
前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、矩形状の領域に相当する周波数成分ごとに分割することを特徴とする動画像符号化装置。 The moving image encoding device according to claim 1,
The prediction error signal dividing unit divides the prediction error signal after orthogonal transform into frequency components corresponding to rectangular regions.
前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、周波数帯域に応じた領域に相当する周波数成分ごとに分割することを特徴とする動画像符号化装置。 The moving image encoding device according to claim 1,
The prediction error signal dividing unit divides the prediction error signal after orthogonal transform into frequency components corresponding to regions corresponding to frequency bands.
前記予測誤差信号分割手段は、直交変換後の予測誤差信号を、視覚的な重要度に応じた領域に相当する周波数成分ごとに分割することを特徴とする動画像符号化装置。 The moving image encoding device according to claim 1,
The moving picture coding apparatus characterized in that the prediction error signal dividing means divides the prediction error signal after orthogonal transform into frequency components corresponding to regions corresponding to visual importance.
前記予測誤差信号分割手段は、
直交変換後の予測誤差信号を、矩形状の領域に相当する周波数成分ごと、周波数帯域に応じた領域に相当する周波数成分ごと、および視覚的な重要度に応じた領域に相当する周波数成分ごとのうち、いずれに分割するかをフレーム単位で決定し、
前記決定した周波数成分ごとに、直交変換後の予測誤差信号を分割することを特徴とする動画像符号化装置。 The moving image encoding device according to claim 1,
The prediction error signal dividing means includes
The prediction error signal after the orthogonal transformation is obtained for each frequency component corresponding to a rectangular region, for each frequency component corresponding to a region corresponding to a frequency band, and for each frequency component corresponding to a region corresponding to visual importance. Decide which one to divide into frames,
A moving picture coding apparatus that divides a prediction error signal after orthogonal transformation for each determined frequency component.
請求項1乃至5のいずれかに記載の動画像符号化装置において生成された符号化データを復号し、復号データを生成する復号データ生成部を備えることを特徴とする動画像復号装置。 A video decoding device that performs orthogonal transform on a prediction error signal for each predetermined block size,
6. A moving picture decoding apparatus comprising: a decoded data generating unit that decodes encoded data generated in the moving picture encoding apparatus according to claim 1 and generates decoded data.
直交変換後の予測誤差信号を複数に分割する第1のステップと、
前記第1のステップにおいて分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定する第2のステップと、
前記第2のステップにおける判定結果に応じて、前記第1のステップにおいて分割された各予測誤差信号を符号化する第3のステップと、
前記第3のステップにおいて符号化された各予測誤差信号を結合して符号化データを生成する第4のステップと、
を備えることを特徴とする動画像符号化方法。 A video encoding method for orthogonally transforming a prediction error signal for each predetermined block size,
A first step of dividing the prediction error signal after orthogonal transformation into a plurality of steps;
A second step of determining whether to encode based on an orthogonal transform coefficient for each prediction error signal divided in the first step;
A third step of encoding each prediction error signal divided in the first step according to the determination result in the second step;
A fourth step of generating encoded data by combining the prediction error signals encoded in the third step;
A moving picture encoding method comprising:
請求項7に記載の動画像符号化方法において生成された符号化データを復号し、復号データを生成するステップを備えることを特徴とする動画像復号方法。 A video decoding method for orthogonally transforming a prediction error signal for each predetermined block size,
8. A moving picture decoding method comprising the steps of decoding the encoded data generated in the moving picture encoding method according to claim 7 and generating decoded data.
直交変換後の予測誤差信号を複数に分割する第1のステップと、
前記第1のステップにおいて分割された予測誤差信号ごとに、直交変換係数に基づいて符号化するか否かを判定する第2のステップと、
前記第2のステップにおける判定結果に応じて、前記第1のステップにおいて分割された各予測誤差信号を符号化する第3のステップと、
前記第3のステップにおいて符号化された各予測誤差信号を結合して符号化データを生成する第4のステップと、
をコンピュータに実行させることを特徴とするプログラム。 A program for causing a computer to execute a moving image encoding method for orthogonally transforming a prediction error signal for each predetermined block size,
A first step of dividing the prediction error signal after orthogonal transformation into a plurality of steps;
A second step of determining whether to encode based on an orthogonal transform coefficient for each prediction error signal divided in the first step;
A third step of encoding each prediction error signal divided in the first step according to the determination result in the second step;
A fourth step of generating encoded data by combining the prediction error signals encoded in the third step;
A program that causes a computer to execute.
請求項9に記載のプログラムをコンピュータに実行させることで生成された符号化データを復号し、復号データを生成するステップをコンピュータに実行させることを特徴とするプログラム。 A program for causing a computer to execute a moving image decoding method for orthogonally transforming a prediction error signal for each predetermined block size,
10. A program for decoding encoded data generated by causing a computer to execute the program according to claim 9, and causing the computer to execute a step of generating decoded data.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009196472A JP2011049816A (en) | 2009-08-27 | 2009-08-27 | Moving image encoding device, moving image decoding device, moving image encoding method, moving image decoding method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009196472A JP2011049816A (en) | 2009-08-27 | 2009-08-27 | Moving image encoding device, moving image decoding device, moving image encoding method, moving image decoding method, and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2011049816A true JP2011049816A (en) | 2011-03-10 |
Family
ID=43835706
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009196472A Pending JP2011049816A (en) | 2009-08-27 | 2009-08-27 | Moving image encoding device, moving image decoding device, moving image encoding method, moving image decoding method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2011049816A (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015144465A (en) * | 2009-10-28 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | Video decoding method |
| JP6051156B2 (en) * | 2011-04-27 | 2016-12-27 | シャープ株式会社 | Image decoding apparatus and image encoding apparatus |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63215281A (en) * | 1987-03-04 | 1988-09-07 | Toshiba Corp | Picture signal transmitter |
| WO2006118288A1 (en) * | 2005-05-03 | 2006-11-09 | Matsushita Electric Industrial Co., Ltd. | Dynamic image encoding method, dynamic image decoding method, and device thereof |
| JP2006333500A (en) * | 2006-07-10 | 2006-12-07 | Mitsubishi Electric Corp | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method |
-
2009
- 2009-08-27 JP JP2009196472A patent/JP2011049816A/en active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63215281A (en) * | 1987-03-04 | 1988-09-07 | Toshiba Corp | Picture signal transmitter |
| WO2006118288A1 (en) * | 2005-05-03 | 2006-11-09 | Matsushita Electric Industrial Co., Ltd. | Dynamic image encoding method, dynamic image decoding method, and device thereof |
| JP2006333500A (en) * | 2006-07-10 | 2006-12-07 | Mitsubishi Electric Corp | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding method, moving picture decoding method |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015144465A (en) * | 2009-10-28 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | Video decoding method |
| JP2015144466A (en) * | 2009-10-28 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | Method for decoding video |
| JP2015144467A (en) * | 2009-10-28 | 2015-08-06 | サムスン エレクトロニクス カンパニー リミテッド | Video decoding method |
| US10136149B2 (en) | 2009-10-28 | 2018-11-20 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
| US10154273B2 (en) | 2009-10-28 | 2018-12-11 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
| US10171826B2 (en) | 2009-10-28 | 2019-01-01 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
| US10178401B2 (en) | 2009-10-28 | 2019-01-08 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
| US10257530B2 (en) | 2009-10-28 | 2019-04-09 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding residual block, and method and apparatus for decoding residual block |
| JP6051156B2 (en) * | 2011-04-27 | 2016-12-27 | シャープ株式会社 | Image decoding apparatus and image encoding apparatus |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7257535B2 (en) | Improved Residual Coding for Transform Skip Mode and Block Differential Pulse Code Modulation | |
| KR101493140B1 (en) | Flexible band offset mode in sample adaptive offset in hevc | |
| KR102318785B1 (en) | Features of base color index map mode for video and image coding and decoding | |
| DK3282705T3 (en) | PROCEDURE FOR DECODING AND APPARATUS FOR ENCODING A PICTURE THROUGH INTRAPHIC PREDICTION. | |
| KR101684038B1 (en) | Video decoder, video encoder, video decoding method, and video encoding method | |
| JP2010135864A (en) | Image encoding method, device, image decoding method, and device | |
| KR20150090178A (en) | Content adaptive entropy coding of coded/not-coded data for next generation video | |
| CN105684441A (en) | Hash-based block matching in video and image coding | |
| KR20080068276A (en) | Intra prediction coding, decoding method and apparatus | |
| JPWO2010001999A1 (en) | Video encoding / decoding method and apparatus | |
| KR20190080842A (en) | Methods and apparatus for video transform encoding/decoding | |
| WO2013145021A1 (en) | Image decoding method and image decoding apparatus | |
| JP6708211B2 (en) | Moving picture coding apparatus, moving picture coding method, and recording medium storing moving picture coding program | |
| JP2021150788A (en) | Image encoding device, image encoding method and program, and image decoding device, image decoding method and program | |
| JP6528635B2 (en) | Moving picture coding apparatus, moving picture coding method, and computer program for moving picture coding | |
| JP2011049816A (en) | Moving image encoding device, moving image decoding device, moving image encoding method, moving image decoding method, and program | |
| JP2007325024A (en) | Image coding apparatus and image coding method | |
| KR101436949B1 (en) | Method and apparatus for encoding picture, and apparatus for processing picture | |
| RU2810727C1 (en) | Methods, equipment and devices for decoding, encoding and encoding/decoding | |
| KR102926068B1 (en) | Image encoding device, image encoding method and storage medium, image decoding device, image decoding method and storage medium | |
| JP2007266861A (en) | Image encoding device | |
| KR20180041833A (en) | Video coding method and apparatus using most probable mode list of intra | |
| KR20140130269A (en) | Method and apparatus for processing moving image | |
| JP2016165054A (en) | Encoding device, decoding device, and program | |
| KR20130050534A (en) | Methods of encoding using hadamard transform and apparatuses using the same |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120309 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120910 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121009 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130226 |