JP6268715B2 - Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system - Google Patents
Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system Download PDFInfo
- Publication number
- JP6268715B2 JP6268715B2 JP2013037576A JP2013037576A JP6268715B2 JP 6268715 B2 JP6268715 B2 JP 6268715B2 JP 2013037576 A JP2013037576 A JP 2013037576A JP 2013037576 A JP2013037576 A JP 2013037576A JP 6268715 B2 JP6268715 B2 JP 6268715B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- bit depth
- quantization
- moving image
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
この発明は、動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムに関し、例えば、動画像をDVC(Distributed Video Coding)方式で符号化して配信する動画像配信システムに適用し得る。 The present invention relates to a moving image encoding device and program, a moving image decoding device and program, and a moving image distribution system. For example, the present invention relates to a moving image distribution system that encodes and distributes a moving image by a DVC (Distributed Video Coding) method. Applicable.
従来のDVC(Distributed Video Coding)方式を採用したシステムは、Slepian‐Wolf理論およびWyner−Ziv理論に基づき動画像の符号化および復号をおこなうシステムである。 A system that adopts a conventional DVC (Distributed Video Coding) system is a system that encodes and decodes a moving picture based on the Slepian-Wolf theory and the Wyner-Ziv theory.
DVC方式は、デコーダで生成される符号化対象画像の予測画像(以下、「デコーダ予測画像」と呼ぶ)から符号化対象画像を再構成する符号(以下、「Wyner−Ziv符号」と呼ぶ)を、デコーダ予測画像を直接参照することなく生成することを特徴とする。この特徴より、DVC方式を採用した動画像符号化装置は複雑な予測画像生成部を備える必要がなく、符号化にかかる演算量の削減が可能になる。DVC方式の間題は、デコーダ予測画像自体を保持して、復号画像を生成するのに必要十分なWyner−Ziv符号のレートを求めることが困難であることである。例えば、DVC方式を採用した動画像符号化装置では、Wyner−Ziv符号が多すぎると圧縮効果が得られず、Wyner−Ziv符号が少なすぎるとデコーダ予測画像から復号画像を生成できない。 In the DVC method, a code (hereinafter referred to as “Wyner-Ziv code”) that reconstructs an encoding target image from a prediction image (hereinafter referred to as “decoder predicted image”) of the encoding target image generated by the decoder. The decoder prediction image is generated without referring directly. Due to this feature, a moving picture encoding apparatus adopting the DVC method does not need to include a complicated predicted image generation unit, and the amount of calculation required for encoding can be reduced. The problem with the DVC scheme is that it is difficult to obtain a Wyner-Ziv code rate that is necessary and sufficient to generate a decoded image while retaining the decoder predicted image itself. For example, in a video encoding apparatus adopting the DVC method, if there are too many Wyner-Ziv codes, a compression effect cannot be obtained, and if there are too few Wyner-Ziv codes, a decoded picture cannot be generated from the predicted decoder picture.
このようなDVC方式の課題を解決する従来技術として、非特許文献1の記載技術がある。非特許文献1では、デコーダ予測画像から復号画像が生成されるまで追加のWyner−Ziv符号を要求し続ける(フィードバックし続ける)ことで必要十分なレートを探る方式(以下、「デコーダレート制御方式」と呼ぶ)を実現している。
As a conventional technique for solving such a problem of the DVC method, there is a technique described in
しかし、従来のデコーダレート制御方式には、ネットワークを介した復号処理の存在なしに符号化することができないため、用途が限定されるという短所がある。そして、この短所を改善するための従来技術として非特許文献2、3の記載技術がある。
However, the conventional decoder rate control method has a disadvantage in that the application is limited because it cannot be encoded without the presence of a decoding process via a network. And as a prior art for improving this shortcoming, there are technologies described in
この短所を解消するため、非特許文献2や非特許文献3では、エンコーダ予測画像(デコーダ予測画像ほど複雑な演算を必要とせずに生成が可能な予測画像)を動画像符号化装置側で生成し、符号化対象画像とエンコーダ予測画像を比較することで、レートを制御する方式(以下、「エンコーダレート制御方式」と呼ぶ)が提案されている。
In order to eliminate this shortcoming, in Non-Patent
非特許文献2、3のエンコーダレート制御方式を採用した動画像符号化装置では、レート制御を行うことで、初回に送られるWyer−Ziv符号のレートを、必要十分なレートに近づけ、フィードバック回数を少なくしている。
In the moving picture coding apparatus adopting the encoder rate control method of
従来の動画像符号化装置でエンコーダ予測画像(サイドインフォメーション)を生成する場合、生成したエンコーダ予測画像の量子化値と、Wyner−Ziv画像の量子化値との間の誤りの量に応じて、動画像復号装置側に供給する符号量を増減させる。すなわち、従来の動画像符号化装置では、上述の量子化値の誤りの量が多いほど多くの符号量のパリティビットを、動画像復号装置側に供給することになる。 When an encoder predicted image (side information) is generated by a conventional moving image encoding device, according to the amount of error between the quantized value of the generated encoder predicted image and the quantized value of the Wyner-Ziv image, Increase or decrease the amount of code supplied to the video decoding device side. That is, in the conventional video encoding device, the larger the amount of quantization value errors described above, the larger the amount of code bits supplied to the video decoding device side.
一方、動画像符号化装置において、上述の符号量はより少ない方が、伝送効率等の面から好ましいが、符号量を少なくすると動画像復号装置側で生成する復号画像の品質が低下する。 On the other hand, in the video encoding device, it is preferable from the viewpoint of transmission efficiency and the like that the code amount is smaller, but if the code amount is reduced, the quality of the decoded image generated on the video decoding device side is lowered.
そのため、復号画像の品質を低下させずに符号量を少なくすることができる動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムが望まれている。 Therefore, a moving image encoding device and program, a moving image decoding device and program, and a moving image distribution system that can reduce the amount of code without degrading the quality of the decoded image are desired.
第1の本発明は、フレーム列を有する動画像を符号化する動画像符号化装置において、(1)上記フレーム列のうちキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、(2)非キーフレームの複雑度合を計算する複雑度計算部と、(3)上記複雑度計算部の計算結果に基づいて、画像を構成する各パラメータの量子化に係るビットデプスを決定するビットデプス決定手段と、(4)上記ビットデプス決定手段で決定されたビットデプスで、非キーフレームの各パラメータ、及び、上記予測画像の各パラメータを量子化して、量子化後非キーフレーム及び量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して決定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、(5)量子化後非キーフレームに対する量子化後予測画像の誤りを訂正するための誤り訂正符号を生成する誤り訂正符号生成手段とを有し、(6)上記ビットデプス決定手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値であることを特徴とする。 According to a first aspect of the present invention, there is provided a moving image encoding apparatus for encoding a moving image having a frame sequence. (1) A predicted image that generates a predicted image of a non-key frame using a key frame in the frame sequence. A generating unit; (2) a complexity calculating unit that calculates the degree of complexity of a non-key frame; and (3) a bit depth related to quantization of each parameter constituting an image based on a calculation result of the complexity calculating unit. And (4) quantizing each parameter of the non-key frame and each parameter of the predicted image with the bit depth determined by the bit depth determining means, For generating a frame and a predicted image after quantization, for a parameter for which a bit depth smaller than the maximum bit depth is determined, Data obtained by adding padding bits of a predetermined pattern corresponding to the difference from the most bit depth to either the most significant bit side or the least significant bit side of the quantized data corresponding to the specified bit depth And (5) error correction code generation means for generating an error correction code for correcting an error in the predicted image after quantization with respect to the non-key frame after quantization, (6) ) parameters of each image processed by the bit depth determination means and the quantizing means, the pixel values of the pixels constituting the image, or transform coefficient obtained by converting the image by a predetermined conversion method It is characterized by a quantized value for each of several regions.
第2の本発明は、フレーム列を有する動画像がフレーム単位に符号化された動画像データを復号する動画像復号装置において、(1)キーフレームのデータを保持するキーフレーム保持手段と、(2)上記キーフレーム保持手段が保持したキーフレームを利用して、上記フレーム列のうち非キーフレームの予測画像を生成する予測画像生成手段と、(3)上記動画像データを構成する非キーフレームの符号化データの生成過程で、画像を構成する各パラメータの量子化に適用されたビットデプスに係るビットデプス情報を保持するビットデプス保持手段と、(4)上記ビットデプス保持手段で保持されたビットデプスで、上記予測画像の各パラメータを量子化して、量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して設定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、(5)上記動画像データを構成する非キーフレームの符号化データが、量子化後予測画像を訂正するための誤り訂正符号だった場合、その誤り訂正符号を用いて量子化後予測画像を訂正した訂正後画像を生成する誤り訂正手段と、(6)訂正後画像と、上記予測画像とに基づいて、非キーフレームの画像を再構成した再構成画像を生成する再構成手段とを有し、(7)上記ビットデプス決定手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値であることを特徴とする。 According to a second aspect of the present invention, in a moving image decoding apparatus for decoding moving image data in which a moving image having a frame sequence is encoded in units of frames, (1) key frame holding means for holding key frame data; 2) predicted image generation means for generating a predicted image of a non-key frame in the frame sequence using the key frame held by the key frame holding means; and (3) a non-key frame constituting the moving image data. Bit depth holding means for holding bit depth information related to the bit depth applied to quantization of each parameter constituting the image in the process of generating the encoded data of (4), and (4) held by the bit depth holding means The bit depth is used to quantize each parameter of the predicted image to generate a quantized predicted image, which is smaller than the maximum bit depth. The parameter for which the bit depth is determined corresponds to the difference from the most bit depth on either the most significant bit side or the least significant bit side of the quantized data for the bit depth set for the parameter. Quantization means for generating data to which padding bits of a predetermined pattern are added as quantized data of the parameter; and (5) encoded data of non-keyframes constituting the moving image data includes a predicted image after quantization. In the case of an error correction code for correction, error correction means for generating a corrected image obtained by correcting the quantized predicted image using the error correction code, (6) the corrected image, and the predicted image And (7) the bit depth determination unit and the quantization unit, the reconstruction unit configured to generate a reconstructed image based on the reconstruction of the non-keyframe image. Parameters of each image processed by the step, the pixel values of the pixels constituting the image, or it is quantized value for each conversion coefficient region obtained by converting the image by a predetermined conversion method It is characterized by.
第3の本発明の動画像符号化プログラムは、フレーム列を有する動画像を符号化する動画像符号化装置に搭載されたコンピュータを、(1)上記フレーム列のうちキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、(2)非キーフレームの複雑度合を計算する複雑度計算部と、(3)上記複雑度計算部の計算結果に基づいて、画像を構成する各パラメータの量子化に係るビットデプスを決定するビットデプス決定手段と、(4)上記ビットデプス決定手段で決定されたビットデプスで、非キーフレームの各パラメータ、及び、上記予測画像の各パラメータを量子化して、量子化後非キーフレーム及び量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して決定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、(5)量子化後非キーフレームに対する量子化後予測画像の誤りを訂正するための誤り訂正符号を生成する誤り訂正符号生成手段として機能させ、(6)上記ビットデプス決定手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値であることを特徴とする。 A moving image encoding program according to a third aspect of the present invention provides a computer mounted on a moving image encoding apparatus that encodes a moving image having a frame sequence, using (1) a key frame in the frame sequence, A predicted image generating means for generating a predicted image of a non-key frame; (2) a complexity calculating unit for calculating a complexity level of the non-key frame; and (3) an image based on a calculation result of the complexity calculating unit. Bit depth determining means for determining a bit depth relating to quantization of each parameter constituting; (4) each bit parameter determined by the bit depth determining means, each parameter of the non-key frame, and each prediction image The parameter is quantized to generate a non-key frame after quantization and a predicted image after quantization, and a bit depth that is less than the maximum bit depth is determined. For the meter, padding bits of a predetermined pattern corresponding to the difference from the most bit depth are placed on either the most significant bit side or the least significant bit side of the quantized data for the bit depth determined for the parameter. Quantization means for generating the added data as quantized data of the parameter; and (5) an error correction code for generating an error correction code for correcting an error in the predicted image after quantization for the non-key frame after quantization. (6) The parameter of each image processed by the bit depth determination unit and the quantization unit is the pixel value of each pixel constituting the image, or the image is converted by a predetermined conversion method. characterized in that it is a quantized value for each conversion coefficient region obtained by converting.
第4の本発明の動画像復号プログラムは、フレーム列を有する動画像がフレーム単位に符号化された動画像データを復号する動画像復号装置に搭載されたコンピュータを、(1)キーフレームのデータを保持するキーフレーム保持手段と、(2)上記キーフレーム保持手段が保持したキーフレームを利用して、上記フレーム列のうち非キーフレームの予測画像を生成する予測画像生成手段と、(3)上記動画像データを構成する非キーフレームの符号化データの生成過程で、画像を構成する各パラメータの量子化に適用されたビットデプスに係るビットデプス情報を保持するビットデプス保持手段と、(4)上記ビットデプス保持手段で保持されたビットデプスで、上記予測画像の各パラメータを量子化して、量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して設定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、(5)上記動画像データを構成する非キーフレームの符号化データが、量子化後予測画像を訂正するための誤り訂正符号だった場合、その誤り訂正符号を用いて量子化後予測画像を訂正した訂正後画像を生成する誤り訂正手段と、(6)訂正後画像と、上記予測画像とに基づいて、非キーフレームの画像を再構成した再構成画像を生成する再構成手段として機能させ、(7)上記ビットデプス決定手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値であることを特徴とする。 A moving image decoding program according to a fourth aspect of the present invention provides a computer mounted on a moving image decoding apparatus that decodes moving image data in which a moving image having a frame sequence is encoded in units of frames. (2) a predicted image generating unit that generates a predicted image of a non-key frame in the frame sequence using the key frame held by the key frame holding unit; and (3) Bit depth holding means for holding bit depth information related to bit depth applied to quantization of each parameter constituting an image in the process of generating encoded data of non-key frames constituting the moving image data; (4 ) The quantized prediction image is generated by quantizing each parameter of the prediction image with the bit depth held by the bit depth holding means. For a parameter for which a bit depth less than the maximum bit depth is determined, either the most significant bit side or the least significant bit side of the quantized data corresponding to the bit depth set for the parameter is set. , A quantization means for generating, as quantized data of the parameter, data added with a predetermined pattern of padding bits corresponding to the difference from the most bit depth, and (5) a non-key frame of the moving image data If the encoded data is an error correcting code for correcting the quantized predicted image, an error correcting means for generating a corrected image obtained by correcting the quantized predicted image using the error correcting code; (6 ) Based on the corrected image and the predicted image, it functions as a reconstruction unit that generates a reconstructed image obtained by reconstructing a non-keyframe image. (7) The parameters of each image processed by the bit depth determining means and the quantizing means are obtained by converting the pixel value of each pixel constituting the image or converting the image by a predetermined conversion method. characterized in that it is a quantized value for each conversion coefficient region.
第5の本発明は、フレーム列を有する動画像をフレーム単位に符号化した動画像データを生成する動画像符号化装置と、上記動画像符号化装置で生成された動画像データを復号する動画像復号装置とを備える動画像配信システムにおいて、(1)上記動画像符号化装置として第1の本発明の動画像符号化装置を適用し、(2)上記動画像復号装置として第2の本発明の動画像復号装置を適用したことを特徴とする。 According to a fifth aspect of the present invention, there is provided a moving image encoding device for generating moving image data obtained by encoding a moving image having a frame sequence in units of frames, and a moving image for decoding the moving image data generated by the moving image encoding device. In a moving image distribution system including an image decoding device, (1) the moving image encoding device according to the first aspect of the present invention is applied as the moving image encoding device, and (2) the second image as the moving image decoding device. The moving picture decoding apparatus of the invention is applied.
本発明によれば、復号画像の品質を低下させずに符号量を少なくすることができる動画像配信システムを提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the moving image delivery system which can reduce code amount, without reducing the quality of a decoded image can be provided.
(A)第1の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第1の実施形態を、図面を参照しながら詳述する。
(A) First Embodiment Hereinafter, a first embodiment of a moving image encoding apparatus and program, a moving image decoding apparatus and program, and a moving image distribution system according to the present invention will be described in detail with reference to the drawings. .
(A−1)第1の実施形態の構成
動画像配信システム1は、動画像符号化装置10及び動画像復号装置20を有している。
(A-1) Configuration of First Embodiment The moving
図1は、この実施形態の動画像配信システム1の全体構成を示すブロック図である。
FIG. 1 is a block diagram showing the overall configuration of a moving
動画像配信システム1は、動画像符号化装置10及び動画像復号装置20を有している。
The moving
動画像符号化装置10は、フレーム単位(画像単位)で入力される入力動画像信号(入力映像信号)を符号化して、符号化したデータをストリーム化(ビットストリーム化)して出力する。図1に示すように、動画像符号化装置10では、入力動画像信号を構成する各画像が、Wyner−Ziv画像F11とKey画像F12とに分けて符号化される。そして、動画像符号化装置10は、Wyner−Ziv画像F11を符号化した符号化データのストリーム(以下、「Slepian−WolfストリームST1」と呼ぶ)と、Key画像F12を符号化したデータのストリーム(以下、「KeyストリームST2」と呼ぶ)と、後述するビットデプス伝達符号C1(詳細については後述する)を出力する。
The moving
動画像復号装置20は、動画像符号化装置10から出力された符号化データ(Slepian−Wolfストリーム、及びKeyストリーム)を復号して、復号画像(復号フレーム)を生成し、フレーム単位(画像単位)で復号動画像信号(復号動画像データ)として出力するものである。動画像復号装置20は、Slepian−WolfストリームST1を復号して得たWyner−Ziv復号画像F41と、KeyストリームST2を復号して得た復号画像(Key画像F12)とを合わせた復号動画像信号を出力する。
The
なお、動画像符号化装置10が出力するデータ形式、及び動画像復号装置20に入力されるデータ形式については限定されないものである。例えば、動画像符号化装置10から、リアルタイムデータ伝送に適したストリーム形式ではなく、同様のデータを1つのデータファイルとして出力して、オフライン(例えば、ハードディスク等のデータ記録媒体)で動画像復号装置20に供給するようにしてもよい。
Note that the data format output by the
次に、動画像符号化装置10の内部構成について図2を用いて説明する。
Next, the internal configuration of the moving
動画像符号化装置10は、ビットデプス制御部101、符号化対象画像量子化部104、エンコーダ予測画像生成部105、エンコーダ予測画像量子化部106、レート制御部107、Slepian−Wolf符号化部108、ビットデプス通知部109、及びKey画像符号化部120を有している。また、ビットデプス制御部101は、複雑度計算部102、及び制御部103を有している。
The moving
Key画像符号化部120は、画面内符号化処理(例えば、H.264/AVCやJPEG等の符号化技術による符号化処理)を行って、Key画像F12を符号化し、その符号化データをストリーム化して、KeyストリームST2として出力するものである。
The Key
エンコーダ予測画像生成部105は、Key画像F12からエンコーダ予測画像F21を生成するものである。エンコーダ予測画像生成部105がエンコーダ予測画像F21を生成する方式については限定されないものであり、DVCシステムを採用したシステムにおける種々の生成方式を適用することができる。
The encoder predicted
エンコーダ予測画像量子化部106は、エンコーダ予測画像F21を量子化(例えば、画素ごとにビット列のデータに変換)し、量子化後エンコーダ予測画像F22を生成するものである。
The encoder predicted
レート制御部107は、量子化後エンコーダ予測画像F22と量子化後Wyner−Ziv画像F23からSlepian−Wolf符号に必要な符号量を推定し、その推定結果をレートRとして出力するものである。レート制御部107が符号量を推定する具体的処理については、限定されないものであり、DVCを採用したシステムにおける種々の推定処理を適用することができる。
The
Slepian−Wolf符号化部108は、量子化後Wyner−Ziv画像F23をSlepian−Wolf符号化し、レートRに基づく符号量で、Slepian−WolfストリームST1を生成するものである。Slepian−Wolf符号化部108がSlepian−Wolf符号化処理を行う具体的方式については、限定されないものであり、DVCを採用したシステムにおける種々の符号化処理を適用することができる。
The Slepian-
符号化対象画像量子化部104は、Wyner−Ziv画像F11とエンコーダ予測画像F21と、ビットデプス通知部109の制御(後述するビットデプス制御信号S12)とに基づき、量子化後Wyner−Ziv画像F23を生成するものである。
The encoding target
ビットデプス制御部101は、フレームを任意の大きさのブロックに分割し、Wyner−Ziv画像F11を構成するブロックごとに、画像の量子化に用いるパラメータ(後述するビットデプス)を計算するものであり、複雑度計算部102及び制御部103を有している。
The bit
複雑度計算部102は、フレーム(Wyner−Ziv画像F11)を所定の大きさのブロックに分割して(この実施形態では、例として4×4のブロックに分割するものとする)、Wyner−Ziv画像F11を構成するブロックごとに、複雑度を計算する。そして、複雑度計算部102は、ブロックごとに求めた複雑度を複雑度S11として出力する。
The
複雑度S11が複雑度を計算する方法については限定されないものであるが、例えば、ブロックごとの交流成分の大きさや、エッジの強さ等に基づいて複雑度を計算するようにしてもよい。 The method of calculating the complexity by the complexity S11 is not limited. For example, the complexity may be calculated based on the size of the AC component for each block, the strength of the edge, or the like.
まず、複雑度S11がブロックごとの交流成分に基づいて、各ブロックの複雑度を計算する例について説明する。複雑度計算部102は、例えば、Wyner−Ziv画像F11の各ブロック内の画素値の平均値を、全てのブロックの画素値(画像全体の画素値)の平均値と比較し、ブロックごとの差分が大きいほど当該ブロックの交流成分が大きい(すなわち、複雑度が高い)と判定するようにしてもよい。また、例えば、動画像符号化装置10が、非特許文献4の記載技術のように、スケーラブル符号化機構を備える場合、複雑度計算部102は、スケーラブル符号化機構が生成したWyner−Ziv画像F11の縮小画像を拡大処理した拡大画像を生成し、Wyner−Ziv画像F11と該拡大画像との差分画像の信号の大きさを評価することで、複雑度S11を計算するようにしてもよい。また、複雑度計算部102は、該縮小画像を直流成分の情報とみなし、Wyner−Ziv画像F11から差し引くことで、交流成分を求め、交流成分の大きさを評価することで複雑度S11を計算するようにしてもよい。
First, an example in which the complexity S11 calculates the complexity of each block based on the AC component for each block will be described. For example, the
次に、複雑度S11がブロックごとのエッジの強さに基づいて、各ブロックの複雑度を計算する例について説明する。複雑度計算部102は、例えば、まず、Wyner−Ziv画像F11の全体にエッジを検出するためのフィルタ(例えば、Sobelフィルタ等のフィルタ)を用いて、画素単位でエッジ部分に属するか否かを検出する。そして、複雑度計算部102は、ブロックごとに、エッジ部分に属する画素(以下、「エッジ画素」と呼ぶ)の数を数え、エッジ画素数が多いブロックほど、エッジが強い(すなわち、複雑度が高い)ブロックと判定するようにしてもよい。
Next, an example in which the complexity S11 calculates the complexity of each block based on the edge strength for each block will be described. For example, the
この実施形態では、説明を簡易とするために、複雑度S11がブロックごとに算出する複雑度は0又は1のいずれかの数値により示されるものとする。言い換えると、この実施形態では、複雑度S11がブロックごとに算出する複雑度は2段階の度合いでしめされるものとする。 In this embodiment, in order to simplify the description, the complexity calculated by the complexity S11 for each block is indicated by a numerical value of 0 or 1. In other words, in this embodiment, the complexity calculated by the complexity S11 for each block is assumed to be expressed in two steps.
例えば、複雑度計算部102は、ブロックごとに複雑度の基礎となる1又は複数のパラメータ(例えば、交流成分及び又はエッジの強さ)を算出し、算出したパラメータに基づいて、当該ブロックについて複雑度(0又は1)を決定するようにしてもよい。例えば、複雑度計算部102は、所定の閾値kと各ブロックの交流成分ACを比較し、AC≧kの場合に当該ブロックの複雑度を1とし、そうでない場合に当該ブロックの複雑度を0とするようにしてもよい。
For example, the
制御部103は、複雑度計算部102から供給される複雑度S11に基づいて、ブロックごとに、Wyner−Ziv画像F11の量子化に用いる画素ごとのビット数(以下、「ビットデプス」と呼ぶものとする)を計算する。そして、制御部103は、ブロックごとに求めたビットデプスを、ビットデプス制御信号S11として出力する。
Based on the complexity S11 supplied from the
ビットデプス制御信号S12は、たとえば、複雑度S11が高い場合に、予測画像の予測困難性が高いとみなして、高いビットデプスで符号化するようにビットデプス制御信号S12を生成し、複雑度S11が低い場合に、予測画像の予測困難性が低いとみなして、低いビットデプスで符号化するようにビットデプス制御信号S12を生成する。 For example, when the complexity S11 is high, the bit depth control signal S12 is considered to have high prediction difficulty in the predicted image, and the bit depth control signal S12 is generated so as to be encoded with a high bit depth. Is low, the bit depth control signal S12 is generated so that the prediction difficulty of the predicted image is low and the coding is performed with a low bit depth.
この実施形態の複雑度S11は、上述のように、0又は1で表される。また、この実施形態において、Wyner−Ziv画像F11の各画素値は0〜255(10進数)のいずれかの整数で表されるものとする。すなわち、Wyner−Ziv画像F11の各画素値は、8桁の2進数(8ビットのデータ)で表されることになる。 The complexity S11 of this embodiment is represented by 0 or 1 as described above. In this embodiment, each pixel value of the Wyner-Ziv image F11 is represented by an integer from 0 to 255 (decimal number). That is, each pixel value of the Wyner-Ziv image F11 is represented by an 8-digit binary number (8-bit data).
そこで、この実施形態では、制御部103は、複雑度S11において複雑度が0と設定されたブロックのビットデプスを3、複雑度S11において複雑度が1と設定されたブロックのビットデプスを5と決定するものとして説明する。
Therefore, in this embodiment, the
次に、動画像復号装置20の内部構成について図3を用いて説明する。
Next, the internal configuration of the
動画像復号装置20は、ビットデプス受取部200、デコーダ予測画像生成部201、デコーダ予測画像量子化部202、LLR推定部203、Slepian−Wolf復号部204、再構成部205及びKey画像復号部220を有している。
The
Key画像復号部220は、KeyストリームST2を復号処理(動画像符号化装置10側に対応する復号処理)して、Key画像F12を得るものである。なお、この実施形態では、説明を簡易とするため、Key画像復号部220において、KeyストリームST2を復元して、符号化側に入力されるKey画像F12と同じ内容の復元画像が得られるものとする。Key画像復号部220で得られる復号画像は、できるだけ符号化側に入力されるKey画像に近い内容であることが望ましいが、完全に同一でなくてもよい。
The key
ビットデプス受取部200は、動画像符号化装置10から供給されたビットデプス伝達符号C1から、ビットデプス制御信号S11を復元して取得するものである。
The bit
デコーダ予測画像生成部201は、Key画像復号部220で取得されたKey画像F12から、デコーダ予測画像F31を生成するものである。デコーダ予測画像生成部201がデコーダ予測画像F31を生成する方式については限定されないものであり、DVC方式を採用したシステムにおける種々の生成方式を適用することができる。
The predicted decoder
デコーダ予測画像量子化部202は、デコーダ予測画像F31を量子化(例えば、画素ごとにビット列のデータに変換)し、量子化後デコーダ予測画像F32を生成するものである。
The decoder predicted
LLR推定部203は、量子化後デコーダ予測画像F32から量子化されたビット列の各ビットについてLLR(Log Likelihood Ratio)を推定し、LLR通知信号S22として出力するものである。
The
Slepian−Wolf復号部204は、LLR通知信号S22とSlepian−WolfストリームST1から、訂正後Wyner−Ziv画像F33を生成するものである。
The Slepian-
動画像符号化装置10では、LLR推定部203及びSlepian−Wolf復号部204により、Slepian−Wolf復号を行う復号手段が形成されている。そして、LLR推定部203及びSlepian−Wolf復号部204が行う具体的処理としては、種々のDVCシステムにおける復号手段を適用することができる。
In the moving
再構成部205は、訂正後Wyner−Ziv画像F33と、デコーダ予測画像F31とを用いて、画像の再構成処理(逆量子化しながらWyner−Ziv画像F11を推定する処理)を行い、Wyner−Ziv復号画像F41を生成するものである。なお、再構成部205の詳細処理については後述する。
The
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の動画像配信システム1の動作を説明する。
(A-2) Operation of the First Embodiment Next, the operation of the moving
(A−2−1)動画像符号化装置10の動作
まず、動画像配信システム1の動画像符号化装置10側の動作について、図4のフローチャートを用いて説明する。
(A-2-1) Operation of Moving
まず、複雑度計算部102において、Wyner−Ziv画像F11の各ブロックについて複雑度S11が計算され、その計算結果が複雑度S11として出力されたものとする(S101)。
First, it is assumed that the
制御部103において、複雑度S11に基づき、各ブロックのビットデプスが計算され、その計算結果が、ビットデプス制御信号S12として出力される(S102)。
The
図6は、複雑度S11及びビットデプス制御信号S12の内容について概念的に図示した例である。図6では、Wyner−Ziv画像F11について、縦4ブロック×横4ブロック(16のブロック)に分割した構成となっている。図6(a)、図6(b)は、それぞれ複雑度S11、ビットデプス制御信号S12の内容を概念的に表している。図6では、四角形の枠のそれぞれを1つのブロックとし、当該四角形の中に当該ブロックに対応するパラメータ(複雑度又はビットデプス)となっている。 FIG. 6 is an example conceptually illustrating the contents of the complexity S11 and the bit depth control signal S12. In FIG. 6, the Wyner-Ziv image F11 is divided into 4 vertical blocks × 4 horizontal blocks (16 blocks). FIGS. 6A and 6B conceptually show the contents of the complexity S11 and the bit depth control signal S12, respectively. In FIG. 6, each square frame is a block, and the parameters (complexity or bit depth) corresponding to the block are included in the square.
図6では、一番左側の列について、上方向のブロックから順に、ブロックB1、B2、B3、B4という符号を付している。また、図6(a)では、ブロックB1〜B4の複雑度が、それぞれ1、0、0、1となっている。さらに、図6(b)では、ブロックB1〜B4のビットデプスがそれぞれ図6(a)の複雑度に対応したビットデプスとなっている。具体的には、図6(b)では、ブロックB1〜B4のビットデプスがそれぞれ5、3、3、5となっている。 In FIG. 6, for the leftmost column, blocks B1, B2, B3, and B4 are assigned in order from the upper block. In FIG. 6A, the complexity of the blocks B1 to B4 is 1, 0, 0, and 1, respectively. Further, in FIG. 6B, the bit depths of the blocks B1 to B4 are bit depths corresponding to the complexity of FIG. 6A, respectively. Specifically, in FIG. 6B, the bit depths of the blocks B1 to B4 are 5, 3, 3, and 5, respectively.
符号化対象画像量子化部104において、ビットデプス制御信号S12に設定された各ブロックのビットデプスを用いて、Wyner−Ziv画像F11が量子化され、量子化後Wyner−Ziv画像F23が生成される(S103)。
In the encoding target
図7は、符号化対象画像量子化部104により、ビットデプス制御信号S12に基づく量子化処理の例について示している。
FIG. 7 shows an example of quantization processing based on the bit depth control signal S12 by the encoding target
図7(a)〜(d)は、それぞれ、図6に示すブロックB1〜B4を構成する1つの画素を量子化する例について示している。 FIGS. 7A to 7D show examples of quantizing one pixel constituting each of the blocks B1 to B4 shown in FIG.
符号化対象画像量子化部104では、まず、Wyner−Ziv画像F11を構成する各ブロックの画素値(0〜255の10進数)を8ビットの2進数に変換し、MSB(最上位ビット)からビットデプス分のビットデータを、量子化値として取得する。例えば、図7(a)では、ブロックB1を構成する任意の画素の画素値を2進数に変換すると「10111011」であり、ブロックB1のビットデプスは5となっている。したがって、符号化対象画像量子化部104は、当該画素の量子化値として、MSBから5ビット分のデータである「10111」を取得する。
The encoding target
ただし、この実施形態の符号化対象画像量子化部104は、各ブロックでビットデプスが異なる場合には、全てのブロックについて、最も長いビットデプスに合わせた桁数のビットデータを出力するものとする。例えば、図6の例では、ビットデプス制御信号S12において、ビットデプスが3と5のブロックが混在している。したがって、符号化対象画像量子化部104は、最も長いビットデプスである5に正規化したビットデータを量子化値として出力するものとする。この場合、最も長いビットデプスのブロックよりも短いビットデプスのブロックでは、正規化に不足するビットデータが発生するが、符号化対象画像量子化部104は、この不足する分のビットデータとして、任意のパターン(以下、このパターンを「シンボル」とも呼ぶ)のダミーデータ(以下、「パディングビット」とも呼ぶ)を埋め込むものとする。この実施形態では、符号化対象画像量子化部104は、パディングビットに用いるシンボルとして、全てが「1」となるビットパターンを適用するものとして説明する。
However, when the bit depth is different in each block, the encoding target
例えば、図7(b)では、ブロックB2を構成する任意の画素の画素値を2進数に変換すると「00101101」であり、ブロックB2のビットデプスは3となっている。しかし、画像全体で最大のビットデプスは5であるため、符号化対象画像量子化部104は、MSBから順に、ビットデプス分のビットデータ(3ビット分のデータ)を取得し、不足する分のパディングビット「11」を追加したビットデータを量子化値として取得する。
For example, in FIG. 7B, when the pixel value of an arbitrary pixel constituting the block B2 is converted into a binary number, it is “00101101”, and the bit depth of the block B2 is 3. However, since the maximum bit depth of the entire image is 5, the encoding target
シンボルとして用いるビットパターンは任意であるが、動画像配信システム1内の他の量子化部でも共通のシンボルを用いる必要がある。また、図7では、パディングビットをLSB側に埋め込んでいるが、MSB側に埋め込んでも良い。ただし、パディングビットの埋め込み場所についても、動画像配信システム1内の他の量子化部や再構成部と一致している必要がある。
Although the bit pattern used as a symbol is arbitrary, it is necessary to use a common symbol also in other quantization units in the moving
そして、エンコーダ予測画像生成部105において、Key画像F12から、動き推定などを用いて、エンコーダ予測画像F21が生成される(S104)。
Then, the encoder predicted
エンコーダ予測画像量子化部106において、ビットデプス制御信号S12を用いて、エンコーダ予測画像F21が量子化され、量子化後エンコーダ予測画像F22が生成される(S105)。なお、エンコーダ予測画像F21における量子化処理の方法は、符号化対象画像量子化部104と同様であるため、詳しい説明は省略する。
In the encoder predicted
レート制御部107において、量子化後Wyner−Ziv画像F23と量子化後エンコーダ予測画像F22とを比較して、動画像復号装置20(デコーダ)で復号に必要とするSlepian−Wolf符号化のレートRが生成される(S106)。
In the
Slepian−Wolf符号化部108において、レートRに基づき、量子化後Wyner−Ziv画像F23がSlepian−Wolf符号化され、Slepian−WolfストリームST1が生成される(S107)。
In the Slepian-
ビットデプス通知部109において、ビットデプス制御信号S12がビットデプス伝達符号C1に変換され出力される(S108)。なお、ビットデプス制御信号S12は、ブロック単位の情報であるため、画像データに比べると、ビットデプス伝達符号C1の符号量は僅かである。
In the bit
(A−2−2)動画像復号装置20の動作
次に、動画像復号装置20の復号処理の動作について、図5のフローチャートを用いて説明する。
(A-2-2) Operation of
まず、ビットデプス受取部200において、入力されたビットデプス伝達符号C1に基づいて、ビットデプス制御信号S11が復元される(S109)。
First, the bit
そして、デコーダ予測画像生成部201において、動き推定などを用いて、Key画像F12からデコーダ予測画像F31が生成される(S110)。
Then, the decoder predicted
デコーダ予測画像量子化部202において、ビットデプス制御信号S12を用いて、デコーダ予測画像F31が量子化され、量子化後デコーダ予測画像F32が生成される(S111)。なお、デコーダ予測画像量子化部202における量子化処理の方法は、符号化対象画像量子化部104と同様であるため、詳しい説明は省略する。
The decoder predicted
LLR推定部203において、量子化後デコーダ予測画像F32から、LLRが推定され、推定されたLLRに基づいたLLR通知信号S22が出力される(S112)。
The
Slepian−Wolf復号部204において、LLR通知信号S22とSlepian−WolfストリームST1を用いてSlepian−Wolf復号が行われ、訂正後Wyner−Ziv画像F33が生成される(S113)。
In the Slepian-
最後に、再構成部205において、ビットデプス制御信号S12と、訂正後Wyner−Ziv画像F33と、デコーダ予測画像F31とに基づいて、Wyner−Ziv復号画像F41が生成される(S114)。
Finally, the
なお、上述の通り、動画像配信システム1を構成する各量子化部において、ビットデプス制御信号S12に基づくパディングビットの埋め込み位置は共通である。したがって、再構成部205では、ビットデプス制御信号S12に基づいて、訂正後Wyner−Ziv画像F33に含まれるパディングビットの位置(すなわち、パディングビットが含まれるブロックに所属する画素の量子化値)を認識することができる。したがって、再構成部205では、訂正後Wyner−Ziv画像F33のうち、パディングビットを無視(捨象)した再構成処理を行うことができる。
As described above, the padding bit embedding position based on the bit depth control signal S12 is common in each quantization unit constituting the moving
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
(A-3) Effects of First Embodiment According to the first embodiment, the following effects can be achieved.
動画像符号化装置10では、複雑度の高い領域について、予測画像(エンコーダ予測画像F21、デコーダ予測画像F31)の品質が低いとみなし、効果的に多くの誤り訂正符号を割り当てる(多いビットデプスを割当てる)ことができる。これにより、動画像符号化装置10における符号化効率及び動画像復号装置20での復号品質を向上させることができる。
The moving
また、動画像符号化装置10及び動画像復号装置20では、パディングビットを利用して、異なるビットデプスの量子化値のギャップを埋めることで、ブロックサイズとSlepian−Wolf符号の処理単位(何ビットごとにSlepian−Wolf符号化又は復号するか)の間に依存関係がなく、コンテンツに応じて、ブロックサイズを容易に変更できる。例えば、複雑度が少ない画素間隔で変化するコンテンツの場合、たとえ、ビットデプス伝達信号の符号量が増えたとしても、動画像配信システム1において、ブロックサイズを小さくし手処理した方が効率的となる場合がある。
In addition, the moving
(B)第2の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第2の実施形態を、図面を参照しながら詳述する。
(B) Second Embodiment Hereinafter, a second embodiment of a moving image encoding apparatus and program, a moving image decoding apparatus and program, and a moving image distribution system according to the present invention will be described in detail with reference to the drawings. .
(B−1)第2の実施形態の構成
第2の実施形態の動画像配信システム1Aの全体構成についても上述の図1を用いて示すことができる。以下、第2の実施形態について第1の実施形態との差異について説明する。
(B-1) Configuration of Second Embodiment The overall configuration of the moving image distribution system 1A of the second embodiment can also be shown using FIG. Hereinafter, the difference between the second embodiment and the first embodiment will be described.
第2の実施形態の動画像配信システム1Aでは、動画像符号化装置10が、動画像符号化装置10Aに置き換わっている。
In the moving image distribution system 1A of the second embodiment, the moving
図8は、第2の実施形態の動画像符号化装置10Aの機能的構成について示したブロック図である。
FIG. 8 is a block diagram illustrating a functional configuration of the moving
そして、第2の実施形態の動画像符号化装置10Aでは、ビットデプス制御部101がビットデプス制御部101Aに置き換わっている。また、ビットデプス制御部101Aでは、制御部103が制御部103Aに置き換わり、さらに動き検出部109が追加されている。
In the moving
動き検出部109は、ブロックごと(複雑度計算部102と同じ方式で分割したブロックごと)に、Wyner−Ziv画像F11とKey画像F12の間で動きの有無を判定し、その判定結果に基づいて動き情報S13を生成する。動き情報S13は、ブロックごとの動きの有無の情報で構成されている。
The
動き情報S13は、たとえば、動きベクトルをゼロとしたときの、SAD(差分絶対値和、Sum of Absolute Difference)やMAD(差分絶対値平均、Mean Absolute Difference)などのコスト関数の大きさが、予め定められた閾値以上の場合に、動きが有りと判定し、それ以外の場合は動き無しと判定するようにしてもよい。また、動画像符号化装置10が、非特許文献4の記載技術のように、スケーラブル符号化機構を備える場合、スケーラブル符号化機構が生成した、Wyner−Ziv画像F11と該Key画像F12にそれぞれ対応する縮小画像間を比較することによって、ブロックごとの動きの有無を計算しても良い。
The motion information S13 has a size of a cost function such as SAD (sum of absolute difference, sum of absolute difference) or MAD (mean absolute difference) when the motion vector is set to zero. It may be determined that there is a motion when the threshold is equal to or greater than a predetermined threshold, and it is determined that there is no motion in other cases. Further, when the moving
制御部103Aは、複雑度S11に加えて、動き情報S13も考慮してブロックごとのビットデプスを決定する点で、第1の実施形態異なっている。
The
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の動画像配信システム1Aの動作を説明する。
(B-2) Operation | movement of 2nd Embodiment Next, operation | movement of 1 A of moving image delivery systems of 2nd Embodiment which has the above structures is demonstrated.
以下では、第2の実施形態の動画像配信システム1Aの動作のうち、第1の実施形態との差異について図9を用いて説明する。 Hereinafter, differences from the first embodiment among the operations of the moving image distribution system 1A according to the second embodiment will be described with reference to FIG.
第2の実施形態の動画像配信システム1Aでは、上述のステップS102がS202に置き換わっている点で異なっている。 The moving image distribution system 1A according to the second embodiment is different in that the above-described step S102 is replaced with S202.
図9(a)は、上述のステップS202における動画像符号化装置10Aの動作について示したフローチャートである。
FIG. 9A is a flowchart showing the operation of the moving
ステップS202−1では、動き検出部109において、Wyner−Ziv画像F11とKey画像F12からブロックごとの動きの有無が判定され、その判定結果に基づいて動き情報S13が生成される。
In step S202-1, the
ステップS202−2では、制御部203において、複雑度S11と動き情報S13とに基づいて、ブロックごとのビットデプスが決定され、その決定に基づいてビットデプス制御信号S12が生成される。
In step S202-2, the
たとえば、動き情報S13が、動きが少ないことを示唆している場合に、複雑度S11の高さに寄らず、予測画像の予測困難性が低いとみなし、低いビットデプスで符号化するようにビットデプス制御信号203を生成し、動き情報S13が、動きの大きいことを示唆している場合に、複雑度S11の高さによってビットデプス制御信号203を生成する。
For example, when the motion information S13 suggests that there is little motion, it is considered that the prediction image is difficult to predict regardless of the complexity S11, and the bit is encoded so as to be encoded with a low bit depth. When the
図9(b)は、制御部103Aで各ブロックのビットデプスを決定するルールについて示した説明図である。
FIG. 9B is an explanatory diagram showing rules for determining the bit depth of each block by the
この実施形態では、制御部103Aは、動き情報S13において動き無し(動きが少ないこと)が示されているブロックについては、図9(b)に示すように、複雑度S11における複雑度の高さによらず、予測画像の予測困難性が低いとみなし、少ないビットデプス(3)を決定するものとする。
In this embodiment, the
また、制御部103Aは、動き情報S13において動き有り(動きが大きいこと)が示されているブロックについては、図9(b)に示すように、複雑度S11の高さに応じたビットデプスを決定(第1の実施形態と同じ方式でビットデプスを決定)するものとする。
Further, the
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態と比較して以下のような効果を奏することができる。
(B-3) Effects of Second Embodiment According to the second embodiment, the following effects can be achieved as compared with the first embodiment.
動画像符号化装置10Aでは、動きの少ない領域(動き無しの領域)については、例え、複雑度の高い領域であったとしても、予測画像(エンコーダ予測画像F21、デコーダ予測画像F31)の品質が高いという仮定に基づき、動きの少ない領域に関しては、少ないビットデプスで符号化している。上述の仮説は、多くの動画像で適用できるものであるため、動画像符号化装置10Aでのビットデプスの制御が更に妥当(適切)となり、結果として符号化効率及び復号品質を更に向上させることができる。
In the moving
(C)第3の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第3の実施形態を、図面を参照しながら詳述する。
(C) Third Embodiment Hereinafter, a third embodiment of a moving image encoding device and program, a moving image decoding device and program, and a moving image distribution system according to the present invention will be described in detail with reference to the drawings. .
(C−1)第3の実施形態の構成
第3の実施形態の動画像配信システムBの全体構成についても上述の図1を用いて示すことができる。以下、第3の実施形態について第2の実施形態との差異について説明する。
(C-1) Configuration of Third Embodiment The overall configuration of the moving image distribution system B of the third embodiment can also be shown using FIG. Hereinafter, the difference between the third embodiment and the second embodiment will be described.
第3の実施形態の動画像配信システムBでは、動画像符号化装置10A及び動画像復号装置20が、動画像符号化装置10B及び動画像復号装置20Bに置き換わっている点で第2の実施形態と異なっている。
In the moving image distribution system B of the third embodiment, the second embodiment is that the moving
図10は、第3の実施形態の動画像符号化装置10Bの機能的構成について示したブロック図である。
FIG. 10 is a block diagram illustrating a functional configuration of a moving
そして、第3の実施形態の動画像符号化装置10Bでは、レート制御部107がレート制御部107Bに置き換わっている。
In the
レート制御部107Bは、ビットデプス制御信号S12と量子化後エンコーダ予測画像F22と量子化後Wyner−Ziv画像F23とに基づいて、パディングビットの位置を特定し、パディングビット以外のビットのみを対象に、ビット反転確率を求め、求めたビット反転確率からレートRを生成する処理を行う。 The rate control unit 107B specifies the position of padding bits based on the bit depth control signal S12, the quantized encoder predicted image F22, and the quantized Wyner-Ziv image F23, and targets only bits other than the padding bits. Then, a bit inversion probability is obtained, and a process for generating a rate R from the obtained bit inversion probability is performed.
図11は、第3の実施形態の動画像復号装置20Bの機能的構成について示したブロック図である。
FIG. 11 is a block diagram illustrating a functional configuration of a
第3の実施形態の動画像復号装置20Bでは、LLR補正部209が追加されている点で第1の実施形態と異なっている。
The moving
LLR補正部209は、ビットデプス制御信号S11より、パディングビットの位置を明らかにし、パディングビットに対応するLLRの大きさが、その他のビットのLLRに比べて十分大きくなるように補正する処理(例えば、1以上の係数を乗じて補正する処理や、定数を加算する処理)を行って、補正後LLRを求める。そして、LLR補正部209は、各ビットの補正後LLRを表す補正後LLR通知信号S23を生成して、Slepian−Wolf復号部204に供給する。
The LLR correction unit 209 clarifies the position of the padding bit from the bit depth control signal S11 and corrects the size of the LLR corresponding to the padding bit so that it is sufficiently larger than the LLRs of the other bits (for example, The corrected LLR is obtained by performing a process of correcting by multiplying one or more coefficients or a process of adding a constant. Then, the LLR correction unit 209 generates a post-correction LLR notification signal S23 representing the post-correction LLR of each bit, and supplies the generated LLR notification signal S23 to the Slepian-
Slepian−Wolf復号部204は、補正後LLR通知信号S23とSlepian−WolfストリームST1を用いて、Slepian−Wolf復号をおこない、訂正後Wyner−Ziv画像F33を生成する。
The Slepian-
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の動画像配信システムBの動作を説明する。
(C-2) Operation of the Third Embodiment Next, the operation of the moving image distribution system B of the third embodiment having the above configuration will be described.
以下では、第3の実施形態の動画像配信システムBの動作のうち、第1の実施形態との差異について図12、図13を用いて説明する。 Hereinafter, of the operation of the moving image distribution system B according to the third embodiment, differences from the first embodiment will be described with reference to FIGS. 12 and 13.
第3の実施形態の動画像配信システムBでは、上述のステップS106、S112、S113が、それぞれステップS306、S312、S313に置き換わっている点で異なっている。 The moving image distribution system B according to the third embodiment is different in that the above-described steps S106, S112, and S113 are replaced with steps S306, S312 and S313, respectively.
まず、動画像符号化装置10B側の処理(ステップS306)について説明する。
First, the process (step S306) on the moving
図12に示すようにステップS306は、3つのステップS306−1〜S306−3に分かれている。 As shown in FIG. 12, step S306 is divided into three steps S306-1 to S306-3.
ステップS306−1では、レート制御部107Bにより、ビットデプス制御信号S12に基づき、パディングビット以外の位置が特定される。 In step S306-1, the rate control unit 107B specifies a position other than the padding bits based on the bit depth control signal S12.
ステップS306−2では、レート制御部107Bにより、パディングビット以外のビットのみを対象にビット反転確率が求められる。 In step S306-2, the rate control unit 107B obtains a bit inversion probability for only bits other than the padding bits.
ステップS306−3では、レート制御部107Bにより、求めたビット反転確率からレートRが生成される。 In step S306-3, the rate R is generated from the obtained bit inversion probability by the rate control unit 107B.
第1の実施形態のSlepian−Wolf符号化処理においては、ビット反転確率が定常であることを前提に符号化するので、パディングビットの位置でもビット反転が発生する可能性を配慮したSlepiam−Wolf符号を生成する。しかし、パディングビットの位置は、符号化側と復号側とで情報(ビットデプス制御信号S12)が共有されている領域であり、新たな情報を必要としない領域である。そこで、第3の実施形態の動画像復号装置20Bでは、パディングビットの位置を特定し、パディングビット以外のビットのみで、ビット反転確率およびレートRを計算することで、符号量の増加を防止する。
In the Slepian-Wolf encoding process of the first embodiment, encoding is performed on the assumption that the bit inversion probability is steady, so that the Sleiam-Wolf code in consideration of the possibility of bit inversion occurring at the position of the padding bit. Is generated. However, the position of the padding bit is an area where information (bit depth control signal S12) is shared between the encoding side and the decoding side, and no new information is required. Therefore, in the
次に、動画像復号装置20B側の処理(ステップS312、S313)について説明する。
Next, the process (steps S312 and S313) on the
図13に示すようにステップS312は、2つのステップS312−1、S312−2に分かれている。 As shown in FIG. 13, step S312 is divided into two steps S312-1 and S312-2.
ステップS312−1では、LLR推定部203により、量子化後デコーダ予測画像F32から、LLRが推定され、LLR通知信号S22として出力される。
In step S312-1, the
ステップS312−2では、LLR補正部209により、ビットデプス制御信号S11に基づき、LLR通知信号S22が補正され、補正後LLR通知信号S23として生成される。 In step S312-2, the LLR correction unit 209 corrects the LLR notification signal S22 based on the bit depth control signal S11, and generates the corrected LLR notification signal S23.
具体的には、LLR補正部209は、ビットデプス制御信号S11より、パディングビットの位置を認識し、パディングビット以外のビットに対応するLLRの大きさが、パディングビットのLLRに比べて十分大きくなるように補正する。 Specifically, the LLR correction unit 209 recognizes the position of the padding bit from the bit depth control signal S11, and the size of the LLR corresponding to the bit other than the padding bit is sufficiently larger than the LLR of the padding bit. Correct as follows.
そして、ステップS313では、Slepian−Wolf復号部204により、補正後LLR通知信号S23とSlepian−WolfストリームST1を用いて、復号処理が行われ、訂正後Wyner−Ziv画像F33が生成される。
In step S313, the Slepian-
第2の実施形態のSlepian−Wolf復号処理では、ビット反転確率が定常であることを前提に処理されるため、パディングビットの位置でもビット反転が発生する可能性を配慮したSlepiam−Wolf復号処理を行う。しかし、パディングビットの位置は、符号化側と復号側とで情報(ビットデプス制御信号S12)が共有されている領域であり、新たな情報を必要としない領域である。そこで、第3の実施形態の動画像復号装置20Bでは、パディングビットの位置を特定し、LLRを補正することで、復号成功確率(復号品質)を向上させることができる。特に、第3の実施形態の動画像符号化装置10Bのように、パディングビットの位置を特定し、パディングビット以外のビットのみで、ビット反転確率およびレートRを計算し、符号量を削減している場合、LLRの補正による復号品質向上効果は大きくなる。
In the Slepian-Wolf decoding process of the second embodiment, since the process is performed on the assumption that the bit inversion probability is steady, the Sleiam-Wolf decoding process considering the possibility of bit inversion occurring even at the padding bit position is performed. Do. However, the position of the padding bit is an area where information (bit depth control signal S12) is shared between the encoding side and the decoding side, and no new information is required. Therefore, in the
(C−3)第3の実施形態の効果
第3の実施形態によれば、第2の実施形態と比較して以下のような効果を奏することができる。
(C-3) Effects of the Third Embodiment According to the third embodiment, the following effects can be achieved as compared with the second embodiment.
動画像符号化装置10Bにおいて、動画像復号装置20Bとの間で、情報共有がされていないパディングビット以外のビットに限定してレートを推定することで、符号量を削減し、効率的な符号化を行うことができる。
In the
また、動画像復号装置20Bにおいても、動画像符号化装置10Bと情報共有がなされている、パディングビットのLLRを、パディングビット以外のビットよりも大きくすることで、Slepian−Wolf復号を助けることができ、復号品質を向上させることができる。
Also, in the
(D)第4の実施形態
以下、本発明による動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システムの第4の実施形態を、図面を参照しながら詳述する。
(D) Fourth Embodiment Hereinafter, a fourth embodiment of a moving image encoding device and program, a moving image decoding device and program, and a moving image distribution system according to the present invention will be described in detail with reference to the drawings. .
(D−1)第4の実施形態の構成
第4の実施形態の動画像配信システム1Cの全体構成についても上述の図1を用いて示すことができる。以下、第4の実施形態について第2の実施形態との差異について説明する。
(D-1) Configuration of Fourth Embodiment The overall configuration of a moving image distribution system 1C of the fourth embodiment can also be shown using FIG. Hereinafter, the difference between the fourth embodiment and the second embodiment will be described.
第4の実施形態の動画像配信システム1Cでは、動画像符号化装置10A及び動画像復号装置20が、動画像符号化装置10C及びに置き換わっていうる点で第2の実施形態と異なっている。
The moving image distribution system 1C of the fourth embodiment is different from the second embodiment in that the moving
図14は、第4の実施形態の動画像符号化装置10Cの機能的構成について示したブロック図である。
FIG. 14 is a block diagram illustrating a functional configuration of a moving
第4の実施形態の動画像符号化装置10Cでは、Slepian−Wolf符号化部108がSlepian−Wolf符号化部108Cに置き換わり、さらに、Slepian−Wolf符号選択部110が追加されている点で第2の実施形態と異なっている。
In the moving
Slepian−Wolf符号選択部110は、ビットデプス制御信号S12に基づき、パディングビット以外のビットを特定して、特定したビットを対象としてSlepian−Wolf符号化処理を行うための情報(以下、「専用Slepian−Wolf符号化情報S13」と呼ぶ)を生成する。
The Slepian-Wolf
この実施形態では、専用Slepian−Wolf符号化情報S13は、上述の特定されたビットのビット数(符号化対象となるビット数)で符号化するのに最適なSlepian−Wolf符号(Slepian−Wolf符号化に用いる符号の行列)を含むものとする。 In this embodiment, the dedicated Slepian-Wolf encoding information S13 is an optimal Slepian-Wolf code (Slepian-Wolf code) that is optimal for encoding with the number of bits of the above specified bits (the number of bits to be encoded). Code matrix used for conversion).
Slepian−Wolf符号選択部110は、例えば、符号化対象となるビット数(特定ビット数)ごとに最適なSlepian−Wolf符号を予め保持しておき、符号化対象となるビット数(特定ビット数)に応じたSlepian−Wolf符号を選択して、専用Slepian−Wolf符号化情報S13の生成に用いるようにしてもよい。
For example, the Slepian-Wolf
Slepian−Wolf符号選択部110で、任意のビット数に応じたSlepian−Wolf符号を保持する具体的な処理については限定されないものである。例えば、参考文献1(Xiao-Yu Hu,Regular and irregular progressive edge-growth tanner graphs, Information Theory, IEEE Transactions on, Volume 51, Issue 1, Pages 386 - 398.)の記載技術を用いて生成したLDPC符号(Low−Density Parity−check Code)に対して、参考文献2(D. Varodayan, A. Aaron and B. Girod,Rate-adaptive codes for distributed source coding, EURASIP Signal Processing Journal, Special Section on Distributed Source Coding, vol. 86, no. 11, pp. 3123-3130, November 2006.)の記載技術に基づく処理を加えて、レートを容易に変更可能なLDPC符号が得られる。そこで、Slepian−Wolf符号選択部110は、例えば、上述の参考文献1、2の記載技術を用いて、任意のビット数に応じて調整された上述のLDPC符号を、Slepian−Wolf符号として保持するようにしてもよい。
The specific process of holding the Slepian-Wolf code corresponding to an arbitrary number of bits in the Slepian-Wolf
Slepian−Wolf符号化部108Cは、専用Slepian−Wolf符号化情報S13を用いてSlepian−Wolf符号化し、Slepian−WolfストリームST1を生成する。 The Slepian-Wolf encoding unit 108C performs Slepian-Wolf encoding using the dedicated Slepian-Wolf encoding information S13, and generates a Slepian-Wolf stream ST1.
図15は、第4の実施形態の動画像復号装置20Cの機能的構成について示したブロック図である。 FIG. 15 is a block diagram illustrating a functional configuration of a video decoding device 20C according to the fourth embodiment.
第4の実施形態の動画像復号装置20Cでは、Slepian−Wolf復号部204がSlepian−Wolf復号部204Cに置き換わり、さらに、Slepian−Wolf符号選択部208が追加されている点で第2の実施形態と異なっている。
In the moving picture decoding apparatus 20C according to the fourth embodiment, the second embodiment is that a Slepian-
Slepian−Wolf符号選択部208は、ビットデプス制御信号S11に基づき、パディングビット以外のビットを特定して、特定したビットを対象としてSlepian−Wolf復号処理を行うための情報(以下、「専用Slepian−Wolf復号情報S24」と呼ぶ)を生成する。
The Slepian-Wolf
専用Slepian−Wolf復号情報S24は、上述の特定されたビットのビット数で復号するのに最適なSlepian−Wolf符号(Slepian−Wolf復号に用いる符号の行列)を含むものとする。 The dedicated Slepian-Wolf decoding information S24 includes a Slepian-Wolf code (a matrix of codes used for Slepian-Wolf decoding) that is optimal for decoding with the number of bits specified above.
Slepian−Wolf符号選択部208は、例えば、復号対象となるビット数(特定ビット数)ごとに最適なSlepian−Wolf符号を予め保持しておき、復号対象となるビット数(特定ビット数)に応じたSlepian−Wolf符号を選択して、専用Slepian−Wolf復号情報S24の生成に用いるようにしてもよい。Slepian−Wolf符号選択部208は、例えば、上述のSlepian−Wolf符号選択部110と同様に、上述の参考文献1、2の記載技術を用いて生成された専用Slepian−Wolf符号化情報S13を保持するようにしてもよい。
For example, the Slepian-Wolf
Slepian−Wolf符号化部108Cは、専用Slepian−Wolf符号化情報S13を用いてSlepian−Wolf復号し、訂正後Wyner−Ziv画像F33を生成する点で第2の実施形態と異なっている。 The Slepian-Wolf encoding unit 108C is different from the second embodiment in that it performs Slepian-Wolf decoding using the dedicated Slepian-Wolf encoding information S13 and generates a corrected Wyner-Ziv image F33.
(C−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態の動画像配信システム1Cの動作を説明する。
(C-2) Operation of the Fourth Embodiment Next, the operation of the moving image distribution system 1C of the fourth embodiment having the above configuration will be described.
以下では、第4の実施形態の動画像配信システム1Cの動作のうち、第2の実施形態との差異について図16、図17を用いて説明する。 Hereinafter, of the operation of the moving image distribution system 1C according to the fourth embodiment, differences from the second embodiment will be described with reference to FIGS.
第4の実施形態の動画像配信システム1Aでは、上述のステップS107、S113が、それぞれステップS407、S413に置き換わっている点で第2の実施形態と異なっている。 The moving image distribution system 1A according to the fourth embodiment is different from the second embodiment in that steps S107 and S113 described above are replaced with steps S407 and S413, respectively.
まず、動画像符号化装置10C側の処理(ステップS407)について説明する。
First, the process (step S407) on the moving
図16に示すようにステップS407は、2つのステップS407−1、S407−2に分かれている。 As shown in FIG. 16, step S407 is divided into two steps S407-1 and S407-2.
ステップS407−1では、Slepian−Wolf符号選択部110により、ビットデプス制御信号S12に基づき、パディングビット以外のビットが特定され、特定されたビットに基づいて専用Slepian−Wolf符号化情報S13が生成される。
In step S407-1, the Slepian-Wolf
ステップS407−2では、Slepian−Wolf符号化部108Cにより、レートRに基づき、専用Slepian−Wolf符号化情報S13を用いて、量子化後Wyner−Ziv画像F23が符号化され、Slepian−WolfストリームST1が生成される。具体的には、Slepian−Wolf符号化部108Cは、専用Slepian−Wolf符号化情報S13の情報に基づき、符号化するビットを集め、集めたビットを上述の最適なSlepian−Wolf符号で符号化する。 In step S407-2, the quantized Wyner-Ziv image F23 is encoded by the Slepian-Wolf encoding unit 108C based on the rate R, using the dedicated Slepian-Wolf encoding information S13, and the Slepian-Wolf stream ST1. Is generated. Specifically, the Slepian-Wolf encoding unit 108C collects bits to be encoded based on the information of the dedicated Slepian-Wolf encoding information S13, and encodes the collected bits with the above-described optimal Sleian-Wolf code. .
次に、動画像復号装置20A側の処理(ステップS413)について説明する。 Next, the process (step S413) on the moving image decoding apparatus 20A side will be described.
図17に示すようにステップS413は、2つのステップS413−1、S413−2に分かれている。 As shown in FIG. 17, step S413 is divided into two steps S413-1 and S413-2.
ステップS413−1では、Slepian−Wolf符号選択部208により、ビットデプス制御信号S11に基づき、パディングビット以外のビットが特定され、特定されたビットに基づいて専用Slepian−Wolf復号情報S24が生成される。
In step S413-1, the Slepian-Wolf
ステップS413−2では、Slepian−Wolf復号部204Cにより、LLR通知信号S22、及び専用Slepian−Wolf復号情報S24を用いて、Slepian−WolfストリームST1が復号され、訂正後Wyner−Ziv画像F33が生成される。 In step S413-2, the Slepian-Wol decoding unit 204C uses the LLR notification signal S22 and the dedicated Slepian-Wolf decoding information S24 to decode the Slepian-Wolf stream ST1, and generates a corrected Wyner-Ziv image F33. The
具体的には、Slepian−Wolf復号部204Cは、専用Slepian−Wolf復号情報S24の情報に基づき、復号するビットに対応するLLRを集め、集めたLLRを上述の最適なSlepian−Wolf符号で、Slepian−WolfストリームST1を復号する。 Specifically, the Slepian-Wol decoding unit 204C collects LLRs corresponding to the bits to be decoded based on the information of the dedicated Slepian-Wolf decoding information S24, and the collected LLRs are converted into the above-mentioned optimal Sleian-Wolf codes using the above-described Slepian-Wolf codes. -Decodes the Wolf stream ST1.
(D−3)第4の実施形態の効果
第4の実施形態によれば、第2の実施形態の効果に加えて以下のような効果を奏することができる。
(D-3) Effects of Fourth Embodiment According to the fourth embodiment, the following effects can be obtained in addition to the effects of the second embodiment.
動画像符号化装置10Cでは、動画像復号装置20Cとの間でパディングビットの位置が共有されていることを利用し、パディングビット以外のビットを符号化するのに最適なSlepian−Wolf符号を用いて符号化することで、符号量の増加を防止することができる。
The moving
また、動画像復号装置20Cでは、動画像符号化装置10Cから供給されたビットデプス制御信号S12に基づいて、パディングビットの位置を特定し、パディングビット以外のビットの誤り訂正に最適なSlepian−Wolf符号を用いて復号することで、復号品質を向上させることができる。
Also, the moving picture decoding apparatus 20C specifies the position of padding bits based on the bit depth control signal S12 supplied from the moving
(E)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(E) Other Embodiments The present invention is not limited to the above-described embodiments, and may include modified embodiments as exemplified below.
(F−1)上記の各実施形態では、説明を簡易とするために、Wyner−Ziv画像の符号化及び復号に用いる各画像(Wyner−Ziv画像、エンコーダ予測画像、デコーダ予測画像等)について、非特許文献1等のようにDCT変換等による変換処理を行わずに、各画素の画素値又は量子化値で表わしたパラメータ形式(ピクセルドメイン形式)のまま処理するものとして説明している。ただし、本発明では、各画像を表現するためのパラメータ形式は、ピクセルドメイン形式に限定されず、DCT変換等により変換係数領域ごとの量子化値で表わしたパラメータ形式(トランスフォームドメイン形式)としても良い。トランスフォームドメイン形式の場合、上記の各実施形態の画素の画素値(量子化値)が、変換係数領域(複数のブロックに分割して処理する場合には、各ブロック内での変換係数領域)ごとの量子化値に置き換えられることになる。上記の各実施形態で、符号化及び復号に用いる各画像について、トランスフォームドメイン形式で処理する場合には、量子化処理の前段に、トランスフォームドメイン形式のパラメータ列に変換する変換処理部を追加すれば良い。
(F-1) In each of the above embodiments, for simplification of description, for each image (Wyner-Ziv image, encoder predicted image, decoder predicted image, etc.) used for encoding and decoding a Wyner-Ziv image, As described in
上記の各実施形態では、各画素の画素値をパラメータとして並べたパラメータ列としてみることができる。そして、Slepian−Wolf理論およびWyner−Ziv理論に基づいたDVC方式の符号化処理及び復号処理では、符号化及び復号する対象となるパラメータ列の数や各パラメータの持つ意味は限定されない。したがって、各画像を表現するためのパラメータ列の形式(パラメータの数等)を変更したとしても、上記の各実施形態と同様の効果を奏することができる。 In each of the above embodiments, the pixel value of each pixel can be viewed as a parameter string arranged as a parameter. In the DVC method encoding process and decoding process based on the Slepian-Wolf theory and the Wyner-Ziv theory, the number of parameter sequences to be encoded and decoded and the meaning of each parameter are not limited. Therefore, even if the format of the parameter string for expressing each image (number of parameters, etc.) is changed, the same effects as those of the above embodiments can be obtained.
(F−2)上記の各実施形態において、動画像復号装置では、Key画像からエンコーダ予測画像やデコーダ予測画像を生成しているが、他時刻のWyner−Ziv復号画像から生成しても良い。また、動画像復号装置では、非特許文献3のようにスケーラブル構造を有する場合は、ベースレイヤの情報を用いて、デコーダ予測画像を生成しても良い。
(F-2) In each of the above embodiments, the moving image decoding apparatus generates an encoder predicted image and a decoder predicted image from a Key image. However, the moving image decoding device may generate a Wyner-Ziv decoded image at another time. Moreover, in a moving image decoding apparatus, when it has a scalable structure like the
(F−3)上記の各実施形態の動画像符号化装置では、レート制御部による推定結果により、レートRを決定する構成となっているが、非特許文献1のように、動画像復号装置側からのフィードバックアプローチによってレート制御する構成としても良い。フィードバックアプローチによってレート制御する場合、エンコーダ予測画像量子化部106を省略するようにしてもよい。
(F-3) In the video encoding device of each of the embodiments described above, the rate R is determined based on the estimation result of the rate control unit. The rate control may be performed by a feedback approach from the side. When rate control is performed by a feedback approach, the encoder predicted
(F−4)上記の各実施形態では、動画像符号化装置と動画像復号装置はネットワーク等の通信路で接続されているものとして説明しているが、動画像符号化装置と動画像復号装置は直接通信可能な構成としなくてもよい。例えば、動画像符号化装置が生成した動画像データ(Slepian−Wolfストリーム及びKeyストリームのデータ)を、DVDやハードディスク等の媒体に記録し、オフラインで動画像復号装置に供給するようにしてもよい。 (F-4) In each of the above embodiments, the video encoding device and the video decoding device are described as being connected via a communication path such as a network. However, the video encoding device and the video decoding are described. The apparatus may not be configured to be able to communicate directly. For example, the moving image data (Slepian-Wolf stream and Key stream data) generated by the moving image encoding device may be recorded on a medium such as a DVD or a hard disk and supplied to the moving image decoding device offline. .
(F−5)第4の実施形態において、Slepian−Wolf符号選択部110とSlepian−Wolf符号選択部208の形態として、エンコーダ予測画像F21が選択されている画素に属するビットが符号化処理および復号処理に関わらないSlepian−Wolf符号を生成しても良い。該Slepian−Wolf符号は、符号化および復号するビットの位置情報を、Slepian−Wolf符号に内在したものとなる。この場合、動画像配信システム1Cでは、ステップS407−2で符号化するビットを集めたり、ステップS313−2で復号するビットに対応するLLRを集めたりする必要はなくなる。
(F-5) In the fourth embodiment, as a form of the Slepian-Wolf
(F−6)上記の各実施形態において、ビットデプス制御部は、ブロック単位でビットデプスを決定しているが、画素ごと(パラメータごと)にビットデプスを決定し、ビットデプス制御信号S11に反映するようにしてもよい。 (F-6) In each of the above embodiments, the bit depth control unit determines the bit depth for each block, but determines the bit depth for each pixel (for each parameter) and reflects it in the bit depth control signal S11. You may make it do.
1…動画像配信システム、10…動画像符号化装置、101…ビットデプス制御部、102…複雑度計算部、103…制御部103、104…符号化対象画像量子化部、105…エンコーダ予測画像生成部、106…エンコーダ予測画像量子化部、107…レート制御部、108…Slepian−Wolf符号化部、109…ビットデプス通知部、120…Key画像符号化部、20…動画像復号装置、200…ビットデプス受取部、201…デコーダ予測画像生成部、202…デコーダ予測画像量子化部、203…LLR推定部、204…Slepian−Wolf復号部、205…再構成部、220…Key画像復号部。
DESCRIPTION OF
Claims (11)
上記フレーム列のうちキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、
非キーフレームの複雑度合を計算する複雑度計算部と、
上記複雑度計算部の計算結果に基づいて、画像を構成する各パラメータの量子化に係るビットデプスを決定するビットデプス決定手段と、
上記ビットデプス決定手段で決定されたビットデプスで、非キーフレームの各パラメータ、及び、上記予測画像の各パラメータを量子化して、量子化後非キーフレーム及び量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して決定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、
量子化後非キーフレームに対する量子化後予測画像の誤りを訂正するための誤り訂正符号を生成する誤り訂正符号生成手段とを有し、
上記ビットデプス決定手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値である
ことを特徴とする動画像符号化装置。 In a video encoding device that encodes a video having a frame sequence,
Predicted image generation means for generating a predicted image of a non-key frame using a key frame of the frame sequence;
A complexity calculator for calculating the complexity of non-keyframes;
Based on the calculation result of the complexity calculation unit, bit depth determination means for determining a bit depth related to quantization of each parameter constituting the image;
Quantize each parameter of the non-key frame and each parameter of the predicted image with the bit depth determined by the bit depth determining means to generate a non-key frame after quantization and a predicted image after quantization. For a parameter for which a bit depth less than the maximum bit depth is determined, either the most significant bit side or the least significant bit side of the quantized data corresponding to the bit depth determined for the parameter, Quantization means for generating, as quantized data of the parameter, data obtained by adding padding bits of a predetermined pattern corresponding to the difference from the most bit depth,
An error correction code generation means for generating an error correction code for correcting an error of the predicted image after quantization for the non-key frame after quantization;
Parameters of each image processed by the bit depth determination means and the quantizing means, the pixel values of the pixels constituting the image, or, conversion coefficients obtained by converting the image by a predetermined conversion method A moving picture coding apparatus characterized by having a quantized value for each region.
上記ビットデプス決定手段は、画像を構成するブロックごとに、当該ブロック内の各パラメータについて共通のビットデプスを決定する
ことを特徴とする請求項1又は2に記載の動画像符号化装置。 The complexity calculation unit calculates the complexity for each block constituting the predicted image of the non-key frame,
The moving picture encoding apparatus according to claim 1 or 2, wherein the bit depth determining means determines a common bit depth for each parameter in the block for each block constituting the image.
キーフレームのデータを保持するキーフレーム保持手段と、
上記キーフレーム保持手段が保持したキーフレームを利用して、上記フレーム列のうち非キーフレームの予測画像を生成する予測画像生成手段と、
上記動画像データを構成する非キーフレームの符号化データの生成過程で、画像を構成する各パラメータの量子化に適用されたビットデプスに係るビットデプス情報を保持するビットデプス保持手段と、
上記ビットデプス保持手段で保持されたビットデプスで、上記予測画像の各パラメータを量子化して、量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して設定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、
上記動画像データを構成する非キーフレームの符号化データが、量子化後予測画像を訂正するための誤り訂正符号だった場合、その誤り訂正符号を用いて量子化後予測画像を訂正した訂正後画像を生成する誤り訂正手段と、
訂正後画像と、上記予測画像とに基づいて、非キーフレームの画像を再構成した再構成画像を生成する再構成手段とを有し、
上記ビットデプス保持手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値である
ことを特徴とする動画像復号装置。 In a moving image decoding apparatus for decoding moving image data in which a moving image having a frame sequence is encoded in units of frames,
Key frame holding means for holding key frame data;
A predicted image generating means for generating a predicted image of a non-key frame in the frame sequence using the key frame held by the key frame holding means;
Bit depth holding means for holding bit depth information related to bit depth applied to quantization of each parameter constituting the image in the process of generating encoded data of non-key frames constituting the moving image data;
The bit depth held by the bit depth holding unit quantizes each parameter of the predicted image to generate a quantized predicted image, and a bit depth smaller than the maximum bit depth is determined. For a parameter, padding bits of a predetermined pattern corresponding to the difference from the most bit depth are placed on either the most significant bit side or the least significant bit side of the quantized data for the bit depth set for the parameter. Quantization means for generating the added data as quantized data of the parameter;
When the encoded data of the non-key frame that constitutes the moving image data is an error correction code for correcting the predicted image after quantization, the corrected image obtained by correcting the predicted image after quantization using the error correction code Error correction means for generating an image;
Reconstructing means for generating a reconstructed image obtained by reconstructing a non-keyframe image based on the corrected image and the predicted image;
Parameters of each image processed by the bit depth holding means and the quantizing means, the pixel values of the pixels constituting the image, or, conversion coefficients obtained by converting the image by a predetermined conversion method A moving picture decoding apparatus characterized by having a quantized value for each region.
量子化後予測画像を構成する各ビットに対してLLRを決定するLLR決定部とを備え、
上記LLR決定部が決定したビットごとのLLRに基づいて誤り訂正処理を行い、
上記LLR決定部は、パディングビットに対して、パディングビットを除くビットよりも大きな値のLLRを設定する
ことを特徴とする請求項6に記載の動画像復号装置。 The error correction means is
An LLR determining unit that determines an LLR for each bit constituting the quantized predicted image;
An error correction process is performed based on the LLR for each bit determined by the LLR determination unit,
The moving picture decoding apparatus according to claim 6, wherein the LLR determination unit sets an LLR having a larger value for padding bits than a bit excluding padding bits.
上記フレーム列のうちキーフレームを利用して、非キーフレームの予測画像を生成する予測画像生成手段と、
非キーフレームの複雑度合を計算する複雑度計算部と、
上記複雑度計算部の計算結果に基づいて、画像を構成する各パラメータの量子化に係るビットデプスを決定するビットデプス決定手段と、
上記ビットデプス決定手段で決定されたビットデプスで、非キーフレームの各パラメータ、及び、上記予測画像の各パラメータを量子化して、量子化後非キーフレーム及び量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して決定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、
量子化後非キーフレームに対する量子化後予測画像の誤りを訂正するための誤り訂正符号を生成する誤り訂正符号生成手段として機能させ、
上記ビットデプス決定手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値である
ことを特徴とする動画像符号化プログラム。 A computer mounted on a video encoding device that encodes a video having a frame sequence,
Predicted image generation means for generating a predicted image of a non-key frame using a key frame of the frame sequence;
A complexity calculator for calculating the complexity of non-keyframes;
Based on the calculation result of the complexity calculation unit, bit depth determination means for determining a bit depth related to quantization of each parameter constituting the image;
Quantize each parameter of the non-key frame and each parameter of the predicted image with the bit depth determined by the bit depth determining means to generate a non-key frame after quantization and a predicted image after quantization. For a parameter for which a bit depth less than the maximum bit depth is determined, either the most significant bit side or the least significant bit side of the quantized data corresponding to the bit depth determined for the parameter, Quantization means for generating, as quantized data of the parameter, data obtained by adding padding bits of a predetermined pattern corresponding to the difference from the most bit depth,
Function as an error correction code generation means for generating an error correction code for correcting an error of a predicted image after quantization for a non-key frame after quantization;
Parameters of each image processed by the bit depth determination means and the quantizing means, the pixel values of the pixels constituting the image, or, conversion coefficients obtained by converting the image by a predetermined conversion method A moving picture coding program characterized by being a quantized value for each region.
キーフレームのデータを保持するキーフレーム保持手段と、
上記キーフレーム保持手段が保持したキーフレームを利用して、上記フレーム列のうち非キーフレームの予測画像を生成する予測画像生成手段と、
上記動画像データを構成する非キーフレームの符号化データの生成過程で、画像を構成する各パラメータの量子化に適用されたビットデプスに係るビットデプス情報を保持するビットデプス保持手段と、
上記ビットデプス保持手段で保持されたビットデプスで、上記予測画像の各パラメータを量子化して、量子化後予測画像を生成するものであって、最多のビットデプスよりも少ないビットデプスが決定されたパラメータについては、当該パラメータに対して設定されたビットデプス分の量子化データの最上位ビット側又は最下位ビット側のいずれかに、最多のビットデプスとの差分に相当する所定パターンのパディングビットを追加したデータを、当該パラメータの量子化データとして生成する量子化手段と、
上記動画像データを構成する非キーフレームの符号化データが、量子化後予測画像を訂正するための誤り訂正符号だった場合、その誤り訂正符号を用いて量子化後予測画像を訂正した訂正後画像を生成する誤り訂正手段と、
訂正後画像と、上記予測画像とに基づいて、非キーフレームの画像を再構成した再構成画像を生成する再構成手段として機能させ、
上記ビットデプス保持手段及び上記量子化手段で処理される各画像のパラメータは、当該画像を構成する各画素の画素値、又は、当該画像を所定の変換方式で変換することで得られる変換係数領域ごとの量子化値である
ことを特徴とする動画像復号プログラム。 A computer mounted on a moving image decoding apparatus for decoding moving image data in which a moving image having a frame sequence is encoded in units of frames;
Key frame holding means for holding key frame data;
A predicted image generating means for generating a predicted image of a non-key frame in the frame sequence using the key frame held by the key frame holding means;
Bit depth holding means for holding bit depth information related to bit depth applied to quantization of each parameter constituting the image in the process of generating encoded data of non-key frames constituting the moving image data;
The bit depth held by the bit depth holding unit quantizes each parameter of the predicted image to generate a quantized predicted image, and a bit depth smaller than the maximum bit depth is determined. For a parameter, padding bits of a predetermined pattern corresponding to the difference from the most bit depth are placed on either the most significant bit side or the least significant bit side of the quantized data for the bit depth set for the parameter. Quantization means for generating the added data as quantized data of the parameter;
When the encoded data of the non-key frame that constitutes the moving image data is an error correction code for correcting the predicted image after quantization, the corrected image obtained by correcting the predicted image after quantization using the error correction code Error correction means for generating an image;
Based on the corrected image and the predicted image, function as a reconstruction unit that generates a reconstructed image obtained by reconstructing a non-keyframe image;
Parameters of each image processed by the bit depth holding means and the quantizing means, the pixel values of the pixels constituting the image, or, conversion coefficients obtained by converting the image by a predetermined conversion method A moving picture decoding program characterized by being a quantized value for each area.
上記動画像符号化装置として請求項1に記載の動画像符号化装置を適用し、
上記動画像復号装置として請求項6に記載の動画像復号装置を適用したこと
を特徴とする動画像配信システム。 A moving image including a moving image encoding device that generates moving image data obtained by encoding a moving image having a frame sequence in units of frames, and a moving image decoding device that decodes the moving image data generated by the moving image encoding device. In the image distribution system,
Applying the video encoding device according to claim 1 as the video encoding device,
A moving image distribution system, wherein the moving image decoding device according to claim 6 is applied as the moving image decoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013037576A JP6268715B2 (en) | 2013-02-27 | 2013-02-27 | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013037576A JP6268715B2 (en) | 2013-02-27 | 2013-02-27 | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014165849A JP2014165849A (en) | 2014-09-08 |
JP6268715B2 true JP6268715B2 (en) | 2018-01-31 |
Family
ID=51616041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013037576A Active JP6268715B2 (en) | 2013-02-27 | 2013-02-27 | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6268715B2 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4605070B2 (en) * | 2006-03-30 | 2011-01-05 | Kddi株式会社 | Image compression encoding apparatus, image decoding apparatus, program, and method |
JP2010166145A (en) * | 2009-01-13 | 2010-07-29 | Osaka Univ | Moving image decoder |
JP5071416B2 (en) * | 2009-03-09 | 2012-11-14 | 沖電気工業株式会社 | Moving picture encoding apparatus, moving picture decoding apparatus, and moving picture transmission system |
EP2717565A4 (en) * | 2011-04-28 | 2016-04-13 | Panasonic Ip Man Co Ltd | Recording medium, playback device, recording device, encoding method, and decoding method related to higher image quality |
-
2013
- 2013-02-27 JP JP2013037576A patent/JP6268715B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014165849A (en) | 2014-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102134705B1 (en) | Signal processing and inheritance in a tiered signal quality hierarchy | |
JP5957561B2 (en) | Video encoding / decoding method and apparatus using large size transform unit | |
JP5071416B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, and moving picture transmission system | |
US8111755B2 (en) | Method and system for low-complexity Slepian-Wolf rate estimation in Wyner-Ziv video encoding | |
KR20220025271A (en) | Method and device for encoding or decoding image | |
JP5900024B2 (en) | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system | |
Huang et al. | Cross-band noise model refinement for transform domain Wyner–Ziv video coding | |
US20120170858A1 (en) | Method and apparatus for encoding and decoding of images | |
JP2009141688A (en) | Image encoding-decoding method, system, image encoding program, and image decoding program | |
JP5270592B2 (en) | Image coding apparatus, image coding method, and image coding program | |
US20080232706A1 (en) | Method and apparatus for encoding and decoding image using pixel-based context model | |
Zhou et al. | Distributed video coding using interval overlapped arithmetic coding | |
JP5625808B2 (en) | Data updating apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system | |
JP5446686B2 (en) | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system | |
EP3022845A1 (en) | Encoder and decoder, and method of operation | |
JP6268715B2 (en) | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system | |
Song et al. | Can gray code improve the performance of distributed video coding? | |
JP2009296277A (en) | Image coder, image decoder, image coding method, image decoding method, and program | |
KR101152482B1 (en) | Methods of encoding and decoding using fast ldpca code and apparatuses using the same | |
JP6268718B2 (en) | Moving picture encoding apparatus and program, moving picture decoding apparatus and program, and moving picture distribution system | |
JP5811823B2 (en) | Video encoding apparatus, system, and program | |
JP2007142498A (en) | Image decoding device and program, and computer-readable recording medium | |
WO2020203962A1 (en) | Image generation device, image generation method, and program | |
JP5625824B2 (en) | Code amount control apparatus and program, and moving picture coding apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170509 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6268715 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |