JP2018117239A - Video data compression apparatus and video data compression method - Google Patents
Video data compression apparatus and video data compression method Download PDFInfo
- Publication number
- JP2018117239A JP2018117239A JP2017006670A JP2017006670A JP2018117239A JP 2018117239 A JP2018117239 A JP 2018117239A JP 2017006670 A JP2017006670 A JP 2017006670A JP 2017006670 A JP2017006670 A JP 2017006670A JP 2018117239 A JP2018117239 A JP 2018117239A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- motion vector
- frame image
- information
- transparency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013144 data compression Methods 0.000 title claims abstract description 18
- 239000013598 vector Substances 0.000 claims abstract description 170
- 238000007906 compression Methods 0.000 claims abstract description 57
- 230000006835 compression Effects 0.000 claims abstract description 57
- 238000001514 detection method Methods 0.000 claims abstract description 39
- 238000004364 calculation method Methods 0.000 description 43
- 230000006870 function Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 14
- 238000013139 quantization Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
【課題】透明度の情報を含む動画の圧縮率を向上させることのできる動画データの圧縮装置、動画データの圧縮方法を提供する。【解決手段】少なくとも一部に透明度の情報が設定されたフレーム画像データを用いて構成される動画データを圧縮する動画圧縮装置10は、特定のフレーム画像データと、該特定のフレーム画像データの前方向、及び/又は、後方向に存在する他のフレーム画像データとの間で動きベクトルを検出する動きベクトル検出部17と、検出された動きベクトルを用いて動画データを圧縮する符号生成部13とを備え、動きベクトル検出部17は、特定のフレーム画像データ、及び/又は、他のフレーム画像データの有する透明度の情報を用いて、特定のフレーム画像データと他のフレーム画像データとの間の動きベクトルを検出する。【選択図】図1A moving image data compression apparatus and moving image data compression method capable of improving the compression rate of a moving image including transparency information are provided. A moving image compression apparatus for compressing moving image data configured using frame image data in which transparency information is set at least partially includes a specific frame image data and a front of the specific frame image data. A motion vector detection unit 17 that detects a motion vector between other frame image data existing in the direction and / or backward direction, and a code generation unit 13 that compresses moving image data using the detected motion vector; The motion vector detection unit 17 uses the information on the transparency of the specific frame image data and / or the other frame image data, and moves between the specific frame image data and the other frame image data. Detect vectors. [Selection] Figure 1
Description
本発明は、透明度の情報が設定された動画データのフレーム画像データを圧縮する動画データの圧縮装置、動画データの圧縮方法に関する。 The present invention relates to a moving image data compression apparatus and moving image data compression method for compressing frame image data of moving image data in which transparency information is set.
従来、動画データを圧縮する際に用いられる手法としてフレーム間予測が知られている(例えば、特許文献1参照)。これは、符号化対象フレーム(例えば時系列順に並んだフレームの中で最新のフレーム)と、符号化対象フレームとは異なる時刻の参照フレーム(例えば最新のフレームの1つ前の過去のフレーム)から生成された予測画像との差分画像を符号化することで、動画データのデータ量を削減するための技術である。 Conventionally, inter-frame prediction is known as a technique used when compressing moving image data (see, for example, Patent Document 1). This is based on the encoding target frame (for example, the latest frame among frames arranged in chronological order) and the reference frame at a different time from the encoding target frame (for example, the past frame one before the latest frame). This is a technique for reducing the data amount of moving image data by encoding a difference image with a generated predicted image.
ここで、フレーム間予測においてフレーム間の差分を符号化する際の処理としては、符号化対象フレームに含まれる画像情報と参照フレームに含まれる画像情報を数値化し、所定の演算に基づく処理によって画像情報の動きの方向や大きさとしての動きベクトルを求め、求めた動きベクトルを符号化することが考えられる。 Here, as processing when encoding the inter-frame difference in inter-frame prediction, the image information included in the encoding target frame and the image information included in the reference frame are digitized, and the image is processed by processing based on a predetermined calculation. It is conceivable to obtain a motion vector as the direction and size of information motion and encode the obtained motion vector.
一方、近年、画像情報には、色情報(例えば、RGB色空間を形成するR,G,Bの情報や、それを輝度情報(Y)と色差情報(U,V)とに変換したY,U,Vの情報など)に加え、透明度(複数の画像を重ね合わせる際の、重ねられた他の画像の透過度のこと)を規定する透明度の情報が含まれる場合がある。そして、画像情報が色情報に加えて透明度の情報を有する場合、単に色情報のみの場合とは画像情報の特質が異なる場合があるので、単に色情報の場合の演算や処理と同じ処理を行うことは必ずしも適切ではない。即ち、符号化対象フレームと参照フレームとに透明な部分や、透明度が高い部分が含まれる場合、符号化対象フレームや参照フレームの色情報は、不透明な画像情報に比べ、動きベクトルを求める際の演算や処理における重要度が高くない場合が多い。 On the other hand, in recent years, image information includes color information (for example, R, G, and B information forming an RGB color space, and Y and Y converted from luminance information (Y) and color difference information (U, V)). In addition to information on U, V, etc., transparency information that defines transparency (transparency of other superimposed images when a plurality of images are superimposed) may be included. If the image information has transparency information in addition to the color information, the characteristics of the image information may differ from the case of only the color information, so the same processing as the calculation and processing for the color information is performed. That is not always appropriate. That is, when the encoding target frame and the reference frame include a transparent part or a part with high transparency, the color information of the encoding target frame or the reference frame is more suitable for determining the motion vector than the opaque image information. In many cases, the degree of importance in computation and processing is not high.
しかし、上記特許文献1においては、画像情報として透明度を有する場合や、画像情報同士の透明度の大きさが相違する場合について考慮されていない。そのため、特許文献1においては、透明な画像も不透明な画像と同様の演算や処理によって動きベクトルを求めることになる。そのため、特許文献1においては、透明な部分を有する動画データについて、色情報の重要度が高くない場合であっても、色情報を中心にした演算や処理を行って動きベクトルを求めることになる。これは、いたずらに演算量を増加させ、かつ、いたずらに符号量を増加させることになり、動画の圧縮率の向上を抑止させてしまうという問題がある。
However, in the above-mentioned
本発明はこのような課題に鑑みてなされたものであり、透明度の情報を含む動画の圧縮率を向上させることのできる動画データの圧縮装置、動画データの圧縮方法を提供することを課題としている。 The present invention has been made in view of such problems, and an object of the present invention is to provide a moving image data compression device and a moving image data compression method capable of improving the compression rate of moving images including transparency information. .
かかる課題を解決するために、請求項1に記載の発明は、少なくとも一部に透明度の情報が設定されたフレーム画像データを用いて構成される動画データを圧縮する動画データの圧縮装置であって、特定のフレーム画像と、該特定のフレーム画像の前方向、及び/又は、後方向に存在する他のフレーム画像データとの間で動きベクトルを検出する動きベクトル検出手段と、検出された前記動きベクトルを用いて前記フレーム画像データを圧縮する圧縮手段とを備え、該動きベクトル検出手段は、前記特定のフレーム画像データ、及び/又は、前記他のフレーム画像データの有する前記透明度の情報を用いて、前記特定のフレーム画像データと前記他のフレーム画像データとの間の前記動きベクトルを検出することを特徴とする。
In order to solve such a problem, the invention described in
請求項2に記載の発明は、請求項1に記載の構成に加え、前記動きベクトル検出手段は、前記特定のフレーム画像データ、及び/又は、前記他のフレーム画像データの有する前記透明度の情報の、前記透明度の高さの値に依存して、動きベクトルの決定における画質の寄与度を補正することで前記動きベクトルを検出することを特徴とする。 According to a second aspect of the present invention, in addition to the configuration according to the first aspect, the motion vector detecting means may include the transparency information of the specific frame image data and / or the other frame image data. The motion vector is detected by correcting the contribution of image quality in determining the motion vector depending on the value of the transparency level.
請求項3に記載の発明は、請求項2に記載の構成に加え、前記動きベクトル検出手段は、前記動きベクトルを検出する際に、前記特定のフレーム画像データの前記透明度の情報の規定する前記透明度、及び/又は、前記他のフレーム画像データの前記透明度の情報の規定する前記透明度、が高いほど、前記特定のフレーム画像データの色情報、及び/又は、前記他のフレーム画像データの色情報が前記動きベクトルの決定に与える影響が小さくなるようにすることを特徴とする。 According to a third aspect of the present invention, in addition to the configuration of the second aspect, the motion vector detecting means defines the transparency information of the specific frame image data when detecting the motion vector. As the transparency and / or the transparency specified by the transparency information of the other frame image data is higher, the color information of the specific frame image data and / or the color information of the other frame image data. The influence on the determination of the motion vector is made small.
請求項4に記載の発明は、請求項1乃至3の何れか一つに記載の構成に加え、前記動きベクトル検出手段は、前記特定のフレーム画像データの色情報に前記特定のフレーム画像データの前記透明度の情報を乗算した値、及び/又は、前記他のフレーム画像データの色情報に前記他のフレーム画像データの前記透明度の情報を乗算した値、を用いて前記動きベクトルを検出することを特徴とする。 According to a fourth aspect of the present invention, in addition to the configuration according to any one of the first to third aspects, the motion vector detecting means includes the color information of the specific frame image data in the color information of the specific frame image data. Detecting the motion vector using a value obtained by multiplying the transparency information and / or a value obtained by multiplying the color information of the other frame image data by the transparency information of the other frame image data. Features.
請求項5に記載の発明は、請求項4に記載の構成に加え、前記動きベクトル検出手段は、前記特定のフレーム画像データの色情報に前記特定のフレーム画像データの前記透明度の情報を乗算した値、及び/又は、前記他のフレーム画像データの色情報に前記他のフレーム画像データの前記透明度の情報を乗算した値の、絶対値誤差又は二乗誤差を用いて前記動きベクトルを検出することを特徴とする。 According to a fifth aspect of the present invention, in addition to the configuration of the fourth aspect, the motion vector detecting means multiplies the color information of the specific frame image data by the transparency information of the specific frame image data. Detecting the motion vector using an absolute value error or a square error of a value and / or a value obtained by multiplying the color information of the other frame image data by the transparency information of the other frame image data. Features.
請求項6に記載の発明は、請求項1乃至5の何れか一つに記載の構成に加え、前記動きベクトル検出手段は、前記特定のフレーム画像データの透明度情報、及び/又は、前記他のフレーム画像データの透明度情報、を用いて前記動きベクトルを検出することを特徴とする。 According to a sixth aspect of the present invention, in addition to the configuration according to any one of the first to fifth aspects, the motion vector detecting means includes transparency information of the specific frame image data and / or the other The motion vector is detected using transparency information of frame image data.
請求項7に記載の発明は、少なくとも一部に透明度の情報が設定されたフレーム画像データを用いて構成される動画データを圧縮するための動画データの圧縮方法であって、特定のフレーム画像データと、該特定のフレーム画像データの前方向、及び/又は、後方向に存在する他のフレーム画像データとの間で動きベクトルが検出される動きベクトル検出手順と、検出された前記動きベクトルを用いて前記フレーム画像データが圧縮される圧縮手順とを備え、該動きベクトル検出手順においては、前記特定のフレーム画像データ、及び/又は、前記他のフレーム画像データの有する前記透明度の情報を用いて、前記特定のフレーム画像データと前記他のフレーム画像データとの間の前記動きベクトルが検出されることを特徴とする。 The invention according to claim 7 is a moving image data compression method for compressing moving image data configured using frame image data in which transparency information is set at least in part, and the specific frame image data A motion vector detection procedure in which a motion vector is detected between the frame image data and other frame image data existing in the forward direction and / or backward direction of the specific frame image data, and using the detected motion vector A compression procedure for compressing the frame image data, and in the motion vector detection procedure, using the transparency information of the specific frame image data and / or the other frame image data, The motion vector between the specific frame image data and the other frame image data is detected.
請求項1、請求項7に記載の発明によれば、特定のフレーム画像データ、及び/又は、他のフレーム画像データの有する透明度の情報を用いて、特定のフレーム画像データと他のフレーム画像データとの間の動きベクトルを検出することにより、透明度の情報が設定された動画データのフレーム画像において、設定された透明度の情報に依存した形で動きベクトルを検出し、フレーム画像データを圧縮することができる。そして、動きベクトルを透明度の情報に依存して検出できるので、透明な部分を有するフレーム画像データの動きベクトルの検出と符号化における、透明な部分の検出に際して重要度の低い色情報が、動きベクトルの検出と符号化に反映する度合いを低減させることが可能になる。これにより、透明度の情報を含む動画の圧縮率を向上させることができる。 According to the first and seventh aspects of the invention, the specific frame image data and / or the other frame image data using the transparency information of the specific frame image data and / or other frame image data. By detecting the motion vector between the frame image data, the motion vector is detected depending on the set transparency information in the frame image of the moving image data in which the transparency information is set, and the frame image data is compressed. Can do. Since the motion vector can be detected depending on the transparency information, color information of low importance in detecting the transparent portion in the detection and encoding of the motion vector of the frame image data having the transparent portion is the motion vector. It is possible to reduce the degree of reflection in the detection and encoding. Thereby, the compression rate of the moving image containing transparency information can be improved.
請求項2に記載の発明によれば、透明度の高さの値に依存して、動きベクトルの決定における画質の貢献度を補正することで動きベクトルを検出することにより、透明度の高さの値を動きベクトルの検出と符号化に反映させて、透明度の情報を含む動画の圧縮率を向上させることができる。 According to the second aspect of the invention, depending on the value of the transparency level, the motion vector is detected by correcting the contribution of the image quality in the determination of the motion vector. Can be reflected in the detection and encoding of motion vectors, and the compression rate of a moving image including transparency information can be improved.
請求項3に記載の発明によれば、フレーム画像データの透明度の情報の規定する透明度が高いほど、フレーム画像データの色情報が動きベクトルの大きさに与える影響が小さくなるようにすることにより、フレーム画像データの透明度が高くなって動きベクトルの検出に際して色情報の重要度が低くなるほど、動きベクトルの検出と符号化に色情報が反映される度合いを低下させることができる。これにより、透明度の情報を含む動画の圧縮において、重要度の低い情報を削減しつつ、圧縮率を向上させることができる。 According to the third aspect of the present invention, the higher the transparency defined by the transparency information of the frame image data, the smaller the influence of the color information of the frame image data on the magnitude of the motion vector, As the transparency of the frame image data becomes higher and the importance of the color information becomes lower when detecting the motion vector, the degree to which the color information is reflected in the detection and encoding of the motion vector can be reduced. Thereby, in the compression of a moving image including transparency information, it is possible to improve the compression rate while reducing less important information.
請求項4に記載の発明によれば、フレーム画像データの色情報に基づいて得られる値を透明度の情報に基づいて補正することで、動きベクトルを検出することができるので、透明度の情報を含む動画の圧縮において、透明度の大きさを動きベクトルの検出と符号化における具体的な演算処理に反映させることができる。これにより、透明度の大きさに基づいて重要度の低いデータを削減しつつ、圧縮率を向上させることを、具体的な演算処理において実現することができる。 According to the invention described in claim 4, since the motion vector can be detected by correcting the value obtained based on the color information of the frame image data based on the transparency information, the transparency information is included. In moving image compression, the degree of transparency can be reflected in specific calculation processing in motion vector detection and encoding. Accordingly, it is possible to realize in a specific calculation process that the compression rate is improved while reducing the data with low importance based on the degree of transparency.
請求項5に記載の発明によれば、色情報に透明度の情報を乗算した値の、絶対値誤差又は二乗誤差によって動きベクトルを検出することにより、透明度の情報を反映させた値に基づいて精度の高い演算処理を行い、適切な動きベクトルを検出することができる。 According to the invention described in claim 5, by detecting a motion vector based on an absolute value error or a square error of a value obtained by multiplying color information by transparency information, accuracy can be determined based on a value reflecting transparency information. It is possible to detect an appropriate motion vector by performing a high calculation process.
請求項6に記載の発明によれば、透明度の情報を用いて動きベクトルを検出することにより、透明度の情報を反映させた値に基づいて精度の高い演算処理を行い、適切な動きベクトルを検出することができる。 According to the invention described in claim 6, by detecting a motion vector using transparency information, high-precision arithmetic processing is performed based on a value reflecting the transparency information, and an appropriate motion vector is detected. can do.
以下、本発明の実施形態について図を用いて詳細に説明する。なお、本実施形態ではMPEGの符号化方式に適用した例に基づき説明するが、MPEG以外のどのような画像の符号化方式に本発明が適用されてもよい。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Although the present embodiment will be described based on an example applied to an MPEG encoding method, the present invention may be applied to any image encoding method other than MPEG.
[この実施の形態で用いられる動画データ]
この実施の形態で用いられる動画データは、透明度(α値)の情報を有する動画データである。具体的には、例えば、動画データを構成する「フレーム画像データ」としてのフレームのそれぞれの画素の画像情報としてに、RGB色空間の「R」情報、「G」情報、「B」情報に加え、透明度(α値)を規定する「A」情報が、0〜255の値で設定されている場合(ただし、「A」情報は0が透明度最大(透明度100%)、255が透明度最小(透明度0%))がこれに相当する。
[Movie data used in this embodiment]
The moving image data used in this embodiment is moving image data having transparency (α value) information. Specifically, for example, in addition to “R” information, “G” information, and “B” information in the RGB color space, as image information of each pixel of a frame as “frame image data” that constitutes moving image data. When the “A” information that defines the transparency (α value) is set with a value from 0 to 255 (however, in the “A” information, 0 is the maximum transparency (
この実施の形態においては、動画圧縮装置10(図1参照)において、この透明度情報を含むフレームを圧縮する。なお、動画圧縮装置10(図1参照)においては、透明度(α値)の情報を含むフレーム全てを圧縮の対象としてもよいし、一部のみを圧縮の対象としてもよい。また、動画圧縮装置10において圧縮の対象とされる動画データは、全てのフレームが透明度(α値)の情報を有していてもよいし、少なくとも一部のフレームのみが透明度(α値)の情報を有していてもよい。また、動画圧縮装置10(図1参照)においては、透明度(α値)の情報を用いた圧縮(後述)と、透明度(α値)の情報を用いた圧縮以外の圧縮方法とを併用して動画データの圧縮を行うものであってもよい。 In this embodiment, the moving image compression apparatus 10 (see FIG. 1) compresses a frame including this transparency information. Note that in the moving picture compression apparatus 10 (see FIG. 1), all frames including transparency (α value) information may be compression targets, or only a part may be compression targets. In addition, the moving image data to be compressed in the moving image compression apparatus 10 may have transparency (α value) information for all frames, or at least some of the frames may have transparency (α value). You may have information. Further, in the moving picture compression apparatus 10 (see FIG. 1), compression (described later) using transparency (α value) information and a compression method other than compression using transparency (α value) information are used in combination. The video data may be compressed.
[動画圧縮装置の基本構成]
図1に、この実施の形態の動画圧縮装置10の機能ブロック図を、図2はこの実施の形態の動画圧縮装置の予測処理部を示す機能ブロック図をそれぞれ示す。この実施の形態の「動画データの圧縮装置」としての動画圧縮装置10は、エンコーダとしての機能を有し、透明度の情報を有する動画データを圧縮符号化する。具体的には、例えばこの動画圧縮装置は、別個の動画が複数重ね合わされ、かつ重ね合わされた際に透明度に応じてアルファブレンドして表示され、その部分から後側で表示される動画の一部が透過した状態でディスプレイに表示される、遊技機の動画の圧縮符号化に用いられる。ただし、遊技機以外に用いられる、複数重ね合わされて表示される、透明度の情報を有するいかなる動画の圧縮符号化に用いられてもよい。
[Basic configuration of video compression device]
FIG. 1 shows a functional block diagram of the moving picture compression apparatus 10 of this embodiment, and FIG. 2 shows a functional block diagram showing a prediction processing unit of the moving picture compression apparatus of this embodiment. The moving image compression apparatus 10 as the “moving image data compression apparatus” of this embodiment has a function as an encoder, and compresses and encodes moving image data having transparency information. Specifically, for example, in this video compression device, a plurality of separate videos are superimposed, and when they are superimposed, alpha blending is displayed according to the transparency, and a part of the video displayed on the rear side from that part is displayed. Is used for compression encoding of moving images of gaming machines, which are displayed on the display in a state where is transmitted. However, it may be used for compression encoding of any moving image having transparency information that is displayed in a superimposed manner and is used for other than gaming machines.
この動画圧縮装置10においては、動画データが所定の矩形領域の単位で、即ち所定数の画素からなるマトリックスの単位で処理される(詳しくは後述する)。 In this moving image compression apparatus 10, moving image data is processed in units of a predetermined rectangular area, that is, in units of a matrix composed of a predetermined number of pixels (details will be described later).
一方の画像と他方の画像とを重ね合わせたフレーム画像データにおいて、画像データを透明度に応じて圧縮する場合、一方の画像の透明度に応じて、一方の画像のフレーム画像データを圧縮しても、他方の画像のフレーム画像データを圧縮しても、両方の画像のフレーム画像データを圧縮してもよい。 In the frame image data in which one image and the other image are superimposed, when compressing the image data according to the transparency, even if the frame image data of one image is compressed according to the transparency of the one image, The frame image data of the other image may be compressed, or the frame image data of both images may be compressed.
この実施の形態では、一方の画像の透明度に応じて一方の画像のフレーム画像データを圧縮する装置の例を用いて説明する。 This embodiment will be described using an example of an apparatus that compresses frame image data of one image in accordance with the transparency of one image.
この実施の形態の動画圧縮装置10は、エンコーダとしての圧縮符号化を行うための構成として、予測処理部11、DCT部12、符号生成部13、フレームメモリ14を有する。また、動画圧縮装置10は、デコーダとしての圧縮データの復号処理を行うための構成として、逆量子化部15、逆DCT部16をも有する。
The moving picture compression apparatus 10 of this embodiment includes a
予測処理部11は、「動画データ」としてのフレームを複数用いてフレーム間予測を行うための処理を行う。具体的には、入力画像としての動画データから予測画像(過去の動画フレームに対して所定の予測処理を行って生成された動画フレーム)を生成して出力する。この予測画像は、入力画像を減算されて生成された予測誤差としてDCT部12に供給されると共に、逆DCT部16で生成されたDCTデータに加算されて参照画像を生成してフレームメモリ14に記憶される。
The
DCT部12は、各画像データのDCT(離散コサイン変換)を行う。具体的には、各画像データに対してブロックの単位で離散コサイン変換等の周波数変換を行うことで周波数成分に分解し、係数化されたDCTデータを生成する。この実施の形態のDCT部12は、予測処理部11におけるフレーム間予測処理の結果としての、入力画像と予測画像との差分により形成された予測誤差の周波数変換を行うことで、DCTデータを生成する。なお、この実施の形態のDCT部12は構成の一例であり、DCT(離散コサイン変換)に替えて、ウェーブレット変換やアダマール変換を利用することは勿論のこと、DPCM(Differential Pulse Code Modulation:差分パルス符号変調)を用いることも可能である。
The
符号生成部13は、所定の符号化方式により処理された画像データを量子化係数に基づいて量子化することで量子化データを生成して符号化する。なお、ここでの「所定の符号化方式」とは、直前の構成であるDCT部12における離散コサイン変換等の周波数変換に基づく変換符号化方式を指す。
The
なお、図1に示す通り、符号生成部13は、DCTデータを量子化係数等を用いて量子化し量子化データを生成する量子化部19と、ハフマン符号や算術符号等のエントロピー符号化を用いて量子化データをさらに圧縮して符号化データを生成する可変長符号化部20とを備えている。
As shown in FIG. 1, the
フレームメモリ14は、RAM、キャッシュ等の各種記憶媒体であって、各種の動画データを記憶する。ここでは、予測処理部11におけるフレーム間予測処理の結果生成された動画データが記憶される。また、逆DCT部16における逆DCT処理の結果生成された動画データも記憶される。
The
逆量子化部15は、既定の量子化係数を用い、入力された量子化データを逆量子化することで、DCTデータを復号する。この実施の形態において逆量子化部15に入力される量子化データは、量子化部19から出力されたもの(図1参照)である。逆DCT部16は、逆量子化部15から出力されたDCTデータに逆DCT処理を行う。逆量子化部から出力された動画データは、予測処理部11から出力された予測画像(後述)と合成されて過去の動画フレームとしての参照画像(後述)を形成し、フレームメモリ14に記憶される。
The
予測処理部11は、「動きベクトル検出手段」としての動きベクトル検出部17と、動き補償部18とを有する。
The
動きベクトル検出部17は、複数の動画フレームの間で動きベクトルを検出する。具体的には、動きベクトル検出部17は、特定のフレーム画像データと、特定のフレーム画像データの前方向、及び/又は、後方向に存在する他のフレーム画像データとの間で動きベクトルを検出する。この実施の形態においては、特定の時間、例えば現在のフレーム画像と、その一つ前のフレーム画像とをそれぞれ略矩形の複数のブロックに区分し、特定の時間のフレーム画像の基準位置となるブロックの画像情報(色情報や透明度情報)が、他のフレーム画像のどのブロックから移動したものかを探索し、それらのブロック同士の移動方向や移動量としての動きベクトルを検出する。
The motion
動き補償部18は、参照画像(過去の動画フレーム)から、動きのある画像を動きベクトル分移動させる動き補償の処理を行う。
The
図2は、予測処理部11の詳細を示す機能ブロック図である。同図に示す通り、予測処理部11の動きベクトル検出部17は、動き探索制御部21、動きベクトル探索部22、符号化コスト算出部23を備えている。また、動きベクトル探索部22は、二乗誤差演算部221、動きベクトル決定部222を備えている。
FIG. 2 is a functional block diagram illustrating details of the
動き探索制御部21は、動きベクトル探索部22や符号化コスト算出部23の処理を制御し、動きベクトル探索部22で探索された動きベクトルの中から最も適切なものを検出する。
The motion
動きベクトル探索部22は、動きベクトルの探索のための処理を行う。具体的には、符号化コスト算出部23の算出したコストを用いて、現在のフレーム画像の一つ前のフレーム画像(参照画像)の基準位置のブロックに表示された画像が、現在のフレーム画像(符号化対象画像)のどのブロックに移動したかを探索するための処理を行う。
The motion
二乗誤差演算部221は、動きベクトルを算出する際に二乗誤差を用いた演算を行うことで、現在のフレーム画像の一つ前のフレーム画像の基準位置のブロックと現在のフレーム画像のブロックとの間の誤差を演算する処理を行う。
The square
動きベクトル決定部222は、二乗誤差演算部221の演算結果に基づいて、符号化コスト算出部23で計算されるコストが小さくなるよう、現在のフレーム画像の一つ前のフレーム画像の基準位置から、現在のフレーム画像のブロックにおける移動位置までの位置と方向とに基づく動きベクトルを決定する。
The motion
符号化コスト算出部23は、現在のフレーム画像の一つ前のフレーム画像の基準位置の有する情報と、現在のフレーム画像のブロックの有する情報とに基づいて、それらのブロック同士の距離を決定するための情報としての符号化コストの値を演算する。 The encoding cost calculation unit 23 determines the distance between the blocks based on the information of the reference position of the previous frame image of the current frame image and the information of the blocks of the current frame image. The value of the encoding cost as the information for calculating is calculated.
[動きベクトルの算出]
以下、この実施の形態における動きベクトルの算出の原理について、図3の模式図を参酌して説明する。この実施の形態の動画圧縮装置10においては、この原理に基づいて動きベクトルの算出を行う。
[Calculation of motion vector]
Hereinafter, the principle of motion vector calculation in this embodiment will be described with reference to the schematic diagram of FIG. In the moving picture compression apparatus 10 of this embodiment, the motion vector is calculated based on this principle.
例えば、図3に示すように、参照画像である最新のフレーム画像の一つ前の過去のフレーム画像(以下「直前フレーム31」と称する)と、符号化対象画像である最新のフレーム画像(以下「最新フレーム32」と称する)とを所定の数の矩形ブロックのマトリックス(例えばm行×n列(ただしm>1,n>1))に区分して、それぞれのフレーム画像のブロックの近似の度合いを対比することで動きベクトルを算出する場合を考える。この場合、過去の直前フレーム31の特定のブロック例えばブロック311に最も画像情報が近似した現在のフレーム画像のブロックを選択し、双方のブロックの距離や方向に基づいて動きベクトルが決定される。
For example, as shown in FIG. 3, a previous frame image immediately before the latest frame image that is the reference image (hereinafter referred to as “immediately preceding
このように動きベクトルを算出する場合、一般に、下記式(1)に示すような二乗誤差を用いた式で算出されていた(なお、この式は色情報がRGB色空間の「R」「G」「B」である場合を示す)。
ただし、
SSD:Sum of Squared Difference(二乗誤差)
Σ:ブロック内の全ての画素の値の総和
Rdst:符号化対象フレームの特定の画素の色情報としてのR情報
Rsrc:参照フレームの特定の画素の色情報としてのR情報
Gdst:符号化対象フレームの特定の画素の色情報としてのG情報
Gsrc:参照フレームの特定の画素の色情報としてのG情報
Bdst:符号化対象フレームの特定の画素の色情報としてのB情報
Bsrc:参照フレームの特定の画素の色情報としてのB情報
^:乗算記号。たとえば「○○^2」は「○○の2乗」を示す。
When the motion vector is calculated in this way, it is generally calculated by an equation using a square error as shown in the following equation (1) (note that this equation has color information “R” “G” in the RGB color space. ”And“ B ”).
However,
SSD: Sum of Squared Difference
Σ: Sum of values of all pixels in the block Rdst: R information as color information of specific pixels of the encoding target frame Rsrc: R information as color information of specific pixels of the reference frame Gdst: Encoding target frame G information as color information of a specific pixel of the G information Gsrc: G information as color information of a specific pixel of the reference frame Bdst: B information as color information of a specific pixel of the encoding target frame Bsrc: Specific information of the reference frame B information ^ as pixel color information: multiplication symbol. For example, “XX ^ 2” indicates “square of XX”.
また、画素情報に透明度情報が含まれている場合には、画素毎の透明度情報を二乗誤差を算出する一要素として単純に利用することが考えられ、その場合には下記色(2)に示すような式となる。
ただし、
SSD:Sum of Squared Difference(二乗誤差)
Σ:ブロック内の全ての画素の値の総和
Adst:符号化対象フレームの特定の画素の透明度情報(α値の情報)
Asrc:参照フレームの特定の画素の透明度情報(α値の情報)
Rdst:符号化対象フレームの特定の画素の色情報としてのR情報
Rsrc:参照フレームの特定の画素の色情報としてのR情報
Gdst:符号化対象フレームの特定の画素の色情報としてのG情報
Gsrc:参照フレームの特定の画素の色情報としてのG情報
Bdst:符号化対象フレームの特定の画素の色情報としてのB情報
Bsrc:参照フレームの特定の画素の色情報としてのB情報
^:乗算記号。たとえば「○○^2」は「○○の2乗」を示す。
In addition, when the pixel information includes transparency information, it is conceivable to simply use the transparency information for each pixel as one element for calculating the square error. In this case, the following color (2) is shown. It becomes an expression like this.
However,
SSD: Sum of Squared Difference
Σ: Sum of values of all pixels in the block Adst: Transparency information of specific pixels of the encoding target frame (α value information)
Asrc: Transparency information (alpha value information) of a specific pixel in the reference frame
Rdst: R information as color information of specific pixels of the encoding target frame Rsrc: R information as color information of specific pixels of the reference frame Gdst: G information Gsrc as color information of specific pixels of the encoding target frame : G information as color information of specific pixel of reference frame Bdst: B information as color information of specific pixel of encoding target frame Bsrc: B information as color information of specific pixel of reference frame ^: multiplication symbol . For example, “XX ^ 2” indicates “square of XX”.
また、符号化対象フレーム中の最も近似したブロックを探索する際は、上記式(2)で算出したSSDの値に、動きベクトルの大きさに関する値を加算した、コストの値が用いられる場合が多い。このコストの値(以下「コスト値」と称する)は、例えば下記式(3)で求められる。そして、コスト値が最小となるブロックが動きベクトルの始点と終点として検出される。
コスト値=SSD+λ動きベクトルの消費ビット・・・(3)
ただし
λ:ビット数の単位をSSDの単位に揃えるための所定の係数
上記式(2)においても画素の透明度情報を二乗誤差を算出する際に利用することになるが、透明度情報をより一層活用するため、この実施の形態においては、動きベクトル探索部22の動きベクトル決定部222は、下記の式(4)によってブロック同士の近似の値を求める。
ただし、
SSD’:Sum of Squared Difference(二乗誤差)
Σ:ブロック内の全ての画素の値の総和
Adst:符号化対象フレームの特定の画素の透明度情報(α値の情報)
Asrc:参照フレームの特定の画素の透明度情報(α値の情報、ただし0≦Asrc≦255)
Rdst:符号化対象フレームの特定の画素の色情報としてのR情報
Rsrc:参照フレームの特定の画素の色情報としてのR情報
Gdst:符号化対象フレームの特定の画素の色情報としてのG情報
Gsrc:参照フレームの特定の画素の色情報としてのG情報
Bdst:符号化対象フレームの特定の画素の色情報としてのB情報
Bsrc:参照フレームの特定の画素の色情報としてのB情報
^:乗算記号。たとえば「○○^2」は「○○の2乗」を示す。
When searching for the most approximate block in the encoding target frame, a cost value obtained by adding a value related to the magnitude of the motion vector to the SSD value calculated by the above equation (2) may be used. Many. The cost value (hereinafter referred to as “cost value”) is obtained by, for example, the following equation (3). Then, the block having the minimum cost value is detected as the start point and end point of the motion vector.
Cost value = SSD + λ consumed motion vector bit (3)
However, λ: a predetermined coefficient for aligning the unit of the number of bits to the unit of SSD In the above formula (2), the transparency information of the pixel is used when calculating the square error, but the transparency information is further utilized. Therefore, in this embodiment, the motion
However,
SSD ': Sum of Squared Difference
Σ: Sum of values of all pixels in the block Adst: Transparency information of specific pixels of the encoding target frame (α value information)
Asrc: Transparency information of a specific pixel of the reference frame (alpha value information, where 0 ≦ Asrc ≦ 255)
Rdst: R information as color information of specific pixels of the encoding target frame Rsrc: R information as color information of specific pixels of the reference frame Gdst: G information Gsrc as color information of specific pixels of the encoding target frame : G information as color information of specific pixel of reference frame Bdst: B information as color information of specific pixel of encoding target frame Bsrc: B information as color information of specific pixel of reference frame ^: multiplication symbol . For example, “XX ^ 2” indicates “square of XX”.
そして、符号化コスト算出部23は、上記式(3)の「SSD」に替えて、上記式(4)で算出した「SSD’」を用い、下記式(5)のコスト値が最小となるブロックを動きベクトルの始点と終点として検出する。
コスト値=SSD’+λ動きベクトルの消費ビット・・・(5)
ただし
λ:ビット数の単位をSSD’の単位に揃えるための所定の係数
上記式(4)においては、右辺の「R」「G」「B」の各項に「Asrc/255(ただし0≦Asrc≦255)」を乗算している点が上記式(2)と異なる。
Then, the coding cost calculation unit 23 uses “SSD ′” calculated by the above equation (4) instead of “SSD” in the above equation (3), and the cost value of the following equation (5) is minimized. Blocks are detected as the start and end points of motion vectors.
Cost value = SSD ′ + λ consumption vector consumption bit (5)
However, λ: a predetermined coefficient for aligning the unit of the number of bits with the unit of SSD ′ In the above equation (4), “Arc / 255 (where 0 ≦ (Asrc ≦ 255) ”is different from the above formula (2).
上記式(4)は、画素ごとに0≦Asrc≦255(0:完全に透明な状態、255:完全に不透明な状態)で透明度が設定されている場合が該当する。例えば、特定の画素が完全に透明(つまりAsrc=0)であれば、「R」「G」「B」の項の値は全て「0」になる。また例えば、特定の画素が半透明(つまり0<Asrc<255)であれば、「R」「G」「B」の項の値は、完全不透明な場合(つまりAsrc=255の場合)の値よりも小さくなる。かつ、特定の画素が半透明の場合、透明度が高いほど「R」「G」「B」の項の値は小さくなる。つまり、動きベクトルを決定する際に、対比する画素同士やブロック同士の色情報の誤差よりも、透明度の誤差の方が、動きベクトルの決定において重要度が高くなる。そして、色情報の誤差を無視したり、色情報の誤差が値全体の中で占める比率を低くしたりする方が、符号化する際の符号量が小さくなる場合が多い。 The above equation (4) corresponds to the case where the transparency is set for each pixel in a range of 0 ≦ Asrc ≦ 255 (0: completely transparent state, 255: completely opaque state). For example, if a specific pixel is completely transparent (that is, Asrc = 0), the values of the terms “R”, “G”, and “B” are all “0”. Also, for example, if a specific pixel is translucent (that is, 0 <Arc <255), the values of the terms “R”, “G”, and “B” are the values when completely opaque (that is, when Asrc = 255). Smaller than. And when a specific pixel is translucent, the value of the term of "R" "G" "B" becomes small, so that transparency is high. That is, when determining a motion vector, an error in transparency is more important in determining a motion vector than an error in color information between contrasting pixels or blocks. In many cases, the amount of code at the time of encoding becomes smaller when the error of the color information is ignored or the ratio of the error of the color information to the entire value is reduced.
ここで、画像の透明度が高いほど、色情報は、画像上の位置を特定する上での重要度が低くなる。しかし、従来の、上記(2)の式における演算においては、ブロックに含まれる画素の画像情報が完全に透明である場合や透明度が高い場合であっても、常に「R」「G」「B」の値が演算され、式(2)によって得られる値全体の中で「R」「G」「B」の値が高い比率を占めることになる。この場合、重要度が低い色情報を無視したり値全体の中で占める比率を低くすることはできないので、符号化する際の符号量を小さくすることが抑止されてしまう。 Here, the higher the transparency of the image, the lower the importance of the color information in specifying the position on the image. However, in the conventional calculation in the above equation (2), even when the image information of the pixels included in the block is completely transparent or highly transparent, “R”, “G”, “B” The value of “R”, “G” and “B” occupy a high ratio in the entire value obtained by the equation (2). In this case, since color information with low importance cannot be ignored or the ratio of the entire value in the entire value cannot be reduced, reducing the amount of code at the time of encoding is prevented.
一方、上記式(4)の演算においては、透明度が高いほど「R」「G」「B」の項の値が「SSD’」の値全体に占める比率は小さくなる。つまり、式(4)の演算によって得られる値は、画像の透明度が高いほど、位置情報を特定する際に、色情報よりも透明度の重要度の高さが反映されたものとなり、R、G、Bで表現される画質による寄与度が補正される。そして、式(4)の演算結果は、色情報の誤差を無視したり、色情報の誤差が値全体の中で占める比率を低くしたりすることができるので、符号化する際の符号量が小さくなって、圧縮率を高くすることが可能になる。 On the other hand, in the calculation of the above formula (4), the higher the transparency, the smaller the ratio of the values of the terms “R”, “G”, and “B” to the entire value of “SSD ′”. That is, the value obtained by the calculation of Expression (4) reflects the importance of transparency more than color information when specifying position information as the transparency of the image is higher. , B contributes to the degree of contribution due to the image quality. Since the calculation result of Expression (4) can ignore the error of the color information or reduce the ratio of the error of the color information in the entire value, the code amount when encoding is small. It becomes small and it becomes possible to make a compression rate high.
[色情報と透明度の相関関係]
図4は、この実施の形態の動画圧縮装置10における色情報と透明度の相関関係の事例を模式的に示す図である。同図は、横軸が透明度(α値、ただし0≦α値≦255)、縦軸が色情報の寄与度又は画質の寄与度(RGBの寄与度又はYUVの寄与度、ただし0%≦寄与度≦100%)を示している。
[Correlation between color information and transparency]
FIG. 4 is a diagram schematically showing an example of the correlation between color information and transparency in the moving picture compression apparatus 10 of this embodiment. In this figure, the horizontal axis is transparency (α value, where 0 ≦ α value ≦ 255), and the vertical axis is color information contribution or image quality contribution (RGB contribution or YUV contribution, where 0% ≦ contribution Degree ≦ 100%).
同図に示す通り、この実施の形態の動画圧縮装置10の二乗誤差演算部221においては、上記式(3)に基づいて動きベクトルが検出されることにより、動きベクトルを探索する際の色情報と透明度の相関関係は、図4に示す第一の関数101のように、α値が0/255のとき(つまり透明度が100%の全透明の場合)は色情報の寄与度は0、α値が127/255(つまり透明度が50%のとき)は色情報の寄与度は50%、α値が255/255(つまり透明度0%の完全不透明のとき)は色情報の寄与度が100%になる。つまりα値と色情報とは比例関係にある。
As shown in the figure, in the square
ただし、この実施の形態において、動画圧縮装置10の二乗誤差演算部221における演算は、完全な比例関係でなくてもよい。例えば、図4に示す第二の関数102、第三の関数103、第八の関数108のように、透明度と色情報とが、α値が0/255のときの色情報の寄与度は0、α値が255/255の色情報の寄与度が100%となり、その途中(0/255<α値<255/255,0%<色情報<100%のとき)は概ねの相関関係を持った状態で透明度と色情報とが推移するように設定されていてもよく、第四の関数104のように、α値が0/255以上127/255未満のときは色情報の寄与度が0%で、α値が127/255以上255/255以下のときは色情報の寄与度が100%になるように設定されていてもよい。
However, in this embodiment, the calculation in the square
また、この実施の形態において、動画圧縮装置10の二乗誤差演算部221における演算は、透明度や色情報の最小値が0/255や0%以外の値でもよいし、最大値が255/255や100%以外の値でもよい。例えば、図4に示す第五の関数105のように、透明度と色情報とが概ねの相関関係を持った状態で、色情報の最大値が100%未満の値となるように設定されていてもよい。また、第六の関数106のように、透明度と色情報とが概ねの相関関係を持った状態で、色情報の最小値が0%より上の値となるように設定されていてもよい。また、第七の関数107のように、透明度と色情報とが概ねの相関関係を持った状態で、色情報の最小値が0%より上の値となり、最大値が100未満の値となるように設定されていてもよい。さらに、第一の関数101乃至第七の関数107以外のいかなる関数にて、これらの関数と同様に設定されていてもよい。すなわち、二乗誤差演算で利用するα値の範囲(本実施の形態では0〜255)において、α値と色情報の寄与度との関係が右肩上がりの傾向を有していれば、α値を考慮した動きベクトル検出となり、符号量を低減することができる。なお、“右肩上がり”とは関数101、103、105、106、107のように単調な上昇のものや、関数102、108のように増減を伴いつつ上昇するものや、関数104のように所定のα値を境に急激に色情報寄与度が変化するものも含む。
In this embodiment, the calculation in the square
[処理手順]
図5は、この実施の形態の動画圧縮装置10の処理手順の一例を示すフローチャートである。以下、図5及び図1乃至図4に基づいて、「動画データの圧縮方法」としての、この実施の形態の処理手順の一例を説明する。なお、図5の処理手順では、いわゆる「ダイヤモンドサーチ」に基づいて動きベクトルを探索する処理を記載しているが、これに限らず、たとえば、処理対象のフレームの全てのブロックを総当たり的に探索する「フルサーチ」等、他のあらゆる処理方法によって動きベクトルの探索が行われてもよい。
[Processing procedure]
FIG. 5 is a flowchart illustrating an example of a processing procedure of the moving image compression apparatus 10 according to this embodiment. Hereinafter, an example of the processing procedure of this embodiment as a “moving image data compression method” will be described with reference to FIG. 5 and FIGS. 1 to 4. Note that the processing procedure of FIG. 5 describes processing for searching for a motion vector based on so-called “diamond search”. However, the processing procedure is not limited to this. For example, all blocks of the processing target frame are brute-forced. The motion vector search may be performed by any other processing method such as “full search” for searching.
動きベクトル検出部17の動き探索制御部21は、動きベクトル探索部22を制御して動きベクトルの探索を開始する。動きベクトル探索部22の動きベクトル決定部222は、参照画像としての直前フレーム31(以下「直前フレーム」と称する。)を所定の数の矩形ブロックのマトリックス(例えばm行×n列(ただしm>1,n>1))に区分し、所定の位置のブロック(例えば一番右下のブロック311)を探索して基準位置とする。
The motion
次に、動きベクトル決定部222は、符号化対象画像としての最新フレーム32を直前フレーム31と同じ矩形ブロックのマトリックス(例えばm行×n列のマトリックス)に区分し、最新フレーム32の直前フレーム31と同じ位置(例えば一番右下のブロック321)を探索する。そして、動きベクトル決定部222は、直前フレーム31と最新フレーム32の探索したブロック311,321をベクトルの始点と終点とする、初期動きベクトルとして決定する。
Next, the motion
そして、動きベクトル決定部222は、初期動きベクトルの始点と終点である直前フレーム31のブロック311と最新フレーム32のブロック321とから画像情報(それぞれのブロックを構成する複数の画素のそれぞれの有する、色情報(R,G,Bの値)と透明度の情報(Aの値))を抽出する。抽出された情報は二乗誤差演算部221に送られ、二乗誤差演算部221は取得した情報を上記式(3)に代入し演算を行う。動きベクトル決定部222と二乗誤差演算部221におけるこの処理と演算は、初期動きベクトルの始点と終点である直前フレーム31のブロック311と最新フレーム32のブロック321を構成する画素それぞれについて繰り返し行われ、その総和が式(3)の「SSD’」の値として算出される。
Then, the motion
そして、動きベクトル探索部22は、算出した「SSD’」の値を符号化コスト算出部23に送る。動きベクトル探索部22は、取得した値を上記式(4)に代入し、「コスト」の値を算出する(ステップS1、動きベクトル検出手順)。
Then, the motion
動きベクトル探索部22は、算出した「コスト」の値を動きベクトル探索部22に送る。動きベクトル探索部22は、取得した「コスト」の値を一時記憶する。
The motion
次に、動きベクトル探索部22は、動きベクトルを上下左右に移動したコストを計算する(ステップS2、動きベクトル検出手順)。具体的には、動きベクトル決定部222は、(直前フレーム31の基準位置のブロック311は固定したままで)最新フレーム32において決定されているブロック321の一つ上隣のブロック322、一つ下隣のブロック(図5においては存在せず)、一つ左隣のブロック323、一つ右隣のブロック(図5においては存在せず)をそれぞれ探索し、直前フレーム31の基準位置のブロック311とそれら探索したブロック322,323とを両端とした動きベクトルを決定する。そして、二乗誤差演算部221は、決定された動きベクトルの両端のブロック311,322,323についてそれぞれ式(3)を用いた「SSD’」の値を算出する。さらに、符号化コスト算出部23は、それらの「SSD’」の値を式(4)に代入して「コスト」の値を算出する。動きベクトル決定部222は、算出されたそれぞれの「コスト」の値を記憶する。
Next, the motion
そして、動きベクトル決定部222は、最新フレーム32のブロック321を上下左右に移動させた後のブロック322,323によって決定される「コスト」の値をそれぞれ対比し、その中で「コスト」の値が最小のものを検出し、その「コスト」の値が最小の方向を、最新フレーム32のブロック321を移動させる方向として採用する(ステップS3、動きベクトル検出手順)。例えば、移動させた後の最新フレーム32のブロック322,323の中で、当初のブロック321よりも一つ上隣のブロック322の「コスト」が最小である場合、動きベクトル決定部222は、一つ上隣のブロック322の方向、即ち上方向を、最新フレーム32におけるブロック321の移動方向として採用する。
Then, the motion
そして、動きベクトル決定部222は、初期動きベクトルの「コスト」と、ステップS3で移動方向の採用に用いられた、移動させた後のブロック322における最小の「コスト」とを対比する。移動させた後の最小の「コスト」が初期動きベクトルの「コスト」よりも小さい場合(ステップS4の“NO”)、その移動方向のブロック322を最新フレーム32の新たな基準となるブロックに設定し、そのブロック322の「コスト」と、そのブロック322の上下左右のブロック(上隣のブロック324、左隣のブロック325、下隣のブロック321)との動きベクトルの「コスト」を算出し(ステップS2,S3)、コストの比較を行うことを、ブロック321の「コスト」より移動させた後のブロック322の「コスト」の方が小さくなる間は繰り返し行う(ステップS4の“NO”
、動きベクトル検出手順)。一方、初期動きベクトルの「コスト」の方が移動させた後のブロック322最小の「コスト」よりも小さい場合(ステップS4の“YES”)は、動きベクトル決定部222はステップS3にて「コスト」を採用したブロック322への移動は行わず、移動させる前のブロック321を動きベクトルの終点(又は始点)として検出し、処理は終了する。
Then, the motion
Motion vector detection procedure). On the other hand, if the “cost” of the initial motion vector is smaller than the minimum “cost” of the moved block 322 (“YES” in step S4), the motion
動きベクトル検出部17は、直前フレーム31の各フレームを順番に基準位置として設定しながらステップS1〜S4の処理を行っていく。この処理が完了すると、予測処理部11は、動き補償部18における動き補償の処理ののち、生成された予測画像を送信する。動画圧縮装置10は、この予測画像と入力画像とによって予測誤差を生成してDCT部12でDCT処理を行う。DCT部12で生成されたDCTデータは符号生成部13に供給され、符号生成部13の量子化部19における処理によって量子化データが生成され、可変長符号化部20において符号化データが生成されて、データの圧縮符号化が行われる(圧縮手順)。
The motion
以上、この実施の形態においては、特定の動画データ、及び/又は、他の動画データの有する透明度の情報を用いて、特定の動画データと他の動画データとの間の動きベクトルを検出することにより、透明度の情報が設定された動画データにおいて、設定された透明度の情報に依存した形で動きベクトルを検出し、動画データを圧縮することができる。そして、動きベクトルを透明度の情報に依存して検出できるので、透明な部分を有する動画データの動きベクトルの検出と符号化における、透明な部分の検出に際して重要度の低い色情報が、動きベクトルの検出と符号化に反映する度合いを低減させることが可能になる。これにより、透明度の情報を含む動画の圧縮率を向上させることができる。 As described above, in this embodiment, the motion vector between the specific moving image data and the other moving image data is detected using the specific moving image data and / or the transparency information of the other moving image data. Thus, in the moving image data in which the transparency information is set, the motion vector can be detected in a form depending on the set transparency information, and the moving image data can be compressed. Since the motion vector can be detected depending on the transparency information, color information of low importance in detecting the transparent portion in the detection and encoding of the motion vector of the moving image data having the transparent portion is the motion vector. The degree of reflection in detection and encoding can be reduced. Thereby, the compression rate of the moving image containing transparency information can be improved.
この実施の形態においては、透明度の高さの値に依存して、特定の動画データの位置情報と他の動画データの位置情報とによって形成されるベクトルの大きさを補正することで動きベクトルを検出することにより、透明度の高さの値を動きベクトルの検出と符号化に反映させて、透明度の情報を含む動画の圧縮率を向上させることができる。 In this embodiment, the motion vector is corrected by correcting the magnitude of the vector formed by the position information of the specific moving image data and the position information of the other moving image data, depending on the value of the transparency level. By detecting, the value of the transparency level is reflected in the detection and encoding of the motion vector, and the compression rate of the moving image including the transparency information can be improved.
この実施の形態においては、動画データの透明度の情報の規定する透明度が高いほど、動画データの色情報が動きベクトルの大きさに与える影響が小さくなるようにすることにより、動画データの透明度が高くなって動きベクトルの検出に際して色情報の重要度が低くなるほど、動きベクトルの検出と符号化に色情報が反映される度合いを低下させることができる。これにより、透明度の情報を含む動画の圧縮において、重要度の低い情報を削減しつつ、圧縮率を向上させることができる。 In this embodiment, the higher the transparency defined by the transparency information of the moving image data, the less the influence of the color information of the moving image data on the size of the motion vector, thereby increasing the transparency of the moving image data. Thus, the lower the importance of the color information when detecting the motion vector, the lower the degree to which the color information is reflected in the detection and encoding of the motion vector. Thereby, in the compression of a moving image including transparency information, it is possible to improve the compression rate while reducing less important information.
この実施の形態においては、動画データの色情報に基づいて得られる値を透明度の情報に基づいて補正することで、動きベクトルを検出することができるので、透明度の情報を含む動画の圧縮において、透明度の大きさを動きベクトルの検出と符号化における具体的な演算処理に反映させることができる。これにより、透明度の大きさに基づいて重要度の低いデータを削減しつつ、圧縮率を向上させることを、具体的な演算処理において実現することができる。 In this embodiment, since the motion vector can be detected by correcting the value obtained based on the color information of the moving image data based on the transparency information, in compression of the moving image including the transparency information, The degree of transparency can be reflected in a specific calculation process in motion vector detection and encoding. Accordingly, it is possible to realize in a specific calculation process that the compression rate is improved while reducing the data with low importance based on the degree of transparency.
この実施の形態においては、色情報に透明度の情報を乗算した値の、絶対値誤差又は二乗誤差によって動きベクトルを検出することにより、透明度の情報を反映させた値に基づいて精度の高い演算処理を行い、適切な動きベクトルを検出することができる。 In this embodiment, by detecting a motion vector by an absolute value error or a square error of a value obtained by multiplying color information by transparency information, high-precision arithmetic processing based on a value reflecting transparency information And an appropriate motion vector can be detected.
この実施の形態においては、透明度の情報を用いて動きベクトルを検出することにより、透明度の情報を反映させた値に基づいて精度の高い演算処理を行い、適切な動きベクトルを検出することができる。 In this embodiment, by detecting the motion vector using the transparency information, it is possible to perform a highly accurate calculation process based on the value reflecting the transparency information and detect an appropriate motion vector. .
なお、この実施の形態においては、最新フレームを符号化対象画像、直前フレームを参照画像としたが、これに限定されず、過去の特定のフレームを符号化対象画像、この特定のフレームの一つ後(時系列的に後)のフレームを参照画像として処理を行ってもよい。また、符号化対象フレームの一つ前や一つ後のフレームのみならず、複数枚前や複数枚後(例えば特定のフレームの二つ前のフレームや二つ後のフレーム)を参照画像として処理を行ってもよいし、所定の時間のフレームの前のフレームと後のフレームとを参照画像として処理を行ってもよい。 In this embodiment, the latest frame is the encoding target image and the immediately preceding frame is the reference image. However, the present invention is not limited to this, and the past specific frame is the encoding target image, one of the specific frames. Processing may be performed using a later (time-series later) frame as a reference image. Also, not only the frame before or after the encoding target frame, but also multiple frames before or after multiple frames (for example, two frames before or two frames after a specific frame) are processed as reference images. Alternatively, processing may be performed using a frame before and after a frame of a predetermined time as a reference image.
上記の実施の形態は本発明の例示であり、本発明が上記の実施の形態のみに限定されることを意味するものではないことは、いうまでもない。 The above embodiment is an exemplification of the present invention, and it is needless to say that the present invention is not limited to the above embodiment.
10・・・動画圧縮装置(動画データの圧縮装置)
11・・・符号生成部(圧縮手段)
17・・・動きベクトル検出部(動きベクトル検出手段)
10... Video compression device (video data compression device)
11: Code generator (compression means)
17... Motion vector detection unit (motion vector detection means)
Claims (7)
特定のフレーム画像と、該特定のフレーム画像の前方向、及び/又は、後方向に存在する他のフレーム画像データとの間で動きベクトルを検出する動きベクトル検出手段と、
検出された前記動きベクトルを用いて前記フレーム画像データを圧縮する圧縮手段とを備え、
該動きベクトル検出手段は、前記特定のフレーム画像データ、及び/又は、前記他のフレーム画像データの有する前記透明度の情報を用いて、前記特定のフレーム画像データと前記他のフレーム画像データとの間の前記動きベクトルを検出することを特徴とする動画データの圧縮装置。 A video data compression device that compresses video data configured using frame image data in which transparency information is set at least in part,
Motion vector detection means for detecting a motion vector between a specific frame image and other frame image data existing in the forward and / or backward direction of the specific frame image;
Compression means for compressing the frame image data using the detected motion vector,
The motion vector detection means uses the transparency information of the specific frame image data and / or the other frame image data to provide a gap between the specific frame image data and the other frame image data. A motion data compressing device, wherein the motion vector is detected.
特定のフレーム画像データと、該特定のフレーム画像データの前方向、及び/又は、後方向に存在する他のフレーム画像データとの間で動きベクトルが検出される動きベクトル検出手順と、
検出された前記動きベクトルを用いて前記フレーム画像データが圧縮される圧縮手順とを備え、
該動きベクトル検出手順においては、前記特定のフレーム画像データ、及び/又は、前記他のフレーム画像データの有する前記透明度の情報を用いて、前記特定のフレーム画像データと前記他のフレーム画像データとの間の前記動きベクトルが検出されることを特徴とする動画データの圧縮方法。
A method for compressing moving image data for compressing moving image data configured using frame image data in which transparency information is set at least in part,
A motion vector detection procedure in which a motion vector is detected between specific frame image data and other frame image data existing in the forward and / or backward direction of the specific frame image data;
A compression procedure in which the frame image data is compressed using the detected motion vector;
In the motion vector detection procedure, using the transparency information of the specific frame image data and / or the other frame image data, the specific frame image data and the other frame image data are A method for compressing moving image data, wherein the motion vector is detected in between.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006670A JP6738091B2 (en) | 2017-01-18 | 2017-01-18 | Video data compression device and video data compression method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017006670A JP6738091B2 (en) | 2017-01-18 | 2017-01-18 | Video data compression device and video data compression method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018117239A true JP2018117239A (en) | 2018-07-26 |
JP6738091B2 JP6738091B2 (en) | 2020-08-12 |
Family
ID=62985728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017006670A Active JP6738091B2 (en) | 2017-01-18 | 2017-01-18 | Video data compression device and video data compression method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6738091B2 (en) |
-
2017
- 2017-01-18 JP JP2017006670A patent/JP6738091B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6738091B2 (en) | 2020-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11546627B2 (en) | Moving picture decoding method and moving picture encoding method | |
CN104539963B (en) | The method performed by video decoder | |
JP5302336B2 (en) | Method and system for compressing blocks of pixels | |
US10250907B2 (en) | Intra-frame pixel prediction method, encoding method and decoding method, and device thereof | |
CN118055253A (en) | Optical flow estimation for motion compensated prediction in video coding | |
KR20130062109A (en) | Method and apparatus for encoding and decoding image | |
JP2013505615A (en) | Video weighted motion compensation | |
TWI506965B (en) | A coding apparatus, a decoding apparatus, a coding / decoding system, a coding method, and a decoding method | |
JP4241588B2 (en) | Moving picture encoding apparatus and moving picture decoding apparatus | |
JP6738091B2 (en) | Video data compression device and video data compression method | |
CN112673630B (en) | Bit stream decoder | |
JP5281597B2 (en) | Motion vector prediction method, motion vector prediction apparatus, and motion vector prediction program | |
JP2017050744A (en) | Image encoding apparatus, image encoding method and program | |
JP6728870B2 (en) | Image compression apparatus, image compression method, and image compression program | |
JP4243205B2 (en) | Moving picture coding apparatus, method and program thereof | |
US7580458B2 (en) | Method and apparatus for video coding | |
US11991375B2 (en) | Moving image encoding device, moving image compression device, moving image encoding method, and program | |
JP2012120108A (en) | Interpolation image generating apparatus and program, and moving image decoding device and program | |
KR20130029026A (en) | Method for coding and reconstructing a pixel block and corresponding devices | |
JP2005318106A (en) | Moving image encoding device and program | |
JP2014123865A (en) | Image processing apparatus and imaging apparatus | |
JP2010103864A5 (en) | ||
JP2019092075A (en) | Picture encoder and control method and program thereof | |
US20140376628A1 (en) | Multi-view image encoding device and method, and multi-view image decoding device and method | |
JP2015170932A (en) | Image compression apparatus and image compression method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200424 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200707 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6738091 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |