[go: up one dir, main page]

KR20100044333A - Video encoding apparatus, and apparatus and method of 2 dimensional ordering transform for image signal, and recording medium therefor - Google Patents

Video encoding apparatus, and apparatus and method of 2 dimensional ordering transform for image signal, and recording medium therefor Download PDF

Info

Publication number
KR20100044333A
KR20100044333A KR1020080103425A KR20080103425A KR20100044333A KR 20100044333 A KR20100044333 A KR 20100044333A KR 1020080103425 A KR1020080103425 A KR 1020080103425A KR 20080103425 A KR20080103425 A KR 20080103425A KR 20100044333 A KR20100044333 A KR 20100044333A
Authority
KR
South Korea
Prior art keywords
pixels
order
alignment
image signal
horizontally
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020080103425A
Other languages
Korean (ko)
Other versions
KR101512643B1 (en
Inventor
김하윤
최윤식
김용구
최영호
김성제
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020080103425A priority Critical patent/KR101512643B1/en
Priority to PCT/KR2009/005923 priority patent/WO2010047492A2/en
Publication of KR20100044333A publication Critical patent/KR20100044333A/en
Application granted granted Critical
Publication of KR101512643B1 publication Critical patent/KR101512643B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체에 관한 것으로, 본 발명에 따른 영상 신호의 2차원 정렬 변환 장치는, 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬부; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬부; 및 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성부를 포함하여 구성되어, 임의의 영상 신호를 크기 순으로 2차원 정렬된 영상 신호로 재배치할 수 있으며, 이 정렬된 영상 신호는 기존 영상이 가지고 있던 불연속 지점을 효율적으로 제거하기 때문에 DCT 등 블록 기반의 변환 기법의 에너지 집중 효과를 높여 부호화 효율을 극대화할 수 있다.The present invention relates to a video encoding apparatus and a device and method for two-dimensional alignment conversion of an image signal, and a recording medium therefor. The apparatus for two-dimensional alignment conversion of an image signal according to the present invention is provided with respect to pixels of an image block. A horizontal alignment unit for horizontal alignment in the order of size in the horizontal direction; A vertical alignment unit for vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And an index map generator for generating an index map of original positions of the horizontally and vertically aligned pixels, and may rearrange an arbitrary image signal into two-dimensionally aligned image signals in size order. Since the video signal effectively removes the discontinuities of the existing video, the coding efficiency can be maximized by increasing the energy concentration effect of block-based transform techniques such as DCT.

Description

동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체{Video encoding apparatus, and Apparatus and Method of 2 dimensional ordering transform for image signal, and Recording Medium therefor}Apparatus and method for converting video signal and two-dimensional alignment conversion of image signal therefor, and recording medium therefor {Video encoding apparatus, and Apparatus and Method of 2 dimensional ordering transform for image signal, and Recording Medium therefor}

본 발명은 비디오 데이터의 압축 기술 분야에서 저장매체 및 통신매체를 효율적으로 사용하기 위하여 영상 데이터를 효율적으로 압축하기 위한 기술에 관한 것으로서, 특히 종래의 DCT 변환과 같은 블록 단위 변환 기법의 전처리 기술로 활용되어, 2차원 영상 신호에 대한 상관성을 최대한 유지하면서 압축 효율을 증대시키기 위하여 영상 신호에 대해 2차원 정렬 변환을 수행하는, 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technique for efficiently compressing image data in order to efficiently use a storage medium and a communication medium in the field of video data compression technology. Particularly, the present invention is used as a preprocessing technique of a block unit transformation technique such as a conventional DCT transformation. A video encoding apparatus and a 2D alignment conversion apparatus and method thereof, which perform 2D alignment transformation on an image signal in order to increase compression efficiency while maintaining correlation with the 2D image signal, and the same It relates to a recording medium for.

일반적으로, 영상 데이터의 압축 기술로는 JPEG, JPEG2000 및 MPEG-2, MPEG-4, H.26L 등이 대표적이며, 이 기술의 대부분은 DCT 변환, Wavelet 변환, Burrows-wheeler 변환 및 이러한 기법의 변종 변환 등을 이용한 변환 기법(이하, 종래의 변환 기법이라 칭함) 기반의 영상 압축 기술이다.Generally, JPEG, JPEG2000, MPEG-2, MPEG-4, and H.26L are typical compression techniques of image data, and most of these techniques are DCT transform, Wavelet transform, Burrows-wheeler transform, and variants of these techniques. An image compression technique based on a transformation technique (hereinafter, referred to as a conventional transformation technique) using a transformation or the like.

종래의 변환 기법의 변환 효율은 제한된 양의 변환 계수로 얼마나 원래의 신호를 잘 표현할 수 있는 가에 있다. 따라서 가능한 적은 양의 변환 계수로 원래의 신호를 잘 표현할수록 변환 기법의 변환 효율이 높아진다. The conversion efficiency of the conventional conversion technique lies in how well the original signal can be represented by a limited amount of conversion coefficients. Therefore, the better the original signal is represented with the smallest possible transform coefficient, the higher the conversion efficiency of the conversion scheme.

DCT나 Wavelet을 기반으로 한 종래의 변환 기법은 주어지는 입력 신호가 잡음으로 인해 평탄하지 않거나, 화소 사이에 급격한 값의 변화로 인한 점이나 경계(Edges) 같은 불연속 지점이 존재하는 경우, 원래의 신호를 표현하기 위해 많은 양의 변환 계수가 필요하다. Conventional conversion schemes based on DCT or Wavelet are designed to provide the original signal when the input signal is not smooth due to noise, or when there are discontinuities such as points or edges due to abrupt changes in values between pixels. A large amount of transform coefficients is needed to represent.

종래의 변환 기법의 변환 효율을 높이기 위한 전처리 기법은 영상의 잡음을 제거하기 위한 노이즈 제거 필터, 영상의 사이즈를 부호화하기 위한 적절한 사이즈로 변환하는 기법, 정확한 움직임 예측을 위한 방향성 보간 필터 설계, 방향성을 고려한 변환 기법 등 여러 기법이 있으며, 신호의 정렬을 통한 기법은 문헌 1[Zhihai He(“Peak Transform for Efficient Image Representation and coding”, IEEE Trans. Image Processing, vol.16, No.7, Jul. 2007)]의 Peak Transform이 대표적이다.Pre-processing techniques to improve the conversion efficiency of conventional conversion techniques include noise reduction filters for removing noise in an image, techniques for converting the size of an image into an appropriate size for encoding, designing a directional interpolation filter for accurate motion prediction, and directionality. There are a number of techniques, such as the conversion technique considered, and the technique through alignment of signals is described in Zhihai He (“Peak Transform for Efficient Image Representation and coding”, IEEE Trans. Image Processing, vol. 16, No. 7, Jul. 2007). )] Is the typical peak transform.

그러나, 문헌 1의 Peak Transform은 압축하기 어려운 신호(hard-to-compress signal)를 압축하기 쉬운 형태의 신호(easier-to-compress signal) 형태로 변환하여 영상 데이터의 압축 효율을 높인 기법이지만, 1차원 신호에 대한 정렬 수행으로 인해 2차원 영상 신호의 상관성을 효율적으로 활용하지 못 하는 것과 이산 신호에 대해 역 변환 과정이 보장되지 않는 문제를 가지고 있다. 또한 블록 단위로 이뤄지는 DCT와 같은 종래의 변환 기법에 대해서는 적절한 신호의 정렬을 제공할 수 없다 는 문제점을 가지고 있다.However, the Peak Transform of Document 1 improves the compression efficiency of image data by converting a hard-to-compress signal into an easier-to-compress signal form. Due to the alignment of the dimensional signals, there are problems in that the correlation of the 2D video signals cannot be effectively utilized and the inverse conversion process is not guaranteed for the discrete signals. In addition, there is a problem in that a proper signal alignment cannot be provided for a conventional conversion technique such as DCT performed in block units.

전술한 문제점을 해결하기 위해 본 발명은, 종래의 DCT 변환과 같은 블록 단위 변환 기법의 전처리 기술로 활용될 수 있도록 하여 임의의 영상 신호를 2차원 정렬함으로써, 종래의 블록 단위 변환 기법의 변환 효율을 극대화할 수 있도록 하는, 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체를 제공하는 것을 목적으로 한다.In order to solve the above-described problems, the present invention can be utilized as a preprocessing technique of a block unit conversion technique such as a conventional DCT transform to achieve a conversion efficiency of the conventional block unit transformation technique by two-dimensional alignment of arbitrary image signals. An object of the present invention is to provide a video encoding apparatus, an apparatus and method for two-dimensional alignment conversion of an image signal, and a recording medium for maximizing the same.

전술한 목적을 달성하기 위하여 본 발명의 일 측면에 따르면, 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬부; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬부; 및 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성부를 포함하는 영상 신호의 2차원 정렬 변환 장치가 제공된다.According to an aspect of the present invention to achieve the above object, a horizontal alignment unit for horizontally aligned in the order of the size of the horizontal direction with respect to the pixels of the image block; A vertical alignment unit for vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And an index map generator for generating an index map of original positions of the horizontally and vertically aligned pixels.

전술한 목적을 달성하기 위하여 본 발명의 다른 측면에 따르면, 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬 단계; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬 단계; 및 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성 단계를 포함하는 영상 신호의 2차원 정렬 변환 방법이 제공된다.According to another aspect of the present invention to achieve the above object, a horizontal alignment step of horizontally aligning the pixels of the image block in the order of the size of the horizontal direction; A vertical alignment step of vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And an index map generation step of generating an index map for the original positions of the horizontally and vertically aligned pixels.

전술한 목적을 달성하기 위하여 본 발명의 또 다른 측면에 따르면, 현재 블 록의 각 화소의 원 화소값과 상기 현재 블록의 각 화소의 예측 화소값의 차이값을 계산하여 잔차신호를 생성하는 감산부; 상기 잔차신호의 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 정렬하고, 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 정렬하며, 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 정렬 변환부; 상기 수평 및 수직 정렬된 화소들을 주파수 계수들로 변환하는 변환부; 상기 변환된 주파수 계수들을 양자화하는 양자화부; 및 상기 양자화된 주파수 계수들을 비트스트림으로 부호화하는 부호화부를 포함하는 것을 특징으로 하는 동영상 부호화 장치가 제공된다.According to yet another aspect of the present invention, a subtraction unit for generating a residual signal by calculating a difference value between the original pixel value of each pixel of the current block and the predicted pixel value of each pixel of the current block. ; The pixels of the image block of the residual signal are arranged in a horizontal order, the pixels are arranged in a vertical direction with respect to the pixels of the image block, and the indexes of the horizontal and vertically aligned pixels are indicative of original positions. An alignment conversion unit generating a map; A converter for converting the horizontally and vertically aligned pixels into frequency coefficients; A quantizer for quantizing the transformed frequency coefficients; And an encoder which encodes the quantized frequency coefficients into a bitstream.

전술한 목적을 달성하기 위하여 본 발명의 또 다른 측면에 따르면, 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬 기능; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬 기능; 및 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성 기능을 포함하는 영상 신호의 2차원 정렬 변환 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체가 제공된다.According to another aspect of the present invention to achieve the above object, a horizontal alignment function for horizontally aligning the pixels of the image block in the order of the size of the horizontal direction; A vertical alignment function of vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And an index map generation function for generating an index map for the original positions of the horizontally and vertically aligned pixels, a computer-readable recording medium having recorded thereon a two-dimensional alignment conversion program of an image signal.

본 발명에 의하면, 화소가 행렬에 대해 내림 차순으로 정렬되기 때문에, 종래의 DCT와 같은 변환 기법을 수행하였을 때 에너지 집중 효과가 커서 적은 수의 계수로 원래의 신호를 표현할 수 있게 되는 효과가 발생한다.According to the present invention, since the pixels are arranged in descending order with respect to the matrix, when the conversion technique such as the conventional DCT is performed, the energy concentration effect is large so that the original signal can be represented with a small number of coefficients. .

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.Hereinafter, some embodiments of the present invention will be described in detail through exemplary drawings. In adding reference numerals to the components of each drawing, it should be noted that the same reference numerals are assigned to the same components as much as possible even though they are shown in different drawings. In addition, in describing the present invention, when it is determined that the detailed description of the related well-known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, in describing the component of this invention, terms, such as 1st, 2nd, A, B, (a), (b), can be used. These terms are only for distinguishing the components from other components, and the nature, order or order of the components are not limited by the terms. If a component is described as being "connected", "coupled" or "connected" to another component, that component may be directly connected to or connected to that other component, but there may be another configuration between each component. It is to be understood that the elements may be "connected", "coupled" or "connected".

동영상 화면은 1초 동안에 30장의 프레임으로 구성되므로 한 프레임과 이웃한 프레임 사이에는 그 차이가 작기 때문에, 인간의 눈으로 구분하지 못한다. 이 때문에, 1초 동안에 30장의 프레임을 뿌리면 인간의 눈은 프레임이 연속적인 것으로 인식한다. Since the video screen is composed of 30 frames in one second, the difference is small between one frame and neighboring frames, and thus cannot be distinguished by the human eye. For this reason, when 30 frames are sprayed in one second, the human eye recognizes the frames as continuous.

이와 같이, 이전 프레임과 현재 프레임이 비슷하다면, 이전 프레임을 구성하고 있는 이미 알고 있는 화소값으로부터 다음 프레임의 화소값을 예측할 수 있다(이를 화면간 예측(interprediction)이라 함). As such, when the previous frame is similar to the current frame, the pixel value of the next frame can be predicted from the known pixel values constituting the previous frame (this is called interprediction).

이러한 동영상 데이터의 부호화 및 복호화는 움직임 예측(motion prediction) 기술을 기반으로 이루어진다. 움직임 예측은 시간 축을 기준으로 과거 프레임을 참조하거나 과거 프레임과 미래 프레임을 모두 참조하는 방식으로 수행된다. 현재 프레임을 부호화하거나 복호화하는데 참조되는 프레임을 참조 프레임이라고 한다. 그리고, 블록 기반 동영상 부호화에서 동영상을 구성하는 하나의 정지영상(프레임)은 매크로블록과 매크로블록을 구성하는 서브블록으로 나누어져, 블록단위로 움직임이 예측되고 부호화가 수행된다.The encoding and decoding of such video data is performed based on a motion prediction technique. The motion prediction is performed by referring to past frames or referring to both past and future frames based on the time axis. The frame referred to to encode or decode the current frame is called a reference frame. In block-based video encoding, one still image (frame) constituting a video is divided into macroblocks and subblocks constituting the macroblock, and motion is predicted in units of blocks and encoding is performed.

또한 동일한 프레임 내에서 화소신호의 상관관계를 사용해 다음 화소를 예측하고 그 예측오차를 부호화할 수도 있다(이를 화면 내 예측(intraprediction)이라 함).It is also possible to predict the next pixel using the correlation of the pixel signals in the same frame and to encode the prediction error (this is called intraprediction).

도 1은 화면간 예측에 사용되는, 동영상을 구성하는 동영상 프레임들을 도시한 도면이다.FIG. 1 is a diagram illustrating video frames constituting a video used for inter prediction.

도 1을 참조하면, 동영상 데이터는 일련의 정지영상으로 구성되어 있다. 이 정지영상들은 GOP(Group of Picture) 단위로 구분되어 있다. 정지영상 하나하나를 프레임이라 한다. 하나의 GOP에는 I 프레임(110), P 프레임(120), B(130) 프레임이 포함되어 있다. I 프레임(110)은 참조 프레임을 사용하지 않고 자체적으로 부호화되는 프레임이며, P 프레임(120)과 B 프레임(130)은 참조 프레임을 사용하여 움직임 추정 및 보상을 수행하여 부호화되는 프레임이다. 특히, B 프레임(130)은 과거의 프레임과 미래의 프레임을 각각 순방향 및 역방향(양방향) 예측하여 부호화되는 프레임이다.Referring to Fig. 1, video data is composed of a series of still images. These still images are divided into GOP (Group of Picture) units. Each still image is called a frame. One GOP includes an I frame 110, a P frame 120, and a B 130 frame. The I frame 110 is a frame that is encoded by itself without using a reference frame, and the P frame 120 and the B frame 130 are frames that are encoded by performing motion estimation and compensation using the reference frame. In particular, the B frame 130 is a frame that is encoded by predicting the frame of the past and the frame of the future in the forward and reverse directions (bidirectional), respectively.

도 2는 본 발명의 일 실시예에 따른 동영상 부호화 장치의 블록도이다.2 is a block diagram of a video encoding apparatus according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 동영상 부호화 장치(200)는 움직임 추정/보상부(210), 감산부(220), 정렬 변환부(230), 변환부(240), 양자화부(250) 및 부호화부(260)를 포함한다. Referring to FIG. 2, the video encoding apparatus 200 according to an embodiment of the present invention may include a motion estimation / compensation unit 210, a subtraction unit 220, an alignment transformer 230, a transformer 240, and quantization. The unit 250 and the encoder 260 are included.

이러한 동영상 부호화 장치(200)는 개인용 컴퓨터(PC: Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 이동통신 단말기(Mobile Communication Terminal) 등일 수 있으며, 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미한다.The video encoding apparatus 200 may be a personal computer (PC), a notebook computer, a personal digital assistant (PDA), a portable multimedia player (PMP), or a PlayStation Portable (PSP). ), A communication device such as a communication modem for communicating with various devices or a wired / wireless communication network, a memory for storing various programs and data for encoding an image, and executing a program. Means a variety of devices including a microprocessor for operation and control.

움직임 추정/보상부(210)는 위에서 설명한 바와 같이 움직임 예측을 기반으로 하는 화면간 예측이나 동일한 프레임 내에서 화소신호의 상관관계를 사용해 다음 화소를 예측하는 화면 내 예측 중 어느 하나 또는 둘의 조합을 이용하여 현재 블록(또는 매크로블록)을 예측할 수 있다.As described above, the motion estimator / compensator 210 performs any one or a combination of intra prediction based on motion prediction or intra prediction that predicts the next pixel using correlation of pixel signals in the same frame. It can be used to predict the current block (or macroblock).

예를 들어, 움직임 추정/보상부(210)는 움직임 추정부(미도시)와 움직임 보상부(미도시)로 나누어 구성될 수 있다. 움직임 추정부는 현재 프레임의 매크로 블록의 움직임 예측치를 참조 프레임에서 찾아 그 움직임의 차이를 움직임 벡터로써 출력한다. 즉, 찾고자 하는 매크로 블록을 참조 프레임의 소정의 탐색영역 내에서 탐색하여, 가장 유사한 매크로 블록을 찾아 그 이동 정도를 움직임 벡터로써 출력한다. 움직임 보상부는 구해진 움직임 벡터에 해당하는 예측 매크로 블록을 참조 프레임으로부터 얻는다.For example, the motion estimator / compensator 210 may be divided into a motion estimator (not shown) and a motion compensator (not shown). The motion estimator finds the motion prediction value of the macroblock of the current frame in the reference frame and outputs the difference of the motion as a motion vector. That is, the macroblock to be searched is searched within a predetermined search area of the reference frame to find the most similar macroblock and the degree of movement thereof is output as a motion vector. The motion compensation unit obtains a prediction macro block corresponding to the obtained motion vector from the reference frame.

또 다른 예로, 움직임 추정/보상부(210)는 현재 프레임의 현재 매크로 블록을 영상 내에서 현재 매크로 블록의 주변 매크로 블록을 이용하여 예측하는 인트라예측부로, 하나 이상의 주변 매크로 블록의 하나 이상의 화소값(Pixel Value)을 이용하여 현재 매크로 블록의 각 화소의 예측 화소값(Predicted Pixel Value)을 계산함으로써 예측 매크로 블록을 예측한다. 여기서, 주변 매크로 블록은 현재 매크로 블록 이전에 압축되고 현재 매크로 블록의 주변에 위치한 하나 이상의 주변 매크로 블록일 수 있다. As another example, the motion estimator / compensator 210 is an intra predictor that predicts a current macroblock of a current frame using a neighboring macroblock of a current macroblock in an image, and includes one or more pixel values of one or more neighboring macroblocks ( The predicted macro block is predicted by calculating a predicted pixel value of each pixel of the current macro block using the pixel value. Here, the peripheral macroblock may be one or more peripheral macroblocks that are compressed before the current macroblock and located around the current macroblock.

감산부(220)는 원 영상 프레임의 매크로 블록에서 예측 매크로 블록을 빼서 그 차이값을 계산하여 잔차신호(Residual Signal)를 생성한다. The subtraction unit 220 generates a residual signal by subtracting the prediction macro block from the macro block of the original image frame and calculating the difference value.

정렬 변환부(230)는 잔차신호의 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 정렬하고 수직 방향의 크기 순으로 정렬하며, 그 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성한다. 본 발명에 따른 정렬 변환부(230)는 도 3을 참조로 보다 상세히 후술하도록 한다.The alignment converter 230 arranges the pixels of the image block of the residual signal in the horizontal order and in the vertical direction, and generates an index map of the original positions of the horizontal and vertical aligned pixels. do. The alignment conversion unit 230 according to the present invention will be described later in more detail with reference to FIG. 3.

변환부(240)는 정렬 변환부(230)에 의해 수평 및 수직 정렬 변환된 화소(잔차신호)를 주파수 영역으로 변환하여 주파수 계수들을 얻는다. 여기서, 변환부(240)는 이산 코사인 변환(DCT: Discrete Cosine Transform, 이하 'DCT 변환'이라 칭함) 또는 웨이블릿 변환(Wavelet Transform) 등의 시간축의 화상 신호를 주파수축으로 변환하는 다양한 변환 기법을 이용하여 잔차신호를 주파수 영역으로 변환한다. 도 1을 참조하여 설명한 I 프레임의 경우, 변환부(240)는 원 영상 프레임의 매크로 블록을 주파수 영역으로 변환한다. The converter 240 converts the horizontally and vertically aligned pixels (residual signals) by the alignment converter 230 into a frequency domain to obtain frequency coefficients. Here, the transform unit 240 uses various transformation techniques for transforming an image signal on a time axis such as Discrete Cosine Transform (DCT) or Wavelet Transform into a frequency axis. To convert the residual signal into the frequency domain. In the case of the I frame described with reference to FIG. 1, the converter 240 converts the macroblock of the original image frame into the frequency domain.

양자화부(250)는 변환부(230)에 의해 주파수 영역으로 변환된 주파수 계수들을 양자화(Quantization)한다. The quantizer 250 quantizes the frequency coefficients transformed into the frequency domain by the transformer 230.

원 영상 프레임의 매크로 블록에서 예측 매크로 블록을 뺀 것을 잔차신호(residual signal)라고 하는데 부호화시의 데이터량을 줄이기 위해서 이 잔차신호값을 부호화한다. 양자화 과정에서 에러가 발생하므로, 비트스트림으로 만들어지는 동영상 데이터에는 변환 및 양자화 과정에서 발생한 에러가 포함되어 있다.Subtracting the predictive macroblock from the macroblock of the original picture frame is called a residual signal, and the residual signal value is encoded to reduce the amount of data during encoding. Since an error occurs during the quantization process, the video data generated in the bitstream includes an error generated during the transformation and quantization process.

또한, 참조 프레임을 얻기 위해, 동영상 부호화 장치(200)는 역양자화부(270)와 역변환부(280)를 추가로 포함할 수 있다.In addition, the video encoding apparatus 200 may further include an inverse quantizer 270 and an inverse transform unit 280 to obtain a reference frame.

참조 프레임을 얻기 위해, 양자화된 잔차신호는 역양자화부(270)와 역변환부(280)를 거쳐 움직임 추정/보상부(210)에서 예측된 영상과 합쳐져 참조 프레임 저장부(미도시)에 저장된다. I 프레임의 경우, 역양자화부(270)와 역변환부(280)를 거쳐 움직임 추정/보상부(210)의 참조 프레임 저장부에 저장된다. 즉, 원 영상을 A 라고 하고, 예측된 영상을 B 라고 하면 변환부(240)는 원 영상과 예측된 영상과의 차이인 A-B를 입력받아 변환을 수행한다. In order to obtain a reference frame, the quantized residual signal is combined with an image predicted by the motion estimation / compensator 210 through an inverse quantizer 270 and an inverse transformer 280 and stored in a reference frame storage unit (not shown). . In the case of an I frame, it is stored in the reference frame storage of the motion estimation / compensation unit 210 through the inverse quantization unit 270 and the inverse transform unit 280. That is, when the original image is called A and the predicted image is called B, the conversion unit 240 receives the A-B, which is a difference between the original image and the predicted image, and performs conversion.

부호화부(260)는 양자화부(250)에 의해 양자화된 주파수 계수들을 비트스트림으로 부호화한다. 이러한 부호화 기술로서는 엔트로피 부호화(Entropy Encoding) 기술이 사용될 수 있으나, 반드시 이에 한정하지 않고 다른 다양한 부호화 기술이 사용될 수도 있다.The encoder 260 encodes the frequency coefficients quantized by the quantizer 250 into a bitstream. An entropy encoding technique may be used as the encoding technique, but various encoding techniques may be used without being limited thereto.

도 3은 본 발명의 일 실시예에 따른 영상 신호의 2차원 정렬 변환 장치의 블 록도로서, 도 2의 정렬 변환부(230)에 대응하므로 동일 부호를 부가하여 설명한다.3 is a block diagram of a two-dimensional alignment conversion apparatus for a video signal according to an embodiment of the present invention, and corresponds to the alignment conversion unit 230 of FIG. 2.

도 3에 도시된 바와 같이, 본 발명의 일 실시예에 따른 영상 신호의 2차원 정렬 변환 장치(230)는 수평 정렬부(231), 수직 정렬부(233), 및 인덱스 맵 생성부(235)를 포함한다. 또한, 변환부(240)를 더 포함할 수 있다.As shown in FIG. 3, the 2D alignment conversion apparatus 230 of an image signal according to an exemplary embodiment of the present invention may include a horizontal alignment unit 231, a vertical alignment unit 233, and an index map generator 235. It includes. In addition, the converter 240 may further include.

수평 정렬부(231)는 영상 블록의 화소들을 수평 방향의 크기 순으로 수평 정렬한다. 즉, 수평 정렬부(231)는 영상 블록의 동일 행내의 화소들에 대해 좌에서 우로 갈수록 화소값의 크기가 작아지는 순으로 정렬한다.The horizontal alignment unit 231 horizontally aligns pixels of the image block in the order of the size of the horizontal direction. That is, the horizontal alignment unit 231 arranges the pixels in the same row of the image block in order of decreasing pixel value from left to right.

수직 정렬부(233)는 영상 블록의 화소들을 수직 방향의 크기 순으로 수직 정렬한다. 즉, 수직 정렬부(233)는 영상 블록의 동일 열내의 화소들에 대해 상단에서 하단으로 갈수록 화소값의 크기가 작아지는 순으로 정렬한다.The vertical alignment unit 233 vertically aligns pixels of the image block in the order of the size of the vertical direction. That is, the vertical alignment unit 233 sorts the pixels in the same column of the image block in order of decreasing size of pixel values from the top to the bottom.

인덱스 맵 생성부(235)는 수평 정렬부(231)에 의해 수평 정렬되고 수직 정렬부(233)에 의해 수직 정렬된 영상 블록의 화소들의 원래 위치(정렬되기 전의 원 위치)에 대한 인덱스 맵을 생성한다.The index map generator 235 generates an index map with respect to the original position (the original position before sorting) of pixels of the image block horizontally aligned by the horizontal alignment unit 231 and vertically aligned by the vertical alignment unit 233. do.

변환부(240)는 일 예로 이산 코사인 변환(Discrete Cosine Transform: DCT)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하거나, 다른 예로 웨이블릿 변환(Wavelet Transform)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것이다. 이와 같은 변환부(240)는 도 2의 설명을 참조한다. 하지만, 본 발명에 따른 변환부(240)는 위의 예에 한정되지 않고 부호화(또는 복호화) 과정에서 필요한 변환(또는 역변환) 과정을 수행하는 기존의 구성을 모두 나타낼 수 있다. The transform unit 240 converts an image signal of a time axis into a frequency axis by using a discrete cosine transform (DCT) as an example, or converts an image signal of a time axis into a frequency axis by using a wavelet transform. To convert. Such a conversion unit 240 refers to the description of FIG. 2. However, the conversion unit 240 according to the present invention is not limited to the above example and may represent all existing configurations for performing the necessary transformation (or inverse transformation) process in the encoding (or decoding) process.

도 4는 본 발명의 일 실시예에 따른 영상 신호의 2차원 정렬 변환 방법의 흐 름도로서, 도 3의 장치에 적용되므로 그 장치의 동작과 함께 설명한다.FIG. 4 is a flowchart illustrating a two-dimensional alignment conversion method of an image signal according to an embodiment of the present invention. Since the present invention is applied to the apparatus of FIG. 3, it will be described together with the operation of the apparatus.

먼저, 도 5와 같은 영상 블록 신호가 영상 신호의 2차원 정렬 변환 장치(230)에 입력된다(S420). 도 5는 4x4 블록 크기를 갖는 영상 신호의 예로서, 영상의 화소 값은 x, y축에 대한 임의의 함수로 f(x,y)로 나타낸다. First, the image block signal as shown in FIG. 5 is input to the 2D alignment conversion apparatus 230 of the image signal (S420). 5 is an example of an image signal having a 4x4 block size, and pixel values of the image are represented as f (x, y) as an arbitrary function on the x and y axes.

이어, 수평 정렬부(231)는 입력된 도 5의 영상 블록 신호에 대해 도 6에 도시된 바와 같이 해당 영상 블록의 행을 기준으로 수평 방향의 크기 순으로 수평 정렬한다. 즉, 도 6과 같이 수평 정렬부(231)는 해당 영상 블록의 동일 행내의 화소들에 대해 좌에서 우로 갈수록 화소값의 크기가 작아지는 순으로 정렬한다(S420).Subsequently, the horizontal alignment unit 231 horizontally aligns the input image block signal of FIG. 5 in the horizontal order based on the row of the corresponding image block as shown in FIG. 6. That is, as shown in FIG. 6, the horizontal alignment unit 231 arranges the pixels in the same row of the image block in order of decreasing size of pixel values from left to right (S420).

이어, 수직 정렬부(233)는 수평 정렬부(231)에 의해 도 6과 같이 수평 정렬된 영상 블록의 화소들에 대해 도 7에 도시된 바와 같이 열을 기준으로 수직 방향의 크기 순으로 수직 정렬한다. 즉, 도 7과 같이 수직 정렬부(233)는 해당 영상 블록의 동일 열내의 화소들에 대해 상단에서 하단으로 갈수록 화소값의 크기가 작아지는 순으로 정렬한다(S430).Subsequently, the vertical alignment unit 233 vertically aligns the pixels of the image block horizontally aligned by the horizontal alignment unit 231 in the vertical direction based on the column size as shown in FIG. 7. do. That is, as shown in FIG. 7, the vertical alignment unit 233 arranges the pixels in the same column of the image block in order of decreasing size of pixel values from the top to the bottom (S430).

도 6의 수평 정렬 단계(S420) 및 도 7의 수직 정렬 단계(S430)를 통해, 도 8와 같이 왼쪽 상단에 가장 높은 화소값을 갖는 화소가 배치되고, 오른쪽 하단에는 가장 낮은 화소값을 갖는 화소가 배치되도록 2차원 정렬 변환을 수행할 수 있다. Through the horizontal alignment step S420 of FIG. 6 and the vertical alignment step S430 of FIG. 7, the pixel having the highest pixel value is disposed at the upper left as shown in FIG. 8, and the pixel having the lowest pixel value is located at the lower right. The two-dimensional alignment transformation may be performed such that is arranged.

이런 정렬 방법은 화소가 행렬에 대해 내림 차순 정렬되기 때문에 종래의 DCT와 같은 변환 기법을 수행하였을 때, 에너지 집중 효과가 커, 적은 수의 계수로 원래의 신호를 표현할 수 있게 된다.This sorting method is such that the pixels are arranged in descending order with respect to the matrix, and when the conversion technique such as the conventional DCT is performed, the energy concentration effect is large, and the original signal can be represented with a small number of coefficients.

다음, 도 8과 같이 정렬된 화소를 원 위치로 재배치하는 역변환을 위해서는 화소의 원 위치에 관한 정보를 담는 인덱스 맵이 필요하다. 도 9는 화소 정렬 변환에 따른 인덱스 맵의 변화를 나타낸 예이다. 영상 블록 신호의 왼쪽 상단을 1로 정의하고 래스터 스캔으로 오른쪽 하단까지 숫자를 증가하여 16까지 정의한다. 이렇게 정의된 영상 신호에 따른 일련의 숫자를 인덱스 맵이라고 하고, 이 인덱스 맵을 통해 정렬 전에 원래 신호의 위치를 기록할 수 있다(S440). Next, an inverse transformation for rearranging the aligned pixels to their original positions as shown in FIG. 8 requires an index map containing information about the original positions of the pixels. 9 illustrates an example of a change of an index map according to pixel alignment transformation. The upper left corner of the image block signal is defined as 1, and the raster scan is defined as 16 by increasing the number to the lower right corner. The series of numbers according to the defined video signal is called an index map, and the position of the original signal can be recorded before alignment through the index map (S440).

정렬 변환 이후로 생성되는 인덱스 맵의 비트량은 주어진 화소의 개수가 N개 일 때, 다음 식 (1)을 통해 얻을 수 있다.The bit amount of the index map generated after the alignment conversion can be obtained through the following equation (1) when the number of given pixels is N.

식 (1)Formula (1)

Figure 112008073189932-PAT00001
Figure 112008073189932-PAT00001

마지막으로, 도 8과 같이 정렬된 블록 영상 신호 및 도 9와 같이 생성된 인덱스 맵을 출력한다(S450).Finally, the block image signals arranged as shown in FIG. 8 and the index map generated as shown in FIG. 9 are output (S450).

또한, 변환부(240)는 도 8과 같이 정렬된 블록 영상 신호를 주파수 계수들로 변환한다. 변환부(240)는 이산 코사인 변환(Discrete Cosine Transform: DCT)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하거나, 웨이블릿 변환(Wavelet Transform)을 이용하여 시간축의 화상 신호를 주파수축으로 변환할 수 있다.In addition, the converter 240 converts the aligned block image signal into frequency coefficients as shown in FIG. 8. The transform unit 240 may convert a time axis image signal to a frequency axis using a discrete cosine transform (DCT), or convert a time signal image signal to a frequency axis using a wavelet transform. have.

본 발명의 방법을 통해 임의의 영상 신호를 2차원 정렬된 영상 신호로 재배치할 수 있으며, 이 정렬된 영상 신호는 기존 영상이 가지고 있던 불연속 지점을 효율적으로 제거하기 때문에 DCT 등 블록 기반의 변환 기법의 에너지 집중 효과를 극대화하게 되어, 결과적으로 높은 부호화 효율의 향상을 기대할 수 있다.Through the method of the present invention, an arbitrary video signal can be rearranged into a two-dimensional aligned video signal. Since the aligned video signal efficiently removes discontinuities of the existing video, block-based conversion techniques such as DCT The energy concentration effect can be maximized, resulting in high coding efficiency.

본 발명의 일 실시예에 따른 영상 신호의 2차원 정렬 변환 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로써 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. The 2D alignment conversion method of an image signal according to an embodiment of the present invention may be implemented as computer readable codes on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like, which are also implemented in the form of carrier waves (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.

이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것이다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.In the above description, all elements constituting the embodiments of the present invention are described as being operated in combination, and the present invention is necessarily limited to these embodiments. In other words, within the scope of the present invention, all of the components may be selectively operated in combination with one or more. In addition, although all of the components may be implemented in one independent hardware, each or all of the components may be selectively combined to perform some or all functions combined in one or a plurality of hardware. It may be implemented as a computer program having a. Codes and code segments constituting the computer program may be easily inferred by those skilled in the art. Such a computer program may be stored in a computer readable storage medium and read and executed by a computer, thereby implementing embodiments of the present invention. The storage medium of the computer program may include a magnetic recording medium, an optical recording medium, a carrier wave medium, and the like.

또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재될 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥 상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, the terms "comprise", "comprise" or "having" described above mean that the corresponding component may be included, unless otherwise stated, and thus excludes other components. It should be construed that it may further include other components instead. All terms, including technical and scientific terms, have the same meanings as commonly understood by one of ordinary skill in the art unless otherwise defined. Terms commonly used, such as terms defined in a dictionary, should be interpreted to coincide with the contextual meaning of the related art, and shall not be construed in an ideal or excessively formal sense unless explicitly defined in the present invention.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The protection scope of the present invention should be interpreted by the following claims, and all technical ideas within the equivalent scope should be interpreted as being included in the scope of the present invention.

이상 설명한 바와 같이, 본 발명은 동영상 부호화 및 복호화 기술 분야에 적용되어 임의의 영상 신호를 2차원 정렬된 영상 신호로 재배치할 수 있으며, 이 정렬된 영상 신호는 기존 영상이 가지고 있던 불연속 지점을 효율적으로 제거하기 때문에 DCT 등 블록 기반의 변환 기법의 에너지 집중 효과를 극대화하게 되어, 결과적으로 부호화을 극대화할 수 있는 효과를 발생하는 매우 유용한 발명이다.As described above, the present invention can be applied to the field of video encoding and decoding technology to rearrange an arbitrary video signal into a two-dimensional aligned video signal, and the aligned video signal efficiently discontinues the discontinuous points of the existing video. Because it eliminates, the energy-intensive effect of block-based transformation techniques such as DCT is maximized, resulting in the effect of maximizing the coding.

도 1은 화면간 예측에 사용되는, 동영상을 구성하는 동영상 프레임들을 도시한 도면,1 is a view showing video frames constituting a video, used for inter prediction;

도 2는 본 발명의 일 실시예에 따른 동영상 부호화 장치의 블록도,2 is a block diagram of a video encoding apparatus according to an embodiment of the present invention;

도 3은 본 발명의 일 실시예에 따른 영상 신호의 2차원 정렬 변환 장치의 블록도,3 is a block diagram of a two-dimensional alignment conversion apparatus of an image signal according to an embodiment of the present invention;

도 4는 본 발명의 일 실시예에 따른 영상 신호의 2차원 정렬 변환 방법의 흐름도,4 is a flowchart of a 2D alignment conversion method of an image signal according to an embodiment of the present invention;

도 5는 4x4 블록 크기를 갖는 영상 신호의 일 예를 나타낸 도면,5 is a diagram illustrating an example of a video signal having a 4x4 block size;

도 6은 본 발명에 따른 수평 정렬 과정을 설명하는 도면,6 is a view illustrating a horizontal alignment process according to the present invention;

도 7은 본 발명에 따른 수직 정렬 과정을 설명하는 도면,7 is a view illustrating a vertical alignment process according to the present invention;

도 8은 본 발명에 따른 수평 및 수직 정렬 과정 후의 영상 블록 신호의 일 예를 나타낸 도면,8 illustrates an example of an image block signal after horizontal and vertical alignment processes according to the present invention;

도 9는 본 발명에 따른 인덱스 맵의 생성 과정을 설명하는 도면이다.9 illustrates a process of generating an index map according to the present invention.

< 도면의 주요 부분에 대한 부호의 설명 ><Description of Symbols for Main Parts of Drawings>

200: 부호화 장치(또는 부호기라 칭함)200: encoding device (or coder)

210: 움직임 추정/보상부, 적응 중첩 블록 움직임 보상 장치210: motion estimation / compensation unit, adaptive overlap block motion compensation device

220: 감산부 230: 정렬 변환부220: subtraction unit 230: alignment conversion unit

231: 수평 정렬부 233: 수직 정렬부231: horizontal alignment portion 233: vertical alignment portion

235: 인덱스 맵 생성부 240: 변환부235: index map generation unit 240: conversion unit

250: 양자화부 260: 부호화부250: quantizer 260: encoder

270: 역양자화부 280: 역변환부270: inverse quantization unit 280: inverse transform unit

Claims (20)

영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬부;A horizontal alignment unit that horizontally aligns the pixels of the image block in an order of magnitude in a horizontal direction; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬부; 및A vertical alignment unit for vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성부Index map generator for generating an index map of the original position of the horizontally and vertically aligned pixels 를 포함하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 장치.Device for two-dimensional alignment conversion of the video signal, characterized in that it comprises a. 제 1 항에 있어서,The method of claim 1, 상기 수평 정렬부는 동일 행내의 화소들에 대해 좌에서 우로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 장치.And the horizontal alignment unit arranges the pixels in the same row in order of decreasing pixel value from left to right. 제 1 항에 있어서,The method of claim 1, 상기 수직 정렬부는 동일 열내의 화소들에 대해 상에서 하로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 장치.And the vertical alignment unit aligns the pixels in the same column in order of decreasing size of pixel values from top to bottom. 제 1 항에 있어서,The method of claim 1, 상기 수평 및 수직 정렬된 화소들을 주파수 계수들로 변환하는 변환부를 더 포함하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 장치.And a converter for converting the horizontally and vertically aligned pixels into frequency coefficients. 제 4 항에 있어서,The method of claim 4, wherein 상기 변환부는 이산 코사인 변환(Discrete Cosine Transform: DCT)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 장치.And the transform unit converts an image signal on a time axis into a frequency axis by using a discrete cosine transform (DCT). 제 4 항에 있어서,The method of claim 4, wherein 상기 변환부는 웨이블릿 변환(Wavelet Transform)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 장치.And the transform unit converts an image signal of a time axis into a frequency axis using a wavelet transform. 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬 단계;A horizontal alignment step of horizontally aligning the pixels of the image block in an order of magnitude in a horizontal direction; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬 단계; 및A vertical alignment step of vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성 단계An index map generation step of generating an index map for the original position of the horizontally and vertically aligned pixels 를 포함하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 방법.2D alignment conversion method of an image signal comprising a. 제 7 항에 있어서,The method of claim 7, wherein 상기 수평 정렬 단계는 동일 행내의 화소들에 대해 좌에서 우로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 방법.The horizontally aligning step of the two-dimensional alignment conversion method of the image signal, characterized in that in order from the left to the right of the pixels in the same row size of the pixel value is smaller. 제 7 항에 있어서,The method of claim 7, wherein 상기 수직 정렬 단계는 동일 열내의 화소들에 대해 상에서 하로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 방법.The vertical alignment step of the two-dimensional alignment conversion method of the image signal, characterized in that the order of the pixels in the same column in order of decreasing size of the pixel value from the top to the bottom. 제 7 항에 있어서,The method of claim 7, wherein 상기 수평 및 수직 정렬된 화소들을 주파수 계수들로 변환하는 변환 단계 더 포함하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 방법.And converting the horizontally and vertically aligned pixels into frequency coefficients. 제 10 항에 있어서,The method of claim 10, 상기 변환 단계는 이산 코사인 변환(Discrete Cosine Transform: DCT)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 방법.The transforming step is a two-dimensional alignment transformation method of an image signal, characterized in that for transforming the image signal on the time axis to the frequency axis using a discrete cosine transform (DCT). 제 10 항에 있어서,The method of claim 10, 상기 변환 단계는 웨이블릿 변환(Wavelet Transform)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 방법.And the transforming step converts an image signal of a time axis into a frequency axis using a wavelet transform. 현재 블록의 각 화소의 원 화소값과 상기 현재 블록의 각 화소의 예측 화소값의 차이값을 계산하여 잔차신호를 생성하는 감산부; A subtraction unit configured to generate a residual signal by calculating a difference value between an original pixel value of each pixel of the current block and a predicted pixel value of each pixel of the current block; 상기 잔차신호의 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 정렬하고, 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 정렬하며, 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 정렬 변환부;The pixels of the image block of the residual signal are arranged in a horizontal order, the pixels are arranged in a vertical direction with respect to the pixels of the image block, and the indexes of the horizontal and vertically aligned pixels are indicative of original positions. An alignment conversion unit generating a map; 상기 수평 및 수직 정렬된 화소들을 주파수 계수들로 변환하는 변환부;A converter for converting the horizontally and vertically aligned pixels into frequency coefficients; 상기 변환된 주파수 계수들을 양자화하는 양자화부; 및A quantizer for quantizing the transformed frequency coefficients; And 상기 양자화된 주파수 계수들을 비트스트림으로 부호화하는 부호화부An encoder that encodes the quantized frequency coefficients into a bitstream 를 포함하는 것을 특징으로 하는 동영상 부호화 장치.Video encoding apparatus comprising a. 제 13 항에 있어서,The method of claim 13, 상기 정렬 변환부는 동일 행내의 화소들에 대해 좌에서 우로 갈수록 화소값의 크기가 작아지는 순으로 정렬하고, 동일 열내의 화소들에 대해 상에서 하로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 동영상 부호 화 장치.The sorting converting unit sorts the pixels in the same row in order of decreasing pixel size from left to right, and arranges the pixels in the same column in decreasing order of size from top to bottom. Video encoding device. 제 13 항에 있어서,The method of claim 13, 상기 변환부는 이산 코사인 변환(Discrete Cosine Transform: DCT)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것을 특징으로 하는 동영상 부호화 장치.And the transform unit converts an image signal on a time axis into a frequency axis by using a discrete cosine transform (DCT). 제 13 항에 있어서,The method of claim 13, 상기 변환부는 웨이블릿 변환(Wavelet Transform)을 이용하여 시간축의 화상 신호를 주파수축으로 변환하는 것을 특징으로 하는 동영상 부호화 장치.And the transform unit converts an image signal on a time axis into a frequency axis using a wavelet transform. 영상 블록의 화소들에 대해 수평 방향의 크기 순으로 수평 정렬하는 수평 정렬 기능;A horizontal alignment function of horizontally aligning the pixels of the image block in an order of magnitude in a horizontal direction; 상기 영상 블록의 화소들에 대해 수직 방향의 크기 순으로 수직 정렬하는 수직 정렬 기능; 및A vertical alignment function of vertically aligning the pixels of the image block in an order of magnitude in a vertical direction; And 상기 수평 및 수직 정렬된 화소들의 원 위치에 대한 인덱스 맵을 생성하는 인덱스 맵 생성 기능Index map generation function for generating an index map for the original position of the horizontally and vertically aligned pixels 을 포함하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.And a computer-readable recording medium having recorded thereon a two-dimensional alignment conversion program of an image signal. 제 17 항에 있어서,The method of claim 17, 상기 수평 정렬 기능은 동일 행내의 화소들에 대해 좌에서 우로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.And the horizontal alignment function arranges the pixels in the same row in order of decreasing pixel value from left to right. 제 17 항에 있어서,The method of claim 17, 상기 수직 정렬 기능은 동일 열내의 화소들에 대해 상에서 하로 갈수록 화소값의 크기가 작아지는 순으로 정렬하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.And the vertical alignment function aligns the pixels in the same column in order of decreasing pixel value from top to bottom. 제 17 항에 있어서,The method of claim 17, 상기 수평 및 수직 정렬된 화소들을 주파수 계수들로 변환하는 변환 기능을 더 포함하는 것을 특징으로 하는 영상 신호의 2차원 정렬 변환 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.And a conversion function for converting the horizontally and vertically aligned pixels into frequency coefficients.
KR1020080103425A 2008-10-22 2008-10-22 2 Video encoding apparatus and Apparatus and Method of 2 dimensional ordering transform for image signal and Recording Medium therefor Active KR101512643B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080103425A KR101512643B1 (en) 2008-10-22 2008-10-22 2 Video encoding apparatus and Apparatus and Method of 2 dimensional ordering transform for image signal and Recording Medium therefor
PCT/KR2009/005923 WO2010047492A2 (en) 2008-10-22 2009-10-15 Moving picture encoder, 2d alignment transformation device and method of image signal for the same, and recording medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080103425A KR101512643B1 (en) 2008-10-22 2008-10-22 2 Video encoding apparatus and Apparatus and Method of 2 dimensional ordering transform for image signal and Recording Medium therefor

Publications (2)

Publication Number Publication Date
KR20100044333A true KR20100044333A (en) 2010-04-30
KR101512643B1 KR101512643B1 (en) 2015-04-16

Family

ID=42119807

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080103425A Active KR101512643B1 (en) 2008-10-22 2008-10-22 2 Video encoding apparatus and Apparatus and Method of 2 dimensional ordering transform for image signal and Recording Medium therefor

Country Status (2)

Country Link
KR (1) KR101512643B1 (en)
WO (1) WO2010047492A2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101370706B1 (en) * 2012-06-29 2014-03-12 인텔렉추얼디스커버리 주식회사 Apparatus and method for preprocessing of video coder
WO2014104520A1 (en) * 2012-12-27 2014-07-03 전자부품연구원 Transform method, computation method and hevc system to which same are applied

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014003507A1 (en) * 2012-06-29 2014-01-03 인텔렉추얼디스커버리 주식회사 Image encoder pretreatment apparatus, and apparatus and method for generating three-dimensional face
US10218974B2 (en) 2015-03-31 2019-02-26 Realnetworks, Inc. Residual transformation and inverse transformation in video coding systems and methods

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0132894B1 (en) * 1992-03-13 1998-10-01 강진구 Image compression encoding and decoding method and apparatus
US6359929B1 (en) * 1997-07-04 2002-03-19 Matsushita Electric Industrial Co., Ltd. Image predictive decoding method, image predictive decoding apparatus, image predictive coding apparatus, and data storage medium
JPH1141503A (en) * 1997-07-17 1999-02-12 Canon Inc Device and method for photographing image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101370706B1 (en) * 2012-06-29 2014-03-12 인텔렉추얼디스커버리 주식회사 Apparatus and method for preprocessing of video coder
WO2014104520A1 (en) * 2012-12-27 2014-07-03 전자부품연구원 Transform method, computation method and hevc system to which same are applied

Also Published As

Publication number Publication date
KR101512643B1 (en) 2015-04-16
WO2010047492A2 (en) 2010-04-29
WO2010047492A3 (en) 2010-07-29

Similar Documents

Publication Publication Date Title
KR100813963B1 (en) Lossless encoding and decoding method for video
RU2514777C1 (en) Method and device for image encoding and decoding using large transformation unit
KR101444667B1 (en) Video Coding Method and Apparatus Using Bi-Direction Intra Prediction
KR20190016981A (en) Method and apparatus for encoding intra prediction information
KR20090058954A (en) Method and device for encoding video using side matching, method and device for decoding thereof
KR20110047697A (en) Method and apparatus for encoding and decoding coding units of picture boundary
KR20100036583A (en) Motion vector encoding/decoding method and apparatus using multiple motion vector estimation and video encoding/decoding method and apparatus using same
KR20130003718A (en) Method and apparatus for image encoding/decoding by fast coding unit mode decision
KR20110114524A (en) Image predictive encoding apparatus, method and program, image predictive decoding apparatus, method and program, and encoding / decoding system and method
KR20110032671A (en) Image Encoding / Decoding Method and Apparatus Considering Low Frequency Components
KR20100041217A (en) Video encoding/decoding apparatus and variable obmc apparatus and method
KR101596085B1 (en) Apparatus and method for video coding/decoding using adaptive intra prediction
KR101512643B1 (en) 2 Video encoding apparatus and Apparatus and Method of 2 dimensional ordering transform for image signal and Recording Medium therefor
US9319710B2 (en) Video encoding and decoding apparatus and method
KR20110065116A (en) An image encoding apparatus and method, and a transform encoding apparatus and method used therein, a converter generating apparatus and method, and an image decoding apparatus and method
KR101377529B1 (en) Video Coding and Decoding Method and Apparatus Using Adaptive Motion Vector Coding/Encoding
KR101543301B1 (en) / / Video encoding/decoding apparatus and Hybrid Block Motion Compensation/Overlapped Block Motion Compensation method and apparatus
US8811474B2 (en) Encoder and encoding method using coded block pattern estimation
KR101943425B1 (en) Method and Apparatus for Image Encoding/Decoding using Efficient Non-fixed Quantization
JP2019036772A (en) Video coding apparatus, video coding method, and video coding program
KR20190009826A (en) Method and Apparatus for Image Encoding/Decoding using Efficient Non-fixed Quantization
KR101673026B1 (en) Method and Apparatus for Coding Competition-based Interleaved Motion Vector and Method and Apparatus for Encoding/Decoding of Video Data Thereof
KR101693284B1 (en) Method and Apparatus for Encoding/Decoding of Video Data Using Global Motion-based Enconding Structure
JP5533885B2 (en) Moving picture encoding apparatus and moving picture decoding apparatus
JP4561701B2 (en) Video encoding device

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20081022

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20131004

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20081022

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20140915

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20150329

PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20150410

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20150410

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20180403

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20180403

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20190401

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20200330

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20210401

Start annual number: 7

End annual number: 7

PR1001 Payment of annual fee

Payment date: 20220325

Start annual number: 8

End annual number: 8

PR1001 Payment of annual fee

Payment date: 20240321

Start annual number: 10

End annual number: 10