[go: up one dir, main page]

KR20110099554A - 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기 - Google Patents

영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기 Download PDF

Info

Publication number
KR20110099554A
KR20110099554A KR1020100018642A KR20100018642A KR20110099554A KR 20110099554 A KR20110099554 A KR 20110099554A KR 1020100018642 A KR1020100018642 A KR 1020100018642A KR 20100018642 A KR20100018642 A KR 20100018642A KR 20110099554 A KR20110099554 A KR 20110099554A
Authority
KR
South Korea
Prior art keywords
complexity
quantization parameter
frame
scene change
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020100018642A
Other languages
English (en)
Other versions
KR101086724B1 (ko
Inventor
김종구
서재원
Original Assignee
충북대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 충북대학교 산학협력단 filed Critical 충북대학교 산학협력단
Priority to KR1020100018642A priority Critical patent/KR101086724B1/ko
Publication of KR20110099554A publication Critical patent/KR20110099554A/ko
Application granted granted Critical
Publication of KR101086724B1 publication Critical patent/KR101086724B1/ko
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 영상의 복잡도를 이용한 H.264/AVC 부호화기의 양자화 파라미터 결정 방법에 관한 것으로서, 비디오 영상이 입력되는 단계, 비디오 영상에 대한 화면의 복잡도를 계산하는 단계, 비디오 영상의 실제 생성 비트와 GOP 할당비트의 비율을 이용하여 목표 비트를 산출하는 단계, 화면의 복잡도와 목표비트를 이용하여 초기 양자화 파라미터를 산출하는 단계, 장면전환이 이루어졌는지를 파악하는 단계, 장면전환이 이루어졌다고 판단되면 목표비트를 산출하는 단계, 목표 비트와 영상 내의 복잡도를 이용하여 장면전환 양자화 파라미터를 결정하는 단계를 포함한다. 이에 의해, 초기 양자화 파라미터와 장면전환 양자화 파라미터를 별도로 결정하도록 함으로써, 초기 비디오 입력시와 장면전환 등의 급격한 화질 변환시 비트율 제어 효율이 저하되는 것을 방지할 수 있으며, 영상 전체의 화질이 향상된다.

Description

영상의 복잡도를 이용한 H.264/AVC 부호화기의 양자화 파라미터 결정 방법{QP Deciding Method of H.264/AVC Encoder using Complexity of Frame}
본 발명은 영상의 복잡도를 이용한 H.264/AVC 부호화기의 양자화 파라미터 결정 방법에 관한 것으로서, 초기 양자화 파라미터와, 장면전환시 양자화 파라미터를 적응적으로 선택함으로써, 비트율 제어의 효율을 향상시킬 수 있도록 하는 영상의 복잡도를 이용한 H.264/AVC 부호화기의 양자화 파라미터 결정 방법에 관한 것이다.
근래에 하드웨어가 고도화되고 소비자가 고화질 서비스를 원하면서 ITU-T와 MPEG에서는 공동으로 H.264/AVC라는 고성능 압축 효율을 갖는 동영상 부호화 표준을 정의하였다. H.264/AVC 동영상 표준의 새로운 기술은 이전에 정의된 H.263, MPEG-4등과 유사한 압축 구조를 가지지만 압축효율을 최대한 향상시켰다. H.264/AVC는 입력된 현재 영상이 인트라 프레임인 경우, 인트라 예측 과정을 통해 최적의 모드로 결정된 예측 화소와 현재 영상과의 차분치를 DCT 변환 및 양자화하여 양자화 계수를 얻고, 얻어진 양자화 계수는 엔트로피 부호화 과정을 거쳐 복호기에 전송된다.
이러한 압축 기술을 이용해 실시간 영상 전송 효율을 높아지고, 기존보다 높은 부호화 효율로 인해 보다 좋은 화질의 영상 전송을 가능하게 되었다. 물론 채널 대역이 충분히 커서 압축하지 않은 본래의 영상정보를 그대로 전송할 수 있다면 이러한 기술이 그다지 효율적이지 못하겠지만, 현재로서는 전송 채널의 제한으로 인해 충분히 큰 정보를 한 번에 전송하는 것은 불가능하다. 따라서 높은 부호화 효율을 가진 압축 기술로 정보를 압축하여 전송하면 보다 좋은 화질의 정보를 실시간으로 받아 볼 수 있다.
이때 보통 채널의 용량은 일정한 크기의 정보를 전송할 수 있게 되어 있으나, 영상 정보는 한 화면마다 각기 다른 정보량을 가지게 된다. 이에 따라, 일정한 채널 용량에 맞춰서 각각의 화면 정보를 전송할 필요가 있다. 이것이 비트율 제어 알고리즘이 필요한 이유이다. 비트율 제어는 기본적으로 채널 용량이 허용하는 비트량과 영상이 가지고 있는 비트량과 화질을 고려하여 최적의 부호화 성능을 가지고도록 하는데 목적을 둔다. 영상의 화질과 압축률을 조절하는 가장 효율적인 방법은 양자화 파라미터를 이용하는 것이다. 이것을 조절하여 영상의 비트량을 목표비트에 가깝게 맞추면서 화질을 개선하는 것이 비트율 제어의 전체 흐름이다.
비트율 제어는 크게 다음의 과정을 통해 부호화 과정이 이루어진다. 먼저 목표비트가 구해지고 다음으로 양자화 파라미터가 결정되며 RDO과정을 통해 MAD(mean of absolute differential)값이 산출되고 부호화가 이루어진다. 이때 목표비트는 버퍼상태와 채널용량을 고려하여 목표비트가 결정되고, 양자화 파라미터는 예측된 MAD값과 목표비트를 이용하여 산출된다.
이러한 H.264/AVC의 비트율 제어 알고리즘은 몇까지의 문제점을 가지고 있다. 첫 번째로 I-프레임과 첫 P-프레임을 위한 비트율 제어 알고리즘이 존재하지 않아 임의로 정해진 고정 양자화 파라미터를 사용하고 있는 점이다. 이는 초기 양자화 파라미터를 적절하게 선택하지 못할 경우 전체적인 비트율 제어 효율의 저하를 가져오는 원인으로 작용한다. 따라서 I-프레임을 위한 적응적인 양자화 파라미터 선택 알고리즘을 통해 비트율 제어 효율을 향상시키도록 하였다.
다음은 MAD 예측을 위해 사용되는 선형 모델에 의한 문제점이다. 보통 선형모델을 통해 예측된 MAD는 비교적 실제 MAD와 유사한 값을 갖게 되는데 장면전환과 같은 급격한 화질 변화가 일어날 경우 매우 큰 오차를 가지게 된다. 예측 MAD의 오차는 결과적으로 비트율 제어를 위한 양자화 파라미터 결정에도 영향을 주게 되므로 장면전환을 위한 새로운 알고리즘의 도입이 필요하다.
본 발명의 목적은, 첫 프레임과, 장면전환시 별도의 양자화 파라미터를 결정하도록 함으로써, 비트율 제어 효율을 향상시킬 수 있도록 하는 영상의 복잡도를 이용한 H.264/AVC 부호화기의 양자화 파라미터 결정 방법에 관한 것이다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해되어질 수 있을 것이다.
상기 목적은, 비디오 영상이 입력되는 단계; 화면의 복잡도를 계산하는 단계; 실제 생성 비트와 GOP 할당비트의 비율을 이용하여 목표 비트를 산출하는 단계; 및, 상기 화면의 복잡도와 목표비트를 이용하여 초기 양자화 파라미터를 산출하는 단계;를 포함하는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법에 의해 달성된다.
본 영상의 복잡도를 이용한 H.264/AVC 부호화기의 양자화 파라미터 결정 방법에 따르면, 초기 양자화 파라미터와 장면전환 양자화 파라미터를 별도로 결정하도록 함으로써, 초기 비디오 입력시와 장면전환 등의 급격한 화질 변환시 비트율 제어 효율이 저하되는 것을 방지할 수 있다. 또한, 초기 양자화 파라미터로 부호화시 영상의 평균 화질에 근접한 영상으로 부호화되었으며, 이때, 영상의 평균 화질이 가장 효율적인 것을 확인하였다. 또한, 장면전환 양자화 파라미터로 부호화시 장면 전환 이후 영상들의 평균 화질에 근접한 영상으로 부호화되었으며, 이에 따라, 기존 비트율 제어 기법의 문제점인 조기 목표비트 고갈의 문제가 해결되어 영상 전체의 화질이 향상되었다.
도 1은 본 발명에 따른 H.264/AVC 부호화기의 구성도,
도 2는 복잡도가 구해지는 원리를 매크로블록에 표시한 모식도,
도 3은 본 발명에 따른 H.264/AVC 부호화기에서 양자화 파라미터를 결정하는 과정을 보인 흐름도이다.
그러면 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
도 1은 본 발명에 따른 H.264/AVC 부호화기의 구성도이다.
H.264/AVC 부호화기는, 비트율 제어기(10), 장면전환 검출기(20), 양자화기(30), DCT 변환기(40), 엔트로피 부호화기(50), 역양자화기(60), IDCT 변환기(40), 영상 메모리(80), 움직임 예측기(90)를 포함한다.
이러한 부호화기에는, 비디오 카메라 또는 캠코더 등을 통해 들어오는 프레임 또는 격행 주사에 의한 필드 영상이 입력된다. 필드 영상은 TV 신호의 영상포맷으로써 널리 사용되고 있는 격행 주사를 지원한다. 격행 주사란 화소 라인들을 짝수 라인과 홀수 라인으로 나누어, 즉 필드신호 2 개로 나누어 주사하는 방식이다.
하나의 프레임은 "상위 필드"(한 프레임을 구성하는 두 개의 필드 중 공간적으로 위에 위치하는 필드)와, "하위필드"(한 프레임을 구성하는 두 개의 필드 중 공간적으로 아래에 위치하는 필드)의 2 개의 필드로 구성된다.
비트율 제어기(10)는 전송되는 프레임의 비트율을 제어하며, 화면의 종류와 특성에 따라 부호화 작업으로 생기는 복원 화면의 결함이 인간의 눈에 민감하게 인식되는 부분에는 많은 비트를 할당하고, 인간의 눈에 쉽게 인식되지 않는 부분에서는 상대적으로 적은 비트를 할당하여 전체적으로 좋은 화질을 느낄 수 있도록 조절하는 역할을 수행한다.
본 발명에 따른 비트율 제어기(10)는, 비디오가 입력되기 시작하는 초기에 필요한 초기 양자화 파라미터와, 장면전환시에 필요한 장면전환 양자화 파라미터를 적응적으로 결정하여 양자화기(30)에 제공한다.
비트율 제어기(10)에서 초기 양자화 파라미터를 결정하는 과정을 상세히 설명하면 다음과 같다.
먼저, 비트율 제어기(10)는, 초기 양자화 파라미터를 결정하기 위해, 입력된 영상에 대해 화면이 가지고 있는 복잡한 정도를 산출하며, 이는 하기의 수학식 1에 표기된 화면내의 복잡도 계산 방법을 이용하여 산출한다.
Figure pat00001
여기서, Ix ,y,z는 k번째 프레임에서 (x,y)위치의 픽셀값, Gf(k)은 k번째 프레임의 프레임복잡도, M,N은 프레임의 가로, 세로 크기를 의미한다.
수학식 1은, 도 2에 도시된 바와 같이, 하나의 프레임에 포함된 다수의 매크로블록내의 각 픽셀 간의 관계를 복잡도로 나타낸 것이다.
그런 다음, 비트율 제어기(10)는, 초기 양자화 파라미터 결정을 위한 목표 비트를 설정한다. 목표비트는 선택 양자화 파라미터의 부호화로 생성되는 실제 생성비트와, GOP 할당비트의 비율을 이용하여 결정하며, 이는 수학식 2로 나타낸 바와 같다.
Figure pat00002
여기서,
Figure pat00003
는 비트율, NGOP는 GOP전체의 프레임수, NtotalP는 GOP전체에서 P프레임의 총 수를 의미하며, Fr은 프레임율을 의미한다.
이렇게 목표비트가 결정되면, 다음의 수학식 3을 이용하여 초기 양자화 파라미터를 산출할 수 있으며, 산출된 초기 양자화 파라미터는 양자화기(30)로 전달된다.
Figure pat00004
여기서, QP(k)는 k번째 프레임에서의 양자화 파라미터 값을 의미한다. 양자화 파라미터는 '1'부터 '51'사이의 값을 갖는다.
한편, 비트율 제어기(10)에서 장면전환 양자화 파라미터를 산출하는 과정은 다음과 같다.
먼저, 비트율 제어기(10)에서 장면전환 양자화 파라미터를 산출하기 위해서는 장면전환이 이루어졌는지를 파악해야 하며, 이는 장면전환 검출기(20)에서 이루어진다. 장면전환 검출기(20)는, 장면전환이 이루어졌는지 여부를 판단하기 위해, 영상 내의 복잡도 비와, 차분 값을 구한다. 여기서 복잡도 비는 이전 영상과 현재 영상의 비를 이용하며, 수학식 4로 나타낼 수 있다.
Figure pat00005
여기서, Gf(k)는 k번째 프레임에서의 복잡도를 나타내며, Gf(k-1)은 k-1번째 프레임에서의 복잡도를 나타낸다.
그리고 차분 값은 이전 영상의 열 복잡도와 현재 영상의 열 복잡도를 차분하여 구하며, 이는 다음의 수학식 5로 나타낼 수 있다.
Figure pat00006
여기서 GMB,R(j,k)는 매크로블록단의 복잡도 GMB(i,j,k)에서 가로열들을 합산한 값으로 가로열 복잡도를 나타내며, M,N은 프레임의 가로, 세로 크기를 의미한다.
장면전환 검출기(20)는, 복잡도 비와 차분 값 각각에 대해 설정된 임계치를 가지고 있으며, 복잡도 비와 차분 값이 각각 다음의 수학식 6의 조건을 만족할 경우 장면 전환이 이루어졌다고 판단한다.
Figure pat00007
여기서, GF , ratio(k)는 k번째 프레임과 k-1번째 프레임의 복잡도비를 나타내며, GF , diff(k)는 k번째 프레임과 k-1번째 프레임의 복잡도 차를 의미한다.
장면전환 검출기(20)에서 장면 전환이 이루어졌다고 판단되면, 비트율 제어기(10)는 장면전환 양자화 파라미터의 결정을 위한 목표비트를 설정한다. 장면전환 양자화 파라미터 결정을 위한 목표비트는, 가용비트를 고려하여, 장면전환시 생성비트의 평균과, 인터프레임의 생성비트의 평균을 이용하여 산출하며, 수학식 7로 나타낼 수 있다.
Figure pat00008
여기서, Fr은 프레임율, NcodeP는 부호화된 P프레임의 수를 의미하며, NGOP는 GOP전체의 프레임수, b(ni)는 i번째 프레임의 실제 발생 비트를 의미한다.
이렇게 산출된 목표 비트와, 영상 내의 복잡도를 수학식 3에 적용하여 장면전환 양자화 파라미터를 결정한다. 결정된 장면전환 양자화 파라미터는 양자화기(30)로 제공된다.
DCT(Discrete Cosine Transform) 변환기는, 공간 도메인의 동영상 정보를 주파수 도메인 데이터로 변환하며, 이산 코사인 변환(DCT: Discrete Cosine Transform)을 수행하여 매크로블록 단위로 DCT 계수 블록을 생성한다.
양자화기(30)는 DCT 변환기(40)에서 출력된 DCT 계수 블록을 양자화하며, 이때, 양자화기(30)는 비트율 제어기(10)로부터 제공받은 초기 양자화 파라미터, 장면전환 양자화 파라미터 등의 양자화 파라미터를 프레임별로 제공받아 DCT 계수 블록을 양자화한다.
엔트로피 부호화기(50)는 발생 빈도가 높은 부호에 대해서는 부호당 기준치보다 짧은 비트를 할당하고, 발생 빈도가 낮은 부호에 대해서는 부호당 기준치보다 긴 비트를 할당하여 전체적으로 부호의 평균길이가 원래 신호가 지니고 있는 정보량의 엔트로피에 가깝도록 하는 역할을 한다. 엔트로피 부호화 방식은 Exponential Golomb 코드, VLC(Variable Length Coding), CAVLC(Context Adaptive Variable Length Coding), CABAC(Context Adaptive Binary Arithmetic Coding) 등의 부호화 방식을 사용할 수 있다.
역양자화기(60)는 현재 프레임이 후속 모션추정/보상에 필요한 경우, 양자화된 스펙트럼 계수에 대해 역양자화를 수행한다.
DCT 역변환기(70)는 DCT 변환기(40)의 동작을 역으로 수행하여, 역양자화기(60)의 출력으로부터 역DCT 변환을 통해 역차이 매크로블록이 생성된다.
역양자화기(60) 및 DCT 역변환기(70)에 의해, 비디오 비트스트림에서 오버헤드 정보(각종 헤더 정보, 스타트 코드 등)가 제거되고 순수한 데이터 정보를 디코딩한 후, 역양자화 및 역 DCT 과정을 거쳐 원래 화면의 픽셀 값을 복원한다.
움직임 예측기(90)는, 현재 프레임이 인터 프레임(예를 들어 P프레임일 경우)이라면, 영상 메모리(80)에 버퍼링되어 있는 이전 프레임의 재구성된 프레임인 기준 프레임에 대한, 현재 프레임내 매크로블록의 모션을 추정하고 보상한다. 움직임 예측기(90)에서 보상된 현재 프레임의 매크로블록(예측 매크로블록)과 원래의 현재 프레임의 매크로블록간의 차이분이 DCT 변환기(40)로 제공된다.
영상 메모리(80)는, 일정한 전송율을 가지는 전송 채널로 균일하게 전송하기 위해, 출력 데이터를 일시적으로 저장하여 완충하는 역할을 한다.
이러한 구성에 의한 부호화기에서 영상 입력 초기와 장면전환시 각각 양자화 파라미터를 결정하는 과정을 도 3을 참조하여 설명하면 다음과 같다.
먼저, 비디오 영상이 입력되면(S300), 비트율 제어기(10)는 초기 양자화 파라미터의 산출을 위한 목표비트를 산출한다. 비트율 제어기(10)는, 입력된 비디오 영상에 대한 화면의 복잡도를 계산하고(S305), 입력된 비디오 영상의 실제 생성 비트와 GOP 할당비트의 비율을 이용하여 목표 비트를 산출한다(S310). 그런 다음, 산출된 화면의 복잡도와 목표 비트를 이용하여 초기 양자화 파라미터를 산출하고(S315), 산출된 초기 양자화 파라미터를 양자화기(30)로 전달한다(S320).
한편, 비디오 영상이 입력되는 동안, 비트율 제어기(10)는 실시간으로 목표비트를 산출하여 전송되는 프레임의 비트율을 지속적으로 제어한다. 이때, 비트율 제어기(10)는 장면전환시 양자화기(30)에서 장면전환 양자화 파라미터를 결정할 수 있도록 목표비트를 산출하여 제공한다. 먼저, 비트율 제어기(10)는 장면전환 검출기(20)로부터 장면전환이 이루어졌는지에 대한 정보를 제공받는다. 장면전환 검출기(20)에서는 복잡도 비와 차분 값을 산출하고(S325), 두 값이 미리 설정된 임계치에 대한 조건을 만족하였는지를 판단한다(S330). 두 값이 조건을 만족하였으면, 장면전환 검출기(20)는 장면이 전환된 것으로 판단하고, 이를 비트율 제어기(10)로 제공한다. 비트율 제어기(10)에서는, 장면 전환시 생성비트의 평균과, 인터프레임의 생성비트의 평균을 이용하여 목표비트를 산출한다(340). 그런 다음, 비트율 제어기(10)에서는, 영상 내의 복잡도와 목표 비트를 이용하여 장면전환 양자화 파라미터를 산출하고(S350), 산출된 장면전환 양자화 파라미터를 양자화기(30)로 전달한다(S360).
만약, 복잡도 비와 차분 값이 조건을 만족하지 못하여 장면전환 검출기(20)에서 장면전환이 이루어지지 아니한 것으로 판단된 경우, 비트율 제어기(10)는 종래와 마찬가지로 가용비트와 버퍼 할당비트를 이용하여 목표비트를 산출한다(S335).
이를 위해, 먼저 비트율 제어기(10)는 수학식 8을 이용하여 GOP(group of picture)의 할당비트를 구한 다음, 수학식 9를 이용하여 가용비트를 구한다.
Figure pat00009
Figure pat00010
여기서
Figure pat00011
는 비트율을 의미하고, Fr는 프레임율을 나타낸다. NGOP와 Np ,r은 각각 전체의 프레임수와 부호화되지 않은 P-프레임수를 의미하며, b(ni -1)은 i-1번째 프레임의 실제 발생 비트를 의미하며, Np ,r은 부호화되지 않은 P프레임수를 의미한다.
그런 다음, 비트율 제어기(10)는, 버퍼상태를 고려한 버퍼 할당비트를 수학식 10을 이용하여 산출한다. 이렇게 구해진 가용비트와 버퍼 할당비트의 가중치 합을 통해, 수학식 11을 이용하여 목표비트가 산출된다.
Figure pat00012
여기서,
Figure pat00013
는 목표 버퍼 레벨, Bc(ni)는 실제 버퍼 점유율을 의미한다.
Figure pat00014
β는 가중치 값을 의미하는 것으로, 보통 0.5값을 갖는다.
그런 다음, 비트율 제어기(10)는 예측 MAD(mean of absolute differential)를 산출한다(S345). MAD는 양자화 파라미터가 결정된 후 ROD(Rate Distortion Optimization)과정을 통해서 구하여 지므로, 이전 영상의 MAD를 이용하여 현재 영상의 MAD를 예측해야 한다. 이를 위한 MAD예측 알고리즘으로 선형 알고리즘이 사용되며, 수학식 12는 예측 MAD를 산출하기 위한 선형 모델에 관한 수식이다.
Figure pat00015
여기서, a1,a2는 선형 모델 파라미터로 각 매크로블록을 부호화 해나감에 따라 갱신되며, 초기값은 각각 1과 0이다.
이렇게 산출된 목표비트와 예측 MAD를 이용하여 비트율 제어를 위한 양자화 파라미터가 결정되어진다(S355). 다음의 수학식 13은 비트와 영상의 왜곡도에 관한 수학적 알고리즘을 통해 산출되어진 식이다.
Figure pat00016
여기서, R은 부호화에 필요한 목표 비트를 의미하고, X1,X2는 각각 이차원 비트율-왜곡 모델의 1차, 2차 계수값을 의미한다.
그런 다음, 산출된 양자화 파라미터는 양자화기(30)로 제공되고(S360), ROD(Rate Distortion Optimization) 과정을 통해 MAD(Mean of Absolute Differential)값이 산출되고 부호화가 이루어진다.
이상에서 본 발명의 바람직한 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (8)

  1. 비디오 영상이 입력되는 단계;
    상기 비디오 영상에 대한 화면의 복잡도를 계산하는 단계;
    상기 비디오 영상의 실제 생성 비트와 GOP 할당비트의 비율을 이용하여 목표 비트를 산출하는 단계; 및,
    상기 화면의 복잡도와 목표비트를 이용하여 초기 양자화 파라미터를 산출하는 단계;를 포함하는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
  2. 제 1 항에 있어서,
    상기 화면의 복잡도는, 하기의 수학식 1을 이용하여 산출되는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
    (수학식 1)
    Figure pat00017

    여기서, Ix,y,z는 k번째 프레임에서 (x,y)위치의 픽셀값, Gf(k)은 k번째 프레임의 프레임복잡도, M,N은 프레임의 가로, 세로 크기를 의미함.
  3. 제 1 항에 있어서,
    상기 목표비트는, 선택 양자화 파라미터의 부호화로 생성되는 실제 생성비트와, GOP 할당비트의 비율을 이용하여 결정하며, 하기의 수학식 2를 이용하여 산출되는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
    (수학식 2)
    Figure pat00018

    여기서,
    Figure pat00019
    는 비트율, NGOP는 GOP전체의 프레임수, NtotalP는 GOP전체에서 P프레임의 총 수를 의미하며, Fr은 프레임율을 의미함.
  4. 제 1 항에 있어서,
    상기 초기 양자화 파라미터는, 하기의 수학식 3을 이용하여 결정되는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
    [수학식 3]
    Figure pat00020

    여기서, QP(k)는 k번째 프레임에서의 양자화 파라미터 값을 의미함.
  5. 제 4 항에 있어서,
    장면전환이 이루어졌는지를 파악하는 단계;
    상기 장면전환이 이루어졌다고 판단되면, 목표비트를 산출하는 단계; 및,
    상기 목표 비트와, 영상 내의 복잡도를 상기 수학식 3에 적용하여 장면전환 양자화 파라미터를 결정하는 단계;를 더 포함하는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
  6. 제 5 항에 있어서,
    상기 장면전환은, 영상 내의 복잡도 비와, 차분 값을 이용하여 판단되며, 상기 복잡도 비는 하기의 수학식 4에 표시된 바와 같이, 이전 영상과 현재 영상의 비를 이용하여 산출되고, 상기 차분 값은 하기의 수학식 5에 표시된 바와 같이 이전영상의 열 복잡도와 현재 영상의 열 복잡도를 차분하여 산출되는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
    (수학식 4)
    Figure pat00021

    (수학식 5)
    Figure pat00022

    여기서, Gf(k)는 k번째 프레임에서의 복잡도, Gf(k-1)은 k-1번째 프레임에서의 복잡도를 나타내며, GMB,R(j,k)는 매크로블록단의 복잡도 GMB(i,j,k)에서 가로열들을 합산한 값으로 가로열 복잡도를 나타내며, M,N은 프레임의 가로, 세로 크기를 의미함.
  7. 제 6 항에 있어서,
    상기 복잡도 비와 차분 값이 하기의 수학식 6의 조건을 만족할 경우 장면 전환이 이루어졌다고 판단하는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
    (수학식 6)
    Figure pat00023

    여기서, GF , ratio(k)는 k번째 프레임과 k-1번째 프레임의 복잡도비를 나타내며, GF , diff(k)는 k번째 프레임과 k-1번째 프레임의 복잡도 차를 의미함.
  8. 제 5 항에 있어서,
    상기 장면전환이 이루어졌다고 판단되면, 가용비트를 고려하여, 장면전환시 생성비트의 평균과, 인터프레임의 생성비트의 평균을 이용하여 목표비트를 산출하며, 상기 목표비트는 하기의 수학식 7로 표시되는 것을 특징으로 하는 H.264/AVC 부호화기의 양자화 파라미터 결정 방법.
    (수학식 7)
    Figure pat00024

    여기서, Fr은 프레임율, NcodeP는 부호화된 P프레임의 수를 의미하며, NGOP는 GOP전체의 프레임수, b(ni)는 ni번째 프레임의 실제 발생 비트를 의미함.
KR1020100018642A 2010-03-02 2010-03-02 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기 Expired - Fee Related KR101086724B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100018642A KR101086724B1 (ko) 2010-03-02 2010-03-02 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100018642A KR101086724B1 (ko) 2010-03-02 2010-03-02 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기

Publications (2)

Publication Number Publication Date
KR20110099554A true KR20110099554A (ko) 2011-09-08
KR101086724B1 KR101086724B1 (ko) 2011-11-24

Family

ID=44952402

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100018642A Expired - Fee Related KR101086724B1 (ko) 2010-03-02 2010-03-02 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기

Country Status (1)

Country Link
KR (1) KR101086724B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014119917A1 (ko) * 2013-01-30 2014-08-07 재단법인 다차원 스마트 아이티 융합시스템 연구단 비트율 결정 방법 및 그 장치
CN108271024A (zh) * 2013-12-28 2018-07-10 同济大学 图像编码、解码方法及装置
CN113973205A (zh) * 2021-10-21 2022-01-25 重庆邮电大学 基于视频内容特征的码率控制比特分配方法及存储介质
CN114173067A (zh) * 2021-12-21 2022-03-11 科大讯飞股份有限公司 一种视频生成方法、装置、设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10362307B2 (en) 2016-09-09 2019-07-23 Hanwha Techwin Co., Ltd. Quantization parameter determination method and image capture apparatus

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014119917A1 (ko) * 2013-01-30 2014-08-07 재단법인 다차원 스마트 아이티 융합시스템 연구단 비트율 결정 방법 및 그 장치
US9548078B2 (en) 2013-01-30 2017-01-17 Center For Integrated Smart Sensors Foundation Method for determining bit rate and apparatus therefor
CN108271024A (zh) * 2013-12-28 2018-07-10 同济大学 图像编码、解码方法及装置
CN108271024B (zh) * 2013-12-28 2021-10-26 同济大学 图像编码、解码方法及装置
CN113973205A (zh) * 2021-10-21 2022-01-25 重庆邮电大学 基于视频内容特征的码率控制比特分配方法及存储介质
CN114173067A (zh) * 2021-12-21 2022-03-11 科大讯飞股份有限公司 一种视频生成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
KR101086724B1 (ko) 2011-11-24

Similar Documents

Publication Publication Date Title
TWI399097B (zh) 用於編碼視訊之系統及方法,以及電腦可讀取媒體
KR101538704B1 (ko) 보간 필터를 적응적으로 사용하여 영상을 부호화 및 복호화하는 방법 및 장치
JP4391809B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
KR100850706B1 (ko) 적응적 동영상 부호화 및 복호화 방법과 그 장치
CN100579234C (zh) 图像编码/解码方法及其装置
KR101431545B1 (ko) 영상의 부호화, 복호화 방법 및 장치
US8331449B2 (en) Fast encoding method and system using adaptive intra prediction
US8325797B2 (en) System and method of reduced-temporal-resolution update for video coding and quality control
KR20190042538A (ko) 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
KR101362590B1 (ko) 화상 처리 장치 및 방법
US20070098067A1 (en) Method and apparatus for video encoding/decoding
EP2141927A1 (en) Filters for video coding
US20070098078A1 (en) Method and apparatus for video encoding/decoding
US20080069211A1 (en) Apparatus and method for encoding moving picture
KR20110071231A (ko) 부호화 방법, 복호화 방법 및 장치
KR20040036943A (ko) 화상 부호화 장치, 화상 부호화 방법, 화상 복호 장치,화상 복호 방법, 및 통신 장치
KR101282193B1 (ko) 칼만 필터와 fir 필터를 사용한 동영상 인코더에서의 비트율 제어 방법
JP2001145113A (ja) 画像情報変換装置及び方法
JP4391810B2 (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
KR101086724B1 (ko) 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기
JP2008219205A (ja) 画像情報符号化装置及び画像情報符号化方法
WO2011064926A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP2008004984A (ja) 画像理装置および方法、プログラム、並びに記録媒体
KR20040079084A (ko) 시간적 복잡도를 고려한 적응적 동영상 부호화와 그 장치
JP5136470B2 (ja) 動画像符号化装置及び動画像符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20100302

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20110608

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20111114

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20111118

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20111121

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20141114

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20141114

Start annual number: 4

End annual number: 4

FPAY Annual fee payment

Payment date: 20151111

Year of fee payment: 5

PR1001 Payment of annual fee

Payment date: 20151111

Start annual number: 5

End annual number: 5

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20170828