KR101301245B1

KR101301245B1 - 스펙트럼 계수의 서브대역 할당 방법 및 장치

Info

Publication number: KR101301245B1
Application number: KR1020080131730A
Authority: KR
Inventors: 김현우; 배현주; 이병선
Original assignee: 한국전자통신연구원
Priority date: 2008-12-22
Filing date: 2008-12-22
Publication date: 2013-09-10
Anticipated expiration: 2028-12-22
Also published as: US20100161320A1; US8438012B2; KR20100073139A

Abstract

본 발명은 스펙트럼 계수의 서브대역 할당 방법 및 장치에 관한 것으로, 입력 음성/오디오 신호로부터 변환된 스펙트럼 계수들의 분포에 따라 서브 대역의 크기를 결정하여, 서브 대역 단위로 보다 정교한 양자화를 수행함으로써, 스펙트럼 계수들의 양자화 잡음을 감소시키고 주파수 영역에서 음질을 향상시키는 그에 따른 신호의 품질이 향상되는 효과가 있다.

스펙트럼, 스펙트럼 계수, 서브대역, 분포, 대역할당, 음성, 오디오, 코덱

Description

스펙트럼 계수의 서브대역 할당 방법 및 장치{A method and apparatus for adaptive sub-band allocation of spectral coefficients}

본 발명은 스펙트럼 계수의 서브대역 할당 방법 및 장치에 관한 것으로, 특히 입력 음성/오디오 신호로부터 변환된 스펙트럼 계수들의 분포에 따라 서브 대역의 크기를 결정하여 서브 대역 단위로 양자화를 수행하는 스펙트럼 계수의 서브대역 할당 방법 및 장치에 관한 것이다.

본 발명은 지식경제부 및 정보통신연구진흥원의 IT성장동력기술개발의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2008-S-011-01, 과제명: FMC 어커스틱 융합코덱 및 제어기술 연구(표준화연계)].

아날로그 음성 신호는 표본화(sampling), 양자화(quantization) 과정을 거쳐 PCM(Pulse Code Modulation) 신호로 변환된다. 이러한 신호 변환은 처리하는 데에 많은 용량이 요구되고, 큰 용량으로 인하여 저장, 전송, 재생에 어려움이 따른다.

그에 따라 PCM 신호를 압축, 복원하기 위해 많은 음성/오디오 코덱(codec)들이 개발되었다.

300Hz~3,400Hz 대역의 음성을 복부호화하는 협대역 코덱의 경우, 음성 발생 과정을 모델링 하는 LPC(Linear Prediction Coefficient) 기술에 기반을 두어 높은 압축률을 이룬다.

또한 광대역(50 ∼ 7,000Hz), 초광대역(50 ∼ 14,00Hz), 전대역(20 ~ 22,000Hz) 음성/오디오 코덱은 입력 신호를 시간 영역에서 주파수 영역으로 변환하여 양자화 하는 방법을 사용한다.

대표적으로 사용되는 주파수 영역 변환은 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), DFT(Discrete Fourier Transform), MDCT(Modified Discrete Cosine Transform) 변환 등이 있다.

MPEG 오디오 코덱들에서는 심리음향(Psychoacoustic) 모델을 이용하여 비트를 할당하고 스펙트럼 계수를 양자화하는 방식을 취하고, G.729.1과 G.711.1과 같은 코덱에서는 스펙트럼 계수를 고정된 크기의 서브대역에 나누어 서브대역에서 이득(gain)을 스칼라 양자화, 모양(shape)을 벡터 양자화하는 방식을 취한다.

그러나, 상기와 같이 기존의 고정된 서브대역을 이용하여 스펙트럼 계수를 할당 방식은 서브대역의 스펙트럼 분포가 특정 계수에서 클 경우 벡터 양자화로 정확한 표현을 하는데 한계가 있어 음질 열화가 발생하는 문제점이 있다.

또한, 스펙트럼 분포가 대체로 고른 경우에는 고정된 서브대역 이용 시 비트 분배가 비효율적인 문제가 있고, 신호에 비해 과다한 연산이 수행되는 등의 문제점이 있어 개선이 요구되고 있다.

본 발명의 목적은, 입력되는 음성 또는 오디오 신호로 변환 시, 신호변환에 따른 스펙트럼 계수들의 분포에 대응하여 서브 대역의 크기를 결정하고, 서브 대역 단위로 양자화를 수행함으로써, 스펙트럼 계수의 분포에 따라 서브대역의 크기가 가변 되므로 양자화를 단위가 변경되므로 보다 정교한 양자화가 가능하고, 그에 따라 신호의 품질이 향상되는 스펙트럼 계수의 서브대역 할당 방법 및 장치를 제공하는데 그 목적이 있다.

상기한 과제를 해결하기 위한 본 발명에 따른 스펙트럼 계수의 서브대역 할당 방법은 오디오 신호로부터 변환된 스펙트럼 계수를 각 대역에 할당하는 단계, 상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 단계, 짧은 서브대역 허용 시, 상기 스펙트럼 계수들의 분포에 대응하여, 각 대역에 대한 서브대역의 유형을 결정하는 단계, 및 상기 각 대역 별 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하고, 상기 서브대역 별로 양자화 하여 비트스트림(Bit stream)을 출력하는 단계를 포함한다.

상기 짧은 서브대역 허용 여부 결정단계는, 상기 스펙트럼 계수에 대한 평탄도(Spectral flatness)를 측정하여, 상기 평탄도가 기 설정된 기준값 보다 작은 경우 짧은 서브대역을 허용하고, 상기 기준값은, 0.3 내지 0.6 범위 내에서 설정되는 것을 특징으로 한다. 또한, 짧은 서브대역이 기본 서브대역으로 설정되거나 입력데이터에 의해 선택되는 경우 짧은 서브대역을 허용한다.

상기 서브대역 유형 결정단계는, 각 대역 별로 상기 스펙트럼 계수의 분포를 산출하고, 상기 스펙트럼 계수의 크기가 고른 분포를 갖는 대역에서는 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역에서는 짧은 서브대역이 사용되도록 설정하는 하는 것을 특징으로 하며, 상기 스펙트럼 계수의 분포는 상기 스펙트럼 계수에 대한 평탄도, 상기 스펙트럼 계수의 최대값과 평균값을 비율, 상기 스펙트럼 계수의 최대값에 대한 미분값 중 적어도 하나를 이용하여 산출하는 것을 특징으로 한다.

또한, 본 발명에 따른 스펙트럼 계수의 서브대역 할당 장치는 오디오 신호를 주파수 대역의 스펙트럼 계수로 변환하는 주파수 변환부. 대역 별 상기 스펙트럼 계수를 할당하고 상기 스펙트럼 계수의 평탄도와 분포를 산출하여, 대역 별 서브대역의 유형을 설정하고 상기 스펙트럼 계수를 할당하는 대역설정부 및 상기 서브대역 별로, 상기 스펙트럼 계수의 이득 및 모양을 산출하여 양자화 하여 비트스트림(Bit stream)을 출력하는 양자화부;를 포함하는 서브대역 할당 장치를 포함한다.

또한, 상기 대역 설정부는 상기 스펙트럼 계수들을 각 대역에 균등하거나 로그스케일로 할당하는 대역할당부, 상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 짧은 서브대역 허용결정부, 상기 스펙트럼 계수의 분포에 대응하여, 상기 스펙트럼 계수의 분포가 고른 분포를 갖는 대역의 경우 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역의 경우 상기 짧은 서브대역이 사용되도록 서브대역의 유형의 결정하는 서브대역 유형 결정부 및 상기 각 대역에 할당된 상기 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하는 서브대역 할당부를 포함한다.

본 발명에 따르면, 스펙트럼 계수의 서브대역 할당 방법 및 장치는, 음성 또는 오디오신호 변환 시 스펙트럼 계수의 분포에 따라, 서브대역의 크기를 변경하여 서브대역 단위로 양자화를 수행함으로써, 계수의 크기에 따른 편차가 큰 경우 짧은 서브대역을 이용한 정교한 양자화가 가능하고, 편차가 적은 경우 큰 서브대역을 설정하여 불필요한 연산을 감소시켜, 비트를 효율적으로 분배하고 시스템의 효율이 향상됨과 동시에 보다 정교한 양자화를 통한 신호품질 및 그에 따른 음질이 크게 향상되는 효과가 있다.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 설명하면 다음과 같다.

도 1 은 본 발명의 일실시예에 따른 오디오신호의 신호변화에 따른 대략적인 흐름이 도시된 흐름도이다.

본 발명은 도 1에 도시된 바와 같이, 음성 등의 오디오신호가 입력되는 경우, 도1의 (a)와 같이 이를 변환하여 비트스트림을 생성하고, 도 1의 (b)와 같이 비트스트림을 오디오신호로 역변환하는 경우, 변환과정에서 신호의 스펙트럼 계수를 이용하여 서브대역을 설정하고, 설정된 서브대역에 스펙트럼 계수를 할당하여 양자화가 수행되도록 한다.

스펙트럼 계수의 서브대역 할당 장치에서 음성 또는 오디오 신호를 주파수 영역에서 부호화 하는 부호화기는 음성/오디오 입력신호를 주파수 영역에서 부호화하고, 주파수 변환부를 통해 스펙트럼 계수를 획득한다. 이때, 획득한 스펙트럼 계 수를 양자화를 수행하면 비트스트림(bit stream)을 얻는다.

한편, 스펙트럼 계수의 서브대역 힐당 장치에서 복호화기는 비트스트림으로부터 음성 또는 오디오 입력 신호를 복원하는데, 역양자화 시 비트스트림으로부터 스펙트럼 계수를 획득하고 역변환부를 통해 출력 신호를 생성한다.

본 발명의 스펙트럼 계수의 서브대역 할당을 수행하는 장치는 예를 들어 음향입출력장치, 휴대전화기, 이동단말기, 컴퓨터 등이 사용될 수 있으나, 그외 에도 음성 또는 오디오 신호를 변환하여 출력하거나 송수신하는 기기라면 어느 것에나 적용 가능하다.

서브대역 할당 장치는 주파수 변환 후, 변환계수를 이용하여 양자화를 수행하는 경우, 양자화를 수행할 신호의 주파수 대역에서 서브대역을 설정하여 서브대역 별로, 대역의 스펙트럼 계수를 서브대역에 할당하여 각 서브대역 단위로 양자화가 수행되도록 한다.

이때, 서브대역 할당 장치는 주파수 영역에서 스펙트럼 계수의 분포에 따라 서브대역의 크기를 상이하게 하여, 스펙트럼 계수의 분포가 고른 경우와, 고르지 않고 그 크기의 차가 큰 경우 각각 서브대역이 상이하게 설정되도록 한다.

서브대역 할당 장치는 스펙트럼 계수의 분포가 고른 경우에는 신호의 품질 열화가 적게 발생되므로, 긴 서브대역을 설정하고, 스펙트럼 계수의 포가 고르지 않고 각 계수의 값의 편차가 큰 경우에는, 양자화 시 그에 따른 품질 열화가 발생하게 되므로, 짧은 서브대역을 설정하여 짧은 서브대역 단위로 양자화를 진행하여 고품질의 비트스트림이 출력되도록 한다.

이때, 서브대역 할당 장치는 짧은 서브대역에 대해서, 짧은 서브대역의 허용 여부를 먼저 설정한 후, 짧은 서브대역의 사용이 허용된 경우에 한하여, 짧은 서브대역을 설정하고 짧은 서브대역에 스펙트럼 계수를 할당한다.

상기와 같이 스펙트럼 계수의 분포에 따라 서브대역을 상이하게 하여 신호를 변환하는 것은 비트스트림을 오디오 신호로 역변환하는 경우에도 적용될 수 있다.

도 2 는 본 발명의 일실시예에 따른 서브대역 할당 장치의 구성에 대한 설명에 참조되는 블록도이다.

스펙트럼 계수를 서브대역에 할당하는 데 있어서 서브대역 할당장치는 도 2에 도시된 바와 같이, 오디오신호입력부(110), 주파수 변환부 (120), 대역설정부(130), 양자화부(140), 비트스트림 전송부(150) 그리고, 상기와 같은 구성에 대한 동작 전반을 제어하는 제어부(200)를 포함한다.

여기서, 도 2는 입력되는 음성 또는 오디오 신호를 비트스트림으로 변환함으로써 신호를 부호화하는 구성을 포함하나, 그 외 구성을 더 포함하나, 본 발명이 요지를 흐리는 구성에 대하여 그에 대한 설명은 생략하기로 한다.

오디오 신호입력부(110)는 아날로그의 음성 또는 소정의 음향이 입력되면 이를 전기적 신호로 변환하여 제어부(901)로 인가한다. 이때, 오디오 신호입력부(110)는 마이크 등의 오디오 신호 입력장치가 사용될 수 있으나, 이에 한정되지 않으며 외부로부터 음성 또는 오디오 신호를 입력받거나 전송받는 장치 또한 포함될 수 있다.

주파수변환부(120)는 제어부(200)의 제어명령에 대응하여 오디오 신호 입력 부(110)를 통해 입력된 오디오 신호를 주파수 영역의 신호로 변환하고, 그에 따라 스펙트럼 계수를 생성한다.

제어부(200)는 오디오 신호의 입출력을 제어하고, 부호화기에 의해 생성된 비트스트림이 비트스트림 전송부(150)를 통해 전송되도록 제어한다. 이때, 제어부9200)는 신호변환 과정에서, 각 부에서 소정의 동작이 수행되도록 제어명령을 인가하고, 각 구의 결과물이 지정된 부로 인가되도록 데이터의 흐름을 제어한다.

대역설정부(130)는 주파수변환부(120)의 의해 오디오 신호가 주파수 영역의 신호로 변환되면, 스펙트럼 계수를 대역에 할당하고, 스펙트럼 계수의 분포를 분석하여 각 대역에 대한 서브대역을 설정한다.

이때, 대역설정부(130)는 짧은 서브대역 허용 결정부(131), 대역할당부(132), 서브대역 유형 결정부(133) 그리고 서브대역 할당부(134)를 포함한다.

짧은 서브대역 허용 결정부(131)는 입력된 오디오 신호로부터 짧은 서브대역의 사용을 허용할 것인지를 결정한다.

짧은 서브대역 허용 결정부(131)는 스펙트럼 계수에 대한 스펙트럼 평탄(spectral flatness)(이하, ‘평탄도’)를 측정하고, 측정된 평탄도가 기준값 보다 작은 경우 짧은 서브대역을 허용하고, 기준값보다 평탄도가 큰 경우 짧은 서브대역을 허용하지 않는다.

짧은 서브대역 허용 결정부(131)는 다음 수학식1에 따라 스펙트럼 계수에 대한 평탄도(SF)를 산출한다.

이때, 평탄도에 대한 기준값은 0.3 내지 0.6범위 내에서 설정될 수 있다.

또한, 짧은 서브대역 허용 결정부(131)는 짧은 서브대역이 기본 서브대역으로 설정되거나 입력데이터에 의해 선택되는 경우 짧은 서브대역을 허용한다.

대역할당부(132)는 오디오 신호로부터 변환된 스펙트럼 계수들을 각 대역에 할당한다. 이때. 대역할당부(132)는 각 대역에 스펙트럼 계수를 할당함에 있어서 대역별로 균등하게 할당하거나, 인간의 청각적 특성을 반영하여 Bark 스케일로 할당할 수 있다.

예를 들어, 대역할당부(132)는 균등하게 할당하는 경우, 320개의 MDCT (Modified Discrete Cosine Transform) 계수가 있고 16개의 대역이 있을 경우, 균등하게 한 대역에 20개의 MDCT 계수를 할당하는 방식을 사용할 수 있다. 또한, 대역의 개수는 한 개일 수도 있다.

서브대역 유형 결정부(133)는 스펙트럼 계수들의 분포에 따라 각 대역에서 짧은 서브대역을 사용할 것인지 긴 서브대역을 사용할 것인지 설정하여, 결정된 서브대역이 사용되도록 설정한다.

서브대역 유형결정부(133) 계수들의 크기가 고른 분포를 보이는 대역에서는 대역의 길이가 긴 서브대역이 사용되도록 설정하고, 특정 계수들의 크기가 큰 분포를 보이는 대역에서는 짧은 서브대역이 사용되도록 설정한다. 즉, 서브대역 유형결정부(133)는 스펙트럼 계수의 크기에 대하여 편차가 작아서 고른 분포를 나타내는 경우에는 긴 서브대역이, 스펙트럼 계수의 크기가 다양하여 그에 대한 편차가 큰 경우에는 짧은 서브대역이 사용되도록 설정한다.

서브대역 유형결정부(133)는 그 대역의 평탄도(Spectral flatness)를 측정하거나, 스펙트럼 계수의 최대값과 평균값을 비교하거나, 최대값의 미분값을 구하여 스펙트럼 계수의 분포를 측정할 수 있다.

서브대역 유형 결정부(133)는 상기와 같은 방식 중, 최대값과 평균값의 비교를 통해 분포를 측정하는경우 다음 수학식 2과 같이 분포를 측정한다.

서브대역 유형 결정부(133)는 최대값에 대한 평균값의 비율이 기준값 보다 작은 경우 긴 서브대역을 사용하고, 큰 경우 짧은 서브대역이 사용되도록 한다.

서브대역 할당부(134)는 서브대역 유형 결정부(133)에 의해 서브대역의 크기가 결정되면, 각 대역의 스펙트럼 계수들을 각 서브대역에 할당한다.

예를 들어, 서브대역 할당부(134)는 하나의 대역에 20개의 계수가 균등 할당 된 경우, 하나의 짧은 서브대역에 5개의 계수로 구성되고, 짧은 서브대역이 4개로 구성될 수 있다.

양자화부(140)는 주파수변화부(120)에 의해 변환된 신호를 대역설정부(130)에 의한 서브대역 설정 및 서브대역에 대한 스펙트럼 계수 할당에 따라 양자화를 수행하여 비트스트림을 생성한다.

양자화부(140)는 이득양자화부(141) 및 벡터양자화부(142)를 포함한다. 양자화부(140)는 양자화 방식에 따라 구분한 것으로 다른 양자화 방법이 사용되는 경우 그에 따른 양자화부가 구비된다.

이득양자화부(141)는 서브대역 스펙트럼 계수들의 이득(gain)을 산출하고, 산출된 이득을 이용하여, 서브대역 단위로 양자화를 수행한다. 이때, 이득양자화부(141)는 로그스케일로 스칼라 양자화한다.

이때, 계수의 이득은 다음 수학식 3에 의해 산출될 수 있다.

벡터양자화부(142)는 서브대역 스펙트럼 계수들에 대한 모양(shape)을 산출하고, 그 산출된 모양에 따라 양자화를 수행한다. 벡터양자화부(142)는 산출된 서브대역 스펙트럼 계수들을 이득으로 정규화하여 모양(shape)을 산출한 후, 사전에 트래이닝 데이터(training data)로 부터 획득한 테이블을 이용하여 벡터 양자화 수 행한다.

비트스트림 전송부(150)는 양자화부(140)에 의한 양자화가 완료되면, 양자화부(140)로부터 출력되는 비트 스트림을 소정 장치로 전송한다.

도 3 은 본 발명의 일실시예에 따른 서브대역 할당 장치의 또 다른 구성에 대한 설명에 참조되는 블록도이다.

스펙트럼 계수를 서브대역에 할당하는 데 있어서 서브대역 할당장치는 도 3에 도시된 바와 같이 구성될 수 있다.

서브대역 할당 장치의 또 다른 예는 전술한 도 2와 같이, 오디오신호입력부(110), 주파수 변환부(120), 대역설정부(130), 양자화부(140), 비트스트림 전송부(150) 그리고, 상기와 같은 구성에 대한 동작 전반을 제어하는 제어부(200)를 포함하고, 비트스트림을 오디로 신호로 역변환 하기 위한 구성을 더 포함한다.

여기서, 전술한 도 2의 서브대역 할당 장치와 동일 구성에 대하여 동일 명칭 및 동일 부호를 사용하였으며, 그에 대한 설명은 하기에서 생략하기로 한다.

서브대역 할당 장치의 또 다른 예는 비트스트림 수신부(160), 역양자화부(170), 역변환부(180), 오디오신호 출력부(170)를 포함한다. 이때, 대역설정부(130)는 서브유형 복호화부(135)를 더 포함한다.

비트스트림 수신부(160)는 외부 또는 다른 장치로부터 비트스트림 데이터를 수신한다.

대역설정부(130) 중 서브유형 복호화부(135)는 짧은 서브대역 허용 결정부(131)에 의해 짧은 서브대역의 허용 여부가 결정되면, 그에 대응하여 복호화에 따른 서브유형 복호화에 서브대역의 크기를 반영한다.

서브유형 복호화부(135)는 수신된 비트스트림에 대한 서브유형 복호화를 수행하여 역양자화부(170)로 인가한다.

역양자화부(170) 비트스트림으로부터 스펙트럼 계수를 산출하여 역변환부(180)로 인가하는데, 이득 역양자화부(171)와, 벡터역양자화부(172)를 포함한다.

이득역양자화부(171)는 이득값을 산출하여 비트스트림을 역양자화하고, 벡터영양자화부(172)는 모양에 따라 역양자화를 수행한다. 여기서, 부호화기의 양자화부(140)의 양자화 방식에 대응하여 역양자화부(170)가 구성될 수 있으나, 경우에 따라 상이한 방식이 사용될 수 있다.

역변환부(180)는 주파수 영역의 신호를 역변환 함으로써, 오디오신호를 출력한다.

오디오신호 출력부(170)는 역변환부(180)에 변환처리된 오디오신호를 인가받아 외부로 출력한다. 이때, 오디오신호 출력부(170)는 스피커 등이 사용될 수 있다.

서브대역 할당 장치는 신호의 부호화 시 스펙트럼 계수의 분포에 따라 서브대역을 설정하고 서브대역별로 양자화를 수행하는데, 신호의 복호화시에도 스펙트럼의 계수 분포에 따른 특성을 이용하여 복호화를 수행할 수 있다.

도 4 는 본 발명의 일실시예에 따른 스펙트럼 계수의 분포에 따른 서브대역 및 서브대역에 할당되는 스펙트럼 계수에 대한 설명에 참조되는 도이다.

예를 들어, 도4의 (a)와 같이 하나의 대역에 20개의 계수가 할당된 경우, 도 4의 (b)와 같이 복수의 짧은 서브대역이 설정되거나, 도 4의 (d)와 같이 긴 서브대역이 설정되다. 이때, 도 4의 (c)와 같이 서브대역이 설정될 수도 있으며, 각각 서브대역의 크기는 시스템, 스펙트럼 계수의 분포에 따라 상이하게 설정될 수 있다

하나의 대역에 20개의 계수가 할당된 상태에서, 4개의 짧은 서브대역이 사용되는 경우 각각의 서브대역에는 5개의 계수가 할당된다. 2개의 서브대역이 사용되는 경우에는 각각 10개씩 계수가 할당된다.

도 5 는 본 발명의 일실시예에 오디오 신호의 신호변환 시, 서브대역의 스펙트럼 계수 할당 방법에 대한 동작설명에 참조되는 순서도이다.

오디오 신호가 입력되면(S310), 제어부(200)는 입력된 오디오 신호를 주파수변환부(120)로 인가하고, 주파수 변환부(120)는 입력된 오디오신호를 주파수 영역의 신호로 변환한다(S320).

이때, 대역 할당부(132)는 오디오 신호의 변환에 의해 생성된 스펙트럼 계수를 각각의 대역에 할당한다(S330). 대역할당부(132)는 스펙트럼 계수를 대역에 할당하는 데 있어서, 대역에 스펙트럼 계수를 균등하게 할당하거나 음성 특성에 기반하여 로그스케일로 할당 할 수 있다.

짧은 서브대역 혀용 결정부(131)는 각 대역에 대하여 스펙트럼 계수의 분포를 측정하고 그에 대응하여 짧은 서브대역의 허용 여부를 결정한다.

짧은 서브대역 허용 결정부(131)는 스펙트럼 계수에 대한 평탄도를 산출하고, 평탄도를 기준값과 비교하여(S340), 평탄도가 기준값보다 작은 경우 짧은 서브대역을 허용하고(S350), 평탄도가 기준값 보다 큰 경우에는 짧은 서브대역을 허용 하지 않는다(S380). 경우에 따라 짧은 서브대역이 기본 서브대역으로 설정되거나 입력데이터에 의해 선택되는 경우 짧은 서브대역을 허용한다.

짧은 서브대역 허용 시, 서브대역 유형 결정부(133)는 각 대역에 대하여 스펙트럼 계수의 분포를 산출하고 스펙트럼 계수의 분포의 고른 정도에 따라 서브대역의 크기를 설정한다(S360).

즉, 계수의 크기가 고른 분포를 갖는 경우, 서브대역 유형 결정부(133)는 짧은 서브대역이 사용되도록 설정하고(S370), 스펙트럼 계수의 크기가 고르지 않고 큰 분포를 갖는 경우에는 긴 서브대역이 사용되도록 설정한다(S390).

한편, 평탄도가 기준값 보다 큰 경우, 서브대역 유형 결정부(133)는 짧은 서브대역이 허용되지 않도록 설정하고(S380)고, 긴 서브대역이 사용되도록 설정한다(S390). 이때, 하나의 대역이 복수의 짧은 서브대역으로 분할되거나, 긴 서브대역으로 분할될 수 있다.

서브대역 할당부(134)는 각 대역 별 서브대역의 크기가 결정되면, 각 대역 별로 포함하는 스펙트럼 계수를 각 서브대역에 할당한다(S400).

서브대역에 대한 스펙트럼 할당이 완료되면, 이득양자화부(141)는 서브대역 단위로 이득을 산출하고(S410), 이득을 이용하여 양자화를 수행한다(S420). 벡터양자화부(142)는 서브대역 별 스펙트럼 계수의 모양을 산출하고(S430) 그에 따라 벡터 양자화를 수행한다(S440).

양자화가 완료되면 비트스트림이 출력되고(S450), 제어부(110)는 비트스트림을 비트스트림 전송부(150)로 인가하여 지정된 목적지로 전송되도록 제어한다.

따라서 본 발명은 상기와 같이 스펙트럼 계수의 분포에 따라 서브대역의 크기를 상이하게 하여 서브대역 단위로 양자화를 수행함으로써, 종래의 균일한 서브대역을 이용한 양자화로 인한 음질 열화를 최소화하여 향상된 품질을 제공한다.

또한, 본 발명은 스펙트럼 계수들의 크기가 고른 분포를 보이는 대역에서는 큰 서브대역을 사용하고 특정 계수들의 크기가 큰 분포를 보이는 대역에서는 작은 서브대역을 사용하여 비트를 효율적으로 분배할 수 있다.

이상과 같이 본 발명에 의한 스펙트럼 계수의 서브대역 할당 방법 및 장치는 예시된 도면을 참조로 설명하였으나, 본 명세서에 개시된 실시예와 도면에 의해 본 발명은 이에 한정되지 않고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 응용될 수 있다.

도 1 은 본 발명의 일실시예에 따른 오디오신호의 신호변화에 따른 대략적인 흐름이 도시된 흐름도,

도 2 는 본 발명의 일실시예에 따른 서브대역 할당 장치의 구성에 대한 설명에 참조되는 블록도,

도 3 은 본 발명의 일실시예에 따른 서브대역 할당 장치의 또 다른 구성에 대한 설명에 참조되는 블록도,

도 4 는 본 발명의 일실시예에 따른 스펙트럼 계수의 분포에 따른 서브대역 및 서브대역에 할당되는 스펙트럼 계수에 대한 설명에 참조되는 도,

<도면의 주요 부분에 관한 부호의 설명>

120: 주파수변환부 130: 대역설정부

131: 짧은 서브대역 허용 결정부 132: 대역할당부

133: 서브대역 유형 결정부 134: 서브대역 할당부

140: 양자화부 141: 이득양자화부

142: 벡터양자화부 200: 제어부

Claims

오디오 신호로부터 변환된 스펙트럼 계수를 각 대역에 할당하는 단계;

상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 단계;

짧은 서브대역 허용 시, 상기 스펙트럼 계수들의 분포에 대응하여, 각 대역에 대한 서브대역의 유형을 결정하는 단계; 및

상기 각 대역 별 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하고, 상기 서브대역 별로 양자화 하여 비트스트림(Bit stream)을 출력하는 단계를 포함하는 서브대역 할당 방법.
제 1 항에 있어서,

상기 짧은 서브대역 허용 여부 결정단계는, 상기 스펙트럼 계수에 대한 평탄도(Spectral flatness)를 측정하여, 상기 평탄도가 기 설정된 기준값 보다 작은 경우 및 짧은 서브대역이 입력데이터에 의해 선택되거나 기본 서브대역으로 설정된 경우 중 어느 하나의 경우, 상기 짧은 서브대역을 허용하는 것을 특징으로 하는 서브대역 할당 방법.
제 2 항에 있어서,

상기 짧은 서브대역 허용 여부 결정단계는, 상기 평탄도가, 0.3 내지 0.6 범위 내에서 설정된 기준값 보다 작은 경우 짧은 서브대역을 허용하는 것을 특징으로 하는 서브대역 할당 방법.
제 1 항에 있어서,

상기 서브대역 유형 결정단계는, 각 대역 별로 상기 스펙트럼 계수의 분포를 산출하고, 상기 스펙트럼 계수의 크기가 고른 분포를 갖는 대역에서는 긴 서브대역이 사용되도록 설정하고,

상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역에서는 짧은 서브대역이 사용되도록 설정하는 것을 특징으로 하는 서브대역 할당 방법.
제 4 항에 있어서,

상기 서브대역 유형 결정단계는, 각 대역 별 할당된 상기 스펙트럼 계수에 대한 평탄도를 측정하여 상기 스펙트럼 계수의 분포를 산출하는 방법, 상기 스펙트럼 계수의 최대값과 평균값을 비교하여 상기 스펙트럼 계수의 분포를 산출하는 방법 및 상기 스펙트럼 계수의 최대값에 대한 미분값을 연산하여 상기 스펙트럼 계수의 분포를 산출하는 방법 중 적어도 하나를 이용하여 상기 스펙트럼 계수의 분포를 산출하는 것을 특징으로 하는 서브대역 할당 방법.
제 5 항에 있어서,

상기 서브대역 유형 결정단계는, 상기 스펙트럼 계수의 최대값과 평균값을 이용하여 상기 스펙트럼 계수의 분포를 산출 하는 경우,

상기 최대값에 대한 평균값의 비율이 설정값보다 작은 경우 긴 서브대역이 사용되도록 설정하고, 상기 최대값에 대한 평균값의 비율이 설정값보다 큰 경우 짧은 서브대역이 사용되도록 설정하는 것을 특징으로 하는 서브대역 할당 방법.
제 1 항에 있어서,

상기 스펙트럼 계수를 상기 각 대역에 할당하는 단계는, 상기 각 대역에 균등하게 할당하는 방식 및 인간의 청각적 특성을 반영하여 바크(Bark)스케일로 할당하는 방식 중 적어도 하나의 방식을 이용하여 상기 스펙트럼 계수를 할당하는 것을 특징으로 하는 서브대역 할당 방법.
제 1 항에 있어서,

상기 양자화에 따른 비트스트림 출력단계는, 상기 서브대역의 스펙트럼 계수의 이득을 산출하여 로그스케일로 스칼라 양자화하고, 상기 서브대역의 스펙트럼 계수들의 모양(shape)을 구하여 사전에 트레이닝(training) 데이터로부터 구한 테이블로부터 벡터 양자화하는 것을 특징으로 하는 서브대역 할당 방법.
오디오 신호를 주파수 대역의 스펙트럼 계수로 변환하는 주파수 변환부;

대역 별 상기 스펙트럼 계수를 할당하고 상기 스펙트럼 계수의 평탄도와 분포를 산출하여, 대역 별 서브대역의 유형을 설정하고 상기 스펙트럼 계수를 할당하는 대역설정부; 및

상기 서브대역 별로, 상기 스펙트럼 계수의 이득 및 모양을 산출하여 양자화 하여 비트스트림(Bit stream)을 출력하는 양자화부;를 포함하는 서브대역 할당 장치.
제 9 항에 있어서,

상기 대역 설정부는 상기 스펙트럼 계수들을 각 대역에 균등하거나 로그스케일로 할당하는 대역할당부;

상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 짧은 서브대역 허용결정부;

상기 스펙트럼 계수의 분포에 대응하여, 상기 스펙트럼 계수의 분포가 고른 분포를 갖는 대역의 경우 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역의 경우 상기 짧은 서브대역이 사용되도록 서브대역의 유형의 결정하는 서브대역 유형 결정부; 및

상기 각 대역에 할당된 상기 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하는 서브대역 할당부;를 포함하는 서브대역 할당 장치.