KR0181061B1

KR0181061B1 - 적응 디지탈 오디오 부호화 장치 및 그의 비트 할당방법

Info

Publication number: KR0181061B1
Application number: KR1019950007286A
Authority: KR
Inventors: 김종일
Original assignee: 배순훈; 대우전자주식회사
Priority date: 1995-03-31
Filing date: 1995-03-31
Publication date: 1999-05-01
Also published as: KR960036723A

Abstract

입력 디지탈 오디오 신호를 적응적으로 부호화할 수 있는 신규한 장치는 상기 디지탈 오디오 신호의 각 서브밴드들에 대한 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들을 측정하는 제1측정기 ; 상기 입력 디지탈 오디오 신호의 각 프레임들에 대한 인지 정보량들을 상기 측정된 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들에 의거하여 측정하며, 상기 측정된 인지 정보량들에 대응하는 적어도 두 개 이상의 현재 빛 이전 프레임들을 포함하는 프레임 그룹에 대한 평균 및 표준 편차 파라메터들을 측정하는 제2측정기 ; 상기 각 서브밴드들에 대한 비트를 상기 측정된 신호대 마스크 비 데이터, 인지 정보량들, 그리고 평균 및 표준편차 파라메터들에 의거하여 적응적으로 결정하며, 상기 각 서브밴드들에 대해 결정된 비트에 상응하는 비트 할당 정보를 발생하는 비트 할당 수단과 ; 상기 필터된 각 서브밴드 오디오 신호를 상기 발생된 각 서브밴드에 대한 비트 할당 정보에 응답하여 양자화하는 양자기 ; 및 상기 양자화된 오디오 신호와 상기 발생된 비트 할당 정보들을 포맷하는 회로를 구비한다.

Description

적응 디지탈 오디오 부호화 장치 및 그의 비트 할당 방법

제1도는 본 발명에 따른 입력 디지탈 오디오 신호를 적응적으로 부호화 하는 신규한 장치 및 비트 할당 방법을 개략적으로 예시하는 도면.

제2도는 제1도에 도시된 제1비트 할당 유니트의 상세 블럭도.

* 도면의 주요부분에 대한 부호의 설명

10 : 서브밴드 필터링 디바이스

20, 30 : 제1 및 제2인지 파라메터 측정기

40, 50 : 제1 및 제2비트 할당 유니트

60 : 양자기 70 : 포맷팅 회로

본 발명은 디지탈 오디오 부호화 방법 및 그의 장치에 관한 것으로, 특히, 다수개의 프레임들을 갖는 입력 디지탈 오디오 신호를 인간이 청각특성에 부합하는 프레임들의 인지 정보량들에 의거하여 적응적으로 부호화하는 개선된 적응 디지탈 오디오 부호화 장치 및 그의 비트 할당 방법에 관한 것이다.

콤팩트 디스크(Compact Disk : CD) 및/또는 디지탈 오디오 테이프(Digital Audio Tape : DAT)플레이어와 같은 고음질을 달성하기 위해 디지탈화된 오디오 신호들을 전송한다. 오디오 신호가 디지탈 형태로 표현되어, 특히 고화질 텔레비젼(HDTV)에 사용될 때, 상당한 양의 데이터가 전송된다. 그러나, 오디오 신호에 할당된 가용한 대역폭은 제한되어 있기 때문에, 상당한 양, 예를들어, 48KHz로 샘플링된 16비트 펄스 부호 변조(PCM) 오디오 신호, 즉, 초당 768Kbits의 데이터를 제한된 오디오 대역, 예를들어, 약 128KHz로 전송하기 위해서는 압축해야 된다.

다양한 오디오 압축 디바이스들 또는 기법들중에서, HDTV 응용을 위해 심리음향 알고리즘(Psychoacoustic Algorithm)을 사용하는 소위 MPEG(Moving Pictures Expert Group)-오디오 알고리즘이 제안되어 왔다.

MPEG-오디오 알고리즘은 서브밴드 샘플링, 심리음향 알고리즘, 양자화 및 부호화 그리고 프레임 포맷팅과 같은 4가지 주요 구성요소로 이루어져 있다. 서브 밴드 필터링은 입력 PCM 오디오 신호를 시간영역에서 주파수 영역으로 매핑하는 프로세스이다. B개(예를들면, 32) 서브밴드를 갖는 필터뱅크(Filter Bank)가 사용될 수도 있다. 각각의 서브밴드에서, 12또는 36샘플들이 그룹되어 처리되며, B개의 서브밴드로 부터의 그룹된 샘플들, 즉, B x 12 또는 36 샘플들이 한 프레임으로 구성된다. 각각의 프레임은 오디오 신호를 부호화, 전송 및 복호화하기 위한 처리 단위이다. 심리음향 모델링은 각각의 서브밴드 또는 서브샘플군에 대해, 양자화 및 부호화의 처리를 제어하기 위해 데이터, 예를들면, 신호대 마스크 비(Signal-to-Mask Ratio : SMR) 데이터의 세트를 생성한다. 그 다음에, 서브밴드 샘플들을 양자화 및 부호화는 단계에서, 생성된 SMR 데이터를 참조하여 가용한 비트를 한 프레임의 각각의 서브밴드에 적응적으로 할당하여 양자화 한다. 프레임 포맷은 프레임 데이터를 다른 필요한 부가정보와 함께 적절한 형태로 포맷하여 전송한다.

그러나, 전술한 MPEG 오디오 기법은 각 프레임에 고정된 비트를 할당하기 때문에, 그기법에는 프레임들 사이에 연속적으로 변경될 수도 있는 입력 디지탈 오디오 신호의 평균(Mean)들, 표준 편차(Standard Deviation)들, 인지 정보량(Perceptual Entropy) 들과 같은 통계적 특성을 반영할 수 없다는 문제점이 내재되어 있다.

따라서, 본 발명의 목적은 다수개의 프레임들을 갖는 입력 디지탈 오디오 신호를 인간의 청각특성에 부합하는 프레임들의 인지 정보량들에 의거하여 적응적으로 부호화하여 부호화 효율과 음질을 향상시키는 신규한 장치 및 그의 비트 할당 방법을 제공하는데 있다.

본 발명의 일 태양에 따르면, 다수개의 프레임들을 갖는 입력 디지탈 오디오 신호를 적응적으로 부호화하며, 상기 각각의 프레임은 다수개의 서브밴드들을 포함하는 장치로서, 상기 입력 디지탈 오디오 신호를 필터링하여 다수개의 서브밴드 단위로 분할하는 수단과 ; 상기 입력 디지탈 오디오 신호의 각 서브밴드들에 대한 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들을 측정하는 제1측정 수단과 ; 상기 측정된 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들에 의거하여 상기 입력 디지탈 오디오 신호의 각각의 프레임들에 대한 인지 정보량들을 측정하며, 상기 측정된 인지 정보량들에 대응하는 적어도 두 개 이상의 현재 및 이전 프레임들을 포함하는 프레임 그룹에 대한 평균 및 표준 편차 파라메터들을 측정하는 제2측정 수단과 ; 상기 측정된 신호대 마스크 비 데이터, 인지 정보량들, 그리고 평균 및 표준편차 파라메터들에 의거하여 상기 각각의 서브밴드들에 대한 비트를 적응적으로 결정하며, 상기 각 서브밴드들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 비트 할당 수단과 ; 상기 필터된 각 서브밴드 오디오 신호를 상기 발생된 각 서브밴드에 대한 비트 할당 정보에 응답하여 양자화하는 수단과 ; 및 상기 양자화된 오디오 신호와 상기 발생된 비트 할당 정보들을 포맷하는 수단을 구비한다.

본 발명의 다른 태양에 따르면, 다수개의 프레임들을 갖는 입력 디지탈 오디오 신호를 적응적으로 부호화하는데 이용하며, 상기 각각의 프레임은 다수개의 서브 밴드를 포함하는 비트 할당 방법으로서, 상기 방법은 : 상기 입력 디지탈 오디오 신호를 필터링하여 다수개의 서브밴드 단위로 분할하는 단계와 ; 상기 디지탈 오디오 신호의 각 서브밴드들에 대한 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들을 측정하는 단계와 ; 상기 입력 디지탈 오디오 신호의 각 프레임들에 대한 인지 정보량들을 상기 측정된 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들에 의거하여 측정하며, 상기 측정된 인지 정보량들에 대응하는 적어도 두 개 이상의 현재 및 이전 프레임들을 포함하는 프레임 그룹에 대한 평균 및 표준 편차 파라메터들을 측정하는 단계와 ; 상기 측정된 평균 및 표준편차 파라메터들에 의거하여 상기 프레임 그룹의 결정 레벨들을 측정하는 단계와 ; 상기 측정된 결정 레벨들, 상기 결정레벨들의 전체수, 상기 인지 정보량들 및 기설정된 평균 비트에 의거하여 상기 프레임 그룹의 각 프레임들에 대한 비트를 결정하며, 상기 각각의 프레임들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 단계와 ; 및 상기 측정된 신호대 마스크 비 데이터 및 상기 발생된 비트 할당 정보들에 의거하여 상기 각 프레임의 각각의 서브밴드들에 대한 비트들을 결정하며, 상기 각각의 서브밴드들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 단계를 포함한다.

본 발명의 상기 목적과 다른 목적 및 특징들은 첨부한 도면과 관련하여 제공된 바람직한 실시예를 설명하면 명백해 질 것이다.

제1도를 참조하면, 본 발명에 따른 적응 디지탈 오디오 부호화 장치 및 비트 할당 방법을 개략적으로 예시하는 블록도가 도시되어 있다.

적응 디지탈 오디오 부호화 장치는 서브밴드 필터링 디바이스(10), 제1 및 제2인지 파라메터 측정기 (20 및 30), 제1 및 제2 비트 할당 유니트(40 및 50), 양자기(60), 및 포맷팅 회로(70)를 포함한다.

N개(즉, n = 0,1,..,N-1, 여기서, N 은 양의 정수)의 샘플들을 포함하는 i번째 프레임, 또는 현재 프레임들의 입력 디지탈 오디오 신호(X(n))는 제1인지 파라메터 측정기(20) 및 서브밴드 필터링 디바이스(10)로 인가된다. 서브밴드 필터링 디바이스(10)는 입력 디지탈 오디오 신호의 서브밴드 필터링 동작을 수행한다. 본 명세서에서 사용된 프레임은 고정된 오디오 샘플들의 수에 상응하는 디지탈 오디오 신호의 일부분을 나타내며, 또한 디지탈 오디오 신호의 부호화 및 복호화를 위한 처리 단위이다.

도시된 바와같이, 서브밴드 필터링 디바이스(10)는 현재 프레임의 입력 디지탈 오디오 신호를 수신하여 본 기술 분야에 잘 알려진 서브밴드 필터링 기법, 예를들면, ISO/IEC JTCI/SC2/WG 11, Part 3, Audio Proposal, CD-11172-3(1991)에 기술된 소위 MPEG 오디오 알고리즘에 개시된 방법을 이용함으로써, 입력 디지탈 오디오 신호들의 필터링을 수행한다. 즉, 서브밴드 필터링 디바이스(10)는 샘플링 주파수(fs)를 갖는 입력 디지탈 오디오 신호를 샘플링 주파수(fs/B)를 갖는 B(예를들면, 32)개의 동일한 주파수 대역을 갖는 서브밴드로 분할하며, 분할된 서브밴드 오디오 샘플들을 양자기(70)로 제공한다.

한편, 제1인지 파라메터 측정기(20)는 현재 프레임의 입력 디지탈 오디오 신호들을 수신하여, 예를들면, MPEG 오디오 알고리즘에 논의된 심리 음향 모델을 이용하여 입력 디지탈 오디오 신호에 포함된 각각의 서브밴드들에 대한 신호대 마스크 비(SMR) 데이터, 음압 레벨(Sound Pressure Level)들, 마스킹 문턱치(Masking Threshold)들을 측정한다. 각 서브밴드에 대한 SMR 데이터는 다음과 같이 추출된다.

여기서, j는 서브밴드 인덱스(j = 0, 1,..,B-1)이고, B는 한 프레임에서의 전체 서브밴드 수이며, SMR(j)는 j번째 서브밴드에서의 신호대 마스크 비이고 ; P(j)는 고속 퓨리에 변환(Fast Fourier Transform) 기법으로 부터 측정된 j번째 서브밴드에서의 음압 레벨이며 ; M(j)_는 j번째 서브밴드에서의 마스킹 문턱치이며 ; 그리고, SMR(j), P(j) 및 M(j)의 단위는 모두 데시벨(dB)이다.

마스킹 문턱치는 가청 한계(Audible Limit)를 나타내는 것으로써, 고유의 가청 한계 또는 음의 문턱치와 오디오 신호의 다른 순음 및 비순음 성분들의 존재에 의해 발생된 증분과의 합을 나타낸다. 그 다음, SMR1(j) 데이터는 제 2 비트 할당 유니트(50)로 제공되는 반면에, P(j) 및 M(j)는 제2인지 파라메터 측정기(30)로 공급된다.

제2인지 파라메터 측정기(30)는 제1인지 파라메터 측정기(20)로 부터의 음압 레벨들 및 마스킹 문턱치들에 의거하여 i번째 프레임의 입력 디지탈 오디오 신호에 대한 인지 정보량(PE(i))을 측정한다. i번째 프레임의 입력 디지탈 오디오 신호에 대한 인지 정보량(PE(i))은, 본 기술 분야에 잘 알려져 있는 바와같이, 다음과 같이 나타낼 수도 있다.

여기서, i,j 및 B 는 상기에 정의된 바와같은 동일한 의미들을 갖는다. 식(2)은 소위 전송율 왜곡 이론(Rate Distortion Theory)을 적용함으로써 얻을 수 있으며, 인간의 청각 특성에 의거한 인지 정보량들에 일치한다. 그리고, 제2인지 파라메터 측정기(30)는 Q(예를들면, 4)개의 현재 및 그것의 이전 프레임들에 대해 측정된 인지 정보량들, 즉, PE(i), PE(i-1), PE(i-2) 및 PE(i-3)들을 그룹화함으로써, 제1도 및 제2도를 참조하여 이하에서 상세하게 설명될 제1비트 할당 유니트(40)의 처리에 따라 그룹된 프레임들간에 비트들을 적응적으로 할당할 수 있도록 하며, 또한, 프레임 그룹의 전체 인지 정보량을 이용하여 그들의 통계적 특성을 나타내는 평균(Mean ; PEm) 및 표준 편차(Standard Deviation ; PEstd) 파라메터들을 측정한다. 프레임 그룹의 전체 인지 정보량에 대한 평균 파라메터(PEm)는, 본 기술 분야에 잘 알려진 바와같이, 다음과 같이 얻을 수도 있다.

여기서, p(p = 0,1,..,Q-1)는 프레임 그룹에서 사용된 프레임 인덱스로써, Q는 상기 프레임 그룹의 전체 프레임수를 나타내며, 그리고 PE(p)는 프레임 그룹에서 p번째 프레임의 인지 정보량을 나타낸다.

그러므로, 프레임 그룹의 전체 인지 정보량들에 대한 표준 편차(PEstd)는, 본 기술 분야에 잘 알려진 바와같이, 다음과 같이 계산될 수도 있다.

여기서, p 및 Q는 상기에 정의된 바와같은 동일한 의미들을 갖는다.

제2인지 파라메터 측정기(30)에서 그룹화되고 측정된 p번째 프레임의 인지정보량(PE(p))과, 평균 및 표준편차 파라메터들(PEm 및 PEstd)은 제1비트 할당 유니트(40)로 인가된다. 제1비트 할당 유니트(40)는 제2인지 파라메터 측정기(30)로 부터의 p번째 프레임의 인지 정보량과 평균 및 표준편차 파라메터들에 의거하여 프레임 그룹에 포함된 각각의 프레임들에 대한 비트를 결정하며, 프레임 그룹의 각각의 프레임들에 대해 결정된 비트들에 상응하는 비트할당 정보(FBI)를 제2비트 할당 유니트(50) 및 포맷팅 회로(70)로 제공한다.

제2도를 참조하면, 제1도에 도시된 제1비트 할당 유니트(40)의 상세 블록도가 도시된다. 상기 제1비트 할당 유니트(40)는 결정 레벨 측정기(41), 감산기(42), 및 비트 할당 디바이스(43)를 포함한다.

결정 레벨 측정기(41)는, 비트 할당 디바이스(43)가 프레임 그룹에서의 각각의 프레임에 비트를 적응적으로 할당하기 위해, 제1도에 도시된 제2인지 파라메터 측정기(30)으로 부터의 평균 및 표준편차 파라메터들(PEm 및 PEstd)에 의거하여 프레임 그룹의 최적의 결정 레벨들을 측정한다. 본 발명의 바람직한 실시예에 있어서, 프레임 그룹의 k 번째 결정 레벨(D(k))은 다음과 같이 나타낼 수 있다.

여기서, k(k = -q~q)는 결정 레벨 인덱스이고, q는 양의 정수이며, 그리고 NF는 프레임 그룹에서 정규화 팩터(Factor)이다.

식(5)으로 부터 알수 있는 바와 같이, 프레임 그룹의 k번째 결정 레벨(D(k))과 (k-1)번째 결정 레벨(D(k-1))사이의 레벨 간격은 제2인지 파라메터 측정기(30)로 부터의 표준편차 파라메터(PEstd)와 프레임 그룹의 정규화 팩터(NF)에 의존하는데 반해, 결정 레벨들의 전체 수는 기설정된다. 결정 레벨들의 전체수는 부호화 장치의 부호화 효율과 음질에 의거하여 결정될 수 있다. 결정 레벨 측정기(41)에서 상용된 프레임 그룹의 정규화 팩터(NF)는 실제 인간의 청각 특성과 매우 부합하는 상기 프레임 그룹의 최적의 결정 레벨들을 추출하기 위해서 제2인지 파라메터 측정기(30)로 부터의 평균 및 표준편차 파라메터들과, 그것의 메모리(도시 안됨)에 사전저장된 글로벌(Global) 평균(PEgm)과 글로벌 표준편차 파라메터들의 평균(PEgstd)을 이용함으로써 바람직하게 결정될 수 있다. 글로벌 평균과 글로벌 표준편차들의 평균 파라메터들의 각각은 기설정된 기간 동안에 측정된 평균과 표준편차 파라메터들을 이용함으로써 용이하게 측정될 수가 있다. 본 발명의 바람직한 실시예에 있어서, 프레임 그룹의 정규화 팩터(NF)는 다음과 같이 결정될 수 있다.

식(6)에서 PEm과 PEstd는 상기 그룹에서 식(3)및 식(4)로 구한 인지 정보량이 평균 및 표쥰 편차이고 PEgm과 PEgstd는 장시간(예를 들어 4sec)동안의 PEm과 PEstd 의 평균값에 해당하는데, 오디오 신호의 이러한 장시간 특성은 일반적으로 일정하므로 사전에 자장된 값을 이용할수 있으며, 또는 이전의 PEm과 PEstd 을 장시간 동안의 평균을 구하여 사용할수도 있다.

식들 (5) 및 (6)로 부터 알 수 있는 바와 같이, 상기 프레임 그룹의 결정 레벨들은 평균 파라메터의 정수배로써 결정될 수 있음을 주목하자.

한편, 감산기(41)는 제2인지 파라메터 측정기(30)로 부터의 인지 파라메터(E(p))를 평균 파라메터(PEm)로 감산함으로써, 프레임 그룹에서 p번째 프레임의 편차신호(E(p))를 계산한다. 그 다음에, 결정 레벨 측정기(41)에서 측정되고 사전 결정된 결정 레벨(D(k)) 및 결정 레벨들의 전체 수(즉, 2q+1)는 비트 할당 디바이스(43)로 동시에 제공된다.

비트 할당 디바이스(43)는 프레임 그룹의 각 프레임 그룹에 대한 비트를, 결정 레벨 측정기(41)로 부터의 결정 레벨들과 결정 레벨들의 전체 수, 그리고 감산기(42)로 부터의 편차 신호에 의거하여 결정하며, 각 프레임에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 제1도에 도시된 제2비트 할당 유니트(50) 및 포맷팅 회로(70)로 각기 제공한다. 본 발명의 바람직한 실시예에 있어서, 프레임 그룹에서 p번째 프레임의 비트할당(FB(p))은 다음과 같이 결정 될 수 있다.

여기서, p는 상기에 정의된 바와같은 동일한 의미를 가지며, FBm은 프레임당 평균 비트(예를들면, 3072비트(즉, 샘플링 주파수가 48KHz, 오디오 데이터가 16-비트 PCM형태, 따라서 초당 128Kbits인 경우))이고, BV는 기설정된 비트 변동값을 나타내며, 2q+1은 기설정된 결정레벨들의 전체 수를 나타내며, 그리고 I는 p번째 프레임에서의 레벨 인덱스이다.

식(7)으로 부터 알 수 있는 바와같이, p번째 채널에 대한 비트할당(FB(p))은 평균비트(FBm)와 그것의 두 번째 항으로부터 계산된 가변비트를 가산함으로써 계산될 수 있다. 기설정된 비트 변동값(BV)은 식(7)에 정의된 바와같이 한 프레임에 대한 평균 비트값과 동일한 값으로 결정될 수 있으며, 프레임 그룹에서 p번째 프레임 에 대한 레벨 인덱스(I)는 결정 레벨 측정기(41)로 부터의 결정 레벨들(D(k))과 감산기(42)로 부터의 편차 신호(E(p))에 의거하여 결정될 수 있다. 본 발명의 바람직한 실시예에 있어서, 프레임 그룹에서 p번째 프레임 대한 레벨 인덱스(I)는 다음 테이블에 도시된 바와 같이 나타낼수도 있다(여기서, 결정 레벨들의 간격이 1.27, 그리고 결정 레벨 인덱스(k)는 -2~2로 가정되었음).

테이블로 부터 알수 있는 바와같이, 예를들어, 만일 편차신호(E(p))가 결정 레벨들(-2.55~-1.28)사이에 존재하면, p번째 프레임의 레벨 인덱스(I)는 -1로서 선택될 수 있으며, 그리고, 만일 편차신호가 결정 레벨들(-1.27~-1.26)사이에 있게 되면, 레벨 인덱스는 0로서 선택될 수 있다. 이와같은 방법으로, p번째 프레임의 비트 할당은 식(7)을 이용함으로써 유리하게 결정될 수 있다.

그 다음에, 비트 할당 유니트(45)에서, 프레임 그룹의 각 프레임에 대해 결정된 비트에 상응하는 비트 할당 정보(FBI)와 제1도에 도시된 제1인지 파라메터 측정기(20)로 부터의 신호대 마스크 비(SMR(j))는 제2비트 할당 유니트(50)로 동시에 제공되며, 그리고 비트 할당 정보는 상기 포맷팅 회로(70)로 제공된다.

제1도를 다시 참조하면, 제2비트 할당 유니트(50)는 제1인지 파라메터 측정기(20)로 부터 공급된 신호대 마스크 비와 제1비트 할당 유니트(40)로 부터 제공된 비트할당 정보를 수신하여, 프레임 그룹의 각 프레임에 포함된 각 서브밴드에 대한 비트를 결정하며, 각 서브밴드에 대해 결정된 비트에 상응하는 비트 할당 정보(SBI)를 양자기(60)와 포맷팅 회로(70)로 동시에 제공한다. 제2비트 할당 유니트(50)에서 사용된 프로세스 원리는, 제1비트 할당 유니트(40)로 부터 전송된 각 프레임에 대한 가용한 비트를 초과하지 않는 범위내에서 한 프레임에 대한 전체 신호대 마스크 비에 의거한다. 그 다음에, 제2비트 할당 유니트(50)로 부터의 각 서브밴드에 대한 비트 할당 정보(SBI)와 서브 밴드 필터링 디바이스(10)로 부터의 분할된 서브 밴드 오디오 샘플들은 양자기(60)로 동시에 제공된다.

양자기(60)는 서브밴드 필터링 디바이스(10)로 부터의 분할된 서브밴드 오디오 샘플들을 제2비트 할당 유니트(50)로 부터의 오디오 샘플들과 상응하는 비트할당 정보에 의거하여 적응적으로 양자화하여 포맷팅 회로(70)로 제공한다.

포맷팅 회로(70)에서, 양자기(60)로 부터의 양자화된 오디오 샘플들과 제1 및 제2비트 할당 유니트들(40 및 50)로 부터의 비트할당 정보들을 포맷화하고 그것의 전송을 위해 전송기(도시 안됨)로 전송함으로써, 입력 디지탈 오디오 신호의 부호화 효율과 음질을 향상시킬 수가 있다. 서브밴드 필터링 디바이스(10)의 원리와 기능, 제2비트 할당 유니트(50), 양자기(60) 및 포맷팅 회로(70)들은 MPEG 오디오 알고리즘에 논의된 그것들과 기본적으로 동일하다.

본 발명은 비록 특정 실시예를 참조하여 설명되었지만, 본 기술 분야에 통상의 지식을 가진자라면 첨부된 청구범위의 사상과 범주를 벗어남이 없이도 다양하게 변경하여 실시할 수 있음을 이해할 것이다.

Claims

다수개의 프레임들을 갖는 입력 디지탈 오디오 신호를 적응적으로 부호화하며, 상기 각각의 프레임은 다수개의 서브밴드들을 포함하는 장치로서 : 상기 입력 디지탈 오디오 신호를 필터링하여 다수개의 서브밴드 단위로 분할하는 수단과 ; 상기 입력 디지탈 오디오 신호의 각 서브밴드들에 대한 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들을 측정하는 제1측정 수단 ; 상기 측정된 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들에 의거하여 상기 입력 디지탈 오디오 신호의 각각의 프레임들의 인지 정보량들을 측정하며, 상기 측정된 인지 정보량들에 대응하는 적어도 두 개 이상의 현재 및 이전 프레임들을 포함하는 프레임 그룹에 대한 평균 및 표준편차 파라메터들을 측정하는 제2측정 수단과 ; 상기 측정된 신호대 마스크 비 데이터, 인지 정보량들, 그리고 평균 및 표준편차 파라메터들에 의거하여 상기 각각의 서브밴드들에 대한 비트를 적응적으로 결정하며, 상기 각 서브밴드들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 비트 할당 수단과 ; 상기 필터된 각 서브밴드 오디오 신호를 상기 발생된 각 서브밴드에 대한 비트 할당 정보에 응답하여 양자화하는 수단과 ; 및 상기 양자화된 오디오 신호와 상기 발생된 비트 할당 정보들을 포맷하는 수단을 구비하는 적응 디지탈 오디오 부호화 장치.
제1항에 있어서, 상기 비트할당 수단은 : 상기 측정된 평균 및 표준편차 파라메터들에 의거하여 상기 프레임 그룹에 대한 결정 레벨들을 측정하는 수단과 ; 상기 측정된 각 인지 정보량과 상기 평균 파라메터간에 편차를 나타내는 편차 신호를 발생하는 수단과 ; 상기 측정된 결정 레벨들, 상기 결정 레벨들의 전체 수, 상기 인지 정보량들 및 기설정된 평균 비트에 의거하여 상기 프레임 그룹의 각 프레임들에 대한 비트를 결정하며, 상기 각 프레임들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 제1비트 할당 수단과 ; 및 상기 측정된 신호대 마스크 비 데이터 및 상기 발생된 비트 할당 정보들에 의거하여 상기 각 프레임의 각각의 서브밴드들에 대한 비트들을 결정하며, 상기 각 서브밴드들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 제2비트 할당 수단을 구비하는 적응 디지탈 오디오 부호화 장치.
제2항에 있어서, 상기 프레임 그룹의 각 결정 레벨(D)들은 다음과 같이 결정되며,

여기서, k(k = -q ~ q)는 결정 레벨 인덱스이고, q는 양의 정수이며, NF는 상기 프레임 그룹에서 정규화 팩터(Factor)이며, PEstd는 상기 프레임 그룹의 표준 편차 파라메터인 적응 디지탈 오디오 부호화 장치.
제3항에 있어서, 상기 프레임 그룹에서 p번째 프레임의 비트할당(FB(p))은 다음과 같이 계산되며,

여기서, p는 상기 프레임 그룹에서 프레임 인덱스이고, FBm은 한 프레임에 대한 평균 비트이며, BV는 기설정된 비트 변동값이고, 2q+1 는 기설정된 결정 레벨들의 전체수이며, 그리고 I는 상기 p번째 프레임의 레벨 인덱스인 적응 디지탈 오디오 부호화 장치.
다수개의 프레임들을 갖는 입력 디지탈 오디오 신호를 적응적으로 부호화하는데 이용하며, 상기 각각의 프레임은 다수개의 서브밴드를 포함하는 비트 할당 방법으로서, 상기 방법은 : 상기 입력 디지탈 오디오 신호를 필터링하여 다수개의 서브밴드 단위로 분할하는 단계와 ; 상기 디지탈 오디오 신호의 각 서브밴드들에 대한 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들을 측정하는 단계와 ; 상기 입력 디지탈 오디오 신호의 각 프레임들에 대한 인지 정보량들을 상기 측정된 신호대 마스크 비 데이터, 음압 레벨들 및 마스킹 문턱치들에 의거하여 측정하며, 상기 측정된 인지 정보량들에 대응하는 적어도 두 개 이상의 현재 및 이전 프레임들을 포함하는 프레임 그룹에 대한 평균 및 표준 편차 파라메터들을 측정하는 단계와 ; 상기 측정된 평균 및 표준편차 파라메터들에 의거하여 상기 프레임 그룹의 결정 레벨들을 측정하는 단계와 ; 상기 측정된 결정 레벨들, 상기 결정레벨들의 전체수, 상기 인지 정보량들 및 기설정된 평균 비트에 의거하여 상기 프레임 그룹의 각 프레임들에 대한 비트를 결정하며, 상기 각각의 프레임들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 단계와 ; 및 상기 측정된 신호대 마스크 비 데이터 및 상기 발생된 비트 할당 정보들에 의거하여 상기 각 프레임의 각각의 서브밴드들에 대한 비트들을 결정하며, 상기 각각의 서브밴드들에 대해 결정된 비트들에 상응하는 비트 할당 정보들을 발생하는 단계를 포함하는 비트 할당 방법.