KR101434834B1

KR101434834B1 - 다채널 오디오 신호의 부호화/복호화 방법 및 장치

Info

Publication number: KR101434834B1
Application number: KR1020070088315A
Authority: KR
Inventors: 김중회; 오은미
Original assignee: 삼성전자주식회사
Priority date: 2006-10-18
Filing date: 2007-08-31
Publication date: 2014-09-02
Anticipated expiration: 2027-08-31
Also published as: KR20080035448A

Abstract

본 발명은 다채널 오디오 신호의 복호화 방법에 관한 것으로, 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하고, 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 코어 오디오 오브젝트 타입을 검출하며, 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하고, 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 레지듀얼 코딩 데이터를 복호화하며, 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱함으로써, 코어 오디오 데이터와 레지듀얼 코딩 데이터를 동일한 복호화 방식으로 복호화하여 복호화단의 복잡도를 줄일 수 있다.

Description

다채널 오디오 신호의 부호화/복호화 방법 및 장치{Method and apparatus for encoding/decoding multi channel audio signal}

본 발명은 다채널 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호를 업믹싱하는 데 사용되는 레지듀얼 신호의 부호화/복호화 방법 및 장치에 관한 것이다.

MPEG(Moving Picture Experts Group) 서라운드(surround) 기술은 오디오 신호의부호화에 있어서 공간의 음원에 대한 오디오 데이터를 압축하는 기술로서, MP3(MPEG Audio Layer-3), MPEG-4 AAC(Advanced Audio Coding) 또는 MPEG-4 HE(High Efficiency)-AAC로 압축된 오디오 신호를 고품질 멀티 채널 서라운드 오디오로 바꿔준다. MPEG 서라운드는 기존 스테레오 장비에 대한 백워드(backward) 호환성을 유지하고, 기존 장비를 사용하면서도 고품질 멀티 채널 오디오 압축에 필요한 비트레이트(bitrate), 즉, 전송 속도를 줄일 수 있는 장점이 있다.

MPEG 서라운드 표준에 따르면 코어 오디오 신호(core audio signal)는 BSAC(Bit Sliced Arithmetic Coding), AAC, MP3(MPEG Audio Layer-3) 등 가운데 어느 하나의 부호화 방식을 이용하여 부호화하지만, 레지듀얼 신호(residual signal) 는 AAC에 의하여만 부호화한다.

그러므로, MPEG 서라운드 표준에 따라 코어 오디오 신호를 AAC가 아닌 다른 부호화 방식으로 부호화할 경우, 부호화단에서 코어 오디오 신호와 레지듀얼 신호를 각기 다른 부호화 방식에 의하여 부호화하여야 한다. 마찬가지로, 복호화단에서도 코어 오디오 신호와 레지듀얼 신호를 각기 다른 복호화 방식에 의하여 복호화하여야 한다.

본 발명이 해결하고자 하는 과제는 레지듀얼 신호를 복호화하는 경우 복호화단의 복잡도를 줄일 수 있는 다채널 오디오 신호의 복호화 방법 및 장치를 제공하는데 있다.

또한, 본 발명이 해결하고자 하는 다른 과제는 레지듀얼 신호를 부호화하는 경우 부호화단의 복잡도를 줄일 수 있는 다채널 오디오 신호의 부호화 방법 및 장치를 제공하는데 있다.

상기 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 복호화 방법은 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 단계; 상기 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 상기 코어 오디오 오브젝트 타입을 검출하는 단계; 상기 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 코어 오디오 데이터를 복호화하는 단계; 상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함한다.

상기 과제는 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 단계; 상기 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 상기 코어 오디오 오브젝트 타입을 검출하는 단계; 상기 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 코어 오디오 데이터를 복호화하는 단계; 상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함하는 다채널 오디오 신호의 복호화 방법를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.

또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 복호화 장치는 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 공간 확장 데이터 타입 검출부; 상기 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 상기 코어 오디오 오브젝트 타입을 검출하는 코어 오디오 오브젝트 타입 검출부; 상 기 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 코어 오디오 데이터를 복호화하는 코어 오디오 데이터 복호화부; 상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 레지듀얼 코딩 데이터 복호화부; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 업믹싱부를 포함한다.

또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 부호화 방법은 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계; 상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계; 상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및 상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 단계를 포함한다.

또한, 상기 또 다른 과제는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계; 상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계; 상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및 상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 단계를 포함하는 다채널 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.

또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 부호화 장치는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 다운믹싱부; 상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 코어 오디오 데이터 부호화부; 상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 레지듀얼 데이터 부호화부; 및 상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 다중화부를 포함한다.

또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 복호화 방법은 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림과 다채널 생성을 위한 부가 정보가 포함된 비트스트림을 수신하는 단계; 상기 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림으로부터 코어 오브젝트 타입을 검출하는 단계; 상기 검출된 코어 오브젝트 타입에 의해 결정된 복호화 방식에 의해 상기 다운 믹싱된 오디오 코어 신호를 복호화하는 단계; 상기 다채널 생성을 위한 부가 정보에 포함된 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업 믹싱하는 단계를 포함한다.

본 발명에 따르면, 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하고, 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 코어 오디오 오브젝트 타입을 검출하며, 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하고, 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 레지듀얼 코딩 데이터를 복호화하며, 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱함으로써, 코어 오디오 데이터와 레지듀얼 코딩 데이터를 동일한 복호화 방식으로 복호화하여 복호화단의 복잡도를 줄일 수 있다.

또한, 본 발명에 따르면, 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하고, 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하며, 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 소정의 부호화 방식에 따라 레지듀얼 데이터를 부호화하고, 부호화된 코어 오디오 데이터 및 부호화된 레지듀얼 데이터를 오디오 신호에 대한 부호화 결과로써 출력함으로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.

본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.

도 1은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 복호화 장치를 나타내는 블록도이다.

도 1을 참조하면, 다채널 오디오 신호의 복호화 장치는 역다중화부(demultiplexing unit, 100), 공간 확장 데이터 타입 검출부(spatial extension data type detecting unit, 110), 코어 오디오 오브젝트 타입 검출부(core audio object type detecting unit, 120), 코어 오디오 데이터 복호화부(core audio data decoding unit, 130), 레지듀얼 코딩 데이터 복호화부(residual coding data decoding unit, 140), 아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부(arbitrary down-mix residual coding data decoding unit, 150), 및 업믹싱부(up-mixing unit, 160)를 포함한다.

역다중화부(100)는 입력단자 IN을 통하여 부호화단으로부터 비트스트림을 입력받아 역다중화한다.

도 2는 본 발명의 일 실시예에 따른 공간 확장 데이터 타입을 검출하기 위한 신택스를 도시한 도면이다. 도 3은 도 2에 도시된 "bsSacExtType"에 대응하는 값들이 할당된 테이블의 일 실시예를 도시한 도면이다. 이하에서는, 도 1 내지 도 3를 참조하여, 공간 확장 데이터 타입 검출부(110)의 동작을 설명하기로 한다.

공간 확장 데이터 타입 검출부(110)는 역다중화부(100)에서 역다중화된 데이터의 헤더에서 공간 확장 데이터(spatial extension data)의 타입을 검출한다. 보다 상세하기는, 공간 확장 데이터 타입 검출부(110)는 도 2에 도시된 함수 SpatialExtensionConfig()에 의하여 역다중화된 데이터의 헤더에서 공간 확장 데이터의 타입을 검출할 수 있다. 함수 SpatialExtensionConfig()에서 "bsSacExtType"은 공간 확장 데이터의 타입을 나타낸다.

도 3을 참조하면, 본 발명의 일 실시예에서 "bsSacExtType"이 '0'이면, 공간 확장 데이터는 레지듀얼 코딩 데이터이고, "bsSacExtType"이 '1'이면, 공간 확장 데이터는 아비트레리 다운믹스 레지듀얼 코딩 데이터이며, "bsSacExtType"이 '12' 이면, 공간 확장 데이터는 MPEG-4 오디오의 코어 오디오 오브젝트 타입(core Audio Object Type)이다. 여기서, 코어 오디오 오브젝트 타입은 부호화단에서 다운 믹스된 신호를 부호화하는 오디오 오브젝트 타입을 말한다. 그러나, 이는 본 발명의 일 실시예에 불과하고, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 다양한 변형이 가능하다는 것을 이해할 수 있다.

다시 말해, 공간 확장 데이터 타입 검출부(110)는 "bsSacExtType"에 '0'이 할당된 경우 공간 확장 데이터의 타입이 레지듀얼 코딩 데이터라고 판단하고, "bsSacExtType"에 '1'이 할당된 경우 공간 확장 데이터의 타입이 아비트레리 다운믹스 레지듀얼 코딩 데이터라고 판단하며, "bsSacExtType"에 '12'가 할당된 경우 공간 확장 데이터의 타입이 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터라고 판단한다.

이하에서는, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입에 따른 오디오 신호의 복호화 장치의 동작에 대하여 설명하기로 한다.

첫째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입이 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우에 대하여 살펴보기로 한다. 다시 말해, 이 경우에는 "bsSacExtType"은 '12'이다.

도 4는 본 발명의 일 실시예에 따른 코어 오디오 오브젝트 타입을 독출하기 위한 신택스를 도시한 도면이다. 이하에서는, 도 1 및 4를 참조하여, 코어 오디오 오브젝트 타입 검출부(120)의 동작을 설명하기로 한다.

공간 확장 데이터 타입 검출부(110)에서 공간 확장 데이터의 타입을 검출한 결과, 공간 확장 데이터가 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터라고 판단되면, 코어 오디오 오브젝트 타입 검출부(120)는 코어 오디오 오브젝트 타입을 검출한다.

보다 상세하게는, 코어 오디오 오브젝트 타입 검출부(120)는 도 4에 도시된 함수 "SpatialExtensionConfigData(12)"에 의하여 코어 오디오 오브젝트 타입을 독출할 수 있다. 여기서, "coreAudioObjectType"은 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타낸다.

다시 도 1을 참조하면, 코어 오디오 데이터 복호화부(130)는 역다중화부(100)에서 역다중화된 코어 오디오 데이터를 복호화한다. 보다 상세하게는, 코어 오디오 데이터 복호화부(130)는 코어 오디오 오브젝트 타입 검출부(120)에서 검출된 코어 오디오 오브젝트 타입에 따라 역다중화된 코어 오디오 데이터를 복호화한다.

상술한 바와 같이, 코어 오디오 오브젝트 타입은 부호화단에서 다운 믹스된 신호를 부호화하는 오디오 오브젝트 타입을 말한다. 여기서, 코어 오디오 데이터는 부호화단에서 BSAC(Bit Sliced Arithmetic Coding), AAC(Advanced Audio Coding), MP3(MPEG Audio Layer-3) 등과 같은 다양한 부호화 방식 가운데 어느 하나에 의하여 부호화될 수 있다. 여기서, BSAC, AAC, MP3 등은 본 발명의 실시예에 불과하며, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 다양한 부호화 방식에 의해 코어 오디오 데이터는 부호화될 수 있음을 이해할 수 있다.

둘째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타 입이 레지듀얼 코딩 데이터인 경우에 대하여 살펴보기로 한다. 다시 말해, 이 경우에는 "bsSacExtType"은 '0'이다.

도 5는 본 발명의 일 실시예에 따른 레지듀얼 코딩 데이터를 복호화하기 위한 신택스를 도시한 도면이다. 이하에서는, 도 1 및 5를 참조하여 레지듀얼 코딩 데이터 복호화부(140)의 동작에 대하여 설명하기로 한다.

레지듀얼 코딩 데이터 복호화부(140)는 제1 코어 오디오 오브젝트 타입 판별부(141), 제1 BSAC 복호화부(142), 및 제1 AAC 복호화부(143)를 포함하여 레지듀얼 코딩 데이터를 복호화한다.

공간 확장 데이터 타입 검출부(110)에서 공간 확장 데이터의 타입을 검출한 결과, 공간 확장 데이터가 레지듀얼 코딩 데이터라고 판단되면, 제1 코어 오디오 오브젝트 타입 판별부(141)는 코어 오디오 오브젝트 타입이 'BSAC'인지 여부를 판단한다.

도 5를 참조하면, 'BSAC'의 코어 오디오 오브젝트 타입으로 '22'가 할당되었으므로, 제1 코어 오디오 오브젝트 타입 판별부(141)는 코어 오디오 오브젝트 타입 검출부(120)에서 검출된 "coreAudioObjectType"이 '22'에 해당하는지 여부를 판단한다.

제1 코어 오디오 오브젝트 타입 판별부(141)의 판단 결과, 코어 오디오 오브젝트 타입이 'BSAC'에 해당하면, 제1 BSAC 복호화부(142)는 'BSAC'에 의해서 레지듀얼 신호를 복호화한다. 예를 들어, 제1 BSAC 복호화부(142)는 도 5에 도시된 신택스의 식별번호 500 또는 520에 의하여 실시될 수 있다. 식별번호 500 또는 520에 서 제1 BSAC 복호화부(142)는 MPEG-4 ER BSAC에 정의되어 있는 함수 bsac_raw_data_block()에 의하여 레지듀얼 코딩 데이터를 복호화한다. 여기서, bsac_raw_data_block()의 "nch"는 항상 '1'로 설정되어 있어야 한다. 여기서, "nch"는 채널의 수(Number of Channels)를 나타낸다.

제1 코어 오디오 오브젝트 타입 판별부(141)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되면, 제1 AAC 복호화부(143)는 'AAC'에 의해서 레지듀얼 코딩 데이터를 복호화한다. 예를 들어, 제1 AAC 복호화부(143)는 도 5에 도시된 신택스의 식별번호 510 또는 530에 의하여 실시될 수 있다. 식별번호 510 또는 530에서 제1 AAC 복호화부(143)는 ISO/IEC 13818-7의 subclause 6.3에 기재된 "MPEG-2 AAC Low Complexity profile bitstream syntax"에 정의되어 있는 individual_channel_stream(0)에 의하여 레지듀얼 코딩 데이터를 복호화한다.

그러나, 제1 AAC 복호화부(143)에서 'AAC'는 단순히 일 실시예에 불과하며, 제1 코어 오디오 오브젝트 타입 판별부(141)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제1 AAC 복호화부(143)에서는 제1 코어 오디오 오브젝트 타입 판별부(141)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 디코딩 방식으로 레지듀얼 코딩 데이터를 복호화할 수 있다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(141)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제1 AAC 복호화부(143)에서는 'MP3'에 의해서 레지듀얼 코딩 데이터를 복호화한다.

이와 같이, 제1 BSAC 복호화부(142) 또는 제1 AAC 복호화부(143)에서 복호화 된 레지듀얼 코딩 데이터를 이용하여 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 멀티 채널 신호로 업믹싱할 수 있다.

셋째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입이 아비트레리 다운 믹스 레지듀얼 코딩 데이터인 경우에 대하여 살펴보기로 한다. 다시 말해, 이 경우에는 "bsSacExtType"은 '1'이다.

도 6은 본 발명의 일 실시예에 따른 아비트레리 다운 믹스 레지듀얼 데이터를 복호화하기 위한 신택스를 도시한 도면이다. 이하에서는, 도 1 및 6을 참조하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부(150)의 동작에 대하여 설명하기로 한다.

아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부(150)는 제2 코어 오디오 오브젝트 타입 판별부(151), 제2 BSAC 복호화부(152), 및 제2 AAC 복호화부(153)를 포함하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다.

제2 코어 오디오 오브젝트 타입 판별부(151)의 판단 결과, 코어 오디오 오브젝트 타입이 'BSAC'에 해당하면, 제2 BSAC 복호화부(152)는 'BSAC'에 의해서 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 예를 들어, 제2 BSAC 복호화부(152)는 도 6에 도시된 신택스의 식별번호 600, 620, 640 및 660 중 적어도 어느 하나 이상에 의하여 실시될 수 있다. 식별번호 600, 620, 640 및 660 중 적어도 어느 하나 이상에서 제2 BSAC 복호화부(152)는 MPEG-4 ER BSAC에 정의되어 있는 함수 bsac_raw_data_block()에 의하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 여기서, bsac_raw_data_block()의 "nch"는 항상 '1'로 설정되어 있어 야 한다. 여기서, "nch"는 채널의 수(Number of Channels)를 나타낸다.

제1 코어 오디오 오브젝트 타입 판별부(151)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되면, 제2 AAC 복호화부(152)는 'AAC'에 의해서 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 예를 들어, 제2 AAC 복호화부(153)는 도 6에 도시된 신택스의 식별번호 610, 630, 650 및 670 중 적어도 어느 하나 이상에 의하여 실시될 수 있다. 식별번호 610 또는 650에서 제2 AAC 복호화부(153)는 ISO/IEC 13818-7의 subclause 6.3에 기재된 "MPEG-2 AAC Low Complexity profile bitstream syntax"에 정의되어 있는 individual_channel_stream(0)에 의하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 또한, 식별번호 630 또는 670에서 제2 AAC 복호화부(153)는 ISO/IEC 13818-7의 subclause 6.3에 기재된 "MPEG-2 AAC Low Complexity profile bitstream syntax"에 정의되어 있는 channel_pair_element()에 의하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 여기서, 파라미터 "common_window"는 '1'로 설정되어 있다.

그러나, 제2 AAC 복호화부(153)에서 'AAC'는 단순히 일 실시예에 불과하며, 제2 코어 오디오 오브젝트 타입 판별부(151)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제2 AAC 복호화부(153)에서는 제2 코어 오디오 오브젝트 타입 판별부(151)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 디코딩 방식으로 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화할 수 있다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(151)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제2 AAC 복호화부(153)에서는 'MP3'에 의해서 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다.

이와 같이, 제2 BSAC 복호화부(152) 또는 제2 AAC 복호화부(153)에서 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 멀티 채널 신호로 업믹싱할 수 있다.

넷째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입이 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터, 레지듀얼 코딩 데이터 또는 아비트레리 다운 믹스 레지듀얼 코딩 데이터가 아닌 경우에 대하여 살펴보기로 한다.

공간 확장 데이터 복호화부(160)는 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터의 타입에 대응하는 방식으로 복호화를 수행한다. 이와 같이, 공간 확장 데이터 복호화부(160)에서 복호화된 데이터를 이용하여 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 멀티 채널 신호로 업믹싱할 수 있다.

업믹싱부(170)는 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 제1 및 제2 BSAC 복호화부(142, 152), 제1 및 제2 ACC 복호화부(143, 153), 또는 공간 확장 데이터 복호화부(160)에서 복호화된 결과를 이용하여 멀티 채널 신호로 업믹싱한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.

도 7은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 복호화 방법을 나타내는 흐름도이다.

도 7을 참조하면, 본 실시예에 따른 다채널 오디오 신호의 복호화 방법은 도 1에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 1에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.

700 단계에서 공간 확장 데이터 타입 검출부(110)는 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출한다.

710 단계에서 코어 오디오 오브젝트 타입 검출부(120)는 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 코어 오디오 오브젝트 타입을 검출한다.

720 단계에서 코어 오디오 데이터 복호화부(130)는 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화한다.

730 단계에서 레지듀얼 코딩 데이터 복호화부(140)는 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 레지듀얼 코딩 데이터를 복호화한다.

740 단계에서 업믹싱부(170)는 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱한다.

본 실시예에서 따른 오디오 신호의 복호화 방법은 공간 확장 데이터가 아비 트레리 다운 믹스 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화하는 단계를 더 포함할 수 있다. 이 경우, 업믹싱부(170)는 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터 및 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 업믹싱할 수 있다.

또한, 본 실시예에 따른 오디오 신호의 복호화 방법은 공간 확장 데이터가 코어 오디오 오브젝트 타입을 나타내는 데이터, 레지듀얼 코딩 데이터 및 아비트레리 다운 믹스 코딩 데이터 외의 데이터인 경우, 공간 확장 데이터의 타입에 따른 복호화 방식으로 공간 확장 데이터를 복호화하는 단계를 더 포함할 수 있다. 이 경우, 업믹싱부(170)는 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터, 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터, 및 복호화된 공간 확장 데이터를 이용하여 업믹싱할 수 있다.

도 8은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 부호화 장치를 나타내는 블록도이다.

도 8을 참조하면, 다채널 오디오 신호의 부호화 장치는 다운믹싱부(down-mixing unit, 800), 코어 오디오 데이터 부호화부(core audio data encoding unit, 810), 레지듀얼 데이터 부호화부(residual data encoding unit, 820), 아비트레리 다운 믹스 레지듀얼 데이터 부호화부(arbitrary down-mix residual data encoding unit, 830), 및 다중화부(multiplexing unit, 840)를 포함한다.

다운믹싱부(800)는 입력 신호(IN)를 다운믹싱한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM(Pulse Code Modulation) 신호일 수 있다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.

코어 오디오 데이터 부호화부(810)는 다운믹싱부(800)에서 출력된 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화한다. 여기서, 코어 오디오 데이터는 BSAC(Bit Sliced Arithmetic Coding), AAC(Advanced Audio Coding), MP3(MPEG Audio Layer-3) 등과 같은 다양한 부호화 방식 가운데 어느 하나에 의하여 부호화될 수 있다. 여기서, BSAC, AAC, MP3 등은 본 발명의 실시예에 불과하며, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 다양한 부호화 방식에 의해 코어 오디오 데이터는 부호화될 수 있음을 이해할 수 있다.

레지듀얼 데이터 부호화부(820)는 제1 코어 오디오 오브젝트 타입 판별부(core audio object type determining unit, 821), 제1 BSAC 부호화부(BSAC encoding unit, 822) 및 제1 AAC 부호화부(AAC encoding unit, 823)를 포함하여 레지듀얼 데이터를 부호화한다.

제1 코어 오디오 오브젝트 타입 판별부(821)는 코어 오디오 데이터 부호화부(810)에서 코어 오디오 데이터를 부호화하는 방식인 코어 오디오 오브젝트 타입을 판별하여 레지듀얼 데이터의 부호화 방식을 결정한다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(821)는 코어 오디오 오브젝트 타입이 'BSAC'인 경우 레지듀얼 데이터의 부호화 방식을 'BSAC'으로 결정하고, 코어 오디오 오브젝트 타입 이 'AAC'인 경우 레지듀얼 데이터의 부호화 방식을 'AAC'로 결정한다.

제1 BSAC 부호화부(822)는 제1 코어 오디오 오브젝트 타입 판별부(821)의 판단 결과 코어 오디오 오브젝트 타입이 'BSAC'인 경우에 레지듀얼 데이터를 'BSAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.

제1 AAC 부호화부(823)는 제1 코어 오디오 오브젝트 타입 판별부(821)의 판단 결과 코어 오디오 오브젝트 타입이 'AAC'인 경우에 레지듀얼 데이터를 'AAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.

그러나, 제1 AAC 부호화부(823)에서 'AAC'는 단순히 일 실시예에 불과하며, 제1 코어 오디오 오브젝트 타입 판별부(821)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제1 AAC 복호화부(823)에서는 제1 코어 오디오 오브젝트 타입 판별부(821)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 부호화 방식으로 레지듀얼 데이터를 부호화할 수 있다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(821)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제1 AAC 부호화부(823)에서는 'MP3'에 의해서 레지듀얼 데이터를 부호화한다.

아비트레리 다운 믹스 레지듀얼 데이터 부호화부(830)는 제2 코어 오디오 오브젝트 타입 판별부(831), 제2 BSAC 부호화부(832) 및 제2 AAC 부호화부(833)를 포함하여 레지듀얼 데이터를 부호화한다.

제2 코어 오디오 오브젝트 타입 판별부(831)는 코어 오디오 데이터 부호화부(810)에서 코어 오디오 데이터를 부호화하는 방식인 코어 오디오 오브젝트 타입을 판별하여 레지듀얼 데이터의 부호화 방식을 결정한다. 예를 들어, 제2 코어 오디오 오브젝트 타입 판별부(831)는 코어 오디오 오브젝트 타입이 'BSAC'인 경우 레지듀얼 데이터의 부호화 방식을 'BSAC'으로 결정하고, 코어 오디오 오브젝트 타입이 'AAC'인 경우 레지듀얼 데이터의 부호화 방식을 'AAC'로 결정한다.

제2 BSAC 부호화부(832)는 제2 코어 오디오 오브젝트 타입 판별부(831)의 판단 결과 코어 오디오 오브젝트 타입이 'BSAC'인 경우에 레지듀얼 데이터를 'BSAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.

제2 AAC 부호화부(833)는 제2 코어 오디오 오브젝트 타입 판별부(831)의 판단 결과 코어 오디오 오브젝트 타입이 'AAC'인 경우에 레지듀얼 데이터를 'AAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.

그러나, 제2 AAC 부호화부(833)에서 'AAC'는 단순히 일 실시예에 불과하며, 제2 코어 오디오 오브젝트 타입 판별부(831)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제2 AAC 복호화부(833)에서는 제2 코어 오디오 오브젝트 타입 판별부(831)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 부호화 방식으로 레지듀얼 데이터를 부호화할 수 있다. 예를 들어, 제2 코어 오디오 오브젝트 타입 판별부(831)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제2 AAC 부호화부(833)에서는 'MP3'에 의해서 레지듀얼 데이터를 부호화한다.

다중화부(840)는 코어 오디오 데이터 부호화부(810)에서 부호화된 결과, 제1 및 제2 BSAC 부호화부(822, 832)에서 부호화된 결과, 및 제1 및 제2 AAC 부호화부(823, 833)에서 부호화된 결과를 다중화하여 비트스트림을 생성하여 출력 단자 OUT로 출력한다.

도 9는 본 발명의 일 실시예에 따른 다채널 오디오 신호의 부호화 방법을 나타내는 흐름도이다.

도 9를 참조하면, 본 실시예에 따른 다채널 오디오 신호의 부호화 방법은 도 8에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 8에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.

900 단계에서 다운믹싱부(900)는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성한다.

910 단계에서 코어 오디오 데이터 부호화부(910)는 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화한다.

920 단계에서 레지듀얼 데이터 부호화부(920)는 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 소정의 부호화 방식에 따라 레지듀얼 데이터를 부호화한다.

930 단계에서 다중화부(940)는 부호화된 코어 오디오 데이터 및 부호화된 레지듀얼 데이터를 다중화하여 오디오 신호에 대한 부호화 결과로써 출력한다.

상기 900 단계는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터, 레지듀얼 데이터, 및 아비트레리 다운 믹스 레지듀얼 데이터를 생성할 수 있다. 이 경우, 본 실시예에 따른 오디오 신호의 부호화 방법은 코어 오디오 오브젝트 타입에 따른 소정의 부호화 방식에 따라 아비트레리 다운 믹스 레지듀얼 데이터를 부호화하는 단계를 더 포함할 수 있다. 이 경우, 다중화부(940)는 부호화된 코어 오디오 데이터, 부호화된 레지듀얼 데이터, 및 부호화된 아비트레리 다운 믹스 레지듀얼 데이터를 다중화하여 오디오 신호에 대한 부호화 결과로써 출력할 수 있다.

본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.

도 2는 본 발명의 일 실시예에 따른 공간 확장 데이터 타입을 검출하기 위한 신택스를 도시한 도면이다.

도 3은 도 2에 도시된 "bsSacExtType"에 대응하는 값들이 할당된 테이블의 일 실시예를 도시한 도면이다.

도 4는 본 발명의 일 실시예에 따른 코어 오디오 오브젝트 타입을 독출하기 위한 신택스를 도시한 도면이다.

도 5는 본 발명의 일 실시예에 따른 레지듀얼 코딩 데이터를 복호화하기 위한 신택스를 도시한 도면이다.

도 6은 본 발명의 일 실시예에 따른 아비트레리 다운 믹스 레지듀얼 데이터를 복호화하기 위한 신택스를 도시한 도면이다.

Claims

비트스트림에 포함된 공간 확장 데이터의 타입을 검출하는 단계;

코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하는 단계;

상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 제1 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
제1항에 있어서,

상기 공간 확장 데이터가 아비트레리 다운 믹스 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화하는 단계를 더 포함하는 것을 특징으 로 하는 다채널 오디오 신호의 복호화 방법.
제2항에 있어서,

상기 업믹싱하는 단계는

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터 혹은 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
제2항에 있어서,

상기 공간 확장 데이터가 상기 코어 오디오 오브젝트 타입을 나타내는 데이터, 상기 레지듀얼 코딩 데이터 및 상기 아비트레리 다운 믹스 코딩 데이터 외의 데이터인 경우, 상기 공간 확장 데이터의 타입에 따른 복호화 방식으로 상기 공간 확장 데이터를 복호화하는 단계를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
제4항에 있어서,

상기 업믹싱하는 단계는

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터, 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터, 혹은 상기 복호화된 공간 확장 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 단계;

코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 오디오 데이터를 복호화하는 단계;

상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 제1 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 공간 확장 데이터 타입 검출부;

코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하는 코어 오디오 데이터 복호화부;

상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 제1 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 레지듀얼 코딩 데이터 복호화부; 및

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 업믹싱부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
제7항에 있어서,

상기 공간 확장 데이터가 아비트레리 다운 믹스 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화하는 아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
제8항에 있어서,

상기 업믹싱부는

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터 혹은 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
제8항에 있어서,

상기 공간 확장 데이터가 상기 코어 오디오 오브젝트 타입을 나타내는 데이터, 상기 레지듀얼 코딩 데이터 및 상기 아비트레리 다운 믹스 코딩 데이터 외의 데이터인 경우, 상기 공간 확장 데이터의 타입에 따른 복호화 방식으로 상기 공간 확장 데이터를 복호화하는 공간 확장 데이터 복호화부를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
제10항에 있어서,

상기 업믹싱부는

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터, 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터, 혹은 상기 복호화된 공간 확장 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계;

상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계;

상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및

상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 레지듀얼 코딩이 적용된 것을 나타내는 정보와 함께 비트스트림에 포함시키는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
제12항에 있어서,

상기 다운믹싱하는 단계는

상기 입력된 오디오 신호를 다운믹싱하여 상기 코어 오디오 데이터, 상기 레지듀얼 데이터, 및 아비트레리 다운 믹스 레지듀얼 데이터를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
제13항에 있어서,

상기 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 아비트레리 다운 믹스 레지듀얼 데이터를 부호화하는 단계를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
제14항에 있어서,

상기 비트스트림은

상기 부호화된 코어 오디오 데이터, 상기 부호화된 레지듀얼 데이터, 혹은 상기 부호화된 아비트레리 다운 믹스 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계;

상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계;

상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및

상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 레지듀얼 코딩이 적용된 것을 나타내는 정보와 함께비트스트림에 포함시키는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 다운믹싱부;

상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 코어 오디오 데이터 부호화부;

상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 레지듀얼 데이터 부호화부; 및

상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 레지듀얼 코딩이 적용된 것을 나타내는 정보와 함께비트스트림에 포함시키는 다중화부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
제17항에 있어서,

상기 다운믹싱부는

상기 입력된 오디오 신호를 다운믹싱하여 상기 코어 오디오 데이터, 상기 레지듀얼 데이터, 및 아비트레리 다운 믹스 레지듀얼 데이터를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
제17항에 있어서,

상기 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 아비트레리 다운 믹스 레지듀얼 데이터를 부호화하는 아비트레리 다운 믹스 레지듀얼 데이터 부호화부를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
제19항에 있어서,

상기 다중화부는

상기 부호화된 코어 오디오 데이터, 상기 부호화된 레지듀얼 데이터, 및 상기 부호화된 아비트레리 다운 믹스 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림과 다채널 생성을 위한 부가 정보가 포함된 비트스트림을 수신하는 단계;

상기 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림으로부터 코어 오브젝트 타입을 검출하는 단계;

상기 검출된 코어 오브젝트 타입에 의해 결정된 복호화 방식에 의해 상기 다운 믹싱된 오디오 코어 신호를 복호화하는 단계;

상기 다채널 생성을 위한 부가 정보에 포함된 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및

상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업 믹싱하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
제1 항에 있어서, 상기 제1 복호화 방식은 AAC 인 다채널 오디오 신호의 복호화 방법.
제7 항에 있어서, 상기 제1 복호화 방식은 AAC 인 다채널 오디오 신호의 복호화 장치.
다운 믹싱된 모노 신호를 복호화하는 단계;

레지듀얼 코딩이 적용되었는지를 나타내는 정보를 참조하여, 레지듀얼 신호를 복호화하는 단계;

상기 복호화된 다운 믹싱된 모노 신호로부터 복수개의 채널신호를 생성하기 위한 부가정보를 복호화하는 단계; 및

상기 복호화된 부가정보 및 복호화된 레지듀얼 신호를 사용하여 복호화된 다운 믹싱된 모노 신호함으로써, 상기 상기 복수개의 채널신호를 복원하는 단계를 포함하는 다채널 복호화 방법.