[go: up one dir, main page]

KR101434834B1 - 다채널 오디오 신호의 부호화/복호화 방법 및 장치 - Google Patents

다채널 오디오 신호의 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
KR101434834B1
KR101434834B1 KR1020070088315A KR20070088315A KR101434834B1 KR 101434834 B1 KR101434834 B1 KR 101434834B1 KR 1020070088315 A KR1020070088315 A KR 1020070088315A KR 20070088315 A KR20070088315 A KR 20070088315A KR 101434834 B1 KR101434834 B1 KR 101434834B1
Authority
KR
South Korea
Prior art keywords
data
residual
decoding
core audio
core
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020070088315A
Other languages
English (en)
Other versions
KR20080035448A (ko
Inventor
김중회
오은미
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US11/907,398 priority Critical patent/US8571875B2/en
Publication of KR20080035448A publication Critical patent/KR20080035448A/ko
Priority to US14/065,073 priority patent/US8977557B2/en
Application granted granted Critical
Publication of KR101434834B1 publication Critical patent/KR101434834B1/ko
Priority to US14/629,839 priority patent/US9570082B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 다채널 오디오 신호의 복호화 방법에 관한 것으로, 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하고, 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 코어 오디오 오브젝트 타입을 검출하며, 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하고, 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 레지듀얼 코딩 데이터를 복호화하며, 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱함으로써, 코어 오디오 데이터와 레지듀얼 코딩 데이터를 동일한 복호화 방식으로 복호화하여 복호화단의 복잡도를 줄일 수 있다.

Description

다채널 오디오 신호의 부호화/복호화 방법 및 장치{Method and apparatus for encoding/decoding multi channel audio signal}
본 발명은 다채널 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호를 업믹싱하는 데 사용되는 레지듀얼 신호의 부호화/복호화 방법 및 장치에 관한 것이다.
MPEG(Moving Picture Experts Group) 서라운드(surround) 기술은 오디오 신호의부호화에 있어서 공간의 음원에 대한 오디오 데이터를 압축하는 기술로서, MP3(MPEG Audio Layer-3), MPEG-4 AAC(Advanced Audio Coding) 또는 MPEG-4 HE(High Efficiency)-AAC로 압축된 오디오 신호를 고품질 멀티 채널 서라운드 오디오로 바꿔준다. MPEG 서라운드는 기존 스테레오 장비에 대한 백워드(backward) 호환성을 유지하고, 기존 장비를 사용하면서도 고품질 멀티 채널 오디오 압축에 필요한 비트레이트(bitrate), 즉, 전송 속도를 줄일 수 있는 장점이 있다.
MPEG 서라운드 표준에 따르면 코어 오디오 신호(core audio signal)는 BSAC(Bit Sliced Arithmetic Coding), AAC, MP3(MPEG Audio Layer-3) 등 가운데 어느 하나의 부호화 방식을 이용하여 부호화하지만, 레지듀얼 신호(residual signal) 는 AAC에 의하여만 부호화한다.
그러므로, MPEG 서라운드 표준에 따라 코어 오디오 신호를 AAC가 아닌 다른 부호화 방식으로 부호화할 경우, 부호화단에서 코어 오디오 신호와 레지듀얼 신호를 각기 다른 부호화 방식에 의하여 부호화하여야 한다. 마찬가지로, 복호화단에서도 코어 오디오 신호와 레지듀얼 신호를 각기 다른 복호화 방식에 의하여 복호화하여야 한다.
본 발명이 해결하고자 하는 과제는 레지듀얼 신호를 복호화하는 경우 복호화단의 복잡도를 줄일 수 있는 다채널 오디오 신호의 복호화 방법 및 장치를 제공하는데 있다.
또한, 본 발명이 해결하고자 하는 다른 과제는 레지듀얼 신호를 부호화하는 경우 부호화단의 복잡도를 줄일 수 있는 다채널 오디오 신호의 부호화 방법 및 장치를 제공하는데 있다.
상기 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 복호화 방법은 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 단계; 상기 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 상기 코어 오디오 오브젝트 타입을 검출하는 단계; 상기 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 코어 오디오 데이터를 복호화하는 단계; 상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함한다.
상기 과제는 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 단계; 상기 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 상기 코어 오디오 오브젝트 타입을 검출하는 단계; 상기 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 코어 오디오 데이터를 복호화하는 단계; 상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함하는 다채널 오디오 신호의 복호화 방법를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.
또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 복호화 장치는 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 공간 확장 데이터 타입 검출부; 상기 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 상기 코어 오디오 오브젝트 타입을 검출하는 코어 오디오 오브젝트 타입 검출부; 상 기 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 코어 오디오 데이터를 복호화하는 코어 오디오 데이터 복호화부; 상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 레지듀얼 코딩 데이터 복호화부; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 업믹싱부를 포함한다.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 부호화 방법은 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계; 상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계; 상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및 상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 단계를 포함한다.
또한, 상기 또 다른 과제는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계; 상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계; 상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및 상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 단계를 포함하는 다채널 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 부호화 장치는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 다운믹싱부; 상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 코어 오디오 데이터 부호화부; 상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 레지듀얼 데이터 부호화부; 및 상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 다중화부를 포함한다.
또한, 상기 또 다른 과제를 해결하기 위한 본 발명에 따른 다채널 오디오 신호의 복호화 방법은 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림과 다채널 생성을 위한 부가 정보가 포함된 비트스트림을 수신하는 단계; 상기 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림으로부터 코어 오브젝트 타입을 검출하는 단계; 상기 검출된 코어 오브젝트 타입에 의해 결정된 복호화 방식에 의해 상기 다운 믹싱된 오디오 코어 신호를 복호화하는 단계; 상기 다채널 생성을 위한 부가 정보에 포함된 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및 상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업 믹싱하는 단계를 포함한다.
본 발명에 따르면, 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하고, 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 코어 오디오 오브젝트 타입을 검출하며, 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하고, 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 레지듀얼 코딩 데이터를 복호화하며, 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱함으로써, 코어 오디오 데이터와 레지듀얼 코딩 데이터를 동일한 복호화 방식으로 복호화하여 복호화단의 복잡도를 줄일 수 있다.
또한, 본 발명에 따르면, 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하고, 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하며, 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 소정의 부호화 방식에 따라 레지듀얼 데이터를 부호화하고, 부호화된 코어 오디오 데이터 및 부호화된 레지듀얼 데이터를 오디오 신호에 대한 부호화 결과로써 출력함으로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.
본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 1을 참조하면, 다채널 오디오 신호의 복호화 장치는 역다중화부(demultiplexing unit, 100), 공간 확장 데이터 타입 검출부(spatial extension data type detecting unit, 110), 코어 오디오 오브젝트 타입 검출부(core audio object type detecting unit, 120), 코어 오디오 데이터 복호화부(core audio data decoding unit, 130), 레지듀얼 코딩 데이터 복호화부(residual coding data decoding unit, 140), 아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부(arbitrary down-mix residual coding data decoding unit, 150), 및 업믹싱부(up-mixing unit, 160)를 포함한다.
역다중화부(100)는 입력단자 IN을 통하여 부호화단으로부터 비트스트림을 입력받아 역다중화한다.
도 2는 본 발명의 일 실시예에 따른 공간 확장 데이터 타입을 검출하기 위한 신택스를 도시한 도면이다. 도 3은 도 2에 도시된 "bsSacExtType"에 대응하는 값들이 할당된 테이블의 일 실시예를 도시한 도면이다. 이하에서는, 도 1 내지 도 3를 참조하여, 공간 확장 데이터 타입 검출부(110)의 동작을 설명하기로 한다.
공간 확장 데이터 타입 검출부(110)는 역다중화부(100)에서 역다중화된 데이터의 헤더에서 공간 확장 데이터(spatial extension data)의 타입을 검출한다. 보다 상세하기는, 공간 확장 데이터 타입 검출부(110)는 도 2에 도시된 함수 SpatialExtensionConfig()에 의하여 역다중화된 데이터의 헤더에서 공간 확장 데이터의 타입을 검출할 수 있다. 함수 SpatialExtensionConfig()에서 "bsSacExtType"은 공간 확장 데이터의 타입을 나타낸다.
도 3을 참조하면, 본 발명의 일 실시예에서 "bsSacExtType"이 '0'이면, 공간 확장 데이터는 레지듀얼 코딩 데이터이고, "bsSacExtType"이 '1'이면, 공간 확장 데이터는 아비트레리 다운믹스 레지듀얼 코딩 데이터이며, "bsSacExtType"이 '12' 이면, 공간 확장 데이터는 MPEG-4 오디오의 코어 오디오 오브젝트 타입(core Audio Object Type)이다. 여기서, 코어 오디오 오브젝트 타입은 부호화단에서 다운 믹스된 신호를 부호화하는 오디오 오브젝트 타입을 말한다. 그러나, 이는 본 발명의 일 실시예에 불과하고, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 다양한 변형이 가능하다는 것을 이해할 수 있다.
다시 말해, 공간 확장 데이터 타입 검출부(110)는 "bsSacExtType"에 '0'이 할당된 경우 공간 확장 데이터의 타입이 레지듀얼 코딩 데이터라고 판단하고, "bsSacExtType"에 '1'이 할당된 경우 공간 확장 데이터의 타입이 아비트레리 다운믹스 레지듀얼 코딩 데이터라고 판단하며, "bsSacExtType"에 '12'가 할당된 경우 공간 확장 데이터의 타입이 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터라고 판단한다.
이하에서는, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입에 따른 오디오 신호의 복호화 장치의 동작에 대하여 설명하기로 한다.
첫째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입이 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우에 대하여 살펴보기로 한다. 다시 말해, 이 경우에는 "bsSacExtType"은 '12'이다.
도 4는 본 발명의 일 실시예에 따른 코어 오디오 오브젝트 타입을 독출하기 위한 신택스를 도시한 도면이다. 이하에서는, 도 1 및 4를 참조하여, 코어 오디오 오브젝트 타입 검출부(120)의 동작을 설명하기로 한다.
공간 확장 데이터 타입 검출부(110)에서 공간 확장 데이터의 타입을 검출한 결과, 공간 확장 데이터가 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터라고 판단되면, 코어 오디오 오브젝트 타입 검출부(120)는 코어 오디오 오브젝트 타입을 검출한다.
보다 상세하게는, 코어 오디오 오브젝트 타입 검출부(120)는 도 4에 도시된 함수 "SpatialExtensionConfigData(12)"에 의하여 코어 오디오 오브젝트 타입을 독출할 수 있다. 여기서, "coreAudioObjectType"은 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타낸다.
다시 도 1을 참조하면, 코어 오디오 데이터 복호화부(130)는 역다중화부(100)에서 역다중화된 코어 오디오 데이터를 복호화한다. 보다 상세하게는, 코어 오디오 데이터 복호화부(130)는 코어 오디오 오브젝트 타입 검출부(120)에서 검출된 코어 오디오 오브젝트 타입에 따라 역다중화된 코어 오디오 데이터를 복호화한다.
상술한 바와 같이, 코어 오디오 오브젝트 타입은 부호화단에서 다운 믹스된 신호를 부호화하는 오디오 오브젝트 타입을 말한다. 여기서, 코어 오디오 데이터는 부호화단에서 BSAC(Bit Sliced Arithmetic Coding), AAC(Advanced Audio Coding), MP3(MPEG Audio Layer-3) 등과 같은 다양한 부호화 방식 가운데 어느 하나에 의하여 부호화될 수 있다. 여기서, BSAC, AAC, MP3 등은 본 발명의 실시예에 불과하며, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 다양한 부호화 방식에 의해 코어 오디오 데이터는 부호화될 수 있음을 이해할 수 있다.
둘째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타 입이 레지듀얼 코딩 데이터인 경우에 대하여 살펴보기로 한다. 다시 말해, 이 경우에는 "bsSacExtType"은 '0'이다.
도 5는 본 발명의 일 실시예에 따른 레지듀얼 코딩 데이터를 복호화하기 위한 신택스를 도시한 도면이다. 이하에서는, 도 1 및 5를 참조하여 레지듀얼 코딩 데이터 복호화부(140)의 동작에 대하여 설명하기로 한다.
레지듀얼 코딩 데이터 복호화부(140)는 제1 코어 오디오 오브젝트 타입 판별부(141), 제1 BSAC 복호화부(142), 및 제1 AAC 복호화부(143)를 포함하여 레지듀얼 코딩 데이터를 복호화한다.
공간 확장 데이터 타입 검출부(110)에서 공간 확장 데이터의 타입을 검출한 결과, 공간 확장 데이터가 레지듀얼 코딩 데이터라고 판단되면, 제1 코어 오디오 오브젝트 타입 판별부(141)는 코어 오디오 오브젝트 타입이 'BSAC'인지 여부를 판단한다.
도 5를 참조하면, 'BSAC'의 코어 오디오 오브젝트 타입으로 '22'가 할당되었으므로, 제1 코어 오디오 오브젝트 타입 판별부(141)는 코어 오디오 오브젝트 타입 검출부(120)에서 검출된 "coreAudioObjectType"이 '22'에 해당하는지 여부를 판단한다.
제1 코어 오디오 오브젝트 타입 판별부(141)의 판단 결과, 코어 오디오 오브젝트 타입이 'BSAC'에 해당하면, 제1 BSAC 복호화부(142)는 'BSAC'에 의해서 레지듀얼 신호를 복호화한다. 예를 들어, 제1 BSAC 복호화부(142)는 도 5에 도시된 신택스의 식별번호 500 또는 520에 의하여 실시될 수 있다. 식별번호 500 또는 520에 서 제1 BSAC 복호화부(142)는 MPEG-4 ER BSAC에 정의되어 있는 함수 bsac_raw_data_block()에 의하여 레지듀얼 코딩 데이터를 복호화한다. 여기서, bsac_raw_data_block()의 "nch"는 항상 '1'로 설정되어 있어야 한다. 여기서, "nch"는 채널의 수(Number of Channels)를 나타낸다.
제1 코어 오디오 오브젝트 타입 판별부(141)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되면, 제1 AAC 복호화부(143)는 'AAC'에 의해서 레지듀얼 코딩 데이터를 복호화한다. 예를 들어, 제1 AAC 복호화부(143)는 도 5에 도시된 신택스의 식별번호 510 또는 530에 의하여 실시될 수 있다. 식별번호 510 또는 530에서 제1 AAC 복호화부(143)는 ISO/IEC 13818-7의 subclause 6.3에 기재된 "MPEG-2 AAC Low Complexity profile bitstream syntax"에 정의되어 있는 individual_channel_stream(0)에 의하여 레지듀얼 코딩 데이터를 복호화한다.
그러나, 제1 AAC 복호화부(143)에서 'AAC'는 단순히 일 실시예에 불과하며, 제1 코어 오디오 오브젝트 타입 판별부(141)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제1 AAC 복호화부(143)에서는 제1 코어 오디오 오브젝트 타입 판별부(141)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 디코딩 방식으로 레지듀얼 코딩 데이터를 복호화할 수 있다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(141)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제1 AAC 복호화부(143)에서는 'MP3'에 의해서 레지듀얼 코딩 데이터를 복호화한다.
이와 같이, 제1 BSAC 복호화부(142) 또는 제1 AAC 복호화부(143)에서 복호화 된 레지듀얼 코딩 데이터를 이용하여 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 멀티 채널 신호로 업믹싱할 수 있다.
셋째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입이 아비트레리 다운 믹스 레지듀얼 코딩 데이터인 경우에 대하여 살펴보기로 한다. 다시 말해, 이 경우에는 "bsSacExtType"은 '1'이다.
도 6은 본 발명의 일 실시예에 따른 아비트레리 다운 믹스 레지듀얼 데이터를 복호화하기 위한 신택스를 도시한 도면이다. 이하에서는, 도 1 및 6을 참조하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부(150)의 동작에 대하여 설명하기로 한다.
아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부(150)는 제2 코어 오디오 오브젝트 타입 판별부(151), 제2 BSAC 복호화부(152), 및 제2 AAC 복호화부(153)를 포함하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다.
제2 코어 오디오 오브젝트 타입 판별부(151)의 판단 결과, 코어 오디오 오브젝트 타입이 'BSAC'에 해당하면, 제2 BSAC 복호화부(152)는 'BSAC'에 의해서 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 예를 들어, 제2 BSAC 복호화부(152)는 도 6에 도시된 신택스의 식별번호 600, 620, 640 및 660 중 적어도 어느 하나 이상에 의하여 실시될 수 있다. 식별번호 600, 620, 640 및 660 중 적어도 어느 하나 이상에서 제2 BSAC 복호화부(152)는 MPEG-4 ER BSAC에 정의되어 있는 함수 bsac_raw_data_block()에 의하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 여기서, bsac_raw_data_block()의 "nch"는 항상 '1'로 설정되어 있어 야 한다. 여기서, "nch"는 채널의 수(Number of Channels)를 나타낸다.
제1 코어 오디오 오브젝트 타입 판별부(151)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되면, 제2 AAC 복호화부(152)는 'AAC'에 의해서 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 예를 들어, 제2 AAC 복호화부(153)는 도 6에 도시된 신택스의 식별번호 610, 630, 650 및 670 중 적어도 어느 하나 이상에 의하여 실시될 수 있다. 식별번호 610 또는 650에서 제2 AAC 복호화부(153)는 ISO/IEC 13818-7의 subclause 6.3에 기재된 "MPEG-2 AAC Low Complexity profile bitstream syntax"에 정의되어 있는 individual_channel_stream(0)에 의하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 또한, 식별번호 630 또는 670에서 제2 AAC 복호화부(153)는 ISO/IEC 13818-7의 subclause 6.3에 기재된 "MPEG-2 AAC Low Complexity profile bitstream syntax"에 정의되어 있는 channel_pair_element()에 의하여 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다. 여기서, 파라미터 "common_window"는 '1'로 설정되어 있다.
그러나, 제2 AAC 복호화부(153)에서 'AAC'는 단순히 일 실시예에 불과하며, 제2 코어 오디오 오브젝트 타입 판별부(151)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제2 AAC 복호화부(153)에서는 제2 코어 오디오 오브젝트 타입 판별부(151)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 디코딩 방식으로 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화할 수 있다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(151)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제2 AAC 복호화부(153)에서는 'MP3'에 의해서 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화한다.
이와 같이, 제2 BSAC 복호화부(152) 또는 제2 AAC 복호화부(153)에서 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 멀티 채널 신호로 업믹싱할 수 있다.
넷째, 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터 타입이 MPEG-4 오디오의 코어 오디오 오브젝트 타입을 나타내는 데이터, 레지듀얼 코딩 데이터 또는 아비트레리 다운 믹스 레지듀얼 코딩 데이터가 아닌 경우에 대하여 살펴보기로 한다.
공간 확장 데이터 복호화부(160)는 공간 확장 데이터 타입 검출부(110)에서 검출된 공간 확장 데이터의 타입에 대응하는 방식으로 복호화를 수행한다. 이와 같이, 공간 확장 데이터 복호화부(160)에서 복호화된 데이터를 이용하여 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 멀티 채널 신호로 업믹싱할 수 있다.
업믹싱부(170)는 코어 오디오 데이터 복호화부(130)에서 복호화된 코어 오디오 데이터를 제1 및 제2 BSAC 복호화부(142, 152), 제1 및 제2 ACC 복호화부(143, 153), 또는 공간 확장 데이터 복호화부(160)에서 복호화된 결과를 이용하여 멀티 채널 신호로 업믹싱한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
도 7은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 7을 참조하면, 본 실시예에 따른 다채널 오디오 신호의 복호화 방법은 도 1에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 1에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.
700 단계에서 공간 확장 데이터 타입 검출부(110)는 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출한다.
710 단계에서 코어 오디오 오브젝트 타입 검출부(120)는 공간 확장 데이터가 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입을 나타내는 데이터인 경우, 코어 오디오 오브젝트 타입을 검출한다.
720 단계에서 코어 오디오 데이터 복호화부(130)는 검출된 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화한다.
730 단계에서 레지듀얼 코딩 데이터 복호화부(140)는 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 레지듀얼 코딩 데이터를 복호화한다.
740 단계에서 업믹싱부(170)는 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱한다.
본 실시예에서 따른 오디오 신호의 복호화 방법은 공간 확장 데이터가 아비 트레리 다운 믹스 레지듀얼 코딩 데이터인 경우, 코어 오디오 오브젝트 타입에 따른 복호화 방식으로 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화하는 단계를 더 포함할 수 있다. 이 경우, 업믹싱부(170)는 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터 및 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 업믹싱할 수 있다.
또한, 본 실시예에 따른 오디오 신호의 복호화 방법은 공간 확장 데이터가 코어 오디오 오브젝트 타입을 나타내는 데이터, 레지듀얼 코딩 데이터 및 아비트레리 다운 믹스 코딩 데이터 외의 데이터인 경우, 공간 확장 데이터의 타입에 따른 복호화 방식으로 공간 확장 데이터를 복호화하는 단계를 더 포함할 수 있다. 이 경우, 업믹싱부(170)는 복호화된 코어 오디오 데이터를 복호화된 레지듀얼 코딩 데이터, 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터, 및 복호화된 공간 확장 데이터를 이용하여 업믹싱할 수 있다.
도 8은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 8을 참조하면, 다채널 오디오 신호의 부호화 장치는 다운믹싱부(down-mixing unit, 800), 코어 오디오 데이터 부호화부(core audio data encoding unit, 810), 레지듀얼 데이터 부호화부(residual data encoding unit, 820), 아비트레리 다운 믹스 레지듀얼 데이터 부호화부(arbitrary down-mix residual data encoding unit, 830), 및 다중화부(multiplexing unit, 840)를 포함한다.
다운믹싱부(800)는 입력 신호(IN)를 다운믹싱한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM(Pulse Code Modulation) 신호일 수 있다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
코어 오디오 데이터 부호화부(810)는 다운믹싱부(800)에서 출력된 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화한다. 여기서, 코어 오디오 데이터는 BSAC(Bit Sliced Arithmetic Coding), AAC(Advanced Audio Coding), MP3(MPEG Audio Layer-3) 등과 같은 다양한 부호화 방식 가운데 어느 하나에 의하여 부호화될 수 있다. 여기서, BSAC, AAC, MP3 등은 본 발명의 실시예에 불과하며, 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 다양한 부호화 방식에 의해 코어 오디오 데이터는 부호화될 수 있음을 이해할 수 있다.
레지듀얼 데이터 부호화부(820)는 제1 코어 오디오 오브젝트 타입 판별부(core audio object type determining unit, 821), 제1 BSAC 부호화부(BSAC encoding unit, 822) 및 제1 AAC 부호화부(AAC encoding unit, 823)를 포함하여 레지듀얼 데이터를 부호화한다.
제1 코어 오디오 오브젝트 타입 판별부(821)는 코어 오디오 데이터 부호화부(810)에서 코어 오디오 데이터를 부호화하는 방식인 코어 오디오 오브젝트 타입을 판별하여 레지듀얼 데이터의 부호화 방식을 결정한다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(821)는 코어 오디오 오브젝트 타입이 'BSAC'인 경우 레지듀얼 데이터의 부호화 방식을 'BSAC'으로 결정하고, 코어 오디오 오브젝트 타입 이 'AAC'인 경우 레지듀얼 데이터의 부호화 방식을 'AAC'로 결정한다.
제1 BSAC 부호화부(822)는 제1 코어 오디오 오브젝트 타입 판별부(821)의 판단 결과 코어 오디오 오브젝트 타입이 'BSAC'인 경우에 레지듀얼 데이터를 'BSAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.
제1 AAC 부호화부(823)는 제1 코어 오디오 오브젝트 타입 판별부(821)의 판단 결과 코어 오디오 오브젝트 타입이 'AAC'인 경우에 레지듀얼 데이터를 'AAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.
그러나, 제1 AAC 부호화부(823)에서 'AAC'는 단순히 일 실시예에 불과하며, 제1 코어 오디오 오브젝트 타입 판별부(821)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제1 AAC 복호화부(823)에서는 제1 코어 오디오 오브젝트 타입 판별부(821)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 부호화 방식으로 레지듀얼 데이터를 부호화할 수 있다. 예를 들어, 제1 코어 오디오 오브젝트 타입 판별부(821)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제1 AAC 부호화부(823)에서는 'MP3'에 의해서 레지듀얼 데이터를 부호화한다.
아비트레리 다운 믹스 레지듀얼 데이터 부호화부(830)는 제2 코어 오디오 오브젝트 타입 판별부(831), 제2 BSAC 부호화부(832) 및 제2 AAC 부호화부(833)를 포함하여 레지듀얼 데이터를 부호화한다.
제2 코어 오디오 오브젝트 타입 판별부(831)는 코어 오디오 데이터 부호화부(810)에서 코어 오디오 데이터를 부호화하는 방식인 코어 오디오 오브젝트 타입을 판별하여 레지듀얼 데이터의 부호화 방식을 결정한다. 예를 들어, 제2 코어 오디오 오브젝트 타입 판별부(831)는 코어 오디오 오브젝트 타입이 'BSAC'인 경우 레지듀얼 데이터의 부호화 방식을 'BSAC'으로 결정하고, 코어 오디오 오브젝트 타입이 'AAC'인 경우 레지듀얼 데이터의 부호화 방식을 'AAC'로 결정한다.
제2 BSAC 부호화부(832)는 제2 코어 오디오 오브젝트 타입 판별부(831)의 판단 결과 코어 오디오 오브젝트 타입이 'BSAC'인 경우에 레지듀얼 데이터를 'BSAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.
제2 AAC 부호화부(833)는 제2 코어 오디오 오브젝트 타입 판별부(831)의 판단 결과 코어 오디오 오브젝트 타입이 'AAC'인 경우에 레지듀얼 데이터를 'AAC' 방식으로 부호화한다. 이로써, 코어 오디오 데이터와 레지듀얼 데이터를 동일한 부호화 방식으로 부호화하여 부호화단의 복잡도를 줄일 수 있다.
그러나, 제2 AAC 부호화부(833)에서 'AAC'는 단순히 일 실시예에 불과하며, 제2 코어 오디오 오브젝트 타입 판별부(831)에서 코어 오디오 오브젝트 타입이 'BSAC'에 해당하지 않는다고 판단되는 경우, 제2 AAC 복호화부(833)에서는 제2 코어 오디오 오브젝트 타입 판별부(831)에서 검출된 코어 오디오 오브젝트 타입에 대응하는 부호화 방식으로 레지듀얼 데이터를 부호화할 수 있다. 예를 들어, 제2 코어 오디오 오브젝트 타입 판별부(831)에서 검출된 코어 오디오 오브젝트 타입이 'MP3'일 경우 제2 AAC 부호화부(833)에서는 'MP3'에 의해서 레지듀얼 데이터를 부호화한다.
다중화부(840)는 코어 오디오 데이터 부호화부(810)에서 부호화된 결과, 제1 및 제2 BSAC 부호화부(822, 832)에서 부호화된 결과, 및 제1 및 제2 AAC 부호화부(823, 833)에서 부호화된 결과를 다중화하여 비트스트림을 생성하여 출력 단자 OUT로 출력한다.
도 9는 본 발명의 일 실시예에 따른 다채널 오디오 신호의 부호화 방법을 나타내는 흐름도이다.
도 9를 참조하면, 본 실시예에 따른 다채널 오디오 신호의 부호화 방법은 도 8에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 8에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.
900 단계에서 다운믹싱부(900)는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성한다.
910 단계에서 코어 오디오 데이터 부호화부(910)는 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화한다.
920 단계에서 레지듀얼 데이터 부호화부(920)는 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 소정의 부호화 방식에 따라 레지듀얼 데이터를 부호화한다.
930 단계에서 다중화부(940)는 부호화된 코어 오디오 데이터 및 부호화된 레지듀얼 데이터를 다중화하여 오디오 신호에 대한 부호화 결과로써 출력한다.
상기 900 단계는 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터, 레지듀얼 데이터, 및 아비트레리 다운 믹스 레지듀얼 데이터를 생성할 수 있다. 이 경우, 본 실시예에 따른 오디오 신호의 부호화 방법은 코어 오디오 오브젝트 타입에 따른 소정의 부호화 방식에 따라 아비트레리 다운 믹스 레지듀얼 데이터를 부호화하는 단계를 더 포함할 수 있다. 이 경우, 다중화부(940)는 부호화된 코어 오디오 데이터, 부호화된 레지듀얼 데이터, 및 부호화된 아비트레리 다운 믹스 레지듀얼 데이터를 다중화하여 오디오 신호에 대한 부호화 결과로써 출력할 수 있다.
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
도 1은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 2는 본 발명의 일 실시예에 따른 공간 확장 데이터 타입을 검출하기 위한 신택스를 도시한 도면이다.
도 3은 도 2에 도시된 "bsSacExtType"에 대응하는 값들이 할당된 테이블의 일 실시예를 도시한 도면이다.
도 4는 본 발명의 일 실시예에 따른 코어 오디오 오브젝트 타입을 독출하기 위한 신택스를 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 레지듀얼 코딩 데이터를 복호화하기 위한 신택스를 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 아비트레리 다운 믹스 레지듀얼 데이터를 복호화하기 위한 신택스를 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 8은 본 발명의 일 실시예에 따른 다채널 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 9는 본 발명의 일 실시예에 따른 다채널 오디오 신호의 부호화 방법을 나타내는 흐름도이다.

Claims (24)

  1. 비트스트림에 포함된 공간 확장 데이터의 타입을 검출하는 단계;
    코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하는 단계;
    상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 제1 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
  2. 제1항에 있어서,
    상기 공간 확장 데이터가 아비트레리 다운 믹스 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화하는 단계를 더 포함하는 것을 특징으 로 하는 다채널 오디오 신호의 복호화 방법.
  3. 제2항에 있어서,
    상기 업믹싱하는 단계는
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터 혹은 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
  4. 제2항에 있어서,
    상기 공간 확장 데이터가 상기 코어 오디오 오브젝트 타입을 나타내는 데이터, 상기 레지듀얼 코딩 데이터 및 상기 아비트레리 다운 믹스 코딩 데이터 외의 데이터인 경우, 상기 공간 확장 데이터의 타입에 따른 복호화 방식으로 상기 공간 확장 데이터를 복호화하는 단계를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
  5. 제4항에 있어서,
    상기 업믹싱하는 단계는
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터, 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터, 혹은 상기 복호화된 공간 확장 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
  6. 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 단계;
    코어 오디오 오브젝트 타입에 따른 복호화 방식으로 상기 오디오 데이터를 복호화하는 단계;
    상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 제1 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  7. 오디오 신호의 부호화 결과에 포함된 공간 확장 데이터의 타입을 검출하는 공간 확장 데이터 타입 검출부;
    코어 오디오 오브젝트 타입에 따른 복호화 방식으로 코어 오디오 데이터를 복호화하는 코어 오디오 데이터 복호화부;
    상기 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 제1 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 레지듀얼 코딩 데이터 복호화부; 및
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 업믹싱부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
  8. 제7항에 있어서,
    상기 공간 확장 데이터가 아비트레리 다운 믹스 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 복호화하는 아비트레리 다운 믹스 레지듀얼 코딩 데이터 복호화부를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
  9. 제8항에 있어서,
    상기 업믹싱부는
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터 혹은 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
  10. 제8항에 있어서,
    상기 공간 확장 데이터가 상기 코어 오디오 오브젝트 타입을 나타내는 데이터, 상기 레지듀얼 코딩 데이터 및 상기 아비트레리 다운 믹스 코딩 데이터 외의 데이터인 경우, 상기 공간 확장 데이터의 타입에 따른 복호화 방식으로 상기 공간 확장 데이터를 복호화하는 공간 확장 데이터 복호화부를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
  11. 제10항에 있어서,
    상기 업믹싱부는
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터, 상기 복호화된 아비트레리 다운 믹스 레지듀얼 코딩 데이터, 혹은 상기 복호화된 공간 확장 데이터를 이용하여 업믹싱하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 장치.
  12. 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계;
    상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계;
    상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및
    상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 레지듀얼 코딩이 적용된 것을 나타내는 정보와 함께 비트스트림에 포함시키는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
  13. 제12항에 있어서,
    상기 다운믹싱하는 단계는
    상기 입력된 오디오 신호를 다운믹싱하여 상기 코어 오디오 데이터, 상기 레지듀얼 데이터, 및 아비트레리 다운 믹스 레지듀얼 데이터를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
  14. 제13항에 있어서,
    상기 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 아비트레리 다운 믹스 레지듀얼 데이터를 부호화하는 단계를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
  15. 제14항에 있어서,
    상기 비트스트림은
    상기 부호화된 코어 오디오 데이터, 상기 부호화된 레지듀얼 데이터, 혹은 상기 부호화된 아비트레리 다운 믹스 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법.
  16. 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 단계;
    상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 단계;
    상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 단계; 및
    상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 레지듀얼 코딩이 적용된 것을 나타내는 정보와 함께비트스트림에 포함시키는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  17. 입력된 오디오 신호를 다운믹싱하여 코어 오디오 데이터 및 레지듀얼 데이터를 생성하는 다운믹싱부;
    상기 코어 오디오 데이터를 소정의 부호화 방식에 따라 부호화하는 코어 오디오 데이터 부호화부;
    상기 코어 오디오 데이터가 부호화된 방식인 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 상기 레지듀얼 데이터를 부호화하는 레지듀얼 데이터 부호화부; 및
    상기 부호화된 코어 오디오 데이터 및 상기 부호화된 레지듀얼 데이터를 레지듀얼 코딩이 적용된 것을 나타내는 정보와 함께비트스트림에 포함시키는 다중화부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
  18. 제17항에 있어서,
    상기 다운믹싱부는
    상기 입력된 오디오 신호를 다운믹싱하여 상기 코어 오디오 데이터, 상기 레지듀얼 데이터, 및 아비트레리 다운 믹스 레지듀얼 데이터를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
  19. 제17항에 있어서,
    상기 코어 오디오 오브젝트 타입에 따른 상기 소정의 부호화 방식에 따라 아비트레리 다운 믹스 레지듀얼 데이터를 부호화하는 아비트레리 다운 믹스 레지듀얼 데이터 부호화부를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
  20. 제19항에 있어서,
    상기 다중화부는
    상기 부호화된 코어 오디오 데이터, 상기 부호화된 레지듀얼 데이터, 및 상기 부호화된 아비트레리 다운 믹스 레지듀얼 데이터를 상기 오디오 신호에 대한 부호화 결과로써 출력하는 것을 특징으로 하는 다채널 오디오 신호의 부호화 장치.
  21. 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림과 다채널 생성을 위한 부가 정보가 포함된 비트스트림을 수신하는 단계;
    상기 다운 믹싱된 오디오 코어 신호에 해당하는 비트스트림으로부터 코어 오브젝트 타입을 검출하는 단계;
    상기 검출된 코어 오브젝트 타입에 의해 결정된 복호화 방식에 의해 상기 다운 믹싱된 오디오 코어 신호를 복호화하는 단계;
    상기 다채널 생성을 위한 부가 정보에 포함된 공간 확장 데이터가 레지듀얼 코딩 데이터인 경우, 상기 코어 오디오 오브젝트 타입에 따른 상기 복호화 방식으로 상기 레지듀얼 코딩 데이터를 복호화하는 단계; 및
    상기 복호화된 코어 오디오 데이터를 상기 복호화된 레지듀얼 코딩 데이터를 이용하여 업 믹싱하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 복호화 방법.
  22. 제1 항에 있어서, 상기 제1 복호화 방식은 AAC 인 다채널 오디오 신호의 복호화 방법.
  23. 제7 항에 있어서, 상기 제1 복호화 방식은 AAC 인 다채널 오디오 신호의 복호화 장치.
  24. 다운 믹싱된 모노 신호를 복호화하는 단계;
    레지듀얼 코딩이 적용되었는지를 나타내는 정보를 참조하여, 레지듀얼 신호를 복호화하는 단계;
    상기 복호화된 다운 믹싱된 모노 신호로부터 복수개의 채널신호를 생성하기 위한 부가정보를 복호화하는 단계; 및
    상기 복호화된 부가정보 및 복호화된 레지듀얼 신호를 사용하여 복호화된 다운 믹싱된 모노 신호함으로써, 상기 상기 복수개의 채널신호를 복원하는 단계를 포함하는 다채널 복호화 방법.
KR1020070088315A 2006-10-18 2007-08-31 다채널 오디오 신호의 부호화/복호화 방법 및 장치 Expired - Fee Related KR101434834B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US11/907,398 US8571875B2 (en) 2006-10-18 2007-10-11 Method, medium, and apparatus encoding and/or decoding multichannel audio signals
US14/065,073 US8977557B2 (en) 2006-10-18 2013-10-28 Method, medium, and apparatus encoding and/or decoding multichannel audio signals
US14/629,839 US9570082B2 (en) 2006-10-18 2015-02-24 Method, medium, and apparatus encoding and/or decoding multichannel audio signals

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060101580 2006-10-18
KR20060101580 2006-10-18

Publications (2)

Publication Number Publication Date
KR20080035448A KR20080035448A (ko) 2008-04-23
KR101434834B1 true KR101434834B1 (ko) 2014-09-02

Family

ID=39574424

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070088315A Expired - Fee Related KR101434834B1 (ko) 2006-10-18 2007-08-31 다채널 오디오 신호의 부호화/복호화 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101434834B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2522015B1 (en) 2010-01-06 2017-03-08 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
KR20120071072A (ko) 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
CN114913864A (zh) * 2022-05-10 2022-08-16 深圳壹账通智能科技有限公司 音频数据处理方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060077832A (ko) * 2004-12-31 2006-07-05 한국전자통신연구원 공간정보기반 오디오 부호화에서의 공간정보 추출 방법
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060077832A (ko) * 2004-12-31 2006-07-05 한국전자통신연구원 공간정보기반 오디오 부호화에서의 공간정보 추출 방법
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding

Also Published As

Publication number Publication date
KR20080035448A (ko) 2008-04-23

Similar Documents

Publication Publication Date Title
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP6288100B2 (ja) オーディオエンコード装置及びオーディオデコード装置
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101629306B1 (ko) 적응형 하이브리드 변환을 사용한 다채널 오디오 엔코딩된 비트 스트림들의 디코딩
KR101414455B1 (ko) 스케일러블 채널 복호화 방법
KR101615262B1 (ko) 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
KR20100087661A (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR102142837B1 (ko) 오디오 인코더 및 디코더
KR20100048202A (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
EP1932239A1 (en) Method and apparatus for encoding/decoding
TWI483619B (zh) 一種媒體訊號的編碼/解碼方法及其裝置
KR101434834B1 (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
KR20110138367A (ko) 보조 데이터의 삽입 및 추출
KR100718132B1 (ko) 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
KR101842258B1 (ko) 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
KR20150009474A (ko) 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
HK1125750B (en) Method and apparatus for encoding/decoding
HK1127665B (en) Apparatus for processing media signal and method thereof

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20070831

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20120823

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20070831

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20131022

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20140521

PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20140821

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20140822

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PC1903 Unpaid annual fee