본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 1을 참조하면, 오디오 신호의 부호화 장치는 스테레오 부호화부(100), 밴드 분할부(110), 제1 MDCT 적용부(120), 주파수 선형 예측 수행부(130), 멀티-레졸루션 분석부(140), 양자화부(150), 문맥-기반 비트플레인 부호화부(160), 제2 MDCT 적용부(170), 대역폭 확장 부호화부(180) 및 다중화부(190)를 포함한다.
스테레오 부호화부(100)는 입력 신호(IN)에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호(IN)를 다운믹싱(down-mixing)한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM(Pulse Code Modulation) 신호일 수 있다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
구체적으로, 스테레오 파라미터는 스테레오 신호에 대한 부가 정보(side information)를 나타내는 것으로, 부가 정보는 좌채널 신호 및 우채널 신호의 채널 간의 위상차 또는 강도차 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
밴드 분할부(110)는 스테레오 부호화부(100)에서 다운믹싱된 신호를 저주파수 밴드 신호(LB, low frequency band signal) 및 고주파수 밴드 신호(HB, high frequency band signal)로 분할한다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.
제1 MDCT 적용부(120)는 밴드 분할부(110)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, 시간 도메인은 시간의 경과에 따라 입력 신호의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이고, 주파수 도메인은 주파수의 변화에 따라 입력 신호의 크기를 나타내는 도메인이다.
주파수 선형 예측 수행부(130)는 제1 MDCT 적용부(120)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합(linear combination)으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(130)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류(prediction error)가 최소가 되도록 선형 예측 필터의 계수(coefficient)를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(130)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.
구체적으로, 주파수 선형 예측 수행부(130)는 제1 MDCT 적용부(120)에서 주파수 도메인으로 변환된 저주파수 밴드 신호(LB)가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(130)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.
멀티-레졸루션 분석부(140)는 제1 MDCT 적용부(120)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(130)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(140)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(130)에서 필터링된 신호를 두 가지 유형(예를 들어, 스테이빌(stabile) 유형과 숏(short) 유형)으로 나누어 분석할 수 있다.
구체적으로, 멀티-레졸루션 분석부(140)는 제1 MDCT 적용부(120)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(130)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(140)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.
양자화부(150)는 주파수 선형 예측 수행부(130)에서 필터링된 신호 또는 멀티-레졸루션 분석부(140)에서 출력된 결과를 양자화한다.
문맥-기반 비트플레인 부호화부(160)는 문맥을 기반으로 하여 양자화부(150)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(160)는 허프만 코딩(Huffman Coding)을 이용하여 양자화부(150)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.
이와 같이, 주파수 선형 예측 수행부(130), 멀티-레졸루션 분석부(140), 양자화부(150) 및 문맥-기반 비트플레인 부호화부(160)는 제1 MDCT 적용부(120)에서 출력된 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.
제2 MDCT 적용부(170)는 밴드 분할부(110)에서 분할된 고주파수 밴드 신호(HB)에 대하여 MDCT를 수행하여 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인으로 변환한다.
대역폭 확장 부호화부(180)는 제2 MDCT 적용부(170)에서 주파수 도메인으 로변환된 고주파수 밴드 신호의 성분을 전달하기 위하여, 제1 MDCT 적용부(120)에서 주파수 도메인으로 변환된 저주파수 밴드 신호를 이용하여 제2 MDCT 적용부(170)에서 주파수 도메인으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(180)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드의 정보를 이용하여 상술한 바와 같은 대역폭 확장 정보를 생성할 수 있다. 본 발명의 다른 실시예에서, 대역폭 확장 부호화부(180)는 저주파수 밴드 신호에 대하여 부호화된 결과를 이용하여 대역폭 확장 정보를 생성할 수 있다.
다중화부(190)는 스테레오 부호화부(100), 주파수 선형 예측 수행부(130), 문맥-기반 비트플레인 부호화부(160) 및 대역폭 확장 부호화부(180)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한 다.
도 2는 본 발명의 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 2를 참조하면, 오디오 신호의 부호화 장치는 스테레오 부호화부(200), 밴드 분할부(210), MDCT 적용부(220), 주파수 선형 예측 수행부(230), 멀티-레졸루션 분석부(240), 양자화부(250), 문맥-기반 비트플레인 부호화부(260), 저주파수 밴드 변환부(270), 고주파수 밴드 변환부(275), 대역폭 확장 부호화부(280) 및 다중화부(290)를 포함한다.
스테레오 부호화부(200)는 입력 신호(IN)에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호(IN)를 다운믹싱한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
구체적으로, 스테레오 파라미터는 스테레오 신호에 대한 부가 정보를 나타내는 것으로, 부가 정보는 좌채널 신호 및 우채널 신호의 채널 간의 위상차 또는 강도차 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
밴드 분할부(210)는 스테레오 부호화부(200)에서 출력된 다운믹싱된 신호를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.
MDCT 적용부(220)는 밴드 분할부(210)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다.
주파수 선형 예측 수행부(230)는 MDCT 적용부(220)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(230)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(230)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.
구체적으로, 주파수 선형 예측 수행부(230)는 MDCT 적용부(220)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(230)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.
멀티-레졸루션 분석부(240)는 MDCT 적용부(220)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(230)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도로 분석한다. 구체적으로, 멀티-레졸루션 분석부(240)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(230)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.
구체적으로, 멀티-레졸루션 분석부(240)는 MDCT 적용부(220)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(230)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(240)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.
양자화부(250)는 주파수 선형 예측 수행부(520)에서 필터링된 신호 또는 멀티-레졸루션 분석부(240)에서 출력된 결과를 양자화한다.
문맥-기반 비트플레인 부호화부(260)는 문맥을 기반으로 하여 양자화부(250)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(260)는 허프만 코딩을 이용하여 양자화부(250)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.
이와 같이, 주파수 선형 예측 수행부(230), 멀티-레졸루션 분석부(240), 양자화부(250) 및 문맥-기반 비트플레인 부호화부(260)는 MDCT 적용부(220)에서 출력된 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.
저주파수 밴드 변환부(270)는 밴드 분할부(210)에서 분할된 저주파수 밴드 신호(LB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 예를 들어, 저주파수 밴드 변환부(270)는 MDST(Modified Discrete Sine Transform), FFT(Fast Fourier Transform), 및 QMF(Quadrature Mirror Filter) 등을 이용하여 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다. 여기서, 시간 도메인은 시간의 경과에 따라 저주파수 밴드 신호(LB)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이다. 이에 비해, 주파수 도메인은 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다. 시간/주파수 도메인은 시간의 경과 및 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다.
고주파수 밴드 변환부(275)는 밴드 분할부(210)에서 분할된 고주파수 밴드 신호(HB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 여기서, 고주파밴드 변환부(275)는 저주파밴드 변환부(270)에서 이용하는 동일한 변환 기법을 이용한다. 예를 들어, 고주파수 밴드 변환부(275)는 MDST, FFT, 및 QMF 등을 이용하여 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다.
대역폭 확장 부호화부(280)는 저주파수 밴드 변환부(270)에서 주파수 영역 또는 시간/주파수 영역으로 변환된 저주파수 밴드 신호를 이용하여, 고주파수 밴드 변환부(275)에서 주파수 영역 또는 시간/주파수 영역으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(280)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 상술한 바와 같은 저주파수 밴드의 정보를 이용하여 대역폭 확장 정보를 생성할 수 있다. 본 발명의 다른 실시예에서, 대역폭 확장 부호화부(280)는 저주파수 밴드 신호에 대하여 부호화된 결과를 이용하여 대역폭 확장 정보를 생성할 수 있다.
다중화부(290)는 스테레오 부호화부(200), 주파수 선형 예측 수행부(230), 문맥-기반 비트플레인 부호화부(260) 및 대역폭 확장 부호화부(280)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.
도 3은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 3을 참조하면, 오디오 신호의 부호화 장치는 스테레오 부호화부(300), 밴드 분할부(310), 모드 결정부(320), MDCT 적용부(325), 주파수 선형 예측 수행부(330), 멀티-레졸루션 분석부(340), 양자화부(350), 문맥-기반 비트플레인 부호화부(360), 저주파수 밴드 변환부(370), 고주파수 밴드 변환부(375), 대역폭 확장 부호화부(380), CELP(Code Excited Linear Prediction) 부호화부(385) 및 다중화부(390)를 포함한다.
스테레오 부호화부(300)는 입력 신호(IN)에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호(IN)를 다운믹싱한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
구체적으로, 스테레오 파라미터는 스테레오 신호에 대한 부가 정보를 나타내는 것으로, 부가 정보는 좌채널 신호 및 우채널 신호의 채널 간의 위상차 또는 강도차 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
밴드 분할부(310)는 스테레오 부호화부(300)에서 출력된 다운믹싱된 신호를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.
모드 결정부(320)는 소정의 기준에 따라 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB)를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다. 예를 들어, 모드 결정부(320)는 MDCT 적용부(325)에서 출력된 정보에 따라 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB)를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다.
MDCT 적용부(325)는 모드 결정부(320)에서 저주파수 밴드 신호(LB)를 주파수 도메인으로 부호화하는 것으로 결정된 경우, 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, MDCT가 수행된 결과는 모드 결정부(320)에서 부호화 도메인을 결정하는데 이용될 수 있다.
주파수 선형 예측 수행부(330)는 MDCT 적용부(325)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(330)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(330)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.
구체적으로, 주파수 선형 예측 수행부(330)는 MDCT 적용부(325)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(330)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.
멀티-레졸루션 분석부(340)는 MDCT 적용부(325)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(330)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도로 분석한다. 구체적으로, 멀티-레졸루션 분석부(340)는 오디오 스펙트럼의 변화의 격렬한 정도 에 따라 주파수 선형 예측 수행부(330)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.
구체적으로, 멀티-레졸루션 분석부(340)는 MDCT 적용부(325)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(330)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(340)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.
양자화부(350)는 주파수 선형 예측 수행부(330)에서 필터링된 신호 또는 멀티-레졸루션 분석부(340)에서 출력된 결과를 양자화한다.
문맥-기반 비트플레인 부호화부(360)는 문맥을 기반으로 하여 양자화부(350)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(360)는 허프만 코딩을 이용하여 양자화부(350)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.
이와 같이, 주파수 선형 예측 수행부(330), 멀티-레졸루션 분석부(340), 양자화부(350) 및 문맥-기반 비트플레인 부호화부(360)는 MDCT 적용부(325)에서 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.
저주파수 밴드 변환부(370)는 밴드 분할부(310)에서 분할된 저주파수 밴드 신호(LB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 예를 들어, 저주파수 밴드 변환부(370)는 MDST, FFT, 및 QMF 등을 이용하여 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다. 여기서, 시간 도메인은 시간의 경과에 따라 저주파수 밴드 신호(LB)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이다. 이에 비해, 주파수 도메인은 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다. 시간/주파수 도메인은 시간의 경과 및 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다.
고주파수 밴드 변환부(375)는 밴드 분할부(310)에서 분할된 고주파수 밴드 신호(HB)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 여기서, 고주파밴드 변환부(375)는 저주파밴드 변환부(370)에서 이용하는 동일한 변환 기법을 이용한다. 예를 들어, 고주파수 밴드 변환부(375)는 MDST, FFT, 및 QMF 등을 이용하여 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환할 수 있다.
대역폭 확장 부호화부(380)는 저주파수 밴드 변환부(370)에서 주파수 도메인또는 시간/주파수 도메인으로 변환된 저주파수 밴드 신호를 이용하여, 고주파수 밴드 변환부(375)에서 주파수 도메인 또는 시간/주파수 도메인으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확장 부호화부(380)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 저주파수 밴드의 정보를 이용하여 상술한 바와 같은 대역폭 확장 정보를 생성할 수 있다. 본 발명의 다른 실시예에서, 대역폭 확장 부호화부(380)는 저주파수 밴드 신호에 대하여 부호화된 결과를 이용하여 대역폭 확장 정보를 생성할 수 있다.
CELP 부호화부(385)는 모드 결정부(320)에서 저주파수 밴드 신호(LB)를 시간 도메인으로 부호화하는 것으로 결정된 경우, 저주파수 밴드 신호(LB)를 CELP 방식에 의해 부호화한다. 여기서, CELP 방식은 입력된 저주파수 밴드 신호(LB)에 대하여 선형 예측을 수행하여 계산된 선형 예측 필터의 계수를 이용하여 저주파수 밴드 신호(LB)를 필터링하여 포먼트 성분을 부호화하고, 필터링된 신호에 대하여 적응 코드북(adaptive codebook) 및 고정 코드북(fixed codebook)를 검색하여 피치 성분을 부호화한다.
다중화부(390)는 스테레오 부호화부(300), 주파수 선형 예측 수행부(330), 문맥-기반 비트플레인 부호화부(360), 대역폭 확장 부호화부(380) 및 CELP 부호화부(385)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.
도 4는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 4를 참조하면, 오디오 신호의 부호화 장치는 스테레오 부호화부(400), 밴드 분할부(410), 모드 결정부(420), 제1 MDCT 적용부(425), 주파수 선형 예측 수행 부(430), 멀티-레졸루션 분석부(440), 양자화부(450), 문맥-기반 비트플레인 부호화부(460), 제2 MDCT 적용부(470), 제3 MDCT 적용부(475), 대역폭 확장 부호화부(480), CELP 부호화부(485) 및 다중화부(490)를 포함한다.
스테레오 부호화부(400)는 입력 신호(IN)에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호(IN)를 다운믹싱한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
구체적으로, 스테레오 파라미터는 스테레오 신호에 대한 부가 정보를 나타내는 것으로, 부가 정보는 좌채널 신호 및 우채널 신호의 채널 간의 위상차 또는 강도차 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
밴드 분할부(410)는 스테레오 부호화부(400)에서 출력된 다운믹싱된 신호를 저주파수 밴드 신호(LB) 및 고주파수 밴드 신호(HB)로 분할한다. 여기서, 저주파수 밴드 신호는 임의의 임계값 보다 낮은 주파수에 해당하는 신호이며, 고주파수 밴드 신호는 임의의 임계값 보다 높은 주파수에 해당하는 신호일 수 있다.
모드 결정부(420)는 소정의 기준에 따라 밴드 분할부(410)에서 분할된 저주파수 밴드 신호(LB)를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다. 예를 들어, 모드 결정부(420)는 제1 MDCT 적용부(425)에서 출력된 결과에 따라 밴드 분할부(410)에서 분할된 저주파수 밴드 신호(LB)를 시간 도메 인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다.
제1 MDCT 적용부(425)는 모드 결정부(420)에서 저주파수 밴드 신호(LB)를 주파수 도메인으로 부호화하는 것으로 결정된 경우, 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다. 여기서, 시간 도메인은 시간의 경과에 따라 저주파수 밴드 신호(LB)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이다. 이에 비해, 주파수 도메인은 주파수의 변화에 따라 저주파수 밴드 신호(LB)의 크기를 나타내는 도메인이다. 여기서, MDCT가 수행된 결과는 모드 결정부(420)에서 부호화 도메인을 결정하는데 이용될 수 있다.
주파수 선형 예측 수행부(430)는 MDCT 적용부(425)에서 주파수 도메인으로 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(430)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(430)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.
구체적으로, 주파수 선형 예측 수행부(430)는 MDCT 적용부(425)에서 주파수 도메인으로 변환된 저주파수 밴드 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(430)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.
멀티-레졸루션 분석부(440)는 MDCT 적용부(425)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(430)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(440)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(430)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.
구체적으로, 멀티-레졸루션 분석부(440)는 MDCT 적용부(425)에서 주파수 도메인으로 변환된 저주파수 밴드 신호 또는 주파수 선형 예측 수행부(430)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(440)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.
양자화부(450)는 주파수 선형 예측 수행부(430)에서 필터링된 신호 또는 멀티-레졸루션 분석부(440)에서 출력된 결과를 양자화한다.
문맥-기반 비트플레인 부호화부(460)는 문맥을 기반으로 하여 양자화부(450)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(460)는 허프만 코딩을 이용하여 양자화부(450)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.
이와 같이, 주파수 선형 예측 수행부(430), 멀티-레졸루션 분석부(440), 양자화부(450) 및 문맥-기반 비트플레인 부호화부(460)는 MDCT 적용부(425)에서 변환된 저주파수 밴드 신호에 대해서 부호화를 수행하므로, 저주파수 밴드 부호화부라고 할 수 있다.
제2 MDCT 적용부(470)는 밴드 분할부(410)에서 분할된 저주파수 밴드 신호(LB)에 대하여 MDCT를 수행하여, 저주파수 밴드 신호(LB)를 시간 도메인에서 주파수 도메인으로 변환한다. 모드 결정부(420)에서 저주파수 밴드 신호(LB)를 주파수 도메인으로 부호화하는 것으로 결정된 경우, 제2 MDCT 적용부(470)는 저주파수 밴드 신호(LB)에 대해 별도의 MDCT를 수행하지 않는다. 이 경우, 제1 MDCT 적용부(470)의 출력을 제2 MDCT 적용부(470)의 출력으로 대체한다.
제3 MDCT 적용부(475)는 밴드 분할부(410)에서 분할된 고주파수 밴드 신호(HB)에 대하여 MDCT를 수행하여, 고주파수 밴드 신호(HB)를 시간 도메인에서 주파수 도메인으로 변환한다.
대역폭 확장 부호화부(480)는 제2 MDCT 적용부(470)에서 주파수 도메인으로 변환된 저주파수 밴드 신호를 이용하여, 제3 MDCT 적용부(475)에서 주파수 도메인으로 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다. 보다 상세하게는, 대역폭 확 장 부호화부(480)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성을 기초로 저주파수 밴드의 정보를 이용하여 상술한 바와 같은 대역폭 확장 정보를 생성할 수 있다. 본 발명의 다른 실시예에서, 대역폭 확장 부호화부(480)는 저주파수 밴드 신호에 대하여 부호화된 결과를 이용하여 대역폭 확장 정보를 생성할 수 있다.
CELP 부호화부(485)는 모드 결정부(420)에서 저주파수 밴드 신호(LB)를 시간 도메인으로 부호화하는 것으로 결정된 경우, 저주파수 밴드 신호(LB)를 CELP 방식에 의해 부호화한다. 여기서, CELP 방식은 입력된 저주파수 밴드 신호(LB)에 대하여 선형 예측을 수행하여 계산된 선형 예측 필터의 계수를 이용하여 저주파수 밴드 신호(LB)를 필터링하여 포먼트 성분을 부호화하고, 필터링된 신호에 대하여 적응 코드북 및 고정 코드북를 검색하여 피치 성분을 부호화한다.
다중화부(490)는 스테레오 부호화부(400), 주파수 선형 예측 수행부(430), 문맥-기반 비트플레인 부호화부(460), 대역폭 확장 부호화부(480) 및 CELP 부호화부(485)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.
도 5는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 5를 참조하면, 오디오 신호의 부호화 장치는 변환부(500), 스테레오 부호화부(510), 역변환부(520), 모드 결정부(530), FV-MLT 적용부(535), 주파수 선형 예측 수행부(540), 멀티-레졸루션 분석부(550), 양자화부(560), 문맥-기반 비트플 레인 부호화부(570), 대역폭 확장 부호화부(580), CELP 부호화부(585) 및 다중화부(590)를 포함한다.
변환부(500)는 입력 신호(IN)를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 구체적으로, 변환부(500)는 MDST, FFT 및 QMF 등을 이용하여 입력 신호(IN)를 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 이 경우, 변환부(500)는 MDCT를 이용할 수 없는 것은 아니지만, MDCT를 사용할 경우에는 다른 실시예가 보다 효율적이다.
여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 여기서, 시간 도메인은 시간의 경과에 따라 입력 신호(IN)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이다. 이에 비해, 주파수 도메인은 주파수의 변화에 따라 입력 신호(IN)의 크기를 나타내는 도메인이다. 시간/주파수 도메인은 시간의 경과 및 주파수의 변화에 따라 입력 신호(IN)의 크기를 나타내는 도메인이다.
스테레오 부호화부(510)는 변환부(500)에서 주파수 도메인 또는 시간/주파수 도메인으로 변환된 신호에서 스테레오 파라미터를 추출하여 부호화하고, 변환된 신호를 다운믹싱한다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
구체적으로, 스테레오 파라미터는 스테레오 신호에 대한 부가 정보를 나타내 는 것으로, 부가 정보는 좌채널 신호 및 우채널 신호의 채널 간의 위상차 또는 강도차 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
역변환부(520)는 스테레오 부호화부(510)에서 다운믹싱된 신호를 주파수 도메인 또는 시간/주파수 도메인에서 시간 도메인으로 역변환한다. 이 경우, 역변환부(520)는 변환부(500)에서 이용하는 변환 기법에 대응되는 역변환 기법을 이용할 수 있다. 예를 들어, 변환부(500)에서 QMF를 이용한 경우, 역변환부(520)는 역 QMF를 이용할 수 있다.
모드 결정부(530)는 소정의 기준에 따라 역변환부(520)에서 역변환된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다. 예를 들어, 모드 결정부(530)는 FV-MLT 적용부(535)에서 출력된 결과에 따라 역변환부(520)에서 역변환된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정할 수 있다.
FV-MLT 적용부(535)는 모드 결정부(530)에서 부호화 도메인이 결정된 신호에 대하여 FV-MLT(Frequency Varying Modulated Lapped Transform)를 수행하여, 모드 결정부(420)에서 부호화 도메인이 결정된 신호를 서브 밴드 별로 시간 도메인 또는 주파수 도메인 변환한다. 보다 상세하게 설명하면, FV-MLT는 시간 도메인으로 표현된 신호를 주파수 도메인으로 변환한 후 밴드 별로 적절히 시간 해상도(temporal resolution)를 조절하여 소정의 서브 밴드에 대하여 시간 도메인 또는 주파수 도메인으로 표현할 수 있는 적응적인(flexible) 변환 방식이다. 여기서, FV-MLT가 수행 된 결과는 모드 결정부(530)에서 부호화 도메인을 결정하는데 이용될 수 있다.
주파수 선형 예측 수행부(540)는 모드 결정부(530)에서 신호를 주파수 도메인으로 부호화하는 것으로 결정된 경우, FV-MLT 적용부(535)에서 주파수 도메인으로 변환된 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(540)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(540)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.
구체적으로, 주파수 선형 예측 수행부(540)는 FV-MLT 적용부(535)에서 주파수 도메인으로 변환된 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(540)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.
멀티-레졸루션 분석부(550)는 FV-MLT 적용부(535)에서 주파수 도메인으로 변환된 신호 또는 주파수 선형 예측 수행부(540)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도로 분석한다. 구체적으로, 멀티-레졸루션 분석부(550)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파 수 선형 예측 수행부(540)에서 필터링된 오디오 스펙트럼을 두 가지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.
구체적으로, 멀티-레졸루션 분석부(550)는 FV-MLT 적용부(535)에서 주파수 도메인으로 변환된 신호 또는 주파수 선형 예측 수행부(540)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(550)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.
양자화부(560)는 주파수 선형 예측 수행부(540)에서 필터링된 신호 또는 멀티-레졸루션 분석부(550)에서 출력된 결과를 양자화한다.
문맥-기반 비트플레인 부호화부(570)는 문맥을 기반으로 하여 양자화부(560)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(570)는 허프만 코딩을 이용하여 양자화부(560)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.
대역폭 확장 부호화부(580)는 스테레오 부호화부(510)에서 다운믹싱된 신호에서 대역폭 확장 정보를 추출하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
CELP 부호화부(585)는 모드 결정부(530)에서 신호를 시간 도메인으로 부호화하는 것으로 결정된 경우, FV-MLT 적용부(535)에서 시간 도메인으로 변환된 신호를 CELP 방식에 의해 부호화한다. 여기서, CELP 방식은 입력된 신호에 대하여 선형 예측을 수행하여 계산된 선형 예측 필터의 계수를 이용하여 신호를 필터링하여 포먼트 성분을 부호화하고, 필터링된 신호에 대하여 적응 코드북 및 고정 코드북를 검색하여 피치 성분을 부호화한다.
다중화부(590)는 스테레오 부호화부(500), 주파수 선형 예측 수행부(540), 문맥-기반 비트플레인 부호화부(570), 대역폭 확장 부호화부(580) 및 CELP 부호화부(585)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.
도 6은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 장치를 나타내는 블록도이다.
도 6을 참조하면, 오디오 신호의 부호화 장치는 모드 결정부(600), FV-MLT 적용부(610), 스테레오 부호화부(620), 주파수 선형 예측 수행부(630), 멀티-레졸루션 분석부(640), 양자화부(650), 문맥-기반 비트플레인 부호화부(660), 대역폭 확장 부호화부(670), CELP 부호화부(680) 및 다중화부(690)를 포함한다.
모드 결정부(600)는 소정의 기준에 따라 입력 신호(IN)를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다. 여기서, 입력 신호(IN)는 아날로그의 음성 신호 또는 오디오 신호를 디지털 신호로 변조한 PCM 신호일 수 있다. 예를 들어, 모드 결정부(600)는 FV-MLT 적용부(610)에서 출력된 결과에 따라 입력 신호(IN)를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다.
FV-MLT 적용부(610)는 모드 결정부(600)에서 부호화 도메인이 결정된 신호에 대하여 FL-MLT(Frequency Varying Modulated Lapped Transform)를 수행하여, 모드 결정부(600)에서 부호화 도메인이 결정된 신호를 서브 밴드 별로 시간 도메인 또는 주파수 도메인으로 변환한다. 보다 상세하게 설명하면, FV-MLT는 시간 도메인으로 표현된 신호를 주파수 도메인으로 변환한 후 밴드 별로 적절히 시간 해상도를 조절하여 소정의 서브 밴드에 대하여 시간 도메인 또는 주파수 도메인으로 표현할 수 있는 적응적인 변환 방식이다. 여기서, FV-MLT가 수행된 결과는 모드 결정부(600)에서 부호화 도메인을 결정하는데 이용될 수 있다. 여기서, 시간 도메인은 시간의 경과에 따라 입력 신호(IN)의 크기(예를 들어, 에너지 또는 음압 등)를 나타내는 도메인이다. 이에 비해, 주파수 도메인은 주파수의 변화에 따라 신호의 크기를 나타내는 도메인이다. 시간/주파수 도메인은 시간의 경과 및 주파수의 변화에 따라 신호의 크기를 나타내는 도메인이다.
스테레오 부호화부(620)는 FV-MLT 적용부(610)에서 변환된 신호에서 스테레오 파라미터를 추출하여 부호화하고, 변환된 신호를 다운믹싱한다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다.
구체적으로, 스테레오 파라미터는 스테레오 신호에 대한 부가 정보를 나타내는 것으로, 부가 정보는 좌채널 신호 및 우채널 신호의 채널 간의 위상차 또는 강도차 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
주파수 선형 예측 수행부(630)는 모드 결정부(600)에서 입력 신호(IN)를 주파수 도메인으로 부호화하는 것으로 결정된 경우, FV-MLT 적용부(610)에서 주파수 도메인으로 변환된 신호에 대하여 주파수 선형 예측을 수행한다. 여기서, 주파수 선형 예측은 현재 주파수에서의 신호를 이전 주파수에서의 신호의 선형 조합으로 근사하는 방법이다. 구체적으로, 주파수 선형 예측 수행부(630)는 선형 예측이 수행된 신호와 현재 주파수에서의 신호 사이의 차이인 예측 오류가 최소가 되도록 선형 예측 필터의 계수를 계산하고, 계산된 계수에 따라 주파수 도메인으로 변환된 저주파수 밴드 신호를 선형 예측 필터링한다. 이 때, 주파수 선형 예측 수행부(630)는 선형 예측 필터의 계수에 대응되는 값에 대하여 벡터 인덱스로 표현하는 벡터 양자화를 수행하여 부호화의 효율을 향상시킬 수 있다.
구체적으로, 주파수 선형 예측 수행부(630)는 FV-MLT 적용부(610)에서 주파수 도메인으로 변환된 신호가 음성(speech) 신호 또는 피치드(pitched) 신호인 경우에 주파수 선형 예측을 수행할 수 있다. 다시 말해, 주파수 선형 예측 수행부(630)는 입력되는 신호의 특성에 따라 주파수 선형 예측을 수행하여 부호화의 효율을 향상시킬 수 있다.
멀티-레졸루션 분석부(640)는 FV-MLT 적용부(610)에서 주파수 도메인으로 변환된 신호 또는 주파수 선형 예측 수행부(630)에서 필터링된 신호를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수를 다해상도(multi-resolution)로 분석한다. 구체적으로, 멀티-레졸루션 분석부(640)는 오디오 스펙트럼의 변화의 격렬한 정도에 따라 주파수 선형 예측 수행부(630)에서 필터링된 오디오 스펙트럼을 두 가 지 유형(예를 들어, 스테이빌 유형과 숏 유형)으로 나누어 분석할 수 있다.
구체적으로, 멀티-레졸루션 분석부(640)는 FV-MLT 적용부(610)에서 주파수 도메인으로 변환된 신호 또는 주파수 선형 예측 수행부(630)에서 필터링된 신호가 트렌젼트(transient) 신호인 경우에 멀티-레졸루션으로 분석할 수 있다. 다시 말해, 멀티-레졸루션 분석부(640)는 입력되는 신호의 특성에 따라 멀티-레졸루션 분석을 수행하여 부호화의 효율을 향상시킬 수 있다.
양자화부(650)는 주파수 선형 예측 수행부(630)에서 필터링된 신호 또는 멀티-레졸루션 분석부(640)에서 출력된 결과를 양자화한다.
문맥-기반 비트플레인 부호화부(660)는 문맥을 기반으로 하여 양자화부(650)에서 양자화된 결과를 비트플레인으로 부호화한다. 구체적으로, 문맥-기반 비트 플레인 부호화부(660)는 허프만 코딩을 이용하여 양자화부(650)에서 양자화된 결과를 비트플레인으로 부호화할 수 있다.
대역폭 확장 부호화부(670)는 스테레오 부호화부(620)에서 다운믹싱된 신호에서 대역폭 확장 정보를 추출하여 부호화한다. 여기서, 대역폭 확장 정보는 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 다양한 정보를 포함할 수 있음은 본 실시예가 속하는 기술분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.
CELP 부호화부(680)는 모드 결정부(530)에서 입력 신호(IN)를 시간 도메인으로 부호화하는 것으로 결정된 경우, 스테레오 부호화부(620)에서 다운믹싱된 신호를 CELP 방식에 의해 부호화한다. 여기서, CELP 방식은 다운믹싱된 신호에 대하여 선형 예측을 수행하여 계산된 선형 예측 필터의 계수를 이용하여 다운믹싱된 신호를 필터링하여 포먼트 성분을 부호화하고, 필터링된 신호에 대하여 적응 코드북 및 고정 코드북을 검색하여 피치 성분을 부호화한다.
다중화부(690)는 스테레오 부호화부(620), 주파수 선형 예측 수행부(630), 문맥-기반 비트플레인 부호화부(660), 대역폭 확장 부호화부(670) 및 CELP 부호화부(680)에서 부호화를 수행한 결과를 다중화하여 비트 스트림을 생성하고 출력 단자 OUT을 통해 출력한다.
도 7은 본 발명의 일 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 7을 참조하면, 오디오 신호의 복호화 장치는 역다중화부(700), 문맥-기반 비트플레인 복호화부(710), 역양자화부(720), 멀티-레졸루션 합성부(730), 역 주파수 선형 예측 수행부(740), 대역폭 확장 복호화부(750), 제1 역 MDCT 적용부(760), 제2 역 MDCT 적용부(770), 밴드 합성부(780) 및 스테레오 복호화부(790)를 포함한다.
역다중화부(700)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 여기서, 역다중화부(700)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원(reconstruction) 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, 신호 타입 정보(Signal type information), 주파수 선형 예측 및 벡터 양자화(Frequency-domain linear prediction and vector quantization)의 정보, 부호화된 대역폭 확장 정보 및 부호 화된 스테레오 파라미터 등이 있다.
문맥-기반 비트플레인 복호화부(710, Context-dependent Bit plane decoding unit)는 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(710)는 역다중화부(700)로부터 출력된 정보를 입력받아 허프먼 복호화(Huffman decoding)를 진행하여 주파수 스펙트럼, 코딩 밴드 모드(coding band mode) 정보 및 스케일 팩터(scale factor) 등을 복원한다. 구체적으로, 문맥-기반 비트플레인 복호화부(710)는 프레주디스 코딩 밴드 모드(Prejudice coding band mode) 정보, 프레주디스 코딩(Prejudice coding)의 스케일 팩터, 및 프레주디스 코딩(Prejudice coding)의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 복호화 코스메틱(decoding cosmetic) 표시, 주파수 스펙트럼의 양자화 값을 출력한다.
역양자화부(720)는 문맥-기반 비트플레인 복호화부(710)에서 출력된 결과를 역양자화한다.
멀티-레졸루션 합성부(730, Multi-resolution synthesis unit)는 역양자화부(720)의 출력을 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션(Multi-resolution)을 처리한다. 구체적으로, 멀티-레졸루션 합성부(730)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(720)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(740)는 역 양자화 스펙트럼/차 스텍트럼(reserve quantization spectrum/difference spectrum)을 입력받아 복원 스펙트럼/차 스펙트 럼(reconstruction spectrum/difference spectrum)을 출력한다.
역 주파수 선형 예측 수행부(740, inverse frequency linear prediction performing unit)은 멀티-레졸루션 합성부(730)의 출력과 역다중화부(700)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성한다. 구체적으로, 역 주파수 선형 예측 수행부(740)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(720)의 출력 또는 멀티-레졸루션 합성부(730)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(740)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(740)은 차 스펙트럼(difference spectrum) 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.
대역폭 확장 부호화부(750)는 역다중화부(700)로부터 입력받은 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 역 주파수 선형 예측 수행부(740)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(750)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.
제1 역 MDCT 적용부(760)는 부호화단에 대한 역변환 과정으로서 역 주파수 선형 예측 수행부(740)에서 출력된 저주파수 밴드 신호에 대하여 역 MDCT(inverse MDCT)를 수행하여 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 제1 역 MDCT 적용부(760)는 역 주파수 선형 예측 수행부(740)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.
제2 역 MDCT 적용부(770)는 대역폭 확장 복호화부(750)에서 복호화된 고주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다.
밴드 합성부(780)는 제1 역 MDCT 적용부(760)에서 시간 도메인으로 변환된 저주파수 밴드 신호와 제2 역 MDCT 적용부(770)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성한다.
스테레오 복호화부(790)는 역다중화부(700)로부터 입력받은 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 밴드 합성부(780)에서 합성된 신호를 업믹싱(up-mixing)하여 출력단자 OUT을 통해 출력한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
도 8은 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 8을 참조하면, 오디오 데이터 복호화 장치는 역다중화부(800), 문맥-기반 비트플레인 복호화부(810), 역양자화부(820), 멀티-레졸루션 합성부(830), 역 주파수 선형 예측 수행부(840), 역 MDCT 적용부(850), 변환부(855), 대역폭 확장 복호 화부(860), 역변환부(870), 밴드 합성부(880) 및 스테레오 복호화부(890)를 포함한다.
역다중화부(800)는 부호화단으로부터 출력된 비트 스트림(bit stream)을 입력받아 역다중화한다. 역다중화부(800)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(800)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, 신호 타입 정보, 주파수 선형 예측 및 벡터 양자화의 정보, 부호화된 대역폭 확장 정보 및 부호화된 스테레오 파라미터 등이 있다.
문맥-기반 비트플레인 복호화부(810)는 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(810)는 역다중화부(800)로부터 출력된 정보를 입력받아 허프먼 복호화를 진행하여 주파수 스펙트럼, 코딩 밴드 모드 정보, 및 스케일 팩터를 복원한다. 구체적으로, 문맥-기반 비트플레인 복호화부(810)는 프레주디스 코딩 밴드 모드(Prejudice coding band mode) 정보, 프레주디스 코딩(Prejudice coding)의 스케일 팩터, 및 프레주디스 코딩(Prejudice coding)의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 복호화 코스메틱(decoding cosmetic) 표시, 주파수 스펙트럼의 양자화 값을 출력한다.
역양자화부(820)는 문맥-기반 비트플레인 복호화부(710)에서 출력된 결과를 역양자화한다.
멀티-레졸루션 합성부(830)는 역양자화부(820)의 출력을 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수에 대하여 멀티-레졸루션을 처리한다. 구체적으로, 멀티-레졸루션 합성부(830)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(820)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(830)는 역 양자화 스펙트럼/차 스펙트럼(reserve quantization spectrum/difference spectrum)을 입력받아 복원 스펙트럼/차 스펙트럼(reconstruction spectrum/difference spectrum)을 출력한다.
역 주파수 선형 예측 수행부(840)는 멀티-레졸루션 합성부(830)의 출력과 역다중화부(800)로부터 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(840)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(820)의 출력 또는 멀티-레졸루션 합성부(830)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(840)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(840)은 차 스펙트럼(difference spectrum) 계수, 벡터의 인덱스를 입력받아 MDCT 스펙트럼 계수를 출력한다.
역 MDCT 적용부(850)는 역 주파수 선형예측 수행부(840)에서 출력된 저주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역 MDCT 적용부(850)는 역 주파수 선형 예측 수행부(840)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.
변환부(855)는 역 MDCT 적용부(850)에서 시간 도메인으로 변환된 저주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 변환부(855)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다. 변환부(855)에서 MDCT를 적용하여 실시할 수 없는 것은 아니지만 MDCT를 사용할 경우에는 도 7에 도시된 실시예가 보다 효율적이다.
대역폭 확장 복호화부(860)는 역다중화부(800)에서 출력된 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 변환부(855)에서 주파수 영역 또는 시간/주파수 영역으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(860)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.
역변환부(870)는 대역폭 확장 복호화부(860)에서 생성된 고주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 주파수 도메인 또는 시간/주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역변환부(870)는 변환부(855)에서 이용하는 동일한 변환 기법을 이용한다. 역변환부(870)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다.
밴드 합성부(880)는 역 MDCT 적용부(850)에서 시간 도메인으로 변환된 저주파수 밴드 신호와 역변환부(870)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성한다.
스테레오 복호화부(890)는 역다중화부(800)에서 출력된 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 밴드 합성부(880)에서 합성된 신호를 업믹싱하여 출력단자 OUT을 통해 출력한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
도 9는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 9를 참조하면, 오디오 데이터 복호화 장치는 역다중화부(900), 문맥-기반 비트플레인 복호화부(910), 역양자화부(920), 멀티-레졸루션 합성부(930), 역 주파수 선형 예측 수행부(940), 역 MDCT 적용부(950), 변환부(955), 대역폭 확장 복호화부(960), 역변환부(965), CELP 복호화부(970), 밴드 합성부(980) 및 스테레오 복호화부(990)를 포함한다.
역다중화부(900)는 부호화단으로부터 출력된 비트 스트림을 입력받아 역다중화한다. 구체적으로, 역다중화부(900)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분 석하여 출력한다. 여기서, 역다중화부(900)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, 신호 타입 정보, 주파수 선형 예측 및 벡터 양자화의 정보, 부호화된 대역폭 확장 정보, CELP 부호화 정보 및 부호화된 스테레오 파라미터 등이 있다.
문맥-기반 비트플레인 복호화부(910)는 역다중화부(900)에서 역다중화된 결과가 주파수 도메인에서 부호화된 경우, 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(910)는 역다중화부(900)로부터 출력된 정보를 입력받아 허프먼 복호화를 진행하여 주파수 스펙트럼, 코딩 밴드 모드 정보, 및 스케일 팩터를 복원한다. 구체적으로, 문맥-기반 비트플레인 복호화부(910)는 프레주디스(Prejudice coding band mode) 정보, 프레주디스 코딩(Prejudice coding)의 스케일 팩터, 및 프레주드시 코딩(Prejudice coding)의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 복호화 코스메틱(decoding cosmetic) 표시, 주파수 스펙트럼의 양자화 값을 출력한다.
역양자화부(920)는 문맥-기반 비트플레인 복호화부(910)에서 출력된 결과를 역양자화한다.
멀티-레졸루션 합성부(930)는 역양자화부(920)에서 출력된 결과를 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션을 처리한다. 구체적으로, 멀티-레졸루션 합성부(930)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(920)의 출력을 멀티-레졸루션으로 합성하여 복호 화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(930)는 역 양자화 스펙트럼/차 스펙트럼(reserve quantization spectrum/difference spectrum)을 입력받아 복원 스펙트럼/차 스펙트럼(reconstruction spectrum/difference spectrum)을 출력한다.
역 주파수 선형 예측 수행부(940)는 멀티-레졸루션 합성부(930)의 출력과 역다중화부(900)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(940)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(920)의 출력 또는 멀티-레졸루션 합성부(930)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(940)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(940)은 차 스펙트럼(difference spectrum) 계수, 벡터의 인덱스를 입력받아 MDCT 스펙트럼 계수를 출력한다.
역 MDCT 적용부(950)는 역 주파수 선형 예측 수행부(940)에서 출력된 저주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역 MDCT 적용부(950)는 역 주파수 선형 예측 수행부(740)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.
변환부(955)는 역 MDCT 적용부(950)에서 시간 도메인으로 변환된 저주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 변환부(955)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다. 변환부(955)에서 MDCT를 적용하여 실시할 수 없는 것은 아니지만 MDCT를 사용할 경우에는 도 7에 도시된 실시예가 보다 효율적이다.
대역폭 확장 복호화부(960)는 역다중화부(900)에서 출력된 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 변환부(955)에서 주파수 영역 또는 시간/주파수 영역으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 복호화부(960)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.
역변환부(965)는 대역폭 확장 복호화부(960)에서 복호화된 고주파수 밴드 신호를 MDCT 이외의 변환 기법을 이용하여 주파수 도메인 또는 시간-주파수 도메인에서 시간 도메인으로 역변환한다. 여기서, 역변환부(965)는 변환부(955)에서 이용하는 동일한 변환 기법을 이용한다. 역변환부(965)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다.
CELP 복호화부(970)는 역다중화부(900)에서 역다중화된 결과가 시간 도메인에서 부호화된 경우, CELP 부호화 정보를 수신하여 저주파수 밴드 신호를 CELP 복 호화 방식에 의해 복호화한다. 여기서, CELP 부호화 정보는 시간 도메인에서 CELP 방식에 의해 부호화된 결과로서, 고정 코드북의 인덱스 및 게인, 적응 코드북의 지연 및 게인, 및 선형 예측 필터의 계수 등을 포함한다. 구체적으로, CELP 복호화 방식은 고정 코드북의 인덱스 및 게인, 적응 코드북의 지연 및 게인을 이용하여 신호를 복원하고, 선형 예측 필터의 계수를 이용하여 복원된 신호를 합성하여 CELP 부호화 방식에 의해 부호화된 신호를 복호화한다.
밴드 합성부(980)는 역 MDCT 적용부(950)에서 출력된 저주파수 밴드 신호, 역변환부(965)에서 역변환된 고주파수 밴드 신호 및 CELP 복호화부(970)에서 복호화된 신호를 합성한다.
스테레오 복호화부(990)는 역다중화부(900)에서 출력된 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 밴드 합성부(980)에서 합성된 신호를 업믹싱하여 출력단자 OUT을 통해 출력한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
도 10은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 10을 참조하면, 오디오 신호의 복호화 장치는 역다중화부(1000), 문맥-기반 비트플레인 복호화부(1010), 역양자화부(1020), 멀티-레졸루션 합성부(1030), 역 주파수 선형 예측 수행부(1040), 제1 역 MDCT 적용부(1050), CELP 복호화부(1060), MDCT 적용부(1065), 대역폭 확장 복호화부(1070), 제2 역 MDCT 적용 부(1075), 밴드 합성부(1080) 및 스테레오 복호화부(1090)를 포함한다.
역다중화부(1000)는 부호화단으로부터 출력된 비트 스트림을 입력받아 역다중화한다. 구체적으로, 역다중화부(1000)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(1000)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, 신호 타입 정보, 주파수 선형 예측 및 벡터 양자화의 정보, 부호화된 대역폭 확장 정보, CELP 부호화 정보 및 부호화된 스테레오 파라미터 등이 있다.
문맥-기반 비트플레인 복호화부(1010)는 역다중화부(1000)에서 역다중화된 결과가 주파수 도메인에서 부호화된 경우, 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(1010)는 역다중화부(1000)로부터 출력된 정보를 입력받아 허프먼 복호화를 진행하여 주파수 스펙트럼, 코딩 밴드 모드 정보 및 스케일 팩터를 복원한다. 구체적으로, 문맥-기반 비트플레인 복호화부(1010)는 프레주디스 코딩 밴드 모드(Prejudice coding band mode) 정보, 프레주디스 코딩(Prejudice coding)의 스케일 팩터, 및 프레주디스 코딩(Prejudice coding)의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 복호화 코스메틱(decoding cosmetic) 표시, 주파수 스펙트럼의 양자화 값을 출력한다.
역양자화부(1020)는 문맥-기반 비트플레인 복호화부(1010)에서 출력된 결과를 역양자화한다.
멀티-레졸루션 합성부(1030)는 역양자화부(1020)의 출력을 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션을 처리한다. 구체적으로, 멀티-레졸루션 합성부(1030)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(1020)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(1030)는 역 양자화 스펙트럼/차 스펙트럼(reserve quantization spectrum/difference spectrum)을 입력받아 복원 스펙트럼/차 스펙트럼(reconstruction spectrum/difference spectrum)을 출력한다.
역 주파수 선형 예측 수행부(1040)은 멀티-레졸루션 합성부(1030)의 출력과 역다중화부(1000)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성한다. 구체적으로, 역 주파수 선형 예측 수행부(1040)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(1020)의 출력 또는 멀티-레졸루션 합성부(1030)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(1040)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(1040)은 차 스펙트럼(difference spectrum) 계수, 벡터의 인덱스를 입력받아 MDCT 스펙트럼 계수를 출력한다.
제1 역 MDCT 적용부(1050)는 역 주파수 선형 예측 수행부(1040)에서 출력된 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 변환한다. 여기서, 제1 역 MDCT 적용부(1050)는 역 주파수 선형 예측 수행부(1040)에서 역양자화한 결과로 얻은 주파수 스펙트럼 계수를 입력받아 저주파수 밴드에 해당하는 복원된 오디오 데이터로 출력한다.
CELP 복호화부(1060)는 역다중화부(1000)에서 역다중화된 결과가 시간 도메인에서 부호화된 경우, CELP 부호화 정보를 수신하여 저주파수 밴드 신호를 CELP 복호화 방식에 의해 복호화한다. 여기서, CELP 부호화 정보는 시간 도메인에서 CELP 방식에 의해 부호화된 결과이다.
MDCT 적용부(1065)는 역다중화부(1000)에서 역다중화된 결과가 시간 도메인에서 부호화된 경우, CELP 복호화부(1060)에서 복호화된 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환한다. 또한, MDCT 적용부(1065)는 역다중화부(1000)에서 역다중화된 결과가 주파수 도메인에서 부호화된 경우, 별도로 MDCT를 수행하지 않고, 역 주파수 선형 예측 수행부(1040)의 출력을 MDCT 적용부(1065)의 출력으로 대체한다.
대역폭확장 복호화부(1070)는 역다중화부(1000)에서 출력된 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 MDCT 적용부(1065)에서 출력된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다. 여기서, 대역폭확장 복호화부(1070)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 저주파수 밴드 신호에 적용함으로써 고주파수 밴드 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고 주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.
제2 역 MDCT 적용부(1075)는 대역폭 확장 복호화부(1070)에서 복호화된 고주파수 밴드 신호를 역 MDCT에 의해 주파수 도메인에서 시간 도메인으로 역변환한다.
밴드 합성부(1080)는 제1 역 MDCT 적용부(1050)에서 시간 도메인으로 변환된 저주파수 밴드 신호와 제2 역 MDCT 적용부(1075)에서 시간 도메인으로 변환된 고주파수 밴드 신호를 합성한다.
스테레오 복호화부(1090)는 역다중화부(1000)에서 출력된 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 밴드 합성부(1080)에서 합성된 신호를 업믹싱하여 출력단자 OUT을 통해 출력한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
도 11은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 11을 참조하면, 오디오 데이터 복호화 장치는 역다중화부(1100), 문맥-기반 비트플레인 복호화부(1110), 역양자화부(1120), 멀티-레졸루션 합성부(1130), 역 주파수 선형 예측 수행부(1140), CELP 복호화부(1150), 역 FV-MLT 적용부(1160), 변환부(1165), 대역폭 확장 복호화부(1170), 스테레오 복호화부(1180) 및 역변환부(1190)를 포함한다.
역다중화부(1100)는 부호화단으로부터 출력된 비트 스트림을 입력받아 역다중화한다. 역다중화부(1100)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이 터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(1100)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, 신호 타입 정보(Signal type information), 주파수 선형 예측 및 벡터 양자화의 정보, CELP 부호화 정보, 부호화된 대역폭 확장 정보 및 부호화된 스테레오 파라미터 등이 있다.
문맥-기반 비트플레인 복호화부(1110)는 역다중화부(1000)에서 역다중화된 결과가 주파수 도메인에서 부호화된 경우, 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(1110)는 역다중화부(1100)로부터 출력된 정보를 입력받아 허프먼 복호화를 진행하여 주파수 스펙트럼, 코딩 밴드 모드 정보, 및 스케일 팩터를 복원한다. 구체적으로, 문맥-기반 비트플레인 복호화부(1110)는 프레주디스 코딩 밴드 모드(Prejudice coding band mode) 정보, 프레주디스 코딩(Prejudice coding)의 스케일 팩터, 및 프레주디스 코딩(Prejudice coding)의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 복호화 코스메틱(decoding cosmetic) 표시, 주파수 스펙트럼의 양자화 값을 출력한다.
역양자화부(1120)는 문맥-기반 비트플레인 복호화부(1110)에서 출력된 결과를 역양자화한다.
멀티-레졸루션 합성부(1130)는 역양자화부(1120)의 출력을 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수에 대하여 멀티-레졸루션을 처리한다. 구체적으로, 멀티-레졸루션 합성부(1130)는 오디오 신호가 부호화단에서 멀티-레졸루 션으로 분석된 경우에 역양자화부(1120)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(1130)는 역 양자화 스펙트럼/차 스펙트럼(reserve quantization spectrum/difference spectrum)을 입력받아 복원 스펙트럼/차 스펙트럼(reconstruction spectrum/difference spectrum)을 출력한다.
역 주파수 선형 예측 수행부(1140)는 멀티-레졸루션 합성부(1130)의 출력과 역다중화부(1100)로부터 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(1140)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(1120)의 출력 또는 멀티-레졸루션 합성부(1130)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(1140)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(1140)은 차 스펙트럼(difference spectrum) 계수, 벡터의 인덱스를 입력받아 MDCT 스펙트럼 계수를 출력한다.
CELP 복호화부(1150)는 역다중화부(1000)에서 역다중화된 결과가 시간 도메인에서 부호화된 경우, CELP 부호화 정보를 복호화한다. 여기서, CELP 부호화 정보는 시간 도메인에서 CELP 방식에 의해 부호화된 결과이다.
역 FV-MLT 적용부(1160)는 역 주파수 선형 예측 수행부(1140)에서 출력된 신호에 대하여 역 FV-MLT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하고, 상기 시간 도메인으로 변환된 신호와 CELP 복호화부(1150)에서 출력된 신호를 합성하여 시간 도메인으로 변환된 신호를 출력한다.
변환부(1165)는 역 FV-MLT 적용부(1160)에서 시간 도메인으로 변환된 신호를 MDCT 이외의 변환 기법을 이용하여 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 변환부(1165)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다. 변환부(1165)에서 MDCT를 적용하여 실시할 수 없는 것은 아니지만 MDCT를 사용할 경우에는 도 10에 도시된 실시예가 보다 효율적이다.
대역폭 확장 복호화부(1170)는 역다중화부(1100)에서 출력된 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 변환부(1165)에서 주파수 영역 또는 시간/주파수 영역으로 변환된 신호로부터 전 대역의 신호를 생성한다. 여기서, 대역폭 확장 복호화부(1170)는 오디오 신호의 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재한다는 특성에 기초하여 복호화된 대역폭 확장 정보를 변환부(1165)에서 출력된 신호에 적용함으로써 전 대역의 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.
스테레오 복호화부(1180)는 역다중화부(1100)에서 출력된 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 대역폭 확장 복호화부(1170)에서 출력된 신호를 업믹싱한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
역변환부(1190)는 스테레오 복호화부(1180)에서 업믹싱된 신호를 MDCT 이외의 변환 기법을 이용하여 주파수 도메인 또는 시간/주파수 도메인에서 시간 도메인으로 역변환하여 출력 단자 OUT을 통해 출력한다. 여기서, 역변환부(1190)는 변환부(1165)에서 이용하는 동일한 변환 기법을 이용한다. 역변환부(1190)에서 이용하는 변환 기법의 예로 MDST, FFT, 및 QMF 등이 있다.
도 12는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 장치를 나타내는 블록도이다.
도 12를 참조하면, 오디오 데이터 복호화 장치는 역다중화부(1200), 문맥-기반 비트플레인 복호화부(1210), 역양자화부(1220), 멀티-레졸루션 합성부(1230), 역 주파수 선형 예측 수행부(1240), CELP 복호화부(1250), MDCT 적용부(1260), 대역폭 확장 복호화부(1270), 스테레오 복호화부(1280) 및 역 FV-MLT 적용부(1290)를 포함한다.
역다중화부(1200)는 부호화단으로부터 출력된 비트 스트림을 입력받아 역다중화한다. 역다중화부(1200)는 데이터 레벨의 각 부분을 각 단위에 대응하는 데이터 부분으로 분리하며, 해당 단위에 그와 관련된 비트스트림의 정보를 분석하여 출력한다. 여기서, 역다중화부(1200)가 출력하는 정보는 오디오 스펙트럼 스트림의 설명 분석, 양자화 값과 기타 복원 정보, 양자화 스펙트럼의 복원 정보, 문맥-기반 비트플레인 복호화의 정보, 신호 타입 정보, 주파수 선형 예측 및 벡터 양자화의 정보, CELP 부호화 정보, 부호화된 대역폭 확장 정보 및 부호화된 스테레오 파라미터 등이 있다.
문맥-기반 비트플레인 복호화부(1210)는 역다중화부(1000)에서 역다중화된 결과가 주파수 도메인에서 부호화된 경우, 부호화된 비트플레인을 문맥을 기반으로 복호화한다. 여기서, 문맥-기반 비트플레인 복호화부(1210)는 역다중화부(1200)로부터 출력된 정보를 입력받아 허프먼 복호화를 진행하여 주파수 스펙트럼, 코딩 밴드 모드 정보, 및 스케일 팩터를 복원한다. 문맥-기반 비트플레인 복호화부(1210)는 프레주디스 코딩 밴드 모드(Prejudice coding band mode) 정보, 프레주디스 코딩(Prejudice coding)의 스케일 팩터, 및 프레주디스 코딩(Prejudice coding)의 주파수 스펙트럼을 입력받아 코딩 밴드 모드 수치, 스케일 팩터의 복호화 코스메틱(decoding cosmetic) 표시, 주파수 스펙트럼의 양자화 값을 출력한다.
역양자화부(1220)는 문맥-기반 비트플레인 복호화부(1210)에서 출력된 결과를 역양자화한다.
멀티-레졸루션 합성부(1230)는 역양자화부(1220)의 출력을 입력받아 순간적으로 변하는 신호의 오디오 스펙트럼 계수의 멀티-레졸루션을 처리한다. 구체적으로, 멀티-레졸루션 합성부(1230)는 오디오 신호가 부호화단에서 멀티-레졸루션으로 분석된 경우에 역양자화부(1220)의 출력을 멀티-레졸루션으로 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 멀티-레졸루션 합성부(1230)는 역 양자화 스펙트럼/차 스펙트럼(reserve quantization spectrum/difference spectrum)을 입력받아 복원 스펙트럼/차 스펙트럼(reconstruction spectrum/difference spectrum)을 출력한다.
역 주파수 선형 예측 수행부(1240)는 멀티-레졸루션 합성부(1230)의 출력과 역다중화부(1200)로부터 입력받은 부호화단에서 주파수 선형 예측을 수행한 결과를 합성하고 역-벡터 양자화를 수행한다. 구체적으로, 역 주파수 선형 예측 수행부(1240)는 오디오 신호가 부호화단에서 주파수 선형 예측이 수행된 경우에 상기 주파수 선형 예측이 수행된 결과를 역양자화부(1220)의 출력 또는 멀티-레졸루션 합성부(1230)의 출력과 합성하여 복호화의 효율을 향상시킬 수 있다. 여기서, 역 주파수 선형 예측 수행부(1240)은 주파수 도메인 예측 기술과 예측 계수의 벡터 양자화 기술을 채용하여 코딩 효율을 유효하게 제고하였다. 역 주파수 선형 예측 수행부(1240)은 차 스펙트럼(difference spectrum) 계수, 벡터의 인덱스(index)를 입력받아 MDCT 스펙트럼 계수를 출력한다.
CELP 복호화부(1250)는 역다중화부(1200)에서 역다중화된 결과가 시간 도메인에서 부호화된 경우, CELP 부호화 정보를 복호화한다. 여기서, CELP 부호화 정보는 시간 도메인에서 CELP 방식에 의해 부호화된 결과이다.
MDCT 적용부(1260)는 CELP 복호화부(1250)에서 출력된 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환한다.
대역폭 확장 복호화부(1270)는 역다중화부(1200)에서 출력된 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 역 주파수 선형 예측 수행부(1240)에서 출력된 신호 또는 MDCT 적용부(1260)에서 주파수 도메인으로 변환된 신호로부터 전 대역의 신호를 생성한다. 구체적으로, 역다중화부(1200)에서 출력된 결과가 주파수 도메인에서 부호화된 경우, 대역폭 확장 복호화부(1270)는 복호화된 대역폭 확장 정보를 역 주파수 선형 예측 수행부(1240)에서 출력된 신호에 적용함으로써 전 대역의 신호를 생성한다. 또한, 역다중화부(1200)에서 출력된 결과가 시간 도메인에서 부호화된 경우, 대역폭 확장 복호화부(1270)는 복호화된 대역폭 확장 정보를 MDCT 적용부(1260)에서 주파수 도메인으로 변환된 신호에 적용함으로써 전 대역의 신호를 생성한다. 여기서, 대역폭 확장 정보는 고주파수 밴드의 고주파수 밴드의 특성을 나타낼 수 있는 정보로써 고주파수 밴드 신호에 대한 에너지 레벨 또는 포락선 등의 정보이다.
스테레오 복호화부(1280)는 역다중화부(1200)에서 출력된 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 대역폭 확장 복호화부(1270)에서 출력된 신호를 업믹싱한다. 여기서, 업믹싱은 다운믹싱에 상반되는 개념으로, 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것이다.
역 FV-MLT 적용부(1290)는 스테레오 복호화부(1280)에서 업믹싱된 신호에 대하여 역 FV-MLT를 수행하여 주파수 도메인에서 시간 도메인으로 변환하여 출력단자 OUT을 통해 출력한다.
도 13은 본 발명의 일 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.
도 13을 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 1에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 1에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.
1300 단계에서 스테레오 부호화부(100)는 입력 신호에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호를 다운믹싱한다.
1310 단계에서 밴드 분할부(110)는 다운믹싱된 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할한다.
1320 단계에서 변환부(120, 170)는 고주파수 밴드 신호 및 저주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인으로 변환한다. 구체적으로, 변환부는 고주파수 밴드 신호 및 저주파수 밴드 신호에 대하여 MDCT를 수행하여 각각 시간 도메인에서 주파수 도메인으로 변환할 수 있다.
1330 단계에서 저주파수 밴드 부호화부는 변환된 저주파수 밴드 신호를 양자화하야 문맥을 기반으로 비트플레인으로 부호화한다. 구체적으로, 저주파수 밴드 부호화부는 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행하여 필터링하는 주파수 선형 예측 수행부, 변환된 저주파수 밴드 신호 또는 필터링된 신호에 대하여 멀티-레졸루션으로 분석하는 멀티-레졸루션 분석부, 멀티-레졸루션으로 분석된 신호를 양자화하는 양자화부, 및 양자화된 신호를 문맥을 기반으로 하여 비트플레인으로 부호화하는 문맥-기반 비트플레인 부호화부를 포함할 수 있다. 여기서, 주파수 선형 예측 수행부는 변환된 저주파수 밴드 신호에 대하여 주파수 선형 예측을 수행하여 계산된 선형 예측 필터의 계수에 대응되는 값을 벡터 인덱스로 표현할 수 있다.
1340 단계에서 대역폭 확장 부호화부(180)는 변환된 저주파수 밴드 신호를 이용하여 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성 하여 부호화한다.
1350 단계에서 다중화부(190)는 부호화된 스테레오 파라미터, 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.
도 14는 본 발명의 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.
도 14를 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 2에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 2에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.
1400 단계에서 스테레오 부호화부(200)는 입력 신호에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호를 다운믹싱한다.
1410 단계에서 밴드 분할부(210)는 다운믹싱된 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할한다.
1420 단계에서 MDCT 적용부(220)는 저주파수 밴드 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환한다.
1430 단계에서 저주파수 밴드 부호화부는 MDCT가 수행된 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다.
1440 단계에서 변환부(270, 275)는 고주파수 밴드 신호 및 저주파수 밴드 신 호를 각각 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다.
1450 단계에서 대역폭 확장 부호화부(280)는 변환된 저주파수 밴드 신호를 이용하여 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다.
1460 단계에서 다중화부(290)는 부호화된 스테레오 파라미터, 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.
도 15는 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.
도 15를 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 3 또는 4에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 3 또는 4에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.
1500 단계에서 스테레오 부호화부(300)는 입력 신호에서 스테레오 파라미터를 추출하여 부호화하고, 입력 신호를 다운믹싱한다.
1510 단계에서 밴드 분할부(310)는 다운믹싱된 신호를 고주파수 밴드 신호 및 저주파수 밴드 신호로 분할한다.
1520 단계에서 모드 결정부(320)는 저주파수 밴드 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다.
1530 단계에서 CELP 부호화부(385)는 저주파수 밴드 신호를 시간 도메인에서 부호화하는 것으로 결정된 경우 저주파수 밴드 신호를 CELP 방식에 따라 부호화한다.
1540 단계에서 MDCT 적용부(325)는 저주파수 밴드 신호를 주파수 도메인에서 부호화하는 것으로 결정된 경우 저주파수 밴드 신호에 대하여 MDCT를 수행하여 저주파수 밴드 신호를 시간 도메인에서 주파수 도메인으로 변환하고, 저주파수 밴드 부호화부는 MDCT가 수행된 저주파수 밴드 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다.
1550 단계에서 변환부(370, 375)는 저주파수 밴드 신호 및 고주파수 밴드 신호를 각각 시간 도메인에서 주파수 도메인 또는 시간/주파수 도메인으로 변환한다. 여기서, 변환부는 저주파수 밴드 신호 및 상기 고주파수 밴드 신호에 대하여 각각 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환할 수 있다. 이 경우, 저주파수 밴드 신호를 주파수 도메인에서 부호화하는 것으로 결정된 경우 변환부는 저주파수 밴드 신호에 대한 출력을 MDCT 적용부에서 주파수 도메인으로 변환된 신호로 대체할 수 있다.
1560 단계에서 대역폭 확장 부호화부(380)는 변환된 저주파수 밴드 신호를 이용하여 변환된 고주파수 밴드 신호의 특성을 나타내는 대역폭 확장 정보를 생성하여 부호화한다.
1570 단계에서 다중화부(390)는 부호화된 스테레오 파라미터, CELP 방식에 따라 부호화된 결과, 부호화된 비트플레인 및 부호화된 대역폭 확장 정보를 다중화 하여 입력 신호에 대한 부호화 결과로써 출력한다.
도 16은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.
도 16을 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 5에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 5에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.
1600 단계에서 변환부(500)는 입력 신호를 시간 도메인에서 주파수 도메인으로 변환한다.
1610 단계에서 스테레오 부호화부(510)는 변환된 신호에서 스테레오 파라미터를 추출하여 부호화하고, 변환된 신호를 다운믹싱한다.
1620 단계에서 대역폭 확장 부호화부(580)는 다운믹싱된 신호에서 대역폭 확장 정보를 추출하여 부호화한다.
1630 단계에서 역변환부(520)는 다운믹싱된 신호를 시간 도메인으로 역변환한다.
1640 단계에서 모드 결정부(530)는 역변환된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정하고, FV-MLT 적용부(535)는 결정 결과에 따라 역변환된 신호에 대하여 FV-MLT를 적용하여 서브 밴드 별로 시간 도메인 또는 주파수 도메인으로 변환한다.
1650 단계에서 CELP 부호화부(585)는 역변환된 신호를 시간 도메인에서 부호화하는 것으로 결정된 경우 시간 도메인으로 변환된 신호를 CELP 방식에 따라 부호화한다.
1660 단계에서 주파수 도메인 부호화부는 역변환된 신호를 주파수 도메인으로 부호화하는 것으로 결정된 경우 주파수 도메인으로 변환된 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다.
1670 단계에서 다중화부(590)는 부호화된 스테레오 파라미터, 부호화된 대역폭 확장 정보, CELP 방식에 따라 부호화된 결과 및 부호화된 비트플레인을 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.
도 17은 본 발명의 또 다른 실시예에 따른 오디오 신호의 부호화 방법을 나타내는 흐름도이다.
도 17을 참조하면, 본 실시예에 따른 오디오 신호의 부호화 방법은 도 6에 도시된 오디오 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 6에 도시된 오디오 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 부호화 방법에도 적용된다.
1700 단계에서 모드 결정부(600)는 입력 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정하고, FV-MLT 적용부(610)는 결정 결과에 따라 입력 신호에 대하여 FV-MLT를 적용하여 서브 밴드 별로 시간 도메인 또는 주파수 도메인으로 변환한다.
1710 단계에서 스테레오 부호화부(620)는 변환된 신호에서 스테레오 파라미터를 추출하여 부호화하고, 변환된 신호를 다운믹싱한다.
1720 단계에서 대역폭 확장 부호화부(670)는 다운믹싱된 신호에서 대역폭 확장 정보를 추출하여 부호화한다.
1730 단계에서 CELP 부호화부(680)는 다운믹싱된 신호가 시간 도메인에서 부호화하는 것으로 결정된 경우 다운믹싱된 신호를 CELP 방식에 따라 부호화한다.
1740 단계에서 주파수 도메인 부호화부는 다운믹싱된 신호가 주파수 도메인에서 부호화하는 것으로 결정된 경우 다운믹싱된 신호를 양자화하여 문맥을 기반으로 비트플레인으로 부호화한다.
1750 단계에서 다중화부(690)는 부호화된 스테레오 파라미터, 부호화된 대역폭 확장 정보, CELP 방식에 따라 부호화된 결과 및 부호화된 비트플레인을 다중화하여 입력 신호에 대한 부호화 결과로써 출력한다.
도 18은 본 발명의 일 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 18을 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 7에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 7에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.
1800 단계에서 역다중화부(700)는 오디오 신호의 부호화 결과를 입력받는다. 여기서, 부호화 결과는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인, 부호화된 대역폭 확장 정보 및 부호화된 스테레오 파라미터 등을 포함할 수 있다.
1810 단계에서 저주파수 밴드 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성한다. 구체적으로, 저주파수 밴드 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하는 문맥-기반 비트플레인 복호화부, 복호화된 신호를 역양자화하는 역양자화부, 역양자화된 신호를 멀티-레졸루션으로 합성하는 멀티-레졸루션 합성부, 및 벡터 인덱스를 이용하여 부호화단에서 주파수 선형 예측이 수행된 결과를 역양자화된 신호 또는 상기 합성된 신호에 합성하는 역 주파수 선형 예측 수행부를 포함할 수 있다.
1820 단계에서 대역폭 확장 복호화부(750)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 생성된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다.
1830 단계에서 역 MDCT 적용부(760)는 저주파수 밴드 신호 및 고주파수 밴드 신호 각각에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환한다.
1840 단계에서 밴드 합성부(780)는 변환된 저주파수 밴드 신호 및 변환된 고주파수 밴드 신호를 합성한다.
1850 단계에서 스테레오 복호화부(790)는 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 합성된 신호를 업믹싱한다.
도 19는 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 19를 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 8에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 8에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.
1900 단계에서 역다중화부(800)는 오디오 신호의 부호화 결과를 입력받는다. 여기서, 부호화 결과는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인, 부호화된 대역폭 확장 정보 및 부호화된 스테레오 파라미터 등을 포함할 수 있다.
1910 단계에서 저주파수 밴드 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성한다.
1920 단계에서 역 MDCT 적용부(850)는 생성된 저주파수 밴드 신호에 대하여 역 MDCT를 수행하여 주파수 도메인에서 시간 도메인으로 변환한다.
1930 단계에서 변환부(855)는 역 MDCT가 수행된 저주파수 밴드 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환한다.
1940 단계에서 대역폭 확장 복호화부(860)는 대역폭 확장 정보를 이용하여 주파수 도메인 또는 시간/주파수 도메인으로 변환된 저주파수 밴드 신호로부터 고주파수 밴드 신호를 생성한다.
1950 단계에서 역변환부(870)는 생성된 고주파수 밴드 신호를 시간 도메인으로 역변환한다.
1960 단계에서 밴드 합성부(880)는 역변환된 고주파수 밴드 신호 및 변환된 저주파수 밴드 신호를 합성한다.
1970 단계에서 스테레오 복호화부(890)는 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 합성된 신호를 업믹싱한다.
도 20은 본 발명의 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 20을 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 9 또는 10에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 9 또는 10에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.
2000 단계에서 역다중화부(900)는 오디오 신호의 시간 도메인 또는 주파수 도메인에서의 부호화 결과를 입력받는다. 여기서, 부호화 결과는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인, 부호화된 대역폭 확장 정보, CELP 부호화 정보 및 부호화된 스테레오 파라미터 등을 포함할 수 있다.
2010 단계에서 저주파수 밴드 복호화부는 저주파수 밴드 신호가 주파수 도메인에서 부호화된 경우, 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화하여 저주파수 밴드 신호를 생성한다. 여기서, 저주파수 밴드 복호화부는 부호화 된 비트플레인을 문맥을 기반으로 복호화하는 문맥-기반 비트플레인 복호화부, 복호화된 신호를 역양자화하는 역양자화부, 역양자화된 신호를 멀티-레졸루션으로 합성하는 멀티-레졸루션 합성부, 및 벡터 인덱스를 이용하여 부호화단에서 주파수 선형 예측이 수행된 결과를 역양자화된 신호 또는 합성된 신호에 합성하는 역 주파수 선형 예측 수행부를 포함할 수 있다.
2020 단계에서 역 MDCT 적용부(950)는 생성된 저주파수 밴드 신호에 대하여 역 MDCT를 수행하여 시간 도메인으로 역변환한다.
2030 단계에서 변환부(955)는 역 MDCT가 수행된 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환한다.
2040 단계에서 대역폭 확장 복호화부(960)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 주파수 도메인 또는 시간/주파수 도메인으로 변환된 신호로부터 고주파수 밴드 신호를 생성한다.
2050 단계에서 역변환부(965)는 생성된 고주파수 밴드 신호를 시간 도메인으로 역변환한다.
2060 단계에서 CELP 복호화부(970)는 저주파수 밴드 신호가 시간 도메인에서 부호화된 경우, CELP 부호화 정보를 복호화하여 저주파수 밴드 신호를 생성한다.
2070 단계에서 밴드 합성부(980)는 역 MDCT가 수행된 신호, 역변환된 고주파수 밴드 신호 및 CELP 방식으로 복호화된 저주파수 밴드 신호를 합성한다.
2080 단계에서 스테레오 복호화부(990)는 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 합성된 신호를 업믹싱한다.
도 21은 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 21을 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 11에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 11에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.
2100 단계에서 역다중화부(1100)는 오디오 신호의 주파수 도메인 또는 시간 도메인에서의 부호화 결과를 입력받는다. 여기서, 부호화 결과는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인, 부호화된 대역폭 확장 정보, CELP 부호화 정보 및 부호화된 스테레오 파라미터 등을 포함할 수 있다.
2110 단계에서 주파수 도메인 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화한다.
2120 단계에서 CELP 복호화부(1150)는 CELP 부호화 정보를 복호화한다.
2130 단계에서 역 FV-MLT 적용부(1160)는 주파수 도메인 복호화부 또는 CELP 복호화부에서 복호화된 신호에 대하여 역 FV-MLT를 수행하여 시간 도메인으로 변환한다.
2140 단계에서 변환부(1165)는 변환된 신호를 주파수 도메인 또는 시간/주파수 도메인으로 변환한다.
2150 단계에서 대역폭 확장 복호화부(1170)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 주파수 도메인 또는 시간/주파수 도메인으로 변환된 신호로부터 전 대역의 신호를 복호화한다.
2160 단계에서 스테레오 복호화부(1180)는 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 복호화된 전 대역의 신호를 업믹싱한다.
2170 단계에서 역변환부(1190)는 업믹싱된 신호를 시간 도메인으로 역변환한다.
도 22는 본 발명의 또 다른 실시예에 따른 오디오 신호의 복호화 방법을 나타내는 흐름도이다.
도 22를 참조하면, 본 실시예에 따른 오디오 신호의 복호화 방법은 도 12에 도시된 오디오 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 12에 도시된 오디오 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 오디오 신호의 복호화 방법에도 적용된다.
2200 단계에서 역다중화부(1200)는 오디오 신호의 주파수 도메인 또는 시간 도메인에서의 부호화 결과를 수신한다. 여기서, 부호화 결과는 저주파수 밴드 신호에 대하여 문맥을 기반으로 부호화된 비트플레인, 부호화된 대역폭 확장 정보, CELP 부호화 정보 및 부호화된 스테레오 파라미터 등을 포함할 수 있다.
2210 단계에서 주파수 도메인 복호화부는 부호화된 비트플레인을 문맥을 기반으로 복호화하고 역양자화한다.
2220 단계에서 CELP 복호화부(1250)는 CELP 부호화 정보를 복호화한다.
2230 단계에서 MDCT 적용부(1260)는 CELP 복호화부(1250)에서 출력된 신호에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환한다.
2240 단계에서 대역폭 확장 복호화부(1270)는 부호화된 대역폭 확장 정보를 복호화하고, 복호화된 대역폭 확장 정보를 이용하여 주파수 도메인 복호화부 또는 MDCT 적용부(1260)에서 출력된 신호로부터 전 대역의 신호를 생성한다.
2250 단계에서 스테레오 복호화부(1280)는 부호화된 스테레오 파라미터를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 복호화된 전 대역의 신호를 업믹싱한다.
2260 단계에서 역 FV-MLT 적용부(1290)는 업믹싱된 신호에 대하여 역 FV-MLT를 적용하여 시간 도메인으로 변환한다.
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.