[go: up one dir, main page]

KR101301245B1 - 스펙트럼 계수의 서브대역 할당 방법 및 장치 - Google Patents

스펙트럼 계수의 서브대역 할당 방법 및 장치 Download PDF

Info

Publication number
KR101301245B1
KR101301245B1 KR1020080131730A KR20080131730A KR101301245B1 KR 101301245 B1 KR101301245 B1 KR 101301245B1 KR 1020080131730 A KR1020080131730 A KR 1020080131730A KR 20080131730 A KR20080131730 A KR 20080131730A KR 101301245 B1 KR101301245 B1 KR 101301245B1
Authority
KR
South Korea
Prior art keywords
subband
spectral coefficients
band
distribution
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020080131730A
Other languages
English (en)
Other versions
KR20100073139A (ko
Inventor
김현우
배현주
이병선
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020080131730A priority Critical patent/KR101301245B1/ko
Priority to US12/556,073 priority patent/US8438012B2/en
Publication of KR20100073139A publication Critical patent/KR20100073139A/ko
Application granted granted Critical
Publication of KR101301245B1 publication Critical patent/KR101301245B1/ko
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 스펙트럼 계수의 서브대역 할당 방법 및 장치에 관한 것으로, 입력 음성/오디오 신호로부터 변환된 스펙트럼 계수들의 분포에 따라 서브 대역의 크기를 결정하여, 서브 대역 단위로 보다 정교한 양자화를 수행함으로써, 스펙트럼 계수들의 양자화 잡음을 감소시키고 주파수 영역에서 음질을 향상시키는 그에 따른 신호의 품질이 향상되는 효과가 있다.
Figure R1020080131730
스펙트럼, 스펙트럼 계수, 서브대역, 분포, 대역할당, 음성, 오디오, 코덱

Description

스펙트럼 계수의 서브대역 할당 방법 및 장치{A method and apparatus for adaptive sub-band allocation of spectral coefficients}
본 발명은 스펙트럼 계수의 서브대역 할당 방법 및 장치에 관한 것으로, 특히 입력 음성/오디오 신호로부터 변환된 스펙트럼 계수들의 분포에 따라 서브 대역의 크기를 결정하여 서브 대역 단위로 양자화를 수행하는 스펙트럼 계수의 서브대역 할당 방법 및 장치에 관한 것이다.
본 발명은 지식경제부 및 정보통신연구진흥원의 IT성장동력기술개발의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2008-S-011-01, 과제명: FMC 어커스틱 융합코덱 및 제어기술 연구(표준화연계)].
아날로그 음성 신호는 표본화(sampling), 양자화(quantization) 과정을 거쳐 PCM(Pulse Code Modulation) 신호로 변환된다. 이러한 신호 변환은 처리하는 데에 많은 용량이 요구되고, 큰 용량으로 인하여 저장, 전송, 재생에 어려움이 따른다.
그에 따라 PCM 신호를 압축, 복원하기 위해 많은 음성/오디오 코덱(codec)들이 개발되었다.
300Hz~3,400Hz 대역의 음성을 복부호화하는 협대역 코덱의 경우, 음성 발생 과정을 모델링 하는 LPC(Linear Prediction Coefficient) 기술에 기반을 두어 높은 압축률을 이룬다.
또한 광대역(50 ∼ 7,000Hz), 초광대역(50 ∼ 14,00Hz), 전대역(20 ~ 22,000Hz) 음성/오디오 코덱은 입력 신호를 시간 영역에서 주파수 영역으로 변환하여 양자화 하는 방법을 사용한다.
대표적으로 사용되는 주파수 영역 변환은 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), DFT(Discrete Fourier Transform), MDCT(Modified Discrete Cosine Transform) 변환 등이 있다.
MPEG 오디오 코덱들에서는 심리음향(Psychoacoustic) 모델을 이용하여 비트를 할당하고 스펙트럼 계수를 양자화하는 방식을 취하고, G.729.1과 G.711.1과 같은 코덱에서는 스펙트럼 계수를 고정된 크기의 서브대역에 나누어 서브대역에서 이득(gain)을 스칼라 양자화, 모양(shape)을 벡터 양자화하는 방식을 취한다.
그러나, 상기와 같이 기존의 고정된 서브대역을 이용하여 스펙트럼 계수를 할당 방식은 서브대역의 스펙트럼 분포가 특정 계수에서 클 경우 벡터 양자화로 정확한 표현을 하는데 한계가 있어 음질 열화가 발생하는 문제점이 있다.
또한, 스펙트럼 분포가 대체로 고른 경우에는 고정된 서브대역 이용 시 비트 분배가 비효율적인 문제가 있고, 신호에 비해 과다한 연산이 수행되는 등의 문제점이 있어 개선이 요구되고 있다.
본 발명의 목적은, 입력되는 음성 또는 오디오 신호로 변환 시, 신호변환에 따른 스펙트럼 계수들의 분포에 대응하여 서브 대역의 크기를 결정하고, 서브 대역 단위로 양자화를 수행함으로써, 스펙트럼 계수의 분포에 따라 서브대역의 크기가 가변 되므로 양자화를 단위가 변경되므로 보다 정교한 양자화가 가능하고, 그에 따라 신호의 품질이 향상되는 스펙트럼 계수의 서브대역 할당 방법 및 장치를 제공하는데 그 목적이 있다.
상기한 과제를 해결하기 위한 본 발명에 따른 스펙트럼 계수의 서브대역 할당 방법은 오디오 신호로부터 변환된 스펙트럼 계수를 각 대역에 할당하는 단계, 상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 단계, 짧은 서브대역 허용 시, 상기 스펙트럼 계수들의 분포에 대응하여, 각 대역에 대한 서브대역의 유형을 결정하는 단계, 및 상기 각 대역 별 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하고, 상기 서브대역 별로 양자화 하여 비트스트림(Bit stream)을 출력하는 단계를 포함한다.
상기 짧은 서브대역 허용 여부 결정단계는, 상기 스펙트럼 계수에 대한 평탄도(Spectral flatness)를 측정하여, 상기 평탄도가 기 설정된 기준값 보다 작은 경우 짧은 서브대역을 허용하고, 상기 기준값은, 0.3 내지 0.6 범위 내에서 설정되는 것을 특징으로 한다. 또한, 짧은 서브대역이 기본 서브대역으로 설정되거나 입력데이터에 의해 선택되는 경우 짧은 서브대역을 허용한다.
상기 서브대역 유형 결정단계는, 각 대역 별로 상기 스펙트럼 계수의 분포를 산출하고, 상기 스펙트럼 계수의 크기가 고른 분포를 갖는 대역에서는 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역에서는 짧은 서브대역이 사용되도록 설정하는 하는 것을 특징으로 하며, 상기 스펙트럼 계수의 분포는 상기 스펙트럼 계수에 대한 평탄도, 상기 스펙트럼 계수의 최대값과 평균값을 비율, 상기 스펙트럼 계수의 최대값에 대한 미분값 중 적어도 하나를 이용하여 산출하는 것을 특징으로 한다.
또한, 본 발명에 따른 스펙트럼 계수의 서브대역 할당 장치는 오디오 신호를 주파수 대역의 스펙트럼 계수로 변환하는 주파수 변환부. 대역 별 상기 스펙트럼 계수를 할당하고 상기 스펙트럼 계수의 평탄도와 분포를 산출하여, 대역 별 서브대역의 유형을 설정하고 상기 스펙트럼 계수를 할당하는 대역설정부 및 상기 서브대역 별로, 상기 스펙트럼 계수의 이득 및 모양을 산출하여 양자화 하여 비트스트림(Bit stream)을 출력하는 양자화부;를 포함하는 서브대역 할당 장치를 포함한다.
또한, 상기 대역 설정부는 상기 스펙트럼 계수들을 각 대역에 균등하거나 로그스케일로 할당하는 대역할당부, 상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 짧은 서브대역 허용결정부, 상기 스펙트럼 계수의 분포에 대응하여, 상기 스펙트럼 계수의 분포가 고른 분포를 갖는 대역의 경우 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역의 경우 상기 짧은 서브대역이 사용되도록 서브대역의 유형의 결정하는 서브대역 유형 결정부 및 상기 각 대역에 할당된 상기 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하는 서브대역 할당부를 포함한다.
본 발명에 따르면, 스펙트럼 계수의 서브대역 할당 방법 및 장치는, 음성 또는 오디오신호 변환 시 스펙트럼 계수의 분포에 따라, 서브대역의 크기를 변경하여 서브대역 단위로 양자화를 수행함으로써, 계수의 크기에 따른 편차가 큰 경우 짧은 서브대역을 이용한 정교한 양자화가 가능하고, 편차가 적은 경우 큰 서브대역을 설정하여 불필요한 연산을 감소시켜, 비트를 효율적으로 분배하고 시스템의 효율이 향상됨과 동시에 보다 정교한 양자화를 통한 신호품질 및 그에 따른 음질이 크게 향상되는 효과가 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 설명하면 다음과 같다.
도 1 은 본 발명의 일실시예에 따른 오디오신호의 신호변화에 따른 대략적인 흐름이 도시된 흐름도이다.
본 발명은 도 1에 도시된 바와 같이, 음성 등의 오디오신호가 입력되는 경우, 도1의 (a)와 같이 이를 변환하여 비트스트림을 생성하고, 도 1의 (b)와 같이 비트스트림을 오디오신호로 역변환하는 경우, 변환과정에서 신호의 스펙트럼 계수를 이용하여 서브대역을 설정하고, 설정된 서브대역에 스펙트럼 계수를 할당하여 양자화가 수행되도록 한다.
스펙트럼 계수의 서브대역 할당 장치에서 음성 또는 오디오 신호를 주파수 영역에서 부호화 하는 부호화기는 음성/오디오 입력신호를 주파수 영역에서 부호화하고, 주파수 변환부를 통해 스펙트럼 계수를 획득한다. 이때, 획득한 스펙트럼 계 수를 양자화를 수행하면 비트스트림(bit stream)을 얻는다.
한편, 스펙트럼 계수의 서브대역 힐당 장치에서 복호화기는 비트스트림으로부터 음성 또는 오디오 입력 신호를 복원하는데, 역양자화 시 비트스트림으로부터 스펙트럼 계수를 획득하고 역변환부를 통해 출력 신호를 생성한다.
본 발명의 스펙트럼 계수의 서브대역 할당을 수행하는 장치는 예를 들어 음향입출력장치, 휴대전화기, 이동단말기, 컴퓨터 등이 사용될 수 있으나, 그외 에도 음성 또는 오디오 신호를 변환하여 출력하거나 송수신하는 기기라면 어느 것에나 적용 가능하다.
서브대역 할당 장치는 주파수 변환 후, 변환계수를 이용하여 양자화를 수행하는 경우, 양자화를 수행할 신호의 주파수 대역에서 서브대역을 설정하여 서브대역 별로, 대역의 스펙트럼 계수를 서브대역에 할당하여 각 서브대역 단위로 양자화가 수행되도록 한다.
이때, 서브대역 할당 장치는 주파수 영역에서 스펙트럼 계수의 분포에 따라 서브대역의 크기를 상이하게 하여, 스펙트럼 계수의 분포가 고른 경우와, 고르지 않고 그 크기의 차가 큰 경우 각각 서브대역이 상이하게 설정되도록 한다.
서브대역 할당 장치는 스펙트럼 계수의 분포가 고른 경우에는 신호의 품질 열화가 적게 발생되므로, 긴 서브대역을 설정하고, 스펙트럼 계수의 포가 고르지 않고 각 계수의 값의 편차가 큰 경우에는, 양자화 시 그에 따른 품질 열화가 발생하게 되므로, 짧은 서브대역을 설정하여 짧은 서브대역 단위로 양자화를 진행하여 고품질의 비트스트림이 출력되도록 한다.
이때, 서브대역 할당 장치는 짧은 서브대역에 대해서, 짧은 서브대역의 허용 여부를 먼저 설정한 후, 짧은 서브대역의 사용이 허용된 경우에 한하여, 짧은 서브대역을 설정하고 짧은 서브대역에 스펙트럼 계수를 할당한다.
상기와 같이 스펙트럼 계수의 분포에 따라 서브대역을 상이하게 하여 신호를 변환하는 것은 비트스트림을 오디오 신호로 역변환하는 경우에도 적용될 수 있다.
도 2 는 본 발명의 일실시예에 따른 서브대역 할당 장치의 구성에 대한 설명에 참조되는 블록도이다.
스펙트럼 계수를 서브대역에 할당하는 데 있어서 서브대역 할당장치는 도 2에 도시된 바와 같이, 오디오신호입력부(110), 주파수 변환부 (120), 대역설정부(130), 양자화부(140), 비트스트림 전송부(150) 그리고, 상기와 같은 구성에 대한 동작 전반을 제어하는 제어부(200)를 포함한다.
여기서, 도 2는 입력되는 음성 또는 오디오 신호를 비트스트림으로 변환함으로써 신호를 부호화하는 구성을 포함하나, 그 외 구성을 더 포함하나, 본 발명이 요지를 흐리는 구성에 대하여 그에 대한 설명은 생략하기로 한다.
오디오 신호입력부(110)는 아날로그의 음성 또는 소정의 음향이 입력되면 이를 전기적 신호로 변환하여 제어부(901)로 인가한다. 이때, 오디오 신호입력부(110)는 마이크 등의 오디오 신호 입력장치가 사용될 수 있으나, 이에 한정되지 않으며 외부로부터 음성 또는 오디오 신호를 입력받거나 전송받는 장치 또한 포함될 수 있다.
주파수변환부(120)는 제어부(200)의 제어명령에 대응하여 오디오 신호 입력 부(110)를 통해 입력된 오디오 신호를 주파수 영역의 신호로 변환하고, 그에 따라 스펙트럼 계수를 생성한다.
제어부(200)는 오디오 신호의 입출력을 제어하고, 부호화기에 의해 생성된 비트스트림이 비트스트림 전송부(150)를 통해 전송되도록 제어한다. 이때, 제어부9200)는 신호변환 과정에서, 각 부에서 소정의 동작이 수행되도록 제어명령을 인가하고, 각 구의 결과물이 지정된 부로 인가되도록 데이터의 흐름을 제어한다.
대역설정부(130)는 주파수변환부(120)의 의해 오디오 신호가 주파수 영역의 신호로 변환되면, 스펙트럼 계수를 대역에 할당하고, 스펙트럼 계수의 분포를 분석하여 각 대역에 대한 서브대역을 설정한다.
이때, 대역설정부(130)는 짧은 서브대역 허용 결정부(131), 대역할당부(132), 서브대역 유형 결정부(133) 그리고 서브대역 할당부(134)를 포함한다.
짧은 서브대역 허용 결정부(131)는 입력된 오디오 신호로부터 짧은 서브대역의 사용을 허용할 것인지를 결정한다.
짧은 서브대역 허용 결정부(131)는 스펙트럼 계수에 대한 스펙트럼 평탄(spectral flatness)(이하, ‘평탄도’)를 측정하고, 측정된 평탄도가 기준값 보다 작은 경우 짧은 서브대역을 허용하고, 기준값보다 평탄도가 큰 경우 짧은 서브대역을 허용하지 않는다.
짧은 서브대역 허용 결정부(131)는 다음 수학식1에 따라 스펙트럼 계수에 대한 평탄도(SF)를 산출한다.
Figure 112008088108669-pat00001
이때, 평탄도에 대한 기준값은 0.3 내지 0.6범위 내에서 설정될 수 있다.
또한, 짧은 서브대역 허용 결정부(131)는 짧은 서브대역이 기본 서브대역으로 설정되거나 입력데이터에 의해 선택되는 경우 짧은 서브대역을 허용한다.
대역할당부(132)는 오디오 신호로부터 변환된 스펙트럼 계수들을 각 대역에 할당한다. 이때. 대역할당부(132)는 각 대역에 스펙트럼 계수를 할당함에 있어서 대역별로 균등하게 할당하거나, 인간의 청각적 특성을 반영하여 Bark 스케일로 할당할 수 있다.
예를 들어, 대역할당부(132)는 균등하게 할당하는 경우, 320개의 MDCT (Modified Discrete Cosine Transform) 계수가 있고 16개의 대역이 있을 경우, 균등하게 한 대역에 20개의 MDCT 계수를 할당하는 방식을 사용할 수 있다. 또한, 대역의 개수는 한 개일 수도 있다.
서브대역 유형 결정부(133)는 스펙트럼 계수들의 분포에 따라 각 대역에서 짧은 서브대역을 사용할 것인지 긴 서브대역을 사용할 것인지 설정하여, 결정된 서브대역이 사용되도록 설정한다.
서브대역 유형결정부(133) 계수들의 크기가 고른 분포를 보이는 대역에서는 대역의 길이가 긴 서브대역이 사용되도록 설정하고, 특정 계수들의 크기가 큰 분포를 보이는 대역에서는 짧은 서브대역이 사용되도록 설정한다. 즉, 서브대역 유형결정부(133)는 스펙트럼 계수의 크기에 대하여 편차가 작아서 고른 분포를 나타내는 경우에는 긴 서브대역이, 스펙트럼 계수의 크기가 다양하여 그에 대한 편차가 큰 경우에는 짧은 서브대역이 사용되도록 설정한다.
서브대역 유형결정부(133)는 그 대역의 평탄도(Spectral flatness)를 측정하거나, 스펙트럼 계수의 최대값과 평균값을 비교하거나, 최대값의 미분값을 구하여 스펙트럼 계수의 분포를 측정할 수 있다.
서브대역 유형 결정부(133)는 상기와 같은 방식 중, 최대값과 평균값의 비교를 통해 분포를 측정하는경우 다음 수학식 2과 같이 분포를 측정한다.
Figure 112008088108669-pat00002
서브대역 유형 결정부(133)는 최대값에 대한 평균값의 비율이 기준값 보다 작은 경우 긴 서브대역을 사용하고, 큰 경우 짧은 서브대역이 사용되도록 한다.
서브대역 할당부(134)는 서브대역 유형 결정부(133)에 의해 서브대역의 크기가 결정되면, 각 대역의 스펙트럼 계수들을 각 서브대역에 할당한다.
예를 들어, 서브대역 할당부(134)는 하나의 대역에 20개의 계수가 균등 할당 된 경우, 하나의 짧은 서브대역에 5개의 계수로 구성되고, 짧은 서브대역이 4개로 구성될 수 있다.
양자화부(140)는 주파수변화부(120)에 의해 변환된 신호를 대역설정부(130)에 의한 서브대역 설정 및 서브대역에 대한 스펙트럼 계수 할당에 따라 양자화를 수행하여 비트스트림을 생성한다.
양자화부(140)는 이득양자화부(141) 및 벡터양자화부(142)를 포함한다. 양자화부(140)는 양자화 방식에 따라 구분한 것으로 다른 양자화 방법이 사용되는 경우 그에 따른 양자화부가 구비된다.
이득양자화부(141)는 서브대역 스펙트럼 계수들의 이득(gain)을 산출하고, 산출된 이득을 이용하여, 서브대역 단위로 양자화를 수행한다. 이때, 이득양자화부(141)는 로그스케일로 스칼라 양자화한다.
이때, 계수의 이득은 다음 수학식 3에 의해 산출될 수 있다.
Figure 112008088108669-pat00003
벡터양자화부(142)는 서브대역 스펙트럼 계수들에 대한 모양(shape)을 산출하고, 그 산출된 모양에 따라 양자화를 수행한다. 벡터양자화부(142)는 산출된 서브대역 스펙트럼 계수들을 이득으로 정규화하여 모양(shape)을 산출한 후, 사전에 트래이닝 데이터(training data)로 부터 획득한 테이블을 이용하여 벡터 양자화 수 행한다.
비트스트림 전송부(150)는 양자화부(140)에 의한 양자화가 완료되면, 양자화부(140)로부터 출력되는 비트 스트림을 소정 장치로 전송한다.
도 3 은 본 발명의 일실시예에 따른 서브대역 할당 장치의 또 다른 구성에 대한 설명에 참조되는 블록도이다.
스펙트럼 계수를 서브대역에 할당하는 데 있어서 서브대역 할당장치는 도 3에 도시된 바와 같이 구성될 수 있다.
서브대역 할당 장치의 또 다른 예는 전술한 도 2와 같이, 오디오신호입력부(110), 주파수 변환부(120), 대역설정부(130), 양자화부(140), 비트스트림 전송부(150) 그리고, 상기와 같은 구성에 대한 동작 전반을 제어하는 제어부(200)를 포함하고, 비트스트림을 오디로 신호로 역변환 하기 위한 구성을 더 포함한다.
여기서, 전술한 도 2의 서브대역 할당 장치와 동일 구성에 대하여 동일 명칭 및 동일 부호를 사용하였으며, 그에 대한 설명은 하기에서 생략하기로 한다.
서브대역 할당 장치의 또 다른 예는 비트스트림 수신부(160), 역양자화부(170), 역변환부(180), 오디오신호 출력부(170)를 포함한다. 이때, 대역설정부(130)는 서브유형 복호화부(135)를 더 포함한다.
비트스트림 수신부(160)는 외부 또는 다른 장치로부터 비트스트림 데이터를 수신한다.
대역설정부(130) 중 서브유형 복호화부(135)는 짧은 서브대역 허용 결정부(131)에 의해 짧은 서브대역의 허용 여부가 결정되면, 그에 대응하여 복호화에 따른 서브유형 복호화에 서브대역의 크기를 반영한다.
서브유형 복호화부(135)는 수신된 비트스트림에 대한 서브유형 복호화를 수행하여 역양자화부(170)로 인가한다.
역양자화부(170) 비트스트림으로부터 스펙트럼 계수를 산출하여 역변환부(180)로 인가하는데, 이득 역양자화부(171)와, 벡터역양자화부(172)를 포함한다.
이득역양자화부(171)는 이득값을 산출하여 비트스트림을 역양자화하고, 벡터영양자화부(172)는 모양에 따라 역양자화를 수행한다. 여기서, 부호화기의 양자화부(140)의 양자화 방식에 대응하여 역양자화부(170)가 구성될 수 있으나, 경우에 따라 상이한 방식이 사용될 수 있다.
역변환부(180)는 주파수 영역의 신호를 역변환 함으로써, 오디오신호를 출력한다.
오디오신호 출력부(170)는 역변환부(180)에 변환처리된 오디오신호를 인가받아 외부로 출력한다. 이때, 오디오신호 출력부(170)는 스피커 등이 사용될 수 있다.
서브대역 할당 장치는 신호의 부호화 시 스펙트럼 계수의 분포에 따라 서브대역을 설정하고 서브대역별로 양자화를 수행하는데, 신호의 복호화시에도 스펙트럼의 계수 분포에 따른 특성을 이용하여 복호화를 수행할 수 있다.
도 4 는 본 발명의 일실시예에 따른 스펙트럼 계수의 분포에 따른 서브대역 및 서브대역에 할당되는 스펙트럼 계수에 대한 설명에 참조되는 도이다.
예를 들어, 도4의 (a)와 같이 하나의 대역에 20개의 계수가 할당된 경우, 도 4의 (b)와 같이 복수의 짧은 서브대역이 설정되거나, 도 4의 (d)와 같이 긴 서브대역이 설정되다. 이때, 도 4의 (c)와 같이 서브대역이 설정될 수도 있으며, 각각 서브대역의 크기는 시스템, 스펙트럼 계수의 분포에 따라 상이하게 설정될 수 있다
하나의 대역에 20개의 계수가 할당된 상태에서, 4개의 짧은 서브대역이 사용되는 경우 각각의 서브대역에는 5개의 계수가 할당된다. 2개의 서브대역이 사용되는 경우에는 각각 10개씩 계수가 할당된다.
도 5 는 본 발명의 일실시예에 오디오 신호의 신호변환 시, 서브대역의 스펙트럼 계수 할당 방법에 대한 동작설명에 참조되는 순서도이다.
오디오 신호가 입력되면(S310), 제어부(200)는 입력된 오디오 신호를 주파수변환부(120)로 인가하고, 주파수 변환부(120)는 입력된 오디오신호를 주파수 영역의 신호로 변환한다(S320).
이때, 대역 할당부(132)는 오디오 신호의 변환에 의해 생성된 스펙트럼 계수를 각각의 대역에 할당한다(S330). 대역할당부(132)는 스펙트럼 계수를 대역에 할당하는 데 있어서, 대역에 스펙트럼 계수를 균등하게 할당하거나 음성 특성에 기반하여 로그스케일로 할당 할 수 있다.
짧은 서브대역 혀용 결정부(131)는 각 대역에 대하여 스펙트럼 계수의 분포를 측정하고 그에 대응하여 짧은 서브대역의 허용 여부를 결정한다.
짧은 서브대역 허용 결정부(131)는 스펙트럼 계수에 대한 평탄도를 산출하고, 평탄도를 기준값과 비교하여(S340), 평탄도가 기준값보다 작은 경우 짧은 서브대역을 허용하고(S350), 평탄도가 기준값 보다 큰 경우에는 짧은 서브대역을 허용 하지 않는다(S380). 경우에 따라 짧은 서브대역이 기본 서브대역으로 설정되거나 입력데이터에 의해 선택되는 경우 짧은 서브대역을 허용한다.
짧은 서브대역 허용 시, 서브대역 유형 결정부(133)는 각 대역에 대하여 스펙트럼 계수의 분포를 산출하고 스펙트럼 계수의 분포의 고른 정도에 따라 서브대역의 크기를 설정한다(S360).
즉, 계수의 크기가 고른 분포를 갖는 경우, 서브대역 유형 결정부(133)는 짧은 서브대역이 사용되도록 설정하고(S370), 스펙트럼 계수의 크기가 고르지 않고 큰 분포를 갖는 경우에는 긴 서브대역이 사용되도록 설정한다(S390).
한편, 평탄도가 기준값 보다 큰 경우, 서브대역 유형 결정부(133)는 짧은 서브대역이 허용되지 않도록 설정하고(S380)고, 긴 서브대역이 사용되도록 설정한다(S390). 이때, 하나의 대역이 복수의 짧은 서브대역으로 분할되거나, 긴 서브대역으로 분할될 수 있다.
서브대역 할당부(134)는 각 대역 별 서브대역의 크기가 결정되면, 각 대역 별로 포함하는 스펙트럼 계수를 각 서브대역에 할당한다(S400).
서브대역에 대한 스펙트럼 할당이 완료되면, 이득양자화부(141)는 서브대역 단위로 이득을 산출하고(S410), 이득을 이용하여 양자화를 수행한다(S420). 벡터양자화부(142)는 서브대역 별 스펙트럼 계수의 모양을 산출하고(S430) 그에 따라 벡터 양자화를 수행한다(S440).
양자화가 완료되면 비트스트림이 출력되고(S450), 제어부(110)는 비트스트림을 비트스트림 전송부(150)로 인가하여 지정된 목적지로 전송되도록 제어한다.
따라서 본 발명은 상기와 같이 스펙트럼 계수의 분포에 따라 서브대역의 크기를 상이하게 하여 서브대역 단위로 양자화를 수행함으로써, 종래의 균일한 서브대역을 이용한 양자화로 인한 음질 열화를 최소화하여 향상된 품질을 제공한다.
또한, 본 발명은 스펙트럼 계수들의 크기가 고른 분포를 보이는 대역에서는 큰 서브대역을 사용하고 특정 계수들의 크기가 큰 분포를 보이는 대역에서는 작은 서브대역을 사용하여 비트를 효율적으로 분배할 수 있다.
이상과 같이 본 발명에 의한 스펙트럼 계수의 서브대역 할당 방법 및 장치는 예시된 도면을 참조로 설명하였으나, 본 명세서에 개시된 실시예와 도면에 의해 본 발명은 이에 한정되지 않고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 응용될 수 있다.
도 1 은 본 발명의 일실시예에 따른 오디오신호의 신호변화에 따른 대략적인 흐름이 도시된 흐름도,
도 2 는 본 발명의 일실시예에 따른 서브대역 할당 장치의 구성에 대한 설명에 참조되는 블록도,
도 3 은 본 발명의 일실시예에 따른 서브대역 할당 장치의 또 다른 구성에 대한 설명에 참조되는 블록도,
도 4 는 본 발명의 일실시예에 따른 스펙트럼 계수의 분포에 따른 서브대역 및 서브대역에 할당되는 스펙트럼 계수에 대한 설명에 참조되는 도,
도 5 는 본 발명의 일실시예에 오디오 신호의 신호변환 시, 서브대역의 스펙트럼 계수 할당 방법에 대한 동작설명에 참조되는 순서도이다.
<도면의 주요 부분에 관한 부호의 설명>
120: 주파수변환부 130: 대역설정부
131: 짧은 서브대역 허용 결정부 132: 대역할당부
133: 서브대역 유형 결정부 134: 서브대역 할당부
140: 양자화부 141: 이득양자화부
142: 벡터양자화부 200: 제어부

Claims (10)

  1. 오디오 신호로부터 변환된 스펙트럼 계수를 각 대역에 할당하는 단계;
    상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 단계;
    짧은 서브대역 허용 시, 상기 스펙트럼 계수들의 분포에 대응하여, 각 대역에 대한 서브대역의 유형을 결정하는 단계; 및
    상기 각 대역 별 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하고, 상기 서브대역 별로 양자화 하여 비트스트림(Bit stream)을 출력하는 단계를 포함하는 서브대역 할당 방법.
  2. 제 1 항에 있어서,
    상기 짧은 서브대역 허용 여부 결정단계는, 상기 스펙트럼 계수에 대한 평탄도(Spectral flatness)를 측정하여, 상기 평탄도가 기 설정된 기준값 보다 작은 경우 및 짧은 서브대역이 입력데이터에 의해 선택되거나 기본 서브대역으로 설정된 경우 중 어느 하나의 경우, 상기 짧은 서브대역을 허용하는 것을 특징으로 하는 서브대역 할당 방법.
  3. 제 2 항에 있어서,
    상기 짧은 서브대역 허용 여부 결정단계는, 상기 평탄도가, 0.3 내지 0.6 범위 내에서 설정된 기준값 보다 작은 경우 짧은 서브대역을 허용하는 것을 특징으로 하는 서브대역 할당 방법.
  4. 제 1 항에 있어서,
    상기 서브대역 유형 결정단계는, 각 대역 별로 상기 스펙트럼 계수의 분포를 산출하고, 상기 스펙트럼 계수의 크기가 고른 분포를 갖는 대역에서는 긴 서브대역이 사용되도록 설정하고,
    상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역에서는 짧은 서브대역이 사용되도록 설정하는 것을 특징으로 하는 서브대역 할당 방법.
  5. 제 4 항에 있어서,
    상기 서브대역 유형 결정단계는, 각 대역 별 할당된 상기 스펙트럼 계수에 대한 평탄도를 측정하여 상기 스펙트럼 계수의 분포를 산출하는 방법, 상기 스펙트럼 계수의 최대값과 평균값을 비교하여 상기 스펙트럼 계수의 분포를 산출하는 방법 및 상기 스펙트럼 계수의 최대값에 대한 미분값을 연산하여 상기 스펙트럼 계수의 분포를 산출하는 방법 중 적어도 하나를 이용하여 상기 스펙트럼 계수의 분포를 산출하는 것을 특징으로 하는 서브대역 할당 방법.
  6. 제 5 항에 있어서,
    상기 서브대역 유형 결정단계는, 상기 스펙트럼 계수의 최대값과 평균값을 이용하여 상기 스펙트럼 계수의 분포를 산출 하는 경우,
    상기 최대값에 대한 평균값의 비율이 설정값보다 작은 경우 긴 서브대역이 사용되도록 설정하고, 상기 최대값에 대한 평균값의 비율이 설정값보다 큰 경우 짧은 서브대역이 사용되도록 설정하는 것을 특징으로 하는 서브대역 할당 방법.
  7. 제 1 항에 있어서,
    상기 스펙트럼 계수를 상기 각 대역에 할당하는 단계는, 상기 각 대역에 균등하게 할당하는 방식 및 인간의 청각적 특성을 반영하여 바크(Bark)스케일로 할당하는 방식 중 적어도 하나의 방식을 이용하여 상기 스펙트럼 계수를 할당하는 것을 특징으로 하는 서브대역 할당 방법.
  8. 제 1 항에 있어서,
    상기 양자화에 따른 비트스트림 출력단계는, 상기 서브대역의 스펙트럼 계수의 이득을 산출하여 로그스케일로 스칼라 양자화하고, 상기 서브대역의 스펙트럼 계수들의 모양(shape)을 구하여 사전에 트레이닝(training) 데이터로부터 구한 테이블로부터 벡터 양자화하는 것을 특징으로 하는 서브대역 할당 방법.
  9. 오디오 신호를 주파수 대역의 스펙트럼 계수로 변환하는 주파수 변환부;
    대역 별 상기 스펙트럼 계수를 할당하고 상기 스펙트럼 계수의 평탄도와 분포를 산출하여, 대역 별 서브대역의 유형을 설정하고 상기 스펙트럼 계수를 할당하는 대역설정부; 및
    상기 서브대역 별로, 상기 스펙트럼 계수의 이득 및 모양을 산출하여 양자화 하여 비트스트림(Bit stream)을 출력하는 양자화부;를 포함하는 서브대역 할당 장치.
  10. 제 9 항에 있어서,
    상기 대역 설정부는 상기 스펙트럼 계수들을 각 대역에 균등하거나 로그스케일로 할당하는 대역할당부;
    상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 짧은 서브대역 허용결정부;
    상기 스펙트럼 계수의 분포에 대응하여, 상기 스펙트럼 계수의 분포가 고른 분포를 갖는 대역의 경우 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역의 경우 상기 짧은 서브대역이 사용되도록 서브대역의 유형의 결정하는 서브대역 유형 결정부; 및
    상기 각 대역에 할당된 상기 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하는 서브대역 할당부;를 포함하는 서브대역 할당 장치.
KR1020080131730A 2008-12-22 2008-12-22 스펙트럼 계수의 서브대역 할당 방법 및 장치 Expired - Fee Related KR101301245B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020080131730A KR101301245B1 (ko) 2008-12-22 2008-12-22 스펙트럼 계수의 서브대역 할당 방법 및 장치
US12/556,073 US8438012B2 (en) 2008-12-22 2009-09-09 Method and apparatus for adaptive sub-band allocation of spectral coefficients

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080131730A KR101301245B1 (ko) 2008-12-22 2008-12-22 스펙트럼 계수의 서브대역 할당 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20100073139A KR20100073139A (ko) 2010-07-01
KR101301245B1 true KR101301245B1 (ko) 2013-09-10

Family

ID=42267353

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080131730A Expired - Fee Related KR101301245B1 (ko) 2008-12-22 2008-12-22 스펙트럼 계수의 서브대역 할당 방법 및 장치

Country Status (2)

Country Link
US (1) US8438012B2 (ko)
KR (1) KR101301245B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751225B2 (en) * 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
EP2933799B1 (en) * 2012-12-13 2017-07-12 Panasonic Intellectual Property Corporation of America Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
US10410645B2 (en) * 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
SG10201808274UA (en) 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
EP2993665A1 (en) * 2014-09-02 2016-03-09 Thomson Licensing Method and apparatus for coding or decoding subband configuration data for subband groups

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
KR20070087222A (ko) * 1999-07-19 2007-08-27 콸콤 인코포레이티드 음성 코더용 스펙트럼 크기 양자화 방법
KR20080025403A (ko) * 2005-07-15 2008-03-20 마이크로소프트 코포레이션 디지털 미디어의 효율적인 코딩을 위한 대역을 획득하기위한 주파수 세그먼트화

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
JP3254953B2 (ja) 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
JP3353266B2 (ja) 1996-02-22 2002-12-03 日本電信電話株式会社 音響信号変換符号化方法
JP2000134105A (ja) * 1998-10-29 2000-05-12 Matsushita Electric Ind Co Ltd オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
JP2000330599A (ja) * 1999-05-21 2000-11-30 Sony Corp 信号処理方法及び装置、並びに情報提供媒体
US7050965B2 (en) * 2002-06-03 2006-05-23 Intel Corporation Perceptual normalization of digital audio signals
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
WO2007058465A1 (en) 2005-11-15 2007-05-24 Samsung Electronics Co., Ltd. Methods and apparatuses to quantize and de-quantize linear predictive coding coefficient

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
KR20070087222A (ko) * 1999-07-19 2007-08-27 콸콤 인코포레이티드 음성 코더용 스펙트럼 크기 양자화 방법
KR20080025403A (ko) * 2005-07-15 2008-03-20 마이크로소프트 코포레이션 디지털 미디어의 효율적인 코딩을 위한 대역을 획득하기위한 주파수 세그먼트화

Also Published As

Publication number Publication date
US20100161320A1 (en) 2010-06-24
US8438012B2 (en) 2013-05-07
KR20100073139A (ko) 2010-07-01

Similar Documents

Publication Publication Date Title
US11355129B2 (en) Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
CN108831501B (zh) 用于带宽扩展的高频编码/高频解码方法和设备
CN101305423B (zh) 自适应的基于时间/频率的音频编码和解码设备和方法
KR20220004778A (ko) 비트할당방법, 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 기록매체와 이를 채용하는 멀티미디어 기기
JP4212591B2 (ja) オーディオ符号化装置
KR20090122142A (ko) 오디오 신호 처리 방법 및 장치
JP6717746B2 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
KR100695125B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
US20090132238A1 (en) Efficient method for reusing scale factors to improve the efficiency of an audio encoder
KR101301245B1 (ko) 스펙트럼 계수의 서브대역 할당 방법 및 장치
KR102625143B1 (ko) 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
KR102512359B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
JPH0474018A (ja) 適応ビット割当て方法及び装置
JP4639073B2 (ja) オーディオ信号符号化装置および方法
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
KR100682890B1 (ko) 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
JP5010197B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20081222

PA0201 Request for examination
PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20130819

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20130822

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20130822

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20170201

Start annual number: 4

End annual number: 4

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee