KR101301245B1 - 스펙트럼 계수의 서브대역 할당 방법 및 장치 - Google Patents
스펙트럼 계수의 서브대역 할당 방법 및 장치 Download PDFInfo
- Publication number
- KR101301245B1 KR101301245B1 KR1020080131730A KR20080131730A KR101301245B1 KR 101301245 B1 KR101301245 B1 KR 101301245B1 KR 1020080131730 A KR1020080131730 A KR 1020080131730A KR 20080131730 A KR20080131730 A KR 20080131730A KR 101301245 B1 KR101301245 B1 KR 101301245B1
- Authority
- KR
- South Korea
- Prior art keywords
- subband
- spectral coefficients
- band
- distribution
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000003044 adaptive effect Effects 0.000 title 1
- 238000013139 quantization Methods 0.000 claims abstract description 59
- 238000009826 distribution Methods 0.000 claims abstract description 56
- 230000005236 sound signal Effects 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006866 deterioration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (10)
- 오디오 신호로부터 변환된 스펙트럼 계수를 각 대역에 할당하는 단계;상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 단계;짧은 서브대역 허용 시, 상기 스펙트럼 계수들의 분포에 대응하여, 각 대역에 대한 서브대역의 유형을 결정하는 단계; 및상기 각 대역 별 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하고, 상기 서브대역 별로 양자화 하여 비트스트림(Bit stream)을 출력하는 단계를 포함하는 서브대역 할당 방법.
- 제 1 항에 있어서,상기 짧은 서브대역 허용 여부 결정단계는, 상기 스펙트럼 계수에 대한 평탄도(Spectral flatness)를 측정하여, 상기 평탄도가 기 설정된 기준값 보다 작은 경우 및 짧은 서브대역이 입력데이터에 의해 선택되거나 기본 서브대역으로 설정된 경우 중 어느 하나의 경우, 상기 짧은 서브대역을 허용하는 것을 특징으로 하는 서브대역 할당 방법.
- 제 2 항에 있어서,상기 짧은 서브대역 허용 여부 결정단계는, 상기 평탄도가, 0.3 내지 0.6 범위 내에서 설정된 기준값 보다 작은 경우 짧은 서브대역을 허용하는 것을 특징으로 하는 서브대역 할당 방법.
- 제 1 항에 있어서,상기 서브대역 유형 결정단계는, 각 대역 별로 상기 스펙트럼 계수의 분포를 산출하고, 상기 스펙트럼 계수의 크기가 고른 분포를 갖는 대역에서는 긴 서브대역이 사용되도록 설정하고,상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역에서는 짧은 서브대역이 사용되도록 설정하는 것을 특징으로 하는 서브대역 할당 방법.
- 제 4 항에 있어서,상기 서브대역 유형 결정단계는, 각 대역 별 할당된 상기 스펙트럼 계수에 대한 평탄도를 측정하여 상기 스펙트럼 계수의 분포를 산출하는 방법, 상기 스펙트럼 계수의 최대값과 평균값을 비교하여 상기 스펙트럼 계수의 분포를 산출하는 방법 및 상기 스펙트럼 계수의 최대값에 대한 미분값을 연산하여 상기 스펙트럼 계수의 분포를 산출하는 방법 중 적어도 하나를 이용하여 상기 스펙트럼 계수의 분포를 산출하는 것을 특징으로 하는 서브대역 할당 방법.
- 제 5 항에 있어서,상기 서브대역 유형 결정단계는, 상기 스펙트럼 계수의 최대값과 평균값을 이용하여 상기 스펙트럼 계수의 분포를 산출 하는 경우,상기 최대값에 대한 평균값의 비율이 설정값보다 작은 경우 긴 서브대역이 사용되도록 설정하고, 상기 최대값에 대한 평균값의 비율이 설정값보다 큰 경우 짧은 서브대역이 사용되도록 설정하는 것을 특징으로 하는 서브대역 할당 방법.
- 제 1 항에 있어서,상기 스펙트럼 계수를 상기 각 대역에 할당하는 단계는, 상기 각 대역에 균등하게 할당하는 방식 및 인간의 청각적 특성을 반영하여 바크(Bark)스케일로 할당하는 방식 중 적어도 하나의 방식을 이용하여 상기 스펙트럼 계수를 할당하는 것을 특징으로 하는 서브대역 할당 방법.
- 제 1 항에 있어서,상기 양자화에 따른 비트스트림 출력단계는, 상기 서브대역의 스펙트럼 계수의 이득을 산출하여 로그스케일로 스칼라 양자화하고, 상기 서브대역의 스펙트럼 계수들의 모양(shape)을 구하여 사전에 트레이닝(training) 데이터로부터 구한 테이블로부터 벡터 양자화하는 것을 특징으로 하는 서브대역 할당 방법.
- 오디오 신호를 주파수 대역의 스펙트럼 계수로 변환하는 주파수 변환부;대역 별 상기 스펙트럼 계수를 할당하고 상기 스펙트럼 계수의 평탄도와 분포를 산출하여, 대역 별 서브대역의 유형을 설정하고 상기 스펙트럼 계수를 할당하는 대역설정부; 및상기 서브대역 별로, 상기 스펙트럼 계수의 이득 및 모양을 산출하여 양자화 하여 비트스트림(Bit stream)을 출력하는 양자화부;를 포함하는 서브대역 할당 장치.
- 제 9 항에 있어서,상기 대역 설정부는 상기 스펙트럼 계수들을 각 대역에 균등하거나 로그스케일로 할당하는 대역할당부;상기 대역에 대한 짧은 서브대역의 허용 여부를 결정하는 짧은 서브대역 허용결정부;상기 스펙트럼 계수의 분포에 대응하여, 상기 스펙트럼 계수의 분포가 고른 분포를 갖는 대역의 경우 긴 서브대역이 사용되도록 설정하고, 상기 스펙트럼 계수의 분포가 고르지 않고 큰 분포를 갖는 대역의 경우 상기 짧은 서브대역이 사용되도록 서브대역의 유형의 결정하는 서브대역 유형 결정부; 및상기 각 대역에 할당된 상기 스펙트럼 계수들을 상기 유형에 따라 상기 서브대역에 할당하는 서브대역 할당부;를 포함하는 서브대역 할당 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080131730A KR101301245B1 (ko) | 2008-12-22 | 2008-12-22 | 스펙트럼 계수의 서브대역 할당 방법 및 장치 |
US12/556,073 US8438012B2 (en) | 2008-12-22 | 2009-09-09 | Method and apparatus for adaptive sub-band allocation of spectral coefficients |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080131730A KR101301245B1 (ko) | 2008-12-22 | 2008-12-22 | 스펙트럼 계수의 서브대역 할당 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100073139A KR20100073139A (ko) | 2010-07-01 |
KR101301245B1 true KR101301245B1 (ko) | 2013-09-10 |
Family
ID=42267353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080131730A Expired - Fee Related KR101301245B1 (ko) | 2008-12-22 | 2008-12-22 | 스펙트럼 계수의 서브대역 할당 방법 및 장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8438012B2 (ko) |
KR (1) | KR101301245B1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8751225B2 (en) * | 2010-05-12 | 2014-06-10 | Electronics And Telecommunications Research Institute | Apparatus and method for coding signal in a communication system |
EP2933799B1 (en) * | 2012-12-13 | 2017-07-12 | Panasonic Intellectual Property Corporation of America | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method |
US10410645B2 (en) * | 2014-03-03 | 2019-09-10 | Samsung Electronics Co., Ltd. | Method and apparatus for high frequency decoding for bandwidth extension |
SG10201808274UA (en) | 2014-03-24 | 2018-10-30 | Samsung Electronics Co Ltd | High-band encoding method and device, and high-band decoding method and device |
EP2993665A1 (en) * | 2014-09-02 | 2016-03-09 | Thomson Licensing | Method and apparatus for coding or decoding subband configuration data for subband groups |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08190764A (ja) * | 1995-01-05 | 1996-07-23 | Sony Corp | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 |
KR20070087222A (ko) * | 1999-07-19 | 2007-08-27 | 콸콤 인코포레이티드 | 음성 코더용 스펙트럼 크기 양자화 방법 |
KR20080025403A (ko) * | 2005-07-15 | 2008-03-20 | 마이크로소프트 코포레이션 | 디지털 미디어의 효율적인 코딩을 위한 대역을 획득하기위한 주파수 세그먼트화 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5752225A (en) * | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
JP3254953B2 (ja) | 1995-02-17 | 2002-02-12 | 日本ビクター株式会社 | 音声高能率符号化装置 |
JP3353266B2 (ja) | 1996-02-22 | 2002-12-03 | 日本電信電話株式会社 | 音響信号変換符号化方法 |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
JP2000330599A (ja) * | 1999-05-21 | 2000-11-30 | Sony Corp | 信号処理方法及び装置、並びに情報提供媒体 |
US7050965B2 (en) * | 2002-06-03 | 2006-05-23 | Intel Corporation | Perceptual normalization of digital audio signals |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
WO2007058465A1 (en) | 2005-11-15 | 2007-05-24 | Samsung Electronics Co., Ltd. | Methods and apparatuses to quantize and de-quantize linear predictive coding coefficient |
-
2008
- 2008-12-22 KR KR1020080131730A patent/KR101301245B1/ko not_active Expired - Fee Related
-
2009
- 2009-09-09 US US12/556,073 patent/US8438012B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08190764A (ja) * | 1995-01-05 | 1996-07-23 | Sony Corp | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 |
KR20070087222A (ko) * | 1999-07-19 | 2007-08-27 | 콸콤 인코포레이티드 | 음성 코더용 스펙트럼 크기 양자화 방법 |
KR20080025403A (ko) * | 2005-07-15 | 2008-03-20 | 마이크로소프트 코포레이션 | 디지털 미디어의 효율적인 코딩을 위한 대역을 획득하기위한 주파수 세그먼트화 |
Also Published As
Publication number | Publication date |
---|---|
US20100161320A1 (en) | 2010-06-24 |
US8438012B2 (en) | 2013-05-07 |
KR20100073139A (ko) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11355129B2 (en) | Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
CN108831501B (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
CN101305423B (zh) | 自适应的基于时间/频率的音频编码和解码设备和方法 | |
KR20220004778A (ko) | 비트할당방법, 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 기록매체와 이를 채용하는 멀티미디어 기기 | |
JP4212591B2 (ja) | オーディオ符号化装置 | |
KR20090122142A (ko) | 오디오 신호 처리 방법 및 장치 | |
JP6717746B2 (ja) | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 | |
KR100695125B1 (ko) | 디지털 신호 부호화/복호화 방법 및 장치 | |
US20090132238A1 (en) | Efficient method for reusing scale factors to improve the efficiency of an audio encoder | |
KR101301245B1 (ko) | 스펙트럼 계수의 서브대역 할당 방법 및 장치 | |
KR102625143B1 (ko) | 신호 부호화방법 및 장치와 신호 복호화방법 및 장치 | |
KR102512359B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
JPH0474018A (ja) | 適応ビット割当て方法及び装置 | |
JP4639073B2 (ja) | オーディオ信号符号化装置および方法 | |
JP2004309921A (ja) | 符号化装置、符号化方法及びプログラム | |
KR100682890B1 (ko) | 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치 | |
JP5010197B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20081222 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20130819 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20130822 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20130822 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20170201 Start annual number: 4 End annual number: 4 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |