KR101170466B1 - Mdct 영역에서의 후처리 방법, 및 장치 - Google Patents
Mdct 영역에서의 후처리 방법, 및 장치 Download PDFInfo
- Publication number
- KR101170466B1 KR101170466B1 KR1020080131712A KR20080131712A KR101170466B1 KR 101170466 B1 KR101170466 B1 KR 101170466B1 KR 1020080131712 A KR1020080131712 A KR 1020080131712A KR 20080131712 A KR20080131712 A KR 20080131712A KR 101170466 B1 KR101170466 B1 KR 101170466B1
- Authority
- KR
- South Korea
- Prior art keywords
- band
- mdct
- post
- peaks
- mdct coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012805 post-processing Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000003044 adaptive effect Effects 0.000 title description 12
- 238000007493 shaping process Methods 0.000 claims abstract description 30
- 238000010606 normalization Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000003187 abdominal effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (8)
- 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 상기 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 상기 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계;복수의 피크에 대한 미분값의 증감을 토대로 상기 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 상기 글로벌 포먼트와 상기 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계;상기 입력프레임의 입력신호에 대한 shaping 비율을 상기 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계; 및상기 MDCT 계수에 상기 필터 계수를 승산하여 상기 각 서브 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계;를 포함하는 것을 특징으로 하는 MDCT 영역에서의 후처리 방법.
- 제1항에 있어서,상기 서브 대역에 대한 피크는,상기 미분값이 0에 수렴하면서 미분값에 따른 기울기가 양(+) 에서 음(-)으로 향하는 영역이며,상기 서브 대역에 대한 밸리는, 상기 미분값이 0에 수렴하면서, 미분값에 따른 기울기가 음(-)에서 양(+)으로 향하는 영역인 것을 특징으로 하는 MDCT 영역에 서의 후처리 방법.
- 제2항에 있어서,상기 기울기가 미리 설정한 기준값 보다 작을 경우, 상기 피크와 상기 밸리에 대한 서브 대역을 하나로 통합하여 상기 대역을 형성하는 것을 특징으로 하는 MDCT 영역에서의 후처리 방법.
- 제3항에 있어서,싱기 기준값은,-0.5 ~ +0.5 사이의 값인 것을 특징으로 하는 MDCT 영역에서의 후처리 방법.
- 입력 프레임의 MDCT 계수의 미분값을 토대로 상기 MDCT 계수에 대한 피크와 밸리를 구하고, 상기 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 서브 대역 결정부;복수의 피크에 대한 미분값을 토대로 상기 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 상기 글로벌 포먼트와 상기 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 대역 결정부;상기 입력 프레임에 대한 shaping 비율을 결정하는 shaping 비율 결정부;상기 shaping 비율을 상기 각 대역에 대한 서브 대역 단위의 제 1 후처리 필 터 계수와 상기 각 서브대역에서 MDCT 계수 단위의 제 2 후처리 필터 계수를 결정하는 대역 필터계수 결정부;상기 제 1 후처리 필터계수와 상기 MDCT 계수에 승산하고 상기 각 대역의 입력 MDCT 계수와 출력 MDCT 계수의 이득이 동일하도록 이득을 조절하는 제1이득 조절부; 및상기 제 2후처리 필터계수를 상기 MDCT 계수에 곱하고 상기 각 서브 대역에서 입력 MDCT 계수와 출력 MDCT 계수의 이득이 같도록 이득을 조절하는 제2이득조절부;를 포함하는 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
- 제5항에 있어서,상기 서브 대역에 대한 피크는,상기 미분값이 0에 수렴하면서 미분값에 따른 기울기가 양(+) 에서 음(-)으로 향하는 영역이며,상기 서브 대역에 대한 밸리는, 상기 미분값이 0에 수렴하면서, 미분값에 따른 기울기가 음(-)에서 양(+)으로 향하는 영역인 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
- 제6항에 있어서,상기 기울기가 미리 설정한 기준값 보다 작을 경우, 상기 피크와 상기 밸리에 대한 서브 대역을 하나로 통합하여 상기 대역을 형성하는 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
- 제7항에 있어서,싱기 기준값은,-0.5 ~ +0.5 사이의 값인 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080074173 | 2008-07-29 | ||
KR20080074173 | 2008-07-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100012788A KR20100012788A (ko) | 2010-02-08 |
KR101170466B1 true KR101170466B1 (ko) | 2012-08-03 |
Family
ID=42086970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080131712A Expired - Fee Related KR101170466B1 (ko) | 2008-07-29 | 2008-12-22 | Mdct 영역에서의 후처리 방법, 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101170466B1 (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338872A (ja) | 1999-09-22 | 2005-12-08 | Conexant Systems Inc | マルチモードの音声符号器 |
WO2007093726A2 (fr) | 2006-02-14 | 2007-08-23 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
US20080312914A1 (en) | 2007-06-13 | 2008-12-18 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
-
2008
- 2008-12-22 KR KR1020080131712A patent/KR101170466B1/ko not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005338872A (ja) | 1999-09-22 | 2005-12-08 | Conexant Systems Inc | マルチモードの音声符号器 |
WO2007093726A2 (fr) | 2006-02-14 | 2007-08-23 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
US20080312914A1 (en) | 2007-06-13 | 2008-12-18 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
Also Published As
Publication number | Publication date |
---|---|
KR20100012788A (ko) | 2010-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2734781C1 (ru) | Устройство для постобработки звукового сигнала с использованием выявления места всплеска | |
EP2047466B1 (en) | Systems, methods, and apparatus for gain factor limiting | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
CN100589657C (zh) | 编码音频的节约式响度测量方法及装置 | |
US11043226B2 (en) | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters | |
EP2772909B1 (en) | Method for encoding voice signal | |
JP2021502588A (ja) | ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム | |
WO2009142466A2 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP7261173B2 (ja) | 予測に基づく整形を使用したオーディオ信号の後処理のための装置および方法 | |
CN105960675A (zh) | 音频信号解码器中改进的频带扩展 | |
TWI841856B (zh) | 音頻量化器和音頻去量化器及相關方法以及電腦程式 | |
KR100922897B1 (ko) | Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법 | |
KR101170466B1 (ko) | Mdct 영역에서의 후처리 방법, 및 장치 | |
HK40029859B (en) | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters | |
HK40029859A (en) | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters | |
Sohn et al. | A codebook shaping method for perceptual quality improvement of CELP coders | |
KR20080034817A (ko) | 부호화/복호화 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20081222 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20120626 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20120726 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20120727 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20160609 |