KR101259120B1 - 오디오 신호 처리 방법 및 장치 - Google Patents
오디오 신호 처리 방법 및 장치 Download PDFInfo
- Publication number
- KR101259120B1 KR101259120B1 KR1020090105389A KR20090105389A KR101259120B1 KR 101259120 B1 KR101259120 B1 KR 101259120B1 KR 1020090105389 A KR1020090105389 A KR 1020090105389A KR 20090105389 A KR20090105389 A KR 20090105389A KR 101259120 B1 KR101259120 B1 KR 101259120B1
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- information
- current frame
- value
- offset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000005236 sound signal Effects 0.000 title abstract description 67
- 238000012545 processing Methods 0.000 title description 27
- 230000003595 spectral effect Effects 0.000 claims description 84
- 239000000284 extract Substances 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 10
- 238000003672 processing method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (13)
- 노이즈 필링이 복수의 프레임에 사용되는지 여부를 지시하는 노이즈 필링 플래그 정보를 추출하는 단계;상기 복수의 프레임에 포함되는 현재 프레임이 주파수 도메인에서 코딩되었는지 아니면 시간 도메인에서 코딩되었는지를 나타내는 코딩 스킴 정보를 추출하는 단계;상기 노이즈 필링 플래그 정보가 상기 노이즈 필링이 상기 복수의 프레임에 사용되었음을 지시하고 상기 코딩 정보가 상기 현재 프레임이 상기 주파수 도메인에서 코딩되었음을 지시하는 경우, 현재 프레임에 대한 노이즈 레벨 정보 및, 현재 프레임에 대한 노이즈 옵셋 정보를 추출하는 단계; 및,상기 노이즈 레벨 정보 및 상기 노이즈 옵셋 정보를 근거로 현재 프레임에 대해 노이즈 필링을 수행하는 단계, 상기 노이즈 필링은,상기 현재 프레임의 스펙트럴 데이터를 이용하여 현재 프레임에 대한 손실 영역을 결정하는 단계;상기 노이즈 레벨 정보에 대응하는 노이즈 레벨 값을 이용하여 보상 신호를 상기 손실 영역에 채워넣음으로써, 상기 현재 프레임에 대한 보상된 스펙트럴 데이터를 생성하는 단계;상기 노이즈 오프셋 정보를 근거로 상기 현재 프레임에 대한 스케일 팩터를 수정함으로써, 보상된 스케일 팩터를 생성하는 단계를 포함하고,상기 스케일 팩터는 하나 이상의 스펙트럴 데이터에 대응하는 스펙트럴 밴드에 적용되는 것을 특징으로 하는 오디오 신호 처리 방법.
- 삭제
- 제 1 항에 있어서,노이즈 레벨의 참조 값을 나타내는 레벨 파일럿 값, 및 노이즈 옵셋의 참조 값을 나타내는 옵셋 파일럿 값을 추출하는 단계;상기 레벨 파일럿 값 및 상기 노이즈 레벨 정보를 더함으로써 상기 노이즈 레벨 값을 획득하는 단계; 및,상기 노이즈 옵셋 정보가 추출되면, 상기 옵셋 파일롯 값 및 상기 노이즈 옵셋 정보를 더함으로써 노이즈 옵셋 값을 획득하는 단계를 더 포함하고,상기 노이즈 필링은 상기 노이즈 레벨 값 및 상기 노이즈 옵셋 값을 이용하여 수행되는 것임을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,이전 프레임의 노이즈 레벨 값, 및 상기 현재 프레임의 노이즈 레벨 정보를 이용하여, 상기 현재 프레임의 노이즈 레벨 값을 획득하는 단계;상기 노이즈 옵셋 정보가 추출되면, 상기 이전 프레임의 노이즈 옵셋 값 및 상기 현재 프레임의 상기 노이즈 옵셋 정보를 이용하여, 상기 현재 프레임의 노이즈 옵셋 값을 획득하는 단계를 더 포함하고,상기 노이즈 필링은, 상기 노이즈 레벨 값 및 상기 노이즈 옵셋 값을 이용하여 수행되는 것임을 특징으로 하는 오디오 신호 처리 방법.
- 제 1 항에 있어서,상기 노이즈 레벨 정보 및 상기 노이즈 옵셋 정보는 허프만 코딩(Huffman Coding) 방식에 따라서 추출되는 것임을 특징으로 하는 오디오 신호 처리 방법.
- 복수의 프레임에 노이즈 필링이 사용되는지 여부를 지시하는 노이즈 필링 플래그 정보 및, 상기 복수의 프레임에 포함되는 현재 프레임이 주파수 도메인에서 코딩되었는지 아니면 시간 도메인에서 코딩되었는지를 나타내는 코딩 스킴 정보를 추출하는 멀티플렉서;상기 노이즈 필링 플래그 정보가 상기 노이즈 필링이 상기 복수의 프레임에 사용되었음을 지시하고 상기 코딩 정보가 상기 현재 프레임이 상기 주파수 도메인에서 코딩되었음을 지시하는 경우, 현재 프레임에 대한 노이즈 레벨 정보 및 현재 프레임에 대한 노이즈 옵셋 정보를 추출하는 노이즈 정보 디코딩 파트; 및,상기 노이즈 레벨 정보 및 상기 노이즈 옵셋 정보를 근거로 현재 프레임에 대해 노이즈 필링을 수행하는 손실 보상 파트를 포함하되,상기 노이즈 필링은, 상기 현재 프레임의 스펙트럴 데이터를 이용하여 현재 프레임에 대한 손실 영역을 결정하고, 상기 노이즈 레벨 정보에 대응하는 노이즈 레벨 값을 이용하여 보상 신호를 상기 손실 영역에 채워넣음으로써, 상기 현재 프레임에 대한 보상된 스펙트럴 데이터를 생성하고, 상기 노이즈 오프셋 정보를 근거로 상기 현재 프레임에 대한 스케일 팩터를 수정함으로써, 보상된 스케일 팩터를 생성하고,상기 스케일 팩터는 하나 이상의 스펙트럴 데이터에 대응하는 스펙트럴 밴드에 적용되는 것을 특징으로 하는 오디오 신호 처리 장치.
- 삭제
- 제 6 항에 있어서,노이즈 레벨의 참조 값을 나타내는 레벨 파일럿 값, 및 노이즈 옵셋의 참조 값을 나타내는 옵셋 파일럿 값을 추출하고,상기 레벨 파일럿 값 및 상기 노이즈 레벨 정보를 더함으로써 상기 노이즈 레벨 값을 획득하고,상기 노이즈 옵셋 정보가 추출되면, 상기 옵셋 파일롯 값 및 상기 노이즈 옵셋 정보를 더함으로써 노이즈 옵셋 값을 획득하는 데이터 디코딩 파트를 더 포함하고,상기 노이즈 필링은 상기 노이즈 레벨 값 및 상기 노이즈 옵셋 값을 이용하여 수행되는 것임을 특징으로 하는 오디오 신호 처리 장치.
- 제 6 항에 있어서,이전 프레임의 노이즈 레벨 값, 및 상기 현재 프레임의 노이즈 레벨 정보를 이용하여, 상기 현재 프레임의 노이즈 레벨 값을 획득하고,상기 노이즈 옵셋 정보가 추출되면, 상기 이전 프레임의 노이즈 옵셋 값 및 상기 현재 프레임의 상기 노이즈 옵셋 정보를 이용하여, 상기 현재 프레임의 노이즈 옵셋 값을 획득하는 데이터 디코딩 파트를 더 포함하고,상기 노이즈 필링은, 상기 노이즈 레벨 값 및 상기 노이즈 옵셋 값을 이용하여 수행되는 것임을 특징으로 하는 오디오 신호 처리 장치.
- 제 6 항에 있어서,상기 노이즈 레벨 정보 및 상기 노이즈 옵셋 정보는 허프만 코딩(Huffman Coding) 방식에 따라서 추출되는 것임을 특징으로 하는 오디오 신호 처리 장치.
- 스펙트럴 데이터 및 스케일 팩터를 양자화된 신호로서 수신하는 단계;상기 양자화된 신호를 근거로 노이즈 레벨 값 및 노이즈 옵셋 값을 생성하는 단계;노이즈 필링이 복수의 프레임에 사용되는지 여부를 지시하는 노이즈 필링 플래그 정보를 생성하는 단계;상기 복수의 프레임에 포함된 현재 프레임이 주파수 도메인에서 코딩되었는지 아니면 시간 도메인에서 코딩되었는지를 지시하는 코딩 스킴 정보를 생성하는 단계;상기 복수의 프레임에 노이즈 필링이 사용되는 것을 상기 노이즈 필링 플래그 정보가 지시하고 상기 코딩 스킴 정보가 상기 현재 프레임이 상기 주파수 도메인에서 코딩되었는지를 지시하는 경우, 상기 노이즈 레벨 값에 대응하는 상기 현재 프레임의 노이즈 레벨 정보를 및 상기 노이즈 옵셋 값에 대응하는 노이즈 옵셋 정보를 비트스트림에 삽입하는 단계를 포함하고,상기 스케일 팩터는 하나 이상의 스펙트럴 데이터에 대응하는 스펙트럴 밴드에 적용되는 것을 특징으로 하는 오디오 신호 처리 방법.
- 스펙트럴 데이터 및 스케일 팩터를 양자화된 신호로서 수신하고, 양자화된 신호를 근거로 노이즈 레벨 값 및 노이즈 옵셋 값을 생성하고, 노이즈 필링이 복수의 프레임에 사용되는지 여부를 지시하는 노이즈 필링 플래그 정보를 생성하는 손실 보상 추정 파트;상기 복수의 프레임에 포함된 현재 프레임이 주파수 도메인에서 코딩되었는지 아니면 시간 도메인에서 코딩되었는지를 지시하는 코딩 스킴 정보를 생성하는 신호 분류부;상기 복수의 프레임에 노이즈 필링이 사용되는 것을 상기 노이즈 필링 플래그 정보가 지시하고 상기 코딩 스킴 정보가 상기 현재 프레임이 상기 주파수 도메인에서 코딩되었는지를 지시하는 경우, 상기 노이즈 레벨 값에 대응하는 상기 현재 프레임의 노이즈 레벨 정보 및, 상기 노이즈 옵셋 값에 대응하는 노이즈 옵셋 정보를 비트스트림에 삽입하는 노이즈 정보 인코딩 파트를 포함하고,상기 스케일 팩터는 하나 이상의 스펙트럴 데이터에 대응하는 스펙트럴 밴드에 적용되는 것을 특징으로 하는 오디오 신호 처리 장치.
- 노이즈 필링이 복수의 프레임에 사용되는지 여부를 지시하는 노이즈 필링 플래그 정보를 추출하는 단계;상기 복수의 프레임에 포함되는 현재 프레임이 주파수 도메인에서 코딩되었는지 아니면 시간 도메인에서 코딩되었는지를 나타내는 코딩 스킴 정보를 추출하는 단계;상기 노이즈 필링 플래그 정보가 상기 노이즈 필링이 상기 복수의 프레임에 사용되었음을 지시하고 상기 코딩 정보가 상기 현재 프레임이 상기 주파수 도메인에서 코딩되었음을 지시하는 경우, 현재 프레임에 대한 노이즈 레벨 정보 및, 현재 프레임에 대한 노이즈 옵셋 정보를 추출하는 단계; 및,상기 노이즈 레벨 정보 및 상기 노이즈 옵셋 정보를 근거로 현재 프레임에 대해 노이즈 필링을 수행하는 단계, 상기 노이즈 필링은,상기 현재 프레임의 스펙트럴 데이터를 이용하여 현재 프레임에 대한 손실 영역을 결정하는 단계;상기 노이즈 레벨 정보에 대응하는 노이즈 레벨 값을 이용하여 보상 신호를 상기 손실 영역에 채워넣음으로써, 상기 현재 프레임에 대한 보상된 스펙트럴 데이터를 생성하는 단계;상기 노이즈 오프셋 정보를 근거로 상기 현재 프레임에 대한 스케일 팩터를 수정함으로써, 보상된 스케일 팩터를 생성하는 단계를 포함하고,상기 스케일 팩터는 하나 이상의 스펙트럴 데이터에 대응하는 스펙트럴 밴드에 적용되는 동작들을, 프로세서에 의해 실행될 때, 상기 프로세서가 수행하도록 하는 명령이 저장되어 있는 컴퓨터로 읽을 수 있는 저장 매체.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/612,345 US8364471B2 (en) | 2008-11-04 | 2009-11-04 | Apparatus and method for processing a time domain audio signal with a noise filling flag |
EP09013869A EP2182513B1 (en) | 2008-11-04 | 2009-11-04 | An apparatus for processing an audio signal and method thereof |
PCT/KR2009/006448 WO2010053287A2 (en) | 2008-11-04 | 2009-11-04 | An apparatus for processing an audio signal and method thereof |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11132308P | 2008-11-04 | 2008-11-04 | |
US61/111,323 | 2008-11-04 | ||
US11447808P | 2008-11-14 | 2008-11-14 | |
US61/114,478 | 2008-11-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100050414A KR20100050414A (ko) | 2010-05-13 |
KR101259120B1 true KR101259120B1 (ko) | 2013-04-26 |
Family
ID=42276540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090105389A Active KR101259120B1 (ko) | 2008-11-04 | 2009-11-03 | 오디오 신호 처리 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101259120B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030009325A1 (en) * | 1998-01-22 | 2003-01-09 | Raif Kirchherr | Method for signal controlled switching between different audio coding schemes |
US6766293B1 (en) * | 1997-07-14 | 2004-07-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method for signalling a noise substitution during audio signal coding |
-
2009
- 2009-11-03 KR KR1020090105389A patent/KR101259120B1/ko active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6766293B1 (en) * | 1997-07-14 | 2004-07-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method for signalling a noise substitution during audio signal coding |
US20030009325A1 (en) * | 1998-01-22 | 2003-01-09 | Raif Kirchherr | Method for signal controlled switching between different audio coding schemes |
Also Published As
Publication number | Publication date |
---|---|
KR20100050414A (ko) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2182513B1 (en) | An apparatus for processing an audio signal and method thereof | |
KR101162275B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP5219800B2 (ja) | コード化されたオーディオの経済的な音量計測 | |
KR101139880B1 (ko) | 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을 위한 시간적 엔벨로프 정형화 | |
JP5267362B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 | |
JP6704037B2 (ja) | 音声符号化装置および方法 | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
US9117458B2 (en) | Apparatus for processing an audio signal and method thereof | |
KR101397058B1 (ko) | 신호 처리 방법 및 이의 장치 | |
JP2019506633A (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
KR20200027008A (ko) | 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치 | |
KR101259120B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
HK40072591A (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
KR20100114484A (ko) | 오디오 신호 처리 방법 및 장치 | |
HK40068027B (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
HK40068027A (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
AU2012205170B2 (en) | Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering | |
HK1099838A (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
HK1099838B (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
HK1245492A1 (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
KR20100054749A (ko) | 신호의 처리 방법 및 이의 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20091103 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20110416 Patent event code: PE09021S01D |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20111230 Patent event code: PE09021S01D |
|
E90F | Notification of reason for final refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Final Notice of Reason for Refusal Patent event date: 20120825 Patent event code: PE09021S02D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20130221 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20130422 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20130423 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20160324 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20160324 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170314 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20170314 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180314 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20180314 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190314 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20190314 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20250310 Start annual number: 13 End annual number: 13 |