KR101701081B1 - 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 - Google Patents
제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 Download PDFInfo
- Publication number
- KR101701081B1 KR101701081B1 KR1020157020596A KR20157020596A KR101701081B1 KR 101701081 B1 KR101701081 B1 KR 101701081B1 KR 1020157020596 A KR1020157020596 A KR 1020157020596A KR 20157020596 A KR20157020596 A KR 20157020596A KR 101701081 B1 KR101701081 B1 KR 101701081B1
- Authority
- KR
- South Korea
- Prior art keywords
- audio signal
- estimated
- adaptive codebook
- encoding
- weighted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
도 1은 제 1 인코딩 알고리즘과 제 2 인코딩 알고리즘 중 하나를 선택하기 위한 장치의 일 실시예의 개략도를 나타낸 것이다.
도 2는 오디오 신호를 인코딩하기 위한 장치의 일 실시예의 개략도를 나타낸 것이다.
도 3은 제 1 인코딩 알고리즘과 제 2 인코딩 알고리즘 중 하나를 선택하기 위한 장치의 일 실시예의 개략도를 나타낸 것이다.
도 4(a) 및 4(b)는 SNR 및 분절 SNR에 대한 가능한 표현들을 나타낸 것이다.
다음의 설명에서, 각종 도면들에서의 유사한 요소들/단계들은 동일한 참조 부호들에 의해 지칭된다. 도면들에서 본 발명을 이해하는데 필요하지 않은, 신호 연결들 등과 같은 특징들은 생략되었음에 유의해야한다.
Claims (37)
- 오디오 신호(40)의 일부분의 인코딩된 버전을 획득하기 위하여, 상기 오디오 신호(40)의 일부분을 인코딩하기 위한 제 1 특성을 갖는 제 1 인코딩 알고리즘 및 제 2 특성을 갖는 제 2 인코딩 알고리즘 중의 하나를 선택하는 장치(10)로서,
상기 제 1 인코딩 알고리즘을 사용하여 상기 오디오 신호의 일부분을 실제로 인코딩 및 디코딩하지 않고도, 상기 오디오 신호의 일부분에 대한 제 1 품질 측정값을 추정하는 제 1 추정기(12) - 상기 제 1 품질 측정값은 상기 제 1 인코딩 알고리즘과 연관됨 - 와,
상기 제 2 인코딩 알고리즘을 사용하여 상기 오디오 신호의 일부분을 실제로 인코딩 및 디코딩하는 것 없이도, 상기 오디오 신호의 일부분에 대한 제 2 품질 측정값을 추정하는 제 2 추정기(14) - 상기 제 2 품질 측정값은 상기 제 2 인코딩 알고리즘과 연관됨 - 와,
상기 제 1 품질 측정값과 상기 제 2 품질 측정값 간의 비교에 기초하여, 상기 제 1 인코딩 알고리즘 또는 상기 제 2 인코딩 알고리즘을 선택하는 제어기(16)를 포함하고,
상기 제 1 품질 측정값과 제 2 품질 측정값은 상기 오디오 신호를 가중 처리한 버전의 대응 부분에 대한 SNR(signal to noise ratio) 또는 분절(segmental) SNR인
장치.
- 제 1 항에 있어서,
상기 제 1 인코딩 알고리즘은 변환 코딩 알고리즘(transform coding algorithm), MDCT(modified discrete cosine transform) 기반 코딩 알고리즘 또는 TCX(transform coding excitation) 코딩 알고리즘이며,
상기 제 2 인코딩 알고리즘은 CELP(code excited linear prediction) 코딩 알고리즘 또는 ACELP(algebraic code excited linear prediction) 코딩 알고리즘인
장치.
- 제 1 항에 있어서,
상기 제 1 추정기(12)는 상기 오디오 신호의 일부분을 양자화할 경우에 상기 제 1 인코딩 알고리즘에서 사용되는 양자화기(quantizer)가 도입하게 되는 추정된 양자화 왜곡(quantizer distortion)을 결정하고, 상기 오디오 신호를 가중 처리한 버전의 일부분의 에너지 및 상기 추정된 양자화 왜곡에 기초하여 상기 제 1 품질 측정값을 추정하도록 구성되는
장치.
- 제 3 항에 있어서,
상기 제 1 추정기(12)는, 상기 제 1 인코딩 알고리즘에서 사용되는 양자화기 및 엔트로피 코더(entropy coder)로 인코딩되는 경우에 상기 오디오 신호의 일부분이 소정 타겟 비트레이트(target bitrate)를 생성하도록 하는, 상기 오디오 신호의 일부분에 대한 글로벌 이득(global gain)을 추정하도록 구성되고,
상기 제 1 추정기(12)는, 상기 추정된 글로벌 이득의 거듭제곱(power)에 기초하여, 상기 추정된 양자화 왜곡을 결정하도록 더 구성되며,
상기 제 1 인코딩 알고리즘에서 사용되는 양자화기는 균일 스칼라 양자화기(uniform scalar quantizer)이고,
상기 제 1 추정기(12)는, 식 D = G*G/12를 사용하여 상기 추정된 양자화 왜곡을 결정하도록 구성되며, 여기서 D는 상기 추정된 양자화 왜곡이고 G는 상기 추정된 글로벌 이득인
장치.
- 제 3 항에 있어서,
상기 제 1 품질 측정값은 가중 처리된 오디오 신호의 일부분의 분절 SNR이며,
상기 제 1 추정기(12)는, 상기 가중 처리된 오디오 신호의 일부분을 이루는 복수의 서브-부분들의 각각과 관련된 추정된 SNR을 상기 가중 처리된 오디오 신호의 대응하는 서브-부분들의 에너지 및 상기 추정된 양자화 왜곡에 기초하여 계산하고 또한 상기 가중 처리된 오디오 신호의 일부분의 서브-부분들과 관련된 SNR들의 평균을 계산함으로써, 상기 분절 SNR을 추정하여 상기 가중 처리된 오디오 신호의 일부분에 대한 상기 추정된 분절 SNR을 획득하도록 구성되는
장치.
- 제 1 항에 있어서,
상기 제 2 추정기(14)는, 상기 오디오 신호의 일부분을 인코딩하기 위하여 적응 코드북을 사용할 경우에 상기 제 2 인코딩 알고리즘에서 사용되는 상기 적응 코드북이 도입하게 되는 추정된 적응 코드북(adaptive codebook) 왜곡을 결정하도록 구성되고,
상기 제 2 추정기(14)는, 상기 오디오 신호를 가중 처리한 버전의 일부분의 에너지 및 상기 추정된 적응 코드북 왜곡에 기초하여, 상기 제 2 품질 측정값을 추정하도록 구성되며,
상기 오디오 신호의 일부분을 이루는 복수의 서브-부분들의 각각에 대하여, 상기 제 2 추정기(14)는, 사전-처리 스테이지(pre-processing stage)에서 결정된 피치-래그(pitch-lag)만큼 이전으로 시프트되는 상기 가중 처리된 오디오 신호의 서브-부분의 버전에 기초하여 상기 적응 코드북을 근사화하고, 상기 가중 처리된 오디오 신호의 일부분의 서브-부분과 상기 근사화된 적응 코드북 간의 오차가 최소로 되도록 하는 적응 코드북 이득을 추정하고, 상기 가중 처리된 오디오 신호의 일부분의 서브-부분과 상기 적응 코드북 이득에 의해 스케일링(scaling)된 상기 근사화된 적응 코드북 간의 오차의 에너지에 기초하여 상기 추정된 적응 코드북 왜곡을 결정하도록 구성되는
장치.
- 제 6 항에 있어서,
상기 제 2 추정기(14)는, 상수 계수(constant factor)만큼 오디오 신호의 일부분의 각각의 서브-부분에 대해 결정된 상기 추정된 적응 코드북 왜곡을 감소시키도록 더 구성되는
장치.
- 제 6 항에 있어서,
상기 제 2 품질 측정값은 상기 가중 처리된 오디오 신호의 일부분의 분절 SNR이며,
상기 제 2 추정기(14)는, 상기 가중 처리된 오디오 신호의 일부분을 이루는 복수의 서브-부분들의 각각과 관련된 추정된 SNR을 상기 가중 처리된 오디오 신호의 대응하는 서브-부분의 에너지 및 상기 추정된 적응 코드북 왜곡에 기초하여 계산하고 또한 상기 서브-부분들과 관련된 SNR들의 평균을 계산함으로써, 상기 분절 SNR을 추정하여 상기 가중 처리된 오디오 신호의 일부분에 대한 상기 추정된 분절 SNR을 획득하도록 구성되는
장치.
- 제 6 항에 있어서,
상기 제 2 추정기(14)는, 사전처리 스테이지에서 결정된 피치-래그만큼 이전으로 시프트되는 상기 가중 처리된 오디오 신호의 일부분의 버전에 기초하여 상기 적응 코드북을 근사화하고, 상기 가중 처리된 오디오 신호의 일부분과 상기 근사화된 적응 코드북 간의 오차가 최소로 되도록 하는 적응 코드북 이득을 추정하고, 또한 상기 가중 처리된 오디오 신호의 일부분과 상기 적응 코드북 이득에 의해 스케일링된 상기 근사화된 적응 코드북 간의 오차의 에너지에 기초하여 상기 추정된 적응 코드북 왜곡을 결정하도록 구성되는
장치.
- 제 1 항에 있어서,
상기 제어기(16)는, 상기 추정된 품질 측정값들을 비교할 시에 히스테리시스(hysteresis)를 이용하도록 구성되는
장치.
- 오디오 신호의 일부분을 인코딩하는 인코딩 장치(20)로서,
제 1 항에 기재된 장치(10)와, 상기 제 1 인코딩 알고리즘을 수행하는 제 1 인코더 스테이지(encoder stage)(26)와, 상기 제 2 인코딩 알고리즘을 수행하는 제 2 인코더 스테이지(28)를 포함하며,
상기 인코딩 장치는 상기 제어기(16)에 의한 선택에 따라, 상기 제 1 인코딩 알고리즘 또는 상기 제 2 인코딩 알고리즘을 사용하여, 상기 오디오 신호의 일부분을 인코딩하도록 구성되는
인코딩 장치.
- 인코딩 및 디코딩하는 시스템으로서,
제 11 항에 기재된 인코딩 장치(20)와,
상기 오디오 신호의 일부분의 인코딩된 버전 및 상기 오디오 신호의 일부분을 인코딩하는데 사용된 알고리즘의 표시를 수신하고 또한 상기 표시된 알고리즘을 사용하여 상기 오디오 신호의 일부분의 인코딩된 버전을 디코딩하도록 구성되는 디코더를 포함하는
인코딩 및 디코딩 시스템.
- 오디오 신호의 일부분의 인코딩된 버전을 획득하기 위하여, 상기 오디오 신호의 일부분을 인코딩하기 위한 제 1 특성을 갖는 제 1 인코딩 알고리즘 및 제 2 특성을 갖는 제 2 인코딩 알고리즘 중의 하나를 선택하는 방법으로서,
상기 제 1 인코딩 알고리즘을 사용하여 상기 오디오 신호의 일부분을 실제로 인코딩 및 디코딩하지 않고도, 상기 오디오 신호의 일부분에 대한 제 1 품질 측정값을 추정하는 단계 - 상기 제 1 품질 측정값은 상기 제 1 인코딩 알고리즘과 연관됨 - 와,
상기 제 2 인코딩 알고리즘을 사용하여 상기 오디오 신호의 일부분을 실제로 인코딩 및 디코딩하지 않고도, 상기 오디오 신호의 일부분에 대한 제 2 품질 측정값을 추정하는 단계 - 상기 제 2 품질 측정값은 상기 제 2 인코딩 알고리즘과 연관됨 - 와,
상기 제 1 품질 측정값과 상기 제 2 품질 측정값 간의 비교에 기초하여, 상기 제 1 인코딩 알고리즘 또는 상기 제 2 인코딩 알고리즘을 선택하는 단계를 포함하고,
상기 제 1 및 제 2 품질 측정값들은, 상기 오디오 신호를 가중 처리한 버전의 대응 부분에 대한 SNR(signal to noise ratio) 또는 분절 SNR인
방법.
- 제 13 항에 있어서,
상기 제 1 인코딩 알고리즘은 변환 코딩 알고리즘(transform coding algorithm), MDCT(modified discrete cosine transform) 기반 코딩 알고리즘 또는 TCX(transform coding excitation) 코딩 알고리즘이며,
상기 제 2 인코딩 알고리즘은 CELP(code excited linear prediction) 코딩 알고리즘 또는 ACELP(algebraic code excited linear prediction) 코딩 알고리즘인
방법.
- 제 13 항에 있어서,
상기 오디오 신호의 일부분을 양자화할 경우에 상기 제 1 인코딩 알고리즘에서 사용되는 양자화기가 도입하게 되는 추정된 양자화 왜곡을 결정하는 단계(108)와, 상기 오디오 신호를 가중 처리한 버전의 부분의 에너지 및 상기 추정된 양자화 왜곡에 기초하여 상기 품질 측정값을 결정하는 단계를 포함하는
방법.
- 제 15 항에 있어서,
상기 제 1 인코딩 알고리즘에서 사용되는 양자화기 및 엔트로피 코더로 인코딩되는 경우에 상기 오디오 신호의 일부분이 소정 타겟 비트레이트를 생성하도록 하는 상기 오디오 신호의 일부분에 대한 글로벌 이득을 추정하는 단계(106)와, 상기 추정된 글로벌 이득의 거듭제곱에 기초하여 상기 추정된 양자화 왜곡을 결정하는 단계(108)를 포함하고,
상기 양자화기는 균일 스칼라 양자화기이고, 상기 추정된 양자화 왜곡은 식 D = G*G/12를 사용하여 결정되며, 여기서 D는 상기 추정된 양자화 왜곡이고 G는 상기 추정된 글로벌 이득인
방법.
- 제 15 항에 있어서,
상기 제 1 품질 측정값은 가중 처리된 오디오 신호의 일부분의 LPC 필터링된 버전의 분절 SNR이며,
상기 방법은, 상기 가중 처리된 오디오 신호의 대응 서브-부분들의 에너지 및 상기 추정된 양자화 왜곡에 기초하여, 상기 가중 처리된 오디오 신호의 일부분을 이루는 복수의 서브-부분들의 각각과 관련된 추정된 SNR을 계산하고 또한 상기 가중 처리된 오디오 신호의 일부분의 서브-부분들과 관련된 SNR의 평균을 계산함으로써 상기 제 1 분절 SNR을 추정하여 상기 가중 처리된 오디오 신호의 일부분에 대한 상기 추정된 분절 SNR을 획득하는 단계를 포함하는
방법.
- 제 13 항에 있어서,
상기 오디오 신호의 일부분을 인코딩하기 위하여 적응 코드북을 사용할 경우에 상기 제 2 인코딩 알고리즘에서 사용되는 상기 적응 코드북이 도입하게 되는 추정된 적응 코드북 왜곡을 결정하는 단계(116)와, 상기 오디오 신호의 가중 처리한 버전의 일부분의 에너지 및 상기 추정된 적응 코드북 왜곡에 기초하여 상기 제 2 품질 측정값을 추정하는 단계와,
상기 오디오 신호의 일부분을 이루는 복수의 서브-부분들의 각각에 대하여,
사전-처리 스테이지에서 결정된 피치-래그만큼 이전으로 시프트되는 상기 가중 처리된 오디오 신호의 서브-부분의 버전에 기초하여 상기 적응 코드북을 근사화하는 단계(112)와, 상기 가중 처리된 오디오 신호의 일부분의 서브-부분과 상기 근사화된 적응 코드북 간의 오차가 최소로 되도록 하는 적응 코드북 이득을 추정하는 단계(114)와, 상기 가중 처리된 오디오 신호의 일부분의 서브-부분과 상기 적응 코드북 이득에 의해 스케일링된 상기 근사화된 적응 코드북 간의 오차의 에너지에 기초하여 상기 추정된 적응 코드북 왜곡을 결정하는 단계(116)를 포함하는
방법.
- 제 18 항에 있어서,
상수 계수만큼 오디오 신호의 일부분의 각각의 서브-부분에 대해 결정된 상기 추정된 적응 코드북 왜곡을 감소시키는 단계(118)를 포함하는
방법.
- 제 18 항에 있어서,
상기 제 2 품질 측정값은 상기 가중 처리된 오디오 신호의 일부분의 분절 SNR이며,
상기 방법은, 상기 가중 처리된 오디오 신호의 대응 서브-부분들의 에너지 및 상기 추정된 적응 코드북 왜곡에 기초하여 각각의 서브-부분과 관련된 추정된 SNR을 계산하고 또한 상기 서브-부분들과 관련된 SNR의 평균을 계산함으로써 상기 분절 SNR을 추정하여 상기 가중 처리된 오디오 신호의 일부분에 대한 상기 추정된 분절 SNR을 획득하는 단계를 포함하는
방법.
- 제 18 항에 있어서,
사전처리 스테이지에서 결정된 피치-래그만큼 이전으로 시프트되는 상기 가중 처리된 오디오 신호의 일부분의 버전에 기초하여 상기 적응 코드북을 근사화하는 단계와, 상기 가중 처리된 오디오 신호의 일부분과 상기 근사화된 적응 코드북 간의 오차가 최소로 되도록 하는 적응 코드북 이득을 추정하는 단계와, 상기 가중 처리된 오디오 신호의 일부분과 상기 적응 코드북 이득에 의해 스케일링된 상기 근사화된 적응 코드북 간의 오차의 에너지에 기초하여 상기 추정된 적응 코드북 왜곡을 결정하는 단계를 포함하는
방법.
- 제 13 항 내지 제 21 항 중 어느 한 항에 있어서,
상기 추정된 품질 측정값들을 비교할 시에 히스테리시스를 이용하는 단계를 포함하는
방법.
- 컴퓨터 상에서 실행될 경우, 제 13 항 내지 제 21 항 중 어느 한 항에 기재된 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램을 포함하는 컴퓨터 판독가능 저장 매체.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361758100P | 2013-01-29 | 2013-01-29 | |
US61/758,100 | 2013-01-29 | ||
PCT/EP2014/051557 WO2014118136A1 (en) | 2013-01-29 | 2014-01-28 | Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150108848A KR20150108848A (ko) | 2015-09-30 |
KR101701081B1 true KR101701081B1 (ko) | 2017-01-31 |
Family
ID=50033499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157020596A Active KR101701081B1 (ko) | 2013-01-29 | 2014-01-28 | 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 |
Country Status (18)
Country | Link |
---|---|
US (4) | US20150332698A1 (ko) |
EP (1) | EP2951820B1 (ko) |
JP (1) | JP6148810B2 (ko) |
KR (1) | KR101701081B1 (ko) |
CN (2) | CN105229736B (ko) |
AR (1) | AR094676A1 (ko) |
AU (1) | AU2014211583B2 (ko) |
BR (1) | BR112015018021B1 (ko) |
CA (1) | CA2899013C (ko) |
ES (1) | ES2616434T3 (ko) |
MX (1) | MX347410B (ko) |
MY (1) | MY189267A (ko) |
PL (1) | PL2951820T3 (ko) |
PT (1) | PT2951820T (ko) |
RU (1) | RU2618848C2 (ko) |
SG (1) | SG11201505947XA (ko) |
TW (1) | TWI549120B (ko) |
WO (1) | WO2014118136A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101701081B1 (ko) * | 2013-01-29 | 2017-01-31 | 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. | 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
CN107452390B (zh) | 2014-04-29 | 2021-10-26 | 华为技术有限公司 | 音频编码方法及相关装置 |
SG11201509526SA (en) * | 2014-07-28 | 2017-04-27 | Fraunhofer Ges Forschung | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
JP2016218345A (ja) * | 2015-05-25 | 2016-12-22 | ヤマハ株式会社 | 音素材処理装置および音素材処理プログラム |
WO2017050398A1 (en) * | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
US10225730B2 (en) * | 2016-06-24 | 2019-03-05 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio sensor selection in an audience measurement device |
JP7387634B2 (ja) * | 2018-04-11 | 2023-11-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 機械学習に基づく音声符号化及び復号のための知覚に基づく損失関数 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050267742A1 (en) | 2004-05-17 | 2005-12-01 | Nokia Corporation | Audio encoding with different coding frame lengths |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004513557A (ja) * | 2000-11-03 | 2004-04-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のパラメトリック符号化方法及び装置 |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
DE10124420C1 (de) * | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
US7739120B2 (en) | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
JP5154934B2 (ja) * | 2004-09-17 | 2013-02-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 知覚的歪みを最小化する結合オーディオ符号化 |
CN101053020A (zh) * | 2004-11-05 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 利用信号属性的有效音频编码 |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
EP1990799A1 (en) * | 2006-06-30 | 2008-11-12 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US7953595B2 (en) | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2146344B1 (en) | 2008-07-17 | 2016-07-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding/decoding scheme having a switchable bypass |
KR101649376B1 (ko) * | 2008-10-13 | 2016-08-31 | 한국전자통신연구원 | Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치 |
WO2011048118A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
JP5679470B2 (ja) * | 2010-09-10 | 2015-03-04 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 符号化装置及び符号化方法 |
KR101701081B1 (ko) * | 2013-01-29 | 2017-01-31 | 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. | 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 |
SG11201509526SA (en) * | 2014-07-28 | 2017-04-27 | Fraunhofer Ges Forschung | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
-
2014
- 2014-01-28 KR KR1020157020596A patent/KR101701081B1/ko active Active
- 2014-01-28 SG SG11201505947XA patent/SG11201505947XA/en unknown
- 2014-01-28 RU RU2015136467A patent/RU2618848C2/ru active
- 2014-01-28 JP JP2015554187A patent/JP6148810B2/ja active Active
- 2014-01-28 PL PL14702505T patent/PL2951820T3/pl unknown
- 2014-01-28 CN CN201480019093.0A patent/CN105229736B/zh active Active
- 2014-01-28 AU AU2014211583A patent/AU2014211583B2/en active Active
- 2014-01-28 CN CN201910556401.8A patent/CN110517700B/zh active Active
- 2014-01-28 MY MYPI2015001901A patent/MY189267A/en unknown
- 2014-01-28 BR BR112015018021-3A patent/BR112015018021B1/pt active IP Right Grant
- 2014-01-28 MX MX2015009745A patent/MX347410B/es active IP Right Grant
- 2014-01-28 CA CA2899013A patent/CA2899013C/en active Active
- 2014-01-28 ES ES14702505.0T patent/ES2616434T3/es active Active
- 2014-01-28 PT PT147025050T patent/PT2951820T/pt unknown
- 2014-01-28 WO PCT/EP2014/051557 patent/WO2014118136A1/en active Application Filing
- 2014-01-28 EP EP14702505.0A patent/EP2951820B1/en active Active
- 2014-01-29 TW TW103103528A patent/TWI549120B/zh active
- 2014-01-29 AR ARP140100292A patent/AR094676A1/es active IP Right Grant
-
2015
- 2015-07-29 US US14/812,138 patent/US20150332698A1/en not_active Abandoned
-
2018
- 2018-10-01 US US16/148,993 patent/US10622000B2/en active Active
-
2020
- 2020-03-31 US US16/836,857 patent/US11521631B2/en active Active
-
2022
- 2022-11-23 US US18/058,389 patent/US11908485B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050267742A1 (en) | 2004-05-17 | 2005-12-01 | Nokia Corporation | Audio encoding with different coding frame lengths |
WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101701081B1 (ko) | 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 | |
US10706865B2 (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
KR101525185B1 (ko) | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 | |
CA2910878C (en) | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction | |
HK1218461B (en) | Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm | |
HK1222943B (en) | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20150729 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20150729 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160526 Patent event code: PE09021S01D |
|
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20161031 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20170123 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20170123 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20191223 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210114 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220113 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20230112 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240115 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20250114 Start annual number: 9 End annual number: 9 |