KR20200100053A - 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 - Google Patents
최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 Download PDFInfo
- Publication number
- KR20200100053A KR20200100053A KR1020207016424A KR20207016424A KR20200100053A KR 20200100053 A KR20200100053 A KR 20200100053A KR 1020207016424 A KR1020207016424 A KR 1020207016424A KR 20207016424 A KR20207016424 A KR 20207016424A KR 20200100053 A KR20200100053 A KR 20200100053A
- Authority
- KR
- South Korea
- Prior art keywords
- bit
- significant
- bits
- spectral
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3066—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction by means of a mask or a bit-map
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
도 1은 본 발명의 일 실시 예에 따른 오디오 디코더의 개략적인 블록도를 도시한다;
도 2는 본 발명의 다른 실시 예에 따른 오디오 디코더의 개략적인 블록도를 도시한다;
도 3은 본 발명의 일 실시 예에 따른 오디오 인코더의 개략적인 블록도를 도시한다;
도 4는 본 발명의 일 실시 예에 따른 오디오 인코더의 개략적인 블록도를 도시한다;
도 5는 본 발명의 일 실시 예에 따른 오디오 인코더의 개략적인 블록도를 도시한다;
도 6은 본 발명의 실시 예에 따른 다른 오디오 인코더의 개략적인 블록도를 도시한다;
도 7은 본 발명의 다른 실시 예에 따른 오디오 디코더의 개략적인 블록도를 도시한다;
도 8은 본 발명의 실시 예에 따른 오디오 인코더의 기능의 흐름도를 도시한다;
도 9는 본 발명의 실시 예에 따른 오디오 디코더의 기능의 흐름도를 도시한다;
도 10a-10f는 본 발명의 일 실시 예에 따른, 오디오 인코더의 기능의 의사 프로그램 코드 표현을 도시한다;
도 11a-11d는 본 발명의 일 실시 예에 따른, 오디오 디코더의 기능의 의사 프로그램 코드 표현을 도시한다;
도 12는 종래의 오디오 인코더/디코더에 의해 생성된 신호 대 잡음 비의 그래프 표현을 도시한다;
도 13은 본 발명에 따른 오디오 인코더/디코더에 의해 제공되는 신호 대 잡음 비의 그래프 표현을 도시한다:
도 14-18은 본 발명의 실시 예에 따른, 오디오 인코딩 및 오디오 디코딩 방법의 흐름도를 도시한다.
Claims (72)
- 인코딩된 오디오 정보(110; 210; 710)에 기초하여 디코딩된 오디오 정보(112; 212; 712)를 제공하기 위한 오디오 디코더(100; 200; 700)에 있어서,
상기 오디오 디코더는 디코딩된 스펙트럼 값(132; 232; 732; Xq[n], Xq[n+1])을 상기 스펙트럼 값을 나타내는 인코딩된 정보(130; 230)에 기초하여 획득하도록 구성되며,
상기 오디오 디코더는 산술 디코딩을 사용하여 스펙트럼 값 세트에 대해 각각의 심볼 코드(sym)에 기초하여 스펙트럼 값 당 두 개 이상의 최상위 비트를 공동으로 디코딩(950; 1110a-1110g)하도록 구성되고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 나타내고,
상기 오디오 디코더는 이용 가능한 최소 비트 정보의 양에 따라 상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최소 비트를 디코딩(972; 1140a-1141j)하도록 구성되어, 상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는 반면, 하나 이상의 최상위 비트가 디코딩되고 상기 하나 이상의 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해 최하위 비트가 디코딩되지 않도록 하고,
상기 오디오 디코더는 상기 스펙트럼 값을 이용하여 상기 디코딩된 오디오 정보를 제공하도록 구성되는, 디코더. - 제1항에 있어서, 상기 오디오 디코더는 적어도 하나의 스펙트럼 값의 적어도 두 개의 최상위 비트를 나타내는, 산술적으로 인코딩된 표현의 하나의 심볼(sym)을, 상기 적어도 하나의 스펙트럼 값의 상기 적어도 두 개의 최상위 비트에 매핑(1110f, 1110g)하도록 구성되는, 디코더.
- 제1항 또는 제2항에 있어서, 상기 산술 디코딩은 적어도 상기 적어도 두 개의 최상위 비트의 비트 위치(numbits, numbits-1)를 결정하고(1110a, 1110e), 상기 산술적으로 인코딩된 표현의 심볼(sym)에 의해 결정된 상기 적어도 두 개의 최상위 비트를 상기 결정된 비트 위치에 할당(1110f, 1110g)하도록 구성되는, 디코더.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 오디오 디코더는 두 개 이상의 최상위 비트가 디코딩되고 상기 두 개 이상의 최상위 비트와 하나의 최하위 비트 보다 더 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 두 개 이상의 최상위 비트 사이에 있는 하나 이상의 중간 비트를 디코딩(954; 1120a-1120e)하도록 구성되는, 디코더.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 오디오 디코더는 제1 디코딩 단계에서,
스펙트럼 값(950; 1110a-1110g) 당 두 개 이상의 최상위 비트,
두 개 이상의 최상위 비트가 디코딩되고 상기 두 개 이상의 최상위 비트와 하나의 최하위 비트 보다 더 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 두 개 이상의 최상위 비트 사이에 있는, 하나 이상의 중간 비트(954; 1120a-1120e), 및
두 개 이상의 최상위 비트가 디코딩되고 상기 두 개 이상의 최상위 비트와 중간 비트가 - 중간 비트가 존재하는 한 - 넌제로 값을 나타내는 모든 스펙트럼 값에 대해, 부호(958; 1130a-1131d)
를 디코딩하도록 구성되고,
상기 오디오 디코더는 상기 제1 디코딩 단계에서, 상기 두 개 이상의 최상위 비트 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 스펙트럼 값에 대해 부호의 디코딩을 선택적으로 생략(1130a, 1131a)하도록 구성되고,
상기 오디오 디코더는 상기 제1 디코딩 단계 이후 제2 디코딩 단계에서, 상기 두 개 이상의 최상위 값 및 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내고 최하위 비트 정보가 넌제로 값을 나타내는 스펙트럼 값에 대해, 부호 정보를 선택적으로 취득(972; 1140h-1140j, 1141h-1141j)하도록 구성되는, 디코더. - 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 오디오 디코더는 상기 스펙트럼 값들과 관련된 최하위 비트 값을 획득하기 위해서 최하위 비트 정보 비트 시퀀스(lsbs[])의 후속 비트들을 순차적으로 사용(1140e, 1140i, 1141e, 1141i)하도록 구성되는, 디코더.
- 제6항에 있어서, 상기 오디오 디코더는 상기 두 개 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 넌제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 사용(1140e, 1141e)하도록 구성되고, 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 단일 비트는 최하위 비트 값을 취득하기 위해 사용되고(1140f, 1140g, 1141f, 1141g);
상기 오디오 디코더는 상기 두 개 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 각각의 스펙트럼 값들에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 사용(1140e, 1141e)하도록 구성되고 - 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 단일 비트가 상기 제로 값을 확인함 - ;
상기 오디오 디코더는 상기 두 개의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 두 후속 비트를 사용(1140e, 1140i, 1141e, 1141i)하도록 구성되고, 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 두 비트 중 제1 비트는 상기 제로 값에서 최하위 비트 값 만큼의 편차를 나타내고, 상기 최하위 비트 정보 비트 시퀀스의 사용된 두 비트 중 제2 비트는 상기 각각의 스펙트럼 값의 부호를 결정(1140j, 1141j)하는, 디코더. - 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 오디오 디코더는 최저 주파수 스펙트럼 값과 연관된 최하위 비트로부터 시작하여 점점 더 높은 주파수와 연관된 스펙트럼 값으로 진행하면서 최하위 비트들을 디코딩(972; 1140a-1141j)하도록 구성되어,
스펙트럼 값이 최저 주파수 스펙트럼 값에서 마지막 최하위 비트 정보가 이용 가능한 스펙트럼 값까지의 범위에서 최하위 비트 정보에 의해 개선되고, 상기 마지막 최하위 비트 정보가 이용 가능한 상기 스펙트럼 값과 연관된 주파수 보다 더 높은 관련 주파수를 갖는 스펙트럼 값은 개선되지 않고 유지되는, 디코더. - 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 오디오 디코더는,
상기 인코더로부터의 시그널링에 응답하여 고 주파수 범위의 스펙트럼 값의 디코딩이 생략되고 하나 또는 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 더 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 디코딩(934)되는 제1 모드(930, 934, 938, 942, 944, 948), 및
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩(972)되는 반면, 하나 이상의 최상위 비트가 디코드되고 상기 최상위 비트 보다 더 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 디코딩되지 않는 제1 모드 (950, 954, 958, 962, 968, 972)
사이에서 전환 가능하게 구성되는, 디코더. - 제9항에 있어서, 상기 오디오 디코더는 상기 오디오 디코더가 상기 제1 모드 또는 상기 제2 모드에서 동작하는지를 결정하기 위해 상기 인코딩된 오디오 정보에 포함된 비트스트림 플래그를 평가하도록 구성되는, 디코더.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 오디오 디코더는 각각의 심볼 코드에 기초하여 적어도 두 개의 스펙트럼 값(Xq[n], Xq[n+1]에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 공동으로 디코딩(950; 1110a-1110g)하도록 구성되고,
각각의 심벌 코드는 적어도 두 개의 스펙트럼 값에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 나타내는, 디코더. - 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 오디오 디코더는 다음 알고리즘에 따라 스펙트럼 값을 디코딩하도록 구성되는, 디코더:
다음에 따라, 두 계수 및 의 두 개의 최상위 비트를 디코드한다:
numbits = 1;
do {
컨텍스트 c로부터 확률 p를 구함
산술 디코딩과 확률 p로 심볼 sym을 디코딩함
컨텍스트 c룰 갱신함
numbits++;
} while (sym==VAL_ESC)
Xq[n] = (sym & 3) << (numbits-2);
Xq[n+1] = (sym >> 2) << (numbits-2);
다음에 따라, 남은 비트가 있다면, 상기 최하위 비트를 제외하고 남은 비트를 디코딩한다:
for (b = 1; b < numbits-2; b++) {
Decode bit0
Xq[n] += bit0 << b
Decode bit1
Xq[n+1] += bit1 << b
}
다음에 따라, 상기 최상위 비트가 제로이고 상기 남은 비트가 제로인 경우를 제외하고, 각 계수의 부호를 디코딩한다:
if (Xq[n] != 0 ) {
Decode bit0
if (bit0 == 1) {
Xq[n] = -Xq[n];
}
}
if (Xq[n+1] != 0) {
Decode bit1
if (bit1 == 1) {
Xq[n+1] = -Xq[n+1];
}
}
모든 계수 n >= lastnz를 제로로 설정하고, 여기에서 lastnz는 상기 인코딩된 오디오 표현으로부터 취득된 부가 정보에 기초하여 취득된다;
상기 산술 디코딩을 완결하고 미사용 비트의 수를 계산한다;
미사용 비트가 있으면, nlsbs 비트를 디코딩하고 이를 데이터 구조 lsbs[]에 저장하고; 다음에 따라, 상기 디코딩된 LSB 비트를 이용하여 numbits[n]>2 인 경우 계수((Xq(n),Xq(n+1))를 개선한다:
k = 0;
for (n = 0; n < lastnz; n+=2) {
if (numbits[n] > 2) {
if (k == nlsbs) {
break;
}
bit0 = lsbs[k++];
if (bit0 == 1) {
if (Xq[n] > 0) {
Xq[n] += 1;
} else if (Xq[n] < 0) {
Xq[n] -= 1;
} else {
if (k == nlsbs) {
break;
}
bit1 = lsbs[k++];
Xq[n] = 1 - 2*bit1;
}
}
if (k == nlsbs) {
break;
}
bit0 = lsbs[k++];
if (bit0 == 1) {
if (Xq[n+1] > 0) {
Xq[n+1] += 1;
} else if (Xq[n+1] < 0) {
Xq[n+1] -= 1;
} else {
if (k == nlsbs) {
break;
}
bit1 = lsbs[k++];
Xq[n+1] = 1 - 2*bit1;
}
}
}
} - 인코딩된 오디오 정보(110; 210; 710)에 기초하여 디코딩된 오디오 정보(112; 212; 712)를 제공하기 위한 오디오 디코더(100; 200; 700)에 있어서,
상기 오디오 디코더는 상기 스펙트럼 값을 나타내는 인코딩된 정보(130; 230)에 기초하여 디코딩된 스펙트럼 값(132; 232; 732; Xq[n], Xq[n+1]을 획득하도록 구성되며,
상기 오디오 디코더는 복수의 스펙터럼 값(Xq[0] ... Xq[lastnz-1])에 대해 각각의 심볼 코드(sym)에 기초하여 하나 이상의 최상위 비트를 디코딩하고(950; 1110a-1110g), 상기 스펙트럼 값 중 하나 이상에 대해 하나 이상의 최하위 비트를 디코딩하도록 구성되고,
상기 오디오 디코더는,
상기 인코더로부터의 시그널링에 응답하여 고 주파수 범위의 스펙트럼 값의 디코딩이 생략되고 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 더 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 디코드(934)되는 제1 모드(930, 934, 938, 942, 944, 948), 및
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는 반면, 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 디코딩되지 않는 제2 모드(950, 954, 958, 962, 968, 972)
사이에서 전환 가능하게 구성되고;
상기 오디오 디코더는 상기 스펙트럼 값을 이용하여 상기 디코딩된 오디오 정보를 제공하도록 구성되는, 디코더. - 제13항에 있어서, 상기 산술 디코딩은 상기 하나 이상의 최상위 비트의 비트 위치(numbits, numbits-1)를 결정하고(950; 1110a-1110e), 상기 산술적으로 인코딩된 표현의 심볼에 의해 결정된 상기 하나 이상의 최상위 비트를 상기 결정된 비트 위치에 할당(1110f, 1110g)하도록 구성되는, 디코더.
- 제13항 및 제14항 중 어느 한 항에 있어서, 상기 오디오 디코더는, 하나 이상의 최상위 비트가 디코딩되고 상기 하나 이상의 최상위 비트와 하나의 최하위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 하나 이상의 중간 비트를 디코딩(954; 1120a-1120e)하도록 구성되는, 디코더.
- 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 오디오 디코더는 상기 제2 모드에서 동작할 때, 제1 디코딩 단계에서,
스펙트럼 값 당 하나 이상의 최상위 비트,
하나 이상의 최상위 비트가 디코딩되고 상기 하나 이상의 최상위 비트와 하나의 최하위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는, 하나 이상의 중간 비트, 및
하나 이상의 최상위 비트가 디코딩되고 상기 하나 이상의 최상위 비트와 임의의 중간 비트가 - 중간 비트가 존재하는 한 - 넌제로 값을 나타내는 모든 스펙트럼 값에 대해, 부호
를 디코딩하도록 구성되고;
상기 오디오 디코더는 상기 제2 모드에서 동작할 때, 상기 제1 디코딩 단계에서, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 스펙트럼 값에 대해 부호의 디코딩을 선택적으로 생략하도록 구성되고;
상기 오디오 디코더는, 상기 제2 모드에서 동작할 때, 상기 제1 디코딩 단계 다음에 오는 제2 디코딩 단계에서, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내고 최하위 비트 정보가 넌제로 값을 나타내는 스펙트럼 값에 대해서, 부호 정보를 선택적으로 획득하도록 구성되는, 디코더. - 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 오디오 디코더는 상기 제2 모드에서 동작할 때, 상기 스펙트럼 값과 관련된 최하위 비트 값을 획득하기 위해 최하위 비트 정보 비트 시퀀스의 후속 비트를 순차적으로 사용하도록 구성되는, 디코더.
- 제17항에 있어서, 상기 오디오 디코더는, 상기 제2 모드에서 동작할 때, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 넌제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 사용하도록 구성되고, - 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 단일 비트는 최하위 비트 값을 얻기 위해 사용됨 - ;
상기 오디오 디코더는, 제2 모드에서 동작할 때, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 사용하도록 구성되고, - 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 단일 비트는 상기 제로 값을 확인함 - ;
상기 오디오 디코더는, 상기 제2 모드에서 동작할 때, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 이 제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 두 후속 비트를 사용하도록 구성되고 - 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 두 비트 중 제1 비트는 상기 제로 값에서 최하위 비트 값 만큼의 편차를 나타내고, 상기 최하위 비트 정보 비트 시퀀스의 사용된 두 비트 중 제2 비트는 상기 각각의 스펙트럼 값의 부호를 결정하는, 디코더. - 제13항 내지 제18항 중 어느 한 항에 있어서, 상기 오디오 디코더는, 상기 제2 모드에서 동작할 때, 가장 낮은 주파수 스펙트럼 값과 관련된 최하위 비트로부터 시작하여 점점 더 높은 주파수와 관련된 스펙트럼 값으로 진행하면서 최하위 비트들을 디코딩하도록 구성되어,
스펙트럼 값이 최저 주파수 스펙트럼 값에서 마지막 최하위 비트 정보가 이용 가능한 스펙트럼 값 까지의 범위에서 최하위 비트 정보에 의해 개선되고, 상기 마지막 최하위 비트 정보가 이용 가능한 상기 스펙트럼 값과 관련된 주파수 보다 더 높은 관련 주파수를 갖는 스펙트럼 값은 개선되지 않고 유지되는, 디코더. - 제13항 내지 제19항 중 어느 한 항에 있어서, 상기 오디오 디코더는 상기 오디오 디코더가 상기 제1 모드에서 동작하는지 또는 상기 제2 모드에서 동작하는지를 결정하기 위해서 상기 인코딩된 오디오 정보에 포함된 비트스트림 플래그를 평가하도록 구성되는, 디코더.
- 제13항 내지 제20항 중 어느 한 항에 있어서, 상기 오디오 디코더는 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 중간 비트, 및 제1 모드에서 연속되는 비트 시퀀스로부터 임의의 스펙트럼 값과 연관된 상기 최하위 비트를 획득(934)하도록 구성되고,
상기 오디오 디코더는 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 중간 비트, 및 상기 제2 모드에서 개별의 비트 시퀀스로부터 또는 비트 시퀀스의 개별의 비연속적인 비트 위치로부터 임의의 스펙트럼 값(972)과 연관된 상기 최하위 비트를 취득(954)하도록 구성되는, 디코더. - 제13항 내지 제21항 중 어느 한 항에 있어서, 상기 오디오 디코더는 상기 제1 모드에서 상기 하나 이상의 최상위 비트, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 임의의 중간 비트, 및 임의의 스펙트럼 값과 연관된 상기 최하위 비트의 디코딩 후에만 스펙트럼 값과 연관된 부호 정보를, 상기 하나 이상의 최상위 비트, 상기 중간 비트 및 상기 최하위 비트가 제로 값을 나타내는지의 여부에 따라, 선택적으로 획득(938)하도록 구성되고,
상기 오디오 디코더는 상기 하나 이상의 최상위 비트 및 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 임의의 중간 비트의 디코딩 이후, 상기 제2 모드에서 임의의 스펙트럼 값과 연관된 최하위 비트가 디코딩 되기 전에, 스펙트럼 값과 관련된 부호 정보를, 상기 하나 이상의 최상위 비트 및 상기 중간 비트가 제로 값을 나타내는지의 여부에 따라, 선택적으로 획득(958; 1130a-1131d)하도록 구성된, 디코더. - 입력 오디오 정보(310; 410; 510; 610)에 기초하여 인코딩된 오디오 정보(312; 412; 512; 612)를 제공하기 위한 오디오 인코더(300; 400; 500; 600)에 있어서,
상기 오디오 인코더는 상기 입력 오디오 정보의 오디오 콘텐츠를 나타내는 스펙트럼 값(330; 662; Xq[n])을 획득(620, 630, 640, 650, 660)하도록 구성되고,
상기 오디오 인코더는 상기 스펙트럼 값들을 나타내는 인코딩된 정보(350,450,550,672; sym, lsbs[])를 얻기 위해, 적어도 복수의 스펙트럼 값들을 인코딩(670; 800)하도록 구성되고;
상기 오디오 인코더는 산술 인코딩을 사용하여 스펙트럼 값 세트(Xq[0]… Xq[lastnz-1])에 대해 각각의 심볼 코드(sym)를 얻기 위해, 스펙트럼 값 당 두 개 이상의 최상위 비트들을 공동으로 인코딩(878, 886, 890; 1000a, 1020a, 1040a-1040d)하도록 구성되고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 나타내고,
상기 오디오 인코더는 이용 가능한 비트 예산에 의존하여 상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트를 인코딩(882; 898; 1010a-1010e, 1011a-1011e)하도록 구성되어,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 인코딩되는 반면, 두 개 이상의 최상위 비트가 인코딩되고 상기 두 개 이상의 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해 최하위 비트가 인코딩되지 않도록 하고;
상기 오디오 인코더는 상기 스펙트럼 값을 나타내는 상기 인코딩된 정보를 사용하여 상기 인코딩된 오디오 정보를 제공하도록 구성되는, 인코더. - 제23항에 있어서, 상기 산술 인코딩은 상기 적어도 두 개의 최상위 비트의 비트 위치(numbits, numbits-1)를 결정하고(878; 1000a) 상기 비트 위치를 기술하는 정보를 산술적으로 인코딩된 표현에 포함(886,1020a)하도록 구성되는, 인코더.
- 제23항 또는 제24항에 있어서, 상기 오디오 인코더는 상기 적어도 하나의 스펙트럼 값(Xq[n, Xq[n+1)의 적어도 두 개의 최상위 비트를, 적어도 하나의 스펙트럼 값의 상기 적어도 두 개의 최상위 비트를 나타내는, 산술적으로 인코딩된 표현의 하나의 심볼(sym)에 매핑(890; 1040a-1040d)하도록 구성되는, 인코더.
- 제23항 내지 제25항 중 어느 한 항에 있어서, 상기 오디오 인코더는 두 개 이상의 최상위 비트가 인코딩되고 상기 두 개 이상의 최상위 비트와 하나의 최하위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 두 개 이상의 최상위 비트 사이에 있는 하나 이상의 중간 비트를 인코딩(892; 1050a-1050c)하도록 구성되는, 인코더.
- 제23항 내지 제26항 중 어느 한 항에 있어서, 상기 오디오 인코더는, 제1 인코딩 단계에서,
스펙트럼 값 당 두 개 이상의 최상위 비트(878,886, 890; 1000a, 1020a, 1040a-1040d),
두 개 이상의 최상위 비트가 인코딩되고 상기 두 개 이상의 최상위 비트와 하나의 최하위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 두 개 이상의 최상위 비트 사이인 하나 이상의 중간 비트(892; 1050a-1050c), 및
두 개 이상의 최상위 비트가 인코딩되고 상기 두 개 이상의 최상위 비트와 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 넌제로 값을 나타내는 모든 스펙트럼 값에 대해서, 부호(894; 1060a-1061c)
를 인코딩하도록 구성되고,
상기 오디오 인코더는 상기 제1 인코딩 단계에서, 상기 두 개 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 스펙트럼 값에 대해 부호의 인코딩을 선택적으로 생략(1060a, 1061a)하도록 구성되고;
상기 오디오 인코더는, 상기 제2 인코딩 단계에서, 상기 두 개 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내고 최하위 비트 정보가 넌제로 값을 나타내는 스펙트럼 값에 대해서 부호 정보(1010e, 1011e)를 선택적으로 인코딩(898)하도록 구성되는, 인코더. - 제23항 내지 제27항 중 어느 한 항에 있어서, 상기 오디오 인코더는 0에서 최하위 비트 만큼 다른 스펙트럼 값에 대해, 스펙트럼 값의 상기 최하위 비트가 실재로 인코딩되면, 부호 정보를 상기 인코딩된 오디오 표현에 포함(882,898; 1010c-1010e, 1011c-1011e)시키도록 구성되는, 인코더.
- 제23항 내지 제28항 중 어느 한 항에 있어서, 상기 오디오 인코더는 상기 스펙트럼 값들과 연관된 최하위 비트 값들을 인코딩하기 위해서 최하위 비트 정보 비트 시퀀스(lsbs[])의 후속 비트들을 순차적으로 제공하도록 구성되는, 인코더.
- 제29항에 있어서, 상기 오디오 인코더는 상기 두 개 이상의 최상위 비트 값과 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 넌제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스(lsbs[])의 단일 비트(bit)를 제공(882, 898; 1010a, 1010b, 1011a, 1011b)하도록 구성되고, - 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 단일 비트는 최하위 비트 값을 인코딩하기 위해 사용됨 - ;
상기 오디오 인코더는 상기 두 개 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 제공(882, 898; 1010a, 1010b, 1011a, 1011b)하도록 구성되고 - 상기 최하위 비트 정보 비트 시퀀스의 상기 제공된 단일 비트는 상기 제로 값을 확인함 - ; 및
상기 오디오 인코더는 상기 두 개의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 두 후속 비트를 제공(882, 898; 1010a, 1010b, 1010d, 1010e, 1011a, 1011b, 1011d, 1011e)하도록 구성되고, 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 두 비트 중 제1 비트는 상기 제로 값에서 최하위 비트 값 만큼의 편차를 나타내고, 상기 최하위 비트 정보 비트 시퀀스의 제공된 두 비트 중 제2 비트는 상기 각각의 스펙트럼 값의 부호를 인코딩하는, 인코더. - 제23항 내지 제30항 중 어느 한 항에 있어서, 상기 오디오 인코더는 최저 주파수 스펙트럼 값과 연관된 최하위 비트로부터 시작하여 점점 더 높은 주파수와 연관된 스펙트럼 값으로 진행하면서 최하위 비트들을 인코딩(882, 898; 1140a-1141j)하도록 구성되어,
최하위 비트 비트 정보에 의해 스펙트럼 값들을 개선하기 위한 인코딩된 정보가 최하위 주파수 스펙트럼 값으로부터 마지막 최하위 비트 정보가 제공되는 스펙트럼 값까지의 범위에서 제공되고,
최하위 비트 정보에 의해 스펙트럼 값들을 개선하기 위한 인코딩된 정보가 상기 마지막 최하위 비트 정보가 제공되는 상기 스펙트럼 값과 연관된 주파수 보다 높은 관련 주파수를 갖는 스펙트럼 값에 대해서는 제공되지 않는, 인코더. - 제23항 내지 제31항 중 어느 한 항에 있어서, 상기 오디오 인코더는,
이용 가능한 비트 예산이 저 주파수 범위에서 스펙트럼 값의 인코딩으로 소진한 경우 고 주파수 범위에서 넌제로 스펙트럼 값의 인코딩이 생략되고 하나 이상의 최상위 비트가 인코딩되고(848, 852, 856) 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 인코딩(860)되는 제1 모드(840, 844, 848, 852, 856, 860, 864, 868, 869) 및
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 인코딩되는(898) 반면, 하나 이상의 최상위 비트가 인코드되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않는 제2 모드(870, 874, 878, 882, 886, 890, 892, 894, 896, 898) 사이에서 전환 가능하게 구성되는, 인코더. - 제32항에 있어서, 상기 오디오 인코더는 상기 오디오 인코더가 상기 제1 모드에서 동작하는지 또는 상기 제2 모드에서 동작하는지를 나타내기 위해 상기 인코딩된 오디오 정보에 포함된 비트스트림 플래그를 제공하도록 구성되는, 인코더.
- 제23항 내지 제33항 중 어느 한 항에 있어서, 상기 오디오 인코더는 각각의 심볼 코드(sym)를 사용하여 적어도 두 개의 스펙트럼 값(Xq[n], Xq[n+1])에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 공동으로 인코딩(878, 886, 890; 1000a, 1020a, 1040a-1040d)하도록 구성되고,
각각의 심벌 코드는 적어도 두 개의 스펙트럼 값에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 나타내는, 인코더. - 제23항 내지 제34항 중 어느 한 항에 있어서, 상기 오디오 인코더는 실제 최고 주파수 넌제로 스펙트럼 값을 결정하고, 모든 넌제로 스펙트럼 값 또는 모든 넌제로 스펙트럼 값 그룹의 적어도 둘 이상의 최상위 비트를 인코딩하도록 구성되는, 인코더.
- 제23항 내지 제35 중 어느 한 항에 있어서, 상기 오디오 인코더는 모든 넌제로 스펙트럼 값에 대해 최하위 비트를 제외한 모든 비트를 인코딩(878, 886, 890, 892)하도록 구성되고,
상기 오디오 인코더는 비트 예산이 소진될 때까지 스펙트럼 값들에 대한 최하위 비트를 인코딩(882,898)하도록 구성되는, 인코더. - 제23항 내지 제36항 중 어느 한 항에 있어서, 상기 오디오 인코더는 스펙트럼 값을 양자화(660)하는 양자화 단계를 결정하고, 상기 양자화된 스펙트럼 값을 인코딩하기 위한 비트 요구를 결정하는 이득 정보를 획득(810; 814, 818, 82)하도록 구성되는, 인코더.
- 입력 오디오 정보(310; 410; 510; 610)에 기초하여 인코딩된 오디오 정보(312; 412; 512; 612)를 제공하기 위한 오디오 인코더(300; 400; 500; 600)에 있어서,
상기 오디오 인코더는 상기 입력 오디오 정보의 오디오 콘텐츠를 나타내는 스펙트럼 값을 획득(620, 630, 640, 650, 660)하도록 구성되고,
상기 오디오 인코더는 상기 스펙트럼 값들을 나타내는 인코딩된 정보(350, 450, 550, 672; sym, lsbs[])를 얻기 위해서, 적어도 복수의 스펙트럼 값들을 인코딩(670; 800)하도록 구성되고;
상기 오디오 인코더는 복수의 스펙트럼 값(Xq[0] ... Xq[lastnz-1])에 대한 각각의 심볼 코드를 취득하고, 스펙트럼 값 중 하나 이상에 대해 하나 이상의 최하위 비트를 인코딩하기 위해서, 하나 이상의 최상위 비트를 인코딩(882; 898; 1010a-1010e, 1011a-1011e)하도록 구성되고,
각각의 심볼 코드(sym)는 하나 이상의 스펙트럼 값(Xq[n], Xq[n+1])에 대해 하나 이상의 최상위 비트 값을 나타내고,
상기 오디오 인코더는,
이용 가능한 비트 예산이 저 주파수 범위에서 스펙트럼 값의 인코딩으로 소진한 경우 고 주파수 범위에서 넌제로 스펙트럼 값의 인코딩이 생략되고 하나 이상의 최상위 비트가 인코딩되고(848, 852, 856) 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 인코딩(860)되는 제1 모드(840, 844, 848, 852, 856, 860, 864, 868, 869) 및
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 인코딩되는(898) 반면, 하나 이상의 최상위 비트가 인코드되고 상기 최상위 비트 보다 더 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않는 제2 모드(870, 874, 878, 882, 886, 890, 892, 894, 896, 898)
사이에서 전환 가능하게 구성되고,
상기 오디오 인코더는 상기 스펙트럼 값을 나타내는 상기 인코딩된 정보를 사용하여 상기 인코딩된 오디오 정보를 제공하도록 구성되는, 인코더. - 제38항에 있어서, 상기 오디오 인코더는 상기 제2 모드에서 모든 넌제로 스펙트럼 값 또는 모든 넌제로 스펙트럼 값의 그룹의 적어도 하나 이상의 최상위 비트를 인코딩(878,886,890)하도록 구성되는, 인코더.
- 제38항 및 제39항에 있어서, 상기 오디오 인코더는 상기 제1 모드에서 동작할 때, 비트 예산이 충분하지 않은 경우, 스펙트럼 값이 인코딩되는 주파수 범위를 제한하도록 구성되어, 하나 이상의 스펙트럼 값이 상기 스펙트럼 값의 인코딩시 고려되지 않고 유지되는, 인코더.
- 제40항에 있어서, 상기 오디오 인코더는, 상기 제1 모드에서 동작할 때, 최대 주파수 값을 결정하고, 상기 제1 모드에서 동작할 때, 상기 최대 주파수까지의 스펙트럼 값을 인코딩하고(848, 852, 856, 60), 상기 제1 모드에서 동작할 때, 상기 스펙트럼 값이 넌제로인 경우에도 상기 최대 주파수를 초과하는 스펙트럼 값이 인코딩되지 않고 유지되도록 구성되고,
상기 오디오 인코더는, 상기 제1 모드에서 동작할 때, 모든 스펙트럼 값을 인코딩하기 위한 비트 요구의 계산 또는 추정에 의존하여, 상기 최대 주파수 값을 선택하도록 구성되어, 상기 계산되거나 추정된 비트 수요가 비트 예산을 초과하는 경우 인코딩될 스펙트럼 값의 수가 감소되게 하고,
상기 오디오 인코더는 상기 제2 모드에서 동작할 때 상기 최대 주파수 값을 결정하고, 상기 제2 모드에서 동작할 때 스펙트럼 값을 상기 최대 값까지 인코딩하고(878, 882, 886, 890, 898), 상기 제2 모드에서 동작할 때, 상기 최대 주파수 이상의 스펙트럼 값을 인코딩하지 않고 유지하도록 구성되고,
상기 오디오 인코더는, 상기 제2 모드에서 동작할 때, 모든 넌제로 스펙트럼 값 또는 모든 넌제로 스펙트럼 값의 그룹의 적어도 하나 이상의 최상위 비트가 인코딩되고 최대 제로 값의 스펙트럼 값이 인코딩되지 않고 유지되도록 상기 최대 주파수를 선택하도록 구성되는, 인코더. - 제40항 또는 제41항에 있어서, 상기 오디오 인코더는 상기 인코딩된 오디오 정보에 상기 최대 주파수를 기술하는 정보(lastnz)를 포함하도록 구성되는, 인코더.
- 제38항 내지 제42항 중 어느 한 항에 있어서, 상기 오디오 인코더는 이용 가능한 비트 전송률에 의존하여 상기 제1 모드를 사용할지 또는 상기 제2 모드를 사용할지 모드 결정(830)을 행하도록 구성되는, 인코더.
- 제38항 내지 제43항 중 어느 한 항에 있어서, 상기 오디오 인코더는, 최상위 비트 인코딩 단계에서 인코딩된 하나 이상의 최상위 비트에 더하여, 비트 요구 및 비트 예산에 따라 그 인코딩이 선택적으로 생략될 수 있는, 하나 이상의 최하위 비트를, 포함하는 다수의 스펙트럼 값이나 스펙트럼 값의 그룹에 의존하여, 상기 제1 모드를 이용할지 또는 상기 제2 모드를 이용할지에 대해 모드 결정(830)을 행하도록 구성되는, 인코더.
- 제38항 내지 제44항 중 어느 한 항에 있어서, 상기 오디오 인코더는 상기 오디오 인코더가 상기 제1 모드에서 동작하는지 또는 상기 제2 모드에서 동작하는지를 나타내는 상기 인코딩된 오디오 정보에 비트스트림 플래그를 포함하도록 구성되는, 인코더.
- 제38항 내지 제45항 중 어느 한 항에 있어서, 상기 오디오 인코더는 상기 제1 모드에서 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 중간 비트, 및 상기 제1 모드에서 임의의 스펙트럼 값과 연관된 상기 최하위 비트를, 연속적인 비트 시퀀스로 인코딩(860)하도록 구성되고,
상기 오디오 인코더는 상기 제2 모드에서 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 중간 비트, 및 임의의 스펙트럼 값(882, 898)과 연관된 상기 최하위 비트를, 개별의 비트 시퀀스 또는 비트 시퀀스의 개별의 비연속적인 비트 위치에 인코딩(892)하도록 구성되는, 인코더. - 제38항 내지 제46항 중 어느 한 항에 있어서, 상기 오디오 인코더는, 상기 제1 모드에서 동작할 때, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 중간 비트와 연관된 비트 시퀀스의 스펙트럼 값과 연관된 부호 정보, 및 최하위 비트를 인코딩(864)하도록 구성되고,
상기 오디오 인코더는 상기 제2 모드에서 동작할 때, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 중간 비트와 관련된 비트 시퀀스에서 스펙트럼 값과 관련된 부호 정보, 및 최하위 비트 및 부호 정보(882, 898)와 관련된 비트 시퀀스(lsbs[])의 부호 정보(894)를 선택적으로 인코딩하도록 구성되어, 0에서 최하위 비트 값 만큼 벗어난 스펙트럼 값에 대한 부호 정보가 최하위 비트 값 및 부호 정보와 관련이 있는 비트 시퀀스에서 인코딩되는, 인코더. - 입력 오디오 정보(310; 410; 510; 610)에 기초하여 인코딩된 오디오 정보(312; 412; 512; 612)를 제공하기 위한 오디오 인코더(300; 400; 500; 600)에 있어서,
상기 오디오 인코더는 상기 입력 오디오 정보의 오디오 콘텐츠를 나타내는 스펙트럼 값(330; 662; Xq[n])을 획득(620, 630, 640, 650, 660)하도록 구성되고,
상기 오디오 인코더는 상기 스펙트럼 값들을 나타내는 인코딩된 정보(350, 450, 550, 672; sym, lsbs[])를 얻기 위해서, 적어도 복수의 스펙트럼 값들을 인코딩(670; 800)하도록 구성되고;
상기 오디오 인코더는 스펙트럼 값을 양자화하는 양자화 단계를 결정하고, 상기 양자화된 스펙트럼 값을 인코딩하기 위한 비트 요구를 결정하는 이득 정보를 획득(810, 814, 818, 822)하도록 구성되고;
상기 오디오 인코더는 산술 인코딩을 이용하여 복수의 스펙트럼 값(Xq[0] ... Xq[lastnz-1)에 대해 각각의 심볼 코드(sym)를 사용하여 하나 이상의 최상위 비트를 인코딩(878, 886, 890; 1000a, 1020a, 1040a-1040d)하고, 상기 스펙트럼 값의 하나 이상에 대해 하나 이상의 최하위 비트를 인코딩하도록 구성되고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값에 대해 스펙트럼 값 당 하나 이상의 최상위 비트를 나타내고,
상기 오디오 인코더는 이용 가능한 비트 예산에 의존하여 상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트를 인코딩(882; 898; 1010a-1010e, 1011a-1011e)하도록 구성되고;
상기 스펙트럼 값 중 하나 이상과 연관된 하나 이상의 최하위 비트가 인코딩되는 반면, 하나 이상의 최상위 비트가 인코딩되고 보다 상기 하나 이상의 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않도록 하고;
상기 오디오 인코더는 상기 스펙트럼 값을 나타내는 상기 인코딩된 정보를 사용하여 상기 인코딩된 오디오 정보를 제공하도록 구성되는, 인코더. - 제48항에 있어서, 상기 오디오 인코더는 스펙트럼 값의 그룹의 에너지에 기초하여 상기 이득 정보의 제1 추정치를 획득하고(810),
상기 제1 추정치의 이득 정보를 사용하여 스펙트럼 값 세트를 양자화하고(814),
상기 제1 추정치의 이득 정보를 이용하거나 개선된 이득 정보를 이용하여 양자화된 상기 스펙트럼 값 세트를 인코딩하는데 필요한 다수의 비트를 계산 또는 추정하고(818),
필요한 비트 수에 따라 상기 제1 모드를 사용할지 또는 상기 제2 모드를 사용할지를 결정(830)하도록 구성된, 인코더. - 제48항 또는 제49항에 있어서, 상기 오디오 인코더는,
이용 가능한 비트 예산이 저 주파수 범위에서 인코딩된 스펙트럼 값에 의해 소진한 경우 고 주파수 범위에서 넌제로 스펙트럼 값의 인코딩이 생략되고 하나 이상의 최상위 비트가 인코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해서는 최하위 비트가 인코딩되는 제1 모드와,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 인코딩되는 반면, 하나 이상의 최상위 비트가 인코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않는 제2 모드
사이에서 전환 가능하게 구성되고,
상기 오디오 인코더는 필요한 비트 수에 따라 그리고 얼마나 많은 스펙트럼 값이 상기 하나 이상의 최상위 비트 보다 많은 비트를 포함하는지를 나타내는 기준에 따라 상기 제1 모드를 사용할지 또는 상기 제2 모드를 사용할지를 결정하도록 구성되는, 인코더. - 제48항 또는 제49항에 있어서, 상기 오디오 인코더는,
이용 가능한 비트 예산이 저 주파수 범위에서 인코딩된 스펙트럼 값에 의해 소진한 경우 고 주파수 범위에서 넌제로 스펙트럼 값의 인코딩이 생략되고 하나 이상의 최상위 비트가 인코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 인코딩되는 제1 모드와,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 인코딩되는 반면, 하나 이상의 최상위 비트가 인코드되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않는 제2 모드
사이에서 전환 가능하게 구성되고,
상기 오디오 인코더는 필요한 비트 수에 따라 그리고 비트 전송률에 따라 상기 제1 모드를 사용할지 또는 상기 제2 모드를 사용할지를 결정하도록 구성되어, 비트 전송률이 임계 비트 전송률 보다 크거나 같은 경우에 그리고 상기 스펙트럼 값의 세트을 인코딩하는 데에 필요한 계산되거나 추정된 비트 수가 비트 예산 보다 큰 경우에 상기 제2 모드가 선택되는, 인코더. - 제38항 내지 제51항 중 어느 한 항에 있어서, 상기 산술 인코딩은 상기 하나 이상의 최상위 비트의 비트 위치를 결정하고 상기 비트 위치를 기술하는 정보를 산술적으로 인코딩된 표현에 포함하도록 구성되는, 인코더.
- 제38항 내지 제52항 중 어느 한 항에 있어서, 상기 오디오 인코더는 상기 적어도 하나의 스펙트럼 값의 적어도 두 개의 최상위 비트를, 상기 적어도 하나의 스펙트럼 값의 적어도 두 개의 최상위 비트를 나타내는, 산술적으로 인코딩된 표현의 하나의 심볼에 매핑하도록 구성되는, 인코더.
- 제38항 내지 제53항 중 어느 한 항에 있어서, 상기 오디오 인코더는 하나 이상의 최상위 비트가 인코딩되고 상기 하나 이상의 최상위 비트와 하나의 최하위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는 하나 이상의 중간 비트를 인코딩하도록 구성되는, 인코더.
- 제38항 내지 제54항 중 어느 한 항에 있어서, 상기 오디오 인코더는 제1 인코딩 단계에서,
스펙트럼 값 당 하나 이상의 최상위 비트,
하나 이상의 최상위 비트가 인코딩되고 상기 하나 이상의 최상위 비트와 하나의 최하위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해, 비트 위치가 상기 최하위 비트와 상기 하나 이상의 최상위 비트 사이에 있는, 하나 이상의 중간 비트, 및
하나 이상의 최상위 비트가 인코딩되고 상기 하나 이상의 최상위 비트와 임의의 중간 비트가 - 중간 비트가 존재하는 한 - 넌제로 값을 나타내는 모든 스펙트럼 값에 대해, 부호
를 인코딩하도록 구성되고;
상기 오디오 인코더는 상기 제1 인코딩 단계에서, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 스펙트럼 값에 대해 부호의 인코딩을 선택적으로 생략하도록 구성되고;
상기 오디오 인코더는, 상기 제1 인코딩 단계에 이어지는 제2 인코딩 단계에서, 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내고 최하위 비트 정보가 넌제로 값을 나타내고 최하위 비트 정보가 넌제로 값을 나타내는 스펙트럼 값에 대해서, 부호 정보를 선택적으로 인코딩하도록 구성되는, 인코더. - 제38항 내지 제55항 중 어느 한 항에 있어서, 상기 오디오 인코더는 스펙트럼 값의 상기 최하위 비트가 실제로 인코딩되는 경우 0에서 최하위 비트 만큼 다른 스펙트럼 값에 대해 상기 인코딩된 오디오 표현에 부호 정보를 포함하도록 구성되는, 인코더.
- 제38항 내지 제56항 중 어느 한 항에 있어서, 상기 오디오 인코더는 상기 스펙트럼 값과 관련된 최하위 비트 값을 인코딩하기 위해 최하위 비트 정보 비트 시퀀스의 후속 비트를 순차적으로 제공하도록 구성되는, 인코더.
- 제57항에 있어서, 상기 오디오 인코더는 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 넌제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 제공하도록 구성되고, - 상기 최하위 비트 비트 정보 비트 시퀀스의 상기 사용된 단일 비트가 최하위 비트 값을 인코딩하기 위해 사용됨 - ;
상기 오디오 인코더는 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 이 제로 값을 나타내는 각각의 스펙트럼 값들에 대해 상기 최하위 비트 정보 비트 시퀀스의 단일 비트를 제공하도록 구성되고 - 상기 최하위 비트 정보 비트 시퀀스의 상기 제공된 단일 비트는 상기 제로 값을 확인함 - ; 및
상기 오디오 인코더는 상기 하나 이상의 최상위 값 및 임의의 중간 비트 - 중간 비트가 존재하는 한 - 가 제로 값을 나타내는 각각의 스펙트럼 값에 대해 상기 최하위 비트 정보 비트 시퀀스의 두 후속 비트를 제공하도록 구성되고, 상기 최하위 비트 정보 비트 시퀀스의 상기 사용된 두 비트 중 제1 비트는 상기 제로 값에서 최하위 비트 값 만큼의 편차를 나타내고, 상기 최하위 비트 정보 비트 시퀀스의 제공된 두 비트 중 제2 비트는 상기 각각의 스펙트럼 값의 부호를 인코딩하는, 인코더. - 제38항 내지 제58항 중 어느 한 항에 있어서, 상기 오디오 인코더는 최저 주파수 스펙트럼 값과 관련된 최하위 비트로부터 시작하여 점점 더 높은 주파수와 관련된 스펙트럼 값으로 진행하면서 최하위 비트들을 인코딩하도록 구성되어,
최하위 비트 비트 정보에 의해 스펙트럼 값들을 개선하기 위한 인코딩된 정보가 최하위 주파수 스펙트럼 값으로부터 마지막 최하위 최하위 비트 정보가 제공되는 스펙트럼 값까지의 범위에서 제공되고,
최하위 비트 정보에 의해 스펙트럼 값들을 개선하기 위한 인코딩된 정보가 상기 마지막 최하위 비트 정보가 제공되는 상기 스펙트럼 값과 연관된 주파수보다 높은 관련 주파수를 갖는 스펙트럼 값들에 대해 제공되지 않는, 인코더. - 제38항 내지 제59항 중 어느 한 항에 있어서, 상기 오디오 인코더는,
이용 가능한 비트 예산이 저 주파수 범위에서 인코딩된 스펙트럼 값에 의해 소진한 경우 고 주파수 범위의 넌제로 스펙트럼 값의 인코딩이 생략되고 하나 이상의 최상위 비트가 인코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 인코딩되는 제1 모드와,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는 반면, 하나 이상의 최상위 비트가 인코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않는 제2 모드
사이에서 전환 가능하게 구성되는, 인코더. - 제60항에 있어서, 상기 오디오 인코더는 상기 오디오 인코더가 상기 제1 모드에서 동작하는지 또는 상기 제2 모드에서 동작하는지를 나타내기 위해 상기 인코딩된 오디오 정보에 포함된 비트스트림 플래그를 제공하도록 구성되는, 인코더.
- 제38항 내지 제61항 중 어느 한 항에 있어서, 상기 오디오 인코더는 각각의 심볼 코드를 사용하여 적어도 두 개의 스펙트럼 값에 대해 스펙트럼 값 당 하나 이상의 최상위 비트를 공동으로 인코딩하도록 구성되고,
각각의 심벌 코드는 적어도 두 개의 스펙트럼 값에 대한 스펙트럼 값 당 하나 이상의 최상위 비트를 나타내는, 인코더. - 제38항 내지 제62항 중 어느 한 항에 있어서, 상기 오디오 인코더는, 상기 제2 모드에서 동작할 때, 실제 최고 주파수 넌제로 스펙트럼 값을 결정하고, 모든 넌제로 스펙트럼 값 또는 모든 넌제로 스펙트럼 값의 그룹의 적어도 하나 이상의 최상위 비트를 인코딩하도록 구성되는, 인코더.
- 제38항 내지 제63항 중 어느 한 항에 있어서, 상기 오디오 인코더는, 상기 제2 모드에서 동작할 때, 모든 넌제로 스펙트럼 값에 대해 최하위 비트를 제외한 모든 비트를 인코딩하도록 구성되고,
상기 오디오 인코더는 비트 예산이 소진될 때까지 스펙트럼 값들에 대해 최하위 비트들을 인코딩하도록 구성되는, 인코더. - 제38항 내지 제64항 중 어느 한 항에 있어서, 상기 오디오 인코더는 스펙트럼 값을 양자화하는 양자화 단계를 결정하고, 상기 양자화된 스펙트럼 값을 인코딩하기 위한 비트 요구를 결정하는 이득 정보를 획득하도록 구성되는, 인코더.
- 인코딩된 오디오 정보(110; 210; 710)에 기초하여 디코딩된 오디오 정보(112; 212; 712)를 제공하는 방법에 있어서,
상기 방법은 상기 스펙트럼 값을 나타내는 인코딩된 정보(130; 230)에 기초하여 디코딩된 스펙트럼 값(132; 232; 732; Xq[n], Xq[n+1])을 획득하는 단계를 포함하고,
상기 방법은 산술 디코딩을 사용하여 스펙트럼 값의 세트에 대해 각각의 심볼 코드(sym)에 기초하여 스펙트럼 값 당 두 개 이상의 최상위 비트를 공동 디코딩하는 단계(950; 1110a-1110g)를 포함하고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 나타내고,
상기 방법은 이용 가능한 최소 비트 비트 정보의 양에 따라 하나 이상의 스펙트럼 값과 관련된 하나 이상의 최하위 비트를 디코딩하는 단계(972; 1140a-1141j)를 포함하여,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는 반면, 하나 이상의 최상위 비트가 디코딩되고 상기 하나 이상의 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해 최하위 비트가 디코딩되지 않도록 하고;
상기 방법은 상기 스펙트럼 값을 사용하여 상기 디코딩된 오디오 정보를 제공하는 단계를 포함하는, 방법. - 인코딩된 오디오 정보(110; 210; 710)에 기초하여 디코딩된 오디오 정보(112; 212; 712)를 제공하는 방법에 있어서,
상기 방법은 상기 스펙트럼 값을 나타내는 인코딩된 정보(130; 230)에 기초하여 디코딩된 스펙트럼 값(132; 232; 732; Xq[n], Xq[n+1])을 획득하는 단계를 포함하고,
상기 방법은 복수의 스펙트럼 값(Xq[0]… Xq[lastnz-1])에 대한 각각의 심볼 코드(sym)에 기초하여 하나 이상의 최상위 비트를 디코딩하는 단계(950; 1110a-1110g), 및
상기 스펙트럼 값 중 하나 이상에 대해 하나 이상의 최하위 비트를 디코딩하는 단계
를 포함하고,
상기 방법은,
인코더로부터의 시그널링에 응답하여 고 주파수 범위에서 스펙트럼 값의 디코딩이 생략되고 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 디코딩(934)되는 제1 모드(930, 934, 938, 942, 944, 948)와,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는 반면, 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 디코딩되지 않는 제2 모드(950, 954, 958, 962, 968, 972)
사이에서 선택하는 단계를 포함하고,
상기 방법은 상기 스펙트럼 값을 사용하여 상기 디코딩된 오디오 정보를 제공하는, 방법. - 입력 오디오 정보(310; 410; 510; 610)에 기초하여 인코딩된 오디오 정보(312; 412; 512; 612)를 제공하는 방법에 있어서,
상기 방법은 상기 입력 오디오 정보의 오디오 컨텐츠를 나타내는 스펙트럼 값(330; 662; Xq[n])을 획득하는 단계(620, 630, 640, 650, 660)를 포함하고,
상기 방법은 상기 스펙트럼 값을 나타내는 인코딩된 정보(350, 450, 550, 672; sym, lsbs[])를 얻기 위해서, 적어도 복수의 스펙트럼 값을 인코딩하는 단계(670; 800)를 포함하고;
상기 방법은 산술 인코딩을 사용하여 스펙트럼 값의 세트(Xq[0] ... Xq[lastnz-1])에 대한 각각의 심볼 코드(sym)를 얻기 위해, 스펙트럼 값당 두 개 이상의 최상위 비트를 공동 인코딩(878, 886, 890; 1000a, 1020a, 1040a-1040d)하는 단계를 포함하고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값에 대해 스펙트럼 값 당 두 개 이상의 최상위 비트를 나타내고,
상기 방법은 이용 가능한 비트 예산에 의존하여 상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트를 인코딩하는 단계(882; 898; 1010a-1010e, 1011a-1011e)를 포함하여,
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 인코딩되는 반면, 두 개 이상의 최상위 비트가 인코딩되고 상기 두 개의 이상의 최상위 비트 보다 많은 비를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 인코딩되지 않도록 하고,
상기 방법은 상기 스펙트럼 값을 나타내는 상기 인코딩된 정보를 사용하여 상기 인코딩된 오디오 정보를 제공하는 단계를 포함하는, 방법. - 입력 오디오 정보(310; 410; 510; 610)에 기초하여 인코딩된 오디오 정보(312; 412; 512; 612)를 방법에 있어서,
상기 방법은 상기 입력 오디오 정보의 오디오 컨텐츠를 나타내는 스펙트럼 값을 획득하는 단계(620,630,640,650,660)를 포함하고,
상기 방법은 스펙트럼 값을 나타내는 인코딩된 정보(350, 450, 550, 672; sym, lsbs[])를 얻기 위해 적어도 복수의 스펙트럼 값을 인코딩하는 단계(670; 800)를 포함하고;
상기 방법은 복수의 스펙트럼 값(Xq[0] ... Xq[lastnz-1])에 대해 각각의 심볼 코드를 얻기 위해 하나 이상의 최상위 비트를 인코딩하는 단계(882; 898; 1010a-1010e, 1011a-1011e), 및 상기 스펙트럼 값 중 하나 이상에 대한 하나 이상의 최하위 비트를 인코딩하는 단계를 포함하고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값(Xq[n], Xq[n+1])에 대한 하나 이상의 최상위 비트 값을 나타내고,
상기 방법은,
이용 가능한 비트 예산이 저 주파수 범위에서 스펙트럼 값의 인코딩으로 소진한 경우 고 주파수 범위의 넌제로 스펙트럼 값의 인코딩이 생략되고 하나 이상의 최상위 비트가 인코딩되고(848, 852, 856) 상기 최상위 비트 보다 더 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 인코딩(860)되는 제1 모드(840, 844, 848, 852, 856,860, 864, 868, 869) 및
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는(898) 반면, 하나 이상의 최상위 비트가 인코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 디코딩되지 않는 제2 모드(870, 874, 878, 882, 886, 890, 892, 894, 896, 898)
사이에서 선택하는 단계를 포함하고,
상기 방법은 상기 스펙트럼 값을 나타내는 상기 인코딩된 정보를 사용하여 상기 인코딩된 오디오 정보를 제공하는 단계를 포함하는, 방법. - 입력 오디오 정보(310; 410; 510; 610)에 기초하여 인코딩된 오디오 정보(312; 412; 512; 612)를 제공하는 방법에 있어서,
상기 방법은 상기 입력 오디오 정보의 오디오 콘텐츠를 나타내는 스펙트럼 값(330; 662; Xq[n])을 획득하는 단계(620, 630, 640, 650, 60)를 포함하고,
상기 방법은 상기 스펙트럼 값을 나타내는 인코딩된 정보(350, 450, 550, 672; sym, lsbs[])를 얻기 위해 적어도 복수의 스펙트럼 값을 인코딩하는 단계(670; 800);
상기 방법은 스펙트럼 값을 양자화하는 양자화 단계를 결정하고, 상기 양자화된 스펙트럼 값을 인코딩하기 위한 비트 요구를 결정하는 이득 정보를 획득하는 단계(810, 814, 818, 822);
상기 방법은 산술 인코딩을 사용하고, 복수의 스펙트럼 값(Xq[0] ... Xq[lastnz-1]에 대해 각각의 심볼 코드(sym)를 사용하여 하나 이상의 최상위 비트를 인코딩(878, 886, 890; 1000a, 1020a, 1040a-1040d)하는 단계, 및 하나 이상의 스펙트럼 값에 대해 하나 이상의 최하위 비트를 인코딩하는 단계를 포함하고,
각각의 심벌 코드(sym)는 하나 이상의 스펙트럼 값에 대해 스펙트럼 값 당 하나 이상의 최상위 비트를 나타내고,
상기 방법은 이용 가능한 비트 예산에 의존하여 상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트를 인코딩하는 단계(882; 898; 1010a-1010e, 1011a-1011e)를 포함하여,
하나 이상의 스펙트럼 값과 연관된 하나 이상의 최하위 비트가 인코딩되는 반면, 하나 이상의 최상위 비트가 인코딩되고 상기 하나 이상의 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해 최하위 비트가 인코딩되지 않도록 하고;
상기 방법은 상기 스펙트럼 값을 나타내는 상기 인코딩된 정보를 사용하여 상기 인코딩된 오디오 정보를 제공하는 단계를 포함하는, 인코더. - 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 제66항 내지 제70항 중 어느 한 항에 따른 상기 방법을 실행하기 위한 컴퓨터 프로그램.
- 인코딩된 오디오 표현으로서,
스펙트럼 값을 나타내는 인코딩된 정보(130; 230); 및
상기 인코더로부터의 시그널링에 응답하여 고 주파수 범위에서 스펙트럼 값의 디코딩이 생략되고 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 모든 스펙트럼 값에 대해 최하위 비트가 디코딩(934)되는 제1 모드(930, 934, 938, 942, 944, 948), 또는
상기 스펙트럼 값 중 하나 이상과 관련된 하나 이상의 최하위 비트가 디코딩되는 반면, 하나 이상의 최상위 비트가 디코딩되고 상기 최상위 비트 보다 많은 비트를 포함하는 하나 이상의 다른 스펙트럼 값에 대해서는 최하위 비트가 디코딩되지 않는 제1 모드(950, 954, 958, 962, 968, 972)
에서 오디오 디코더의 작동 여부를 나타내는 플래그
를 포함하는, 오디오 표현.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020207016504A KR102492558B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
KR1020207016503A KR102492557B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EPPCT/EP2017/078959 | 2017-11-10 | ||
PCT/EP2017/078959 WO2019091576A1 (en) | 2017-11-10 | 2017-11-10 | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
PCT/EP2018/080698 WO2019092155A1 (en) | 2017-11-10 | 2018-11-08 | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207016504A Division KR102492558B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
KR1020207016503A Division KR102492557B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200100053A true KR20200100053A (ko) | 2020-08-25 |
KR102492554B1 KR102492554B1 (ko) | 2023-01-30 |
Family
ID=60293975
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207016503A Active KR102492557B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
KR1020207016504A Active KR102492558B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
KR1020207016424A Active KR102492554B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207016503A Active KR102492557B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
KR1020207016504A Active KR102492558B1 (ko) | 2017-11-10 | 2018-11-08 | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
Country Status (18)
Country | Link |
---|---|
US (3) | US11386909B2 (ko) |
EP (3) | EP3707710B1 (ko) |
JP (3) | JP7104785B2 (ko) |
KR (3) | KR102492557B1 (ko) |
CN (3) | CN111933159B (ko) |
AR (1) | AR113482A1 (ko) |
AU (3) | AU2018365309B2 (ko) |
BR (3) | BR122020009462A2 (ko) |
CA (3) | CA3082282C (ko) |
ES (1) | ES2972210T3 (ko) |
MX (3) | MX2020004768A (ko) |
MY (2) | MY205309A (ko) |
PL (1) | PL3707710T3 (ko) |
RU (3) | RU2769218C2 (ko) |
SG (3) | SG11202004279TA (ko) |
TW (1) | TWI758556B (ko) |
WO (2) | WO2019091576A1 (ko) |
ZA (3) | ZA202003441B (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020253941A1 (en) * | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
CN112735446B (zh) * | 2020-12-30 | 2022-05-17 | 北京百瑞互联技术有限公司 | 在lc3音频码流中添加额外信息的方法、系统及介质 |
CN114913863B (zh) * | 2021-02-09 | 2024-10-18 | 同响科技股份有限公司 | 数字音信数据编码方法 |
CN112992166B (zh) * | 2021-05-08 | 2021-08-20 | 北京百瑞互联技术有限公司 | 一种动态调整lc3音频编码速率的方法、装置及存储介质 |
CN114550732B (zh) * | 2022-04-15 | 2022-07-08 | 腾讯科技(深圳)有限公司 | 一种高频音频信号的编解码方法和相关装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100324912A1 (en) * | 2009-06-19 | 2010-12-23 | Samsung Electronics Co., Ltd. | Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method |
US20110096830A1 (en) * | 2009-10-28 | 2011-04-28 | Motorola | Encoder that Optimizes Bit Allocation for Information Sub-Parts |
Family Cites Families (189)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
KR100322706B1 (ko) * | 1995-09-25 | 2002-06-20 | 윤종용 | 선형예측부호화계수의부호화및복호화방법 |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
WO1999016050A1 (en) | 1997-09-23 | 1999-04-01 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6992626B2 (en) * | 1999-03-05 | 2006-01-31 | Rannoch Corporation | Method and apparatus to correlate aircraft flight tracks and events with relevant airport operations information |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) * | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
AU2001270365A1 (en) | 2001-06-11 | 2002-12-23 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
DE10217297A1 (de) * | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4728568B2 (ja) * | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
US20040162866A1 (en) | 2003-02-19 | 2004-08-19 | Malvar Henrique S. | System and method for producing fast modulated complex lapped transforms |
KR100923301B1 (ko) * | 2003-03-22 | 2009-10-23 | 삼성전자주식회사 | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
WO2004112021A2 (en) | 2003-06-17 | 2004-12-23 | Matsushita Electric Industrial Co., Ltd. | Receiving apparatus, sending apparatus and transmission system |
CN100508030C (zh) | 2003-06-30 | 2009-07-01 | 皇家飞利浦电子股份有限公司 | 一种编码/解码音频信号的方法及相应设备 |
US7620545B2 (en) * | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
KR100550003B1 (ko) | 2003-07-11 | 2006-02-08 | 학교법인연세대학교 | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 |
AU2003302486A1 (en) * | 2003-09-15 | 2005-04-06 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) * | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
ES2324926T3 (es) | 2004-03-01 | 2009-08-19 | Dolby Laboratories Licensing Corporation | Descodificacion de audio multicanal. |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
US7272567B2 (en) | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
EP1866915B1 (en) | 2005-04-01 | 2010-12-15 | Qualcomm Incorporated | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
KR20070037945A (ko) * | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US20070118361A1 (en) | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2007070007A1 (en) | 2005-12-14 | 2007-06-21 | Matsushita Electric Industrial Co., Ltd. | A method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
CN101395661B (zh) | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
WO2007138511A1 (en) | 2006-05-30 | 2007-12-06 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
ATE496365T1 (de) | 2006-08-15 | 2011-02-15 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US7752038B2 (en) | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
JPWO2008072701A1 (ja) | 2006-12-13 | 2010-04-02 | パナソニック株式会社 | ポストフィルタおよびフィルタリング方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US10795949B2 (en) | 2007-07-26 | 2020-10-06 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
EP2183851A1 (fr) * | 2007-08-24 | 2010-05-12 | France Telecom | Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites |
ES2375192T3 (es) | 2007-08-27 | 2012-02-27 | Telefonaktiebolaget L M Ericsson (Publ) | Codificación por transformación mejorada de habla y señales de audio. |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
EP2207166B1 (en) | 2007-11-02 | 2013-06-19 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
US9659568B2 (en) | 2007-12-31 | 2017-05-23 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
WO2009150290A1 (en) | 2008-06-13 | 2009-12-17 | Nokia Corporation | Method and apparatus for error concealment of encoded audio data |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
ES2955669T3 (es) * | 2008-07-11 | 2023-12-05 | Fraunhofer Ges Forschung | Decodificador de audio, procedimiento para decodificar una señal de audio y programa de ordenador |
MX2011000369A (es) | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
TWI520128B (zh) | 2008-10-08 | 2016-02-01 | 弗勞恩霍夫爾協會 | 多解析度切換音訊編碼/解碼方案(一) |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
WO2010086373A2 (en) * | 2009-01-28 | 2010-08-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) * | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
MY163358A (en) * | 2009-10-08 | 2017-09-15 | Fraunhofer-Gesellschaft Zur Förderung Der Angenwandten Forschung E V | Multi-mode audio signal decoder,multi-mode audio signal encoder,methods and computer program using a linear-prediction-coding based noise shaping |
ES2797525T3 (es) | 2009-10-15 | 2020-12-02 | Voiceage Corp | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC |
CA2778368C (en) * | 2009-10-20 | 2016-01-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction |
BR112012009032B1 (pt) | 2009-10-20 | 2021-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento |
US7978101B2 (en) * | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
WO2011065741A2 (ko) | 2009-11-24 | 2011-06-03 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
AU2011206675C1 (en) * | 2010-01-12 | 2016-04-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
CA2929090C (en) | 2010-07-02 | 2017-03-14 | Dolby International Ab | Selective bass post filter |
MY179769A (en) * | 2010-07-20 | 2020-11-13 | Fraunhofer Ges Forschung | Audio encoder, audio decoder,method for encoding and audio information, method for decoding an audio information and computer program using an optimized hash table |
KR101676477B1 (ko) * | 2010-07-21 | 2016-11-15 | 삼성전자주식회사 | 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법 |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
BR112013020587B1 (pt) | 2011-02-14 | 2021-03-09 | Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. | esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
RU2571388C2 (ru) | 2011-03-18 | 2015-12-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Передача длины элемента кадра при кодировании аудио |
KR101863687B1 (ko) | 2011-04-21 | 2018-06-01 | 삼성전자주식회사 | 선형예측계수 양자화장치, 사운드 부호화장치, 선형예측계수 역양자화장치, 사운드 복호화장치와 전자기기 |
EP2707873B1 (en) | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
US9363339B2 (en) * | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
EP2673776B1 (en) | 2012-01-20 | 2015-06-17 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
KR101621287B1 (ko) | 2012-04-05 | 2016-05-16 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 다채널 오디오 신호 및 다채널 오디오 인코더를 위한 인코딩 파라미터를 결정하는 방법 |
US9305567B2 (en) | 2012-04-23 | 2016-04-05 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
TWI585748B (zh) | 2012-06-08 | 2017-06-01 | 三星電子股份有限公司 | 訊框錯誤隱藏方法以及音訊解碼方法 |
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
TWI553628B (zh) | 2012-09-24 | 2016-10-11 | 三星電子股份有限公司 | 訊框錯誤隱藏方法 |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9318116B2 (en) | 2012-12-14 | 2016-04-19 | Disney Enterprises, Inc. | Acoustic data transmission based on groups of audio receivers |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
RU2628144C2 (ru) | 2013-02-05 | 2017-08-15 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для управления маскировкой потери аудиокадров |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
KR101828186B1 (ko) | 2013-06-21 | 2018-02-09 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 개선된 펄스 재동기화를 사용하여 acelp-형 은폐 내에서 적응적 코드북의 개선된 은폐를 위한 장치 및 방법 |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
PL3058566T3 (pl) | 2013-10-18 | 2018-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie współczynników widmowych widma sygnału audio |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
BR122022008602B1 (pt) | 2013-10-31 | 2023-01-10 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de áudio e método para fornecer uma informação de áudio decodificada utilizando uma dissimulação de erro que modifica um sinal de excitação no domínio de tempo |
WO2015063227A1 (en) | 2013-10-31 | 2015-05-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
PL3069338T3 (pl) * | 2013-11-13 | 2019-06-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder do kodowania sygnału audio, system przesyłania audio i sposób określania wartości korekcji |
CN106233112B (zh) * | 2014-02-17 | 2019-06-28 | 三星电子株式会社 | 信号编码方法和设备以及信号解码方法和设备 |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
FI3751566T3 (fi) | 2014-04-17 | 2024-04-23 | Voiceage Evs Llc | Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä |
US9396733B2 (en) * | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (ko) | 2014-05-15 | 2018-06-09 | ||
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
PH12017500438B1 (en) | 2014-07-28 | 2022-06-01 | Samsung Electronics Co Ltd | Method and apparatus for packet loss concealment, and decoding method and apparatus employing same |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
PL3000110T3 (pl) | 2014-07-28 | 2017-05-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wybór jednego spośród pierwszego algorytmu kodowania i drugiego algorytmu kodowania z zastosowaniem redukcji harmonicznych |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10296959B1 (en) | 2015-03-30 | 2019-05-21 | Audible, Inc. | Automated recommendations of audio narrations |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) * | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017039422A2 (ko) | 2015-09-04 | 2017-03-09 | 삼성전자 주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 WO PCT/EP2017/078959 patent/WO2019091576A1/en active Application Filing
-
2018
- 2018-11-08 CN CN202010749863.4A patent/CN111933159B/zh active Active
- 2018-11-08 EP EP18796482.0A patent/EP3707710B1/en active Active
- 2018-11-08 MY MYPI2020002293A patent/MY205309A/en unknown
- 2018-11-08 MX MX2020004768A patent/MX2020004768A/es unknown
- 2018-11-08 TW TW107139705A patent/TWI758556B/zh active
- 2018-11-08 RU RU2020120256A patent/RU2769218C2/ru active
- 2018-11-08 SG SG11202004279TA patent/SG11202004279TA/en unknown
- 2018-11-08 BR BR122020009462-1A patent/BR122020009462A2/pt unknown
- 2018-11-08 SG SG11202004285TA patent/SG11202004285TA/en unknown
- 2018-11-08 CA CA3082282A patent/CA3082282C/en active Active
- 2018-11-08 CA CA3148999A patent/CA3148999C/en active Active
- 2018-11-08 ES ES18796482T patent/ES2972210T3/es active Active
- 2018-11-08 MX MX2020004770A patent/MX2020004770A/es unknown
- 2018-11-08 SG SG11202004287YA patent/SG11202004287YA/en unknown
- 2018-11-08 KR KR1020207016503A patent/KR102492557B1/ko active Active
- 2018-11-08 WO PCT/EP2018/080698 patent/WO2019092155A1/en active IP Right Grant
- 2018-11-08 EP EP23218359.0A patent/EP4336502A3/en active Pending
- 2018-11-08 MY MYPI2020002291A patent/MY205311A/en unknown
- 2018-11-08 KR KR1020207016504A patent/KR102492558B1/ko active Active
- 2018-11-08 BR BR122020009464-8A patent/BR122020009464A2/pt unknown
- 2018-11-08 BR BR112020009325-4A patent/BR112020009325A2/pt unknown
- 2018-11-08 CA CA3148963A patent/CA3148963A1/en active Pending
- 2018-11-08 JP JP2020526094A patent/JP7104785B2/ja active Active
- 2018-11-08 PL PL18796482.0T patent/PL3707710T3/pl unknown
- 2018-11-08 MX MX2020004772A patent/MX2020004772A/es unknown
- 2018-11-08 RU RU2020119054A patent/RU2767286C2/ru active
- 2018-11-08 RU RU2020120251A patent/RU2769255C2/ru active
- 2018-11-08 KR KR1020207016424A patent/KR102492554B1/ko active Active
- 2018-11-08 EP EP23218364.0A patent/EP4336503A3/en active Pending
- 2018-11-08 CN CN201880085999.0A patent/CN111656443B/zh active Active
- 2018-11-08 CN CN202010749865.3A patent/CN111933160B/zh active Active
- 2018-11-08 AU AU2018365309A patent/AU2018365309B2/en active Active
- 2018-11-09 AR ARP180103274A patent/AR113482A1/es active IP Right Grant
-
2020
- 2020-05-08 US US16/870,396 patent/US11386909B2/en active Active
- 2020-05-08 US US16/870,361 patent/US11380339B2/en active Active
- 2020-05-08 US US16/870,419 patent/US11315583B2/en active Active
- 2020-05-10 AU AU2020203075A patent/AU2020203075B2/en active Active
- 2020-05-10 AU AU2020203074A patent/AU2020203074B2/en active Active
- 2020-06-09 ZA ZA2020/03441A patent/ZA202003441B/en unknown
- 2020-07-08 ZA ZA2020/04583A patent/ZA202004583B/en unknown
- 2020-07-08 ZA ZA2020/04584A patent/ZA202004584B/en unknown
- 2020-07-10 JP JP2020118837A patent/JP7277065B2/ja active Active
- 2020-07-10 JP JP2020118838A patent/JP7104749B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100324912A1 (en) * | 2009-06-19 | 2010-12-23 | Samsung Electronics Co., Ltd. | Context-based arithmetic encoding apparatus and method and context-based arithmetic decoding apparatus and method |
KR20100136899A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
US20110096830A1 (en) * | 2009-10-28 | 2011-04-28 | Motorola | Encoder that Optimizes Bit Allocation for Information Sub-Parts |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102492554B1 (ko) | 최하위 비트의 인코딩 및 디코딩을 적용한 오디오 인코더, 오디오 디코더, 방법 및 컴퓨터 프로그램 | |
JP7005036B2 (ja) | 適応オーディオコーデックシステム、方法および媒体 | |
EP3186808B1 (en) | Audio parameter quantization | |
HK40030420A (en) | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits | |
HK40030420B (en) | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20200608 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200608 Comment text: Request for Examination of Application |
|
PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20200609 |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220209 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221024 |
|
PG1601 | Publication of registration |