KR20230110842A - 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 - Google Patents
양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 Download PDFInfo
- Publication number
- KR20230110842A KR20230110842A KR1020237024617A KR20237024617A KR20230110842A KR 20230110842 A KR20230110842 A KR 20230110842A KR 1020237024617 A KR1020237024617 A KR 1020237024617A KR 20237024617 A KR20237024617 A KR 20237024617A KR 20230110842 A KR20230110842 A KR 20230110842A
- Authority
- KR
- South Korea
- Prior art keywords
- parameter
- parameters
- quantized
- encoded
- elevation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
도 1a 는 제1 측면 또는 제2 측면의 인코더 측의 바람직한 실시예를 도시한다.
도 1b 는 제1 측면 또는 제2 측면의 디코드 측의 바람직한 실시예를 도시한다.
도 2a 는 제1 측면에 따른 인코딩을 위한 장치의 바람직한 실시예를 도시한다.
도 2b 는 도 2a의 파라미터 계산기의 바람직한 구현을 도시한다.
도 2c 는 확산 파라미터의 계산을 위한 추가 구현을 도시한다.
도 2d 는 도 2a의 파라미터 계산기(100)의 추가 바람직한 구현을 도시한다.
도 3a 는 높은 시간 또는 주파수 해상도를 갖는 분석 필터 뱅크(analysis filter bank)(도 1b의 430 또는 도 1a의 130)에 의해 획득된 것으로서 시간/주파수 표현을 도시한다.
도 3b 는 낮은 시간 또는 주파수 해상도 및, 특히, 프레임 당 단일 확산 파라미터의 특정 낮은 시간 해상도를 갖는 확산 그룹화(diffuseness grouping)의 구현을 도시한다.
도 3c 는 5개의 대역들 다른 한편으로는 4개의 시간 영역들 다른 한편으로는 결과적으로 20 시간/주파수 영역들을 갖는 방향 파라미터들에 대한 중간 해상도(medium resolution)의 바람직한 도시를 도시한다.
도 3d는 인코딩된 확산 파라미터 및 인코딩된 방향 파라미터를 갖는 출력 비트 스트림을 도시한다.
도 4a 는 제2 측면에 따라 방향성 오디오 코딩 파라미터들을 인코딩하기 위한 장치를 도시한다.
도 4b는 인코딩된 확산 파라미터들의 계산을 위한 파라미터 인코더 및 파라미터 양자화기의 바람직한 구현을 도시한다.
도 4c 는 상이한 요소들(elements)의 협력과 관련하여 도 4a 인코더의 바람직한 구현을 도시한다.
도 4d 는 바람직한 실시예에서 양자화를 위해 적용된 단위 구의 준 균일 커버리지(quasi-uniform coverage)를 도시한다.
도 5a 는 상이한 인코딩 모드들에서 동작하는 도 4a의 파라미터 인코더의 동작에 대한 개요를 도시한다.
도 5b 는 도 5a의 두 모드에 대한 방향 인덱스들의 전처리(pre-processing)를 도시한다.
도 5c 는 바람직한 실시예에서 제1 코딩 모드를 도시한다.
도 5d 는 제2 코딩 모드의 바람직한 실시예를 도시한다.
도 5e 는 GR 인코딩 절차를 사용하여 대응하는 평균들 및 부호 있는 거리들의 엔트로피 인코딩의 바람직한 구현을 도시한다.
도 5f 는 상기 최적 골롬-라이스 파라미터의 결정을 위한 바람직한 실시예를 도시한다.
도 5g는 도 5e의 블록(279)에 표시된 바와 같이 재정렬된 부호 있는 거리들의 인코딩을 위한 확장된 골롬-라이스 절차의 구현을 도시한다.
도 6a 는 도 4a의 상기 파라미터 양자화기의 구현을 도시한다.
도 6b 는 상기 인코더 측 구현에서 특정 측면에서 또한 사용되는 상기 파라미터 역 양자화기에 대한 기능들의 바람직한 구현을 도시한다.
도 6c 는 상기 로우 방향 인코딩 절차(raw direction encoding procedure)의 구현에 대한 개요를 도시한다.
도 6d 는 방위 및 고도에 대한 상기 평균 방향에 대한 역 양자화 및 양자화 및 상기 계산의 구현을 도시한다.
도 6e 는 상기 평균 고도 및 방위 데이터의 투영을 도시한다.
도 6f 는 고도 및 방위에 대한 상기 거리들의 계산을 도시한다.
도 6g 는 모델링 과정이 있는 상기 엔트로피 인코딩 모드에서 상기 평균 방향의 인코딩에 대한 개요를 도시한다.
도 7a 는 상기 제1 측면에 따른 인코딩된 오디오 신호를 디코딩 하기 위한 디코더를 도시한다.
도 7b 는 도 7a의 파라미터 해상도 변환기(parameter resolution converter) 및 후속 오디오 렌더링의 바람직한 구현을 도시한다.
도 8a 는 상기 제2 측면에 따른 인코딩된 오디오 신호를 디코딩하기 위한 디코더를 도시한다.
도 8b 는 일 실시예에서 상기 인코딩된 확산 파라미터들에 대한 개략적 비트 스트림 표현(schematic bitstream representation)을 도시한다.
도 8c 는 상기 로우 인코딩 모드가 선택된 경우의 상기 비트 스트림의 구현을 도시한다.
도 8d 는 상기 다른 인코딩 모드, 즉 모델링 과정이 있는 상기 엔트로피 인코딩 모드가 선택된 경우의 개략적 비트 스트림을 도시한다.
도 8e 는 상기 역 양자화 정확성이 시간/주파수 영역에 대한 상기 확산에 기초하여 정해지는 파라미터 양자화기(parameter quantizer) 및 상기 파라미터 디코더의 바람직한 구현을 도시한다.
도 8f 는 파라미터 역 양자화기 및 상기 파라미터 디코더의 바람직한 구현을 도시하고, 여기서 상기 고도 알파벳은 상기 역 양자화 정확성으로부터 결정되고 상기 방위 알파벳은 상기 시간/주파수 영역에 대한 상기 고도 데이터 및 상기 역 양자화 정확성에 기초하여 결정된다.
도 8g 는 상기 두 개의 상이한 디코딩 모드들을 도시하는 도 8a의 상기 파라미터 디코더에 대한 개요를 도시한다.
도 9a 는 상기 로우 인코딩 모드가 활성화된 경우 디코딩 동작을 도시한다.
도 9b 는 모델링 과정이 있는 상기 엔트로피 디코딩 모드가 활성화된 경우 상기 평균 방향의 디코딩을 도시한다.
도 9c 는 모델링 과정이 있는 상기 디코딩 모드가 활성화된 경우 상기 고도 및 방위의 재구성(reconstruction) 및 상기 후속 역 양자화를 도시한다.
도 10a는 잘 알려진 DirAC 분석기를 도시한다.
도 10b는 잘 알려진 DirAC 합성기를 도시한다.
Claims (33)
- 확산 파라미터들 및 방향 파라미터들을 포함하는 방향성 오디오 코딩 파라미터들을 인코딩하기 위한 장치에 있어서,
상기 방향 파라미터들 및 상기 확산 파라미터들을 양자화하기 위한 파라미터 양자화기(210);
양자화된 방향 파라미터들 및 양자화된 확산 파라미터들을 엔트로피 인코딩하기 위한 파라미터 인코더(220); 및
인코딩된 방향 파라미터들 및 인코딩된 확산 파라미터들에 대한 정보를 포함하는 인코딩된 파라미터 표현을 생성하기 위한 출력 인터페이스(230)
를 포함하는, 장치. - 제1항에 있어서,
상기 파라미터 양자화기(210)는,
확산 인덱스들(diffuseness indices)을 생산하기 위해 비 균일(non-uniform) 양자화기를 사용하여 상기 확산 파라미터들을 양자화하도록 구성된,
장치. - 제2항에 있어서,
상기 파라미터 양자화기(210)는,
상기 비 균일 양자화기의 재구성 레벨들(reconstruction levels) 및 임계치들을 획득하기 위해 채널 간 일관성 양자화 테이블(inter-channel coherence quantization table)을 사용하여 상기 비 균일 양자화기를 도출하도록 구성된,
장치. - 제1항에 있어서,
상기 파라미터 양자화기(210)는,
각각의 방향 파라미터에 대해, 두 개 또는 세 개의 구성요소들을 갖는 카테시안 벡터(Cartesian vector)를 수신하고,
상기 카테시안 벡터를 방위 각 및 고도 각을 갖는 표현으로 변환하도록 구성된,
장치. - 제4항에 있어서,
상기 파라미터 양자화기(210)는,
음의 값과 양의 값을 갖는 상기 고도 각(elevation angle)을 부호 없는 양자화 인덱스들(unsigned quantization indices)의 세트로 양자화하도록 구성되고,
양자화 인덱스들의 제1 그룹은,
음의 고도 각들을 나타내고,
양자화 인덱스들의 제2 그룹은,
양의 고도 각들을 나타내는,
장치. - 제1항에 있어서,
상기 양자화된 방향 파라미터는,
양자화된 고도 각 및 양자화된 방위 각을 갖고,
상기 파라미터 인코더(220)는,
상기 양자화된 고도 각을 먼저 인코딩하도록 구성되고, 그리고 나서 상기 양자화된 방위 각을 인코딩하도록 구성된,
장치. - 제1항에 있어서,
상기 양자화된 방향 파라미터들은,
방위 각과 고도 각들의 쌍에 대한 부호 없는 인덱스들(unsigned indices)을 포함하고,
상기 파라미터 인코더(220)는,
상기 부호 없는 인덱스들을 부호 있는 인덱스들(signed indices)로 변환하고, 이로써 영 각(zero angle)을 나타내는 인덱스는 가능한 값들의 부호 있는 간격의 중간에 위치되고,
상기 파라미터 인코더(220)는,
양수 및 음수를 부호 없는 수들로 인터리빙하기(interleave) 위해 상기 부호 있는 인덱스들로의 재정렬 변환(reordering transformation)을 수행하도록 구성된,
장치. - 제7항에 있어서,
상기 양자화된 방향 파라미터들은,
재정렬된 또는 비 재정렬된(non-reordered) 부호 없는 방위 및 고도 인덱스들(unsigned azimuth and elevation indices)를 포함하고,
상가 파라미터 인코더(220)는,
방위 인덱스 및 고도 인덱스의 쌍의 인덱스들을 구 인덱스(sphere index)로 병합하고,
상기 구 인덱스의 로우 코딩(raw coding)을 수행하도록 구성된,
장치. - 제8항에 있어서,
상기 파라미터 인코더(220)는,
현재 재정렬된 또는 비 재정렬된 방위 인덱스 및 구 오프셋(sphere offset)으로부터 상기 구 인덱스를 도출하도록 구성되고,
상기 구 오프셋은,
상기 현재 재정렬된 또는 비 재정렬된 고도 인덱스 보다 작은 재정렬된 또는 비 재정렬된 고도 인덱스들에 대응하는 방위 알파벳들(azimuth alphabets)의 합으로부터 도출되는,
장치. - 제1항에 있어서,
상기 파라미터 인코더(220)는,
임계치보다 낮거나 같은 확산 값들과 관련된 양자화된 방향 파라미터들에 대해 엔트로피 코딩(entropy coding)을 수행하고, 상기 임계치보다 큰 확산 값들과 관련된 양자화된 방향 파라미터들에 대해 로우 코딩을 수행하도록 구성된,
장치. - 제10항에 있어서,
상기 파라미터 인코더(220)는,
상기 확산 파라미터들의 상기 양자화 및 양자화 알파벳을 사용하여 동적으로 상기 임계치를 결정하거나, 또는 상기 파라미터 인코더(220)는 상기 확산 파라미터들의 상기 양자화 알파벳에 기초하여 상기 임계치를 결정하는,
장치. - 제1항에 있어서,
상기 파라미터 양자화기(210)는,
양자화된 방향 파라미터로서, 방위 인덱스들, 상기 방위 인덱스들과 관련된 방위 알파벳, 고도 인덱스들, 및 상기 고도 인덱스들과 관련된 고도 알파벳들을 결정하도록 구성되고,
상기 파라미터 인코더(220)는,
입력 신호의 주파수 부분 또는 시간 부분에 대한 양자화된 방향 벡터들로부터 평균 방향 벡터를 도출하고,
상기 주파수 부분 또는 상기 시간 부분에 대한 상기 벡터들의 최고의 각 정확성을 사용하여 상기 평균 방향 벡터를 양자화하고, 및
상기 양자화된 평균 방향 벡터를 인코딩하거나, 또는
상기 출력 인터페이스(230)은 추가적인 부가 정보로서 상기 인코딩된 파라미터 표현에 상기 인코딩된 평균 방향 벡터를 입력하도록 구성된,
장치. - 제12항에 있어서,
상기 파라미터 인코더(220)는,
상기 평균 방향 벡터를 사용하여 예측된 방위 인덱스들 및 예측된 고도 인덱스들을 계산하고,
상기 예측된 방위 인덱스들과 상기 방위 인덱스들 사이 및 상기 예측된 고도 인덱스들과 상기 고도 인덱스들 사이의 부호 있는 거리들(signed distances)을 계산하도록 구성된,
장치. - 제13항에 있어서,
상기 파라미터 인코더(220)는,
큰 값들에 대해서는 값을 빼고(subtract), 작은 값들에 대해서는 값을 더함으로써, 상기 부호 있는 거리들을 감소된 간격(reduced interval)으로 변환하도록 구성된,
장치. - 제1항에 있어서,
상기 파라미터 인코더(220)는,
상기 양자화된 방향 파라미터들이 엔트로피 코딩 모드 또는 로우 코딩 모드 중 하나에 의해 인코딩되었는지 여부를 결정하도록 구성되고,
상기 출력 인터페이스(230)는,
상기 인코딩된 파라미터 표현에 대응하는 표시(indication)를 제공(instroduce)하도록 구성된,
장치. - 제1항에 있어서,
상기 파라미터 인코더(220)는,
골롬-라이스 방법(Golomb-Rice method) 또는 골롬-라이스 방법의 변형(modification)을 사용하여 엔트로피 코딩을 수행하도록 구성된,
장치. - 제12항에 있어서,
상기 파라미터 인코더(220)는,
대응하는 영 값(zero value)이 가능한 값들의 부호 있는 간격의 중간에 있도록 상기 평균 방향 벡터의 구성요소들을 부호 있는 표현으로 변환하고,
양수와 음수를 부호 없는 수들로 인터리빙하기 위해 상기 부호 있는 값들의 재정렬 변환을 수행하고,
상기 평균 방향 벡터의 인코딩된 구성요소들을 획득하기 위해 인코딩 함수를 사용하여 결과를 인코딩하고,
상기 방향 벡터의 대응하는 구성요소에 대한 알파벳 크기들의 최대에 따른 알파벳 크기를 사용하여 골롬-라이스 파라미터를 인코딩하도록 구성된,
장치. - 제13항에 있어서,
상기 파라미터 인코더(220)는,
양수 및 음수를 부호 없는 수들에 인터리빙 하기 위해 상기 부호 있는 거리들 또는 감소된 부호 있는 거리들의 재정렬 변환을 수행하도록 구성되고,
상기 파라미터 인코더(220)는,
골롬-라이스 방법 또는 골롬-라이스 방법의 변형을 사용하여 상기 재정렬된 부호 있는 거리들 또는 재정렬된 감소된 부호 있는 거리들을 인코딩하도록 구성된,
장치. - 제18항에 있어서,
상기 파라미터 인코더(220)는,
코딩될 값의 최하위 부분과 최상위 부분을 결정하는 것,
상기 최상위 부분에 대한 알파벳을 계산하는 것,
상기 최하위 부분에 대한 알파벳을 계산하는 것, 및
상기 최상위 부분에 대한 상기 알파벳을 사용하여 1진법(unary)으로 최상위 부분(most significant part)을 인코딩하고 최하위 부분(least significant part)에 대한 상기 알파벳을 사용하여 2진법으로 상기 최하위 부분을 인코딩하는 것
을 사용하여 골롬-라이스 방법 또는 골롬-라이스 방법의 변형을 적용하도록 구성된,
장치. - 제1항에 있어서,
상기 파라미터 인코더(220)는,
코딩될 값의 최상위 부분과 최하위 부분을 결정하고, 상기 최상위 부분에 대한 인코딩 알파벳을 계산하여, 골롬-라이스 방법 또는 골롬-라이스 방법의 변형을 적용하도록 구성되고,
상가 최상위 부분의 상기 인코딩 알파벳이, 예를 들어 3과 같이, 미리 결정된 값 이하인 경우, 상기 최상위 부분과 상기 최하위 부분을 인코딩 하기 위해 인코드쿼시유니폼 방법(EncodeQuasiUniform method)이 사용되고, 펑쳐드 코드(punctured code)와 같이, 예시적인 인코드쿼시유니폼 방법은, 두 개의 길이만을 갖는 코드들 또는 하나의 길이만의 코드들을 생산하거나, 또는
상기 인코딩 알파벳이 2의 거듭제곱의 크기를 갖는 경우 2진 코드를 사용하여 로우 코딩 모드에서 상기 최하위 부분을 인코딩하거나, 또는
상기 인코딩 알파벳이 2의 거듭제곱과 다른 경우 펑쳐드 코드를 사용하여 상기 로우 코딩 모드에서 상기 최하위 부분을 인코딩하도록 구성된,
장치. - 제1항에 있어서,
제1 시간 또는 주파수 해상도(first time or frequency resolution)로 상기 확산 파라미터들을 계산하고, 제2 시간 또는 주파수 해상도(second time or frequency resolu)로 상기 방향 파라미터들을 계산하기 위한 파라미터 계산기
를 더 포함하는, 장치. - 확산 파라미터들 및 방향 파라미터들을 포함하는 방향성 오디오 코딩 파라미터들을 인코딩하는 방법에 있어서,
상기 확산 파라미터들 및 상기 방향 파라미터들을 양자화하는 단계;
양자화된 확산 파라미터들 및 양자화된 방향 파라미터들을 엔트로피 인코딩하는 단계; 및
인코딩된 확산 파라미터들 및 인코딩된 방향 파라미터들에 대한 정보를 포함하는 인코딩된 파라미터 표현을 생성하는 단계
를 포함하는, 방법. - 인코딩된 확산 파라미터들 및 인코딩된 방향 파라미터들을 포함하는 인코딩된 방향성 오디오 코딩 파라미터들을 포함하는 인코딩된 오디오 신호를 디코딩하기 위한 디코더에 있어서,
상기 인코딩된 오디오 신호를 수신하고 상기 인코딩된 오디오 신호로부터 상기 인코딩된 확산 파라미터들 및 상기 인코딩된 방향 파라미터를 분리하기 위한 입력 인터페이스(800);
양자화된 확산 파라미터들 및 양자화된 방향 파라미터들을 획득하기 위해 상기 인코딩된 확산 파라미터들 및 상기 인코딩된 방향 파라미터들을 엔트로피 디코딩하기 위한 파라미터 디코더(820); 및
상기 양자화된 확산 파라미터들 및 상기 양자화된 방향 파라미터들로부터 역 양자화된(dequantized) 확산 파라미터들 및 역 양자화된 방향 파라미터들을 결정하기 위한 파라미터 역 양자화기(840)
를 포함하는, 디코더. - 제23항에 있어서,
상기 입력 인터페이스(800)는,
상기 인코딩된 오디오 신호에 포함된 코딩 모드 표시(coding mode indication)(806)로부터, 상기 파라미터 디코더(820)가 상기 인코딩된 방향 파라미터들을 디코딩하기 위해 로우 디코딩 모드(raw decoding mode)인 제1 디코딩 모드를 사용할지 또는 상기 제1 디코딩 모드와 다르고 모델링 과정이 있는 디코딩 모드(decoding mode with modeling)인 제2 디코딩 모드를 사용할지 여부를 결정하도록 구성된,
디코더. - 제23항에 있어서,
상기 파라미터 디코더(820)는,
상기 인코딩된 방향 파라미터로부터 양자화된 구 인덱스(quantized sphere index)를 도출하고, 상기 양자화된 구 인덱스를 양자화된 고도 인덱스 및 상기 양자화된 방위 인덱스로 분해(decompose)하도록 구성된,
디코더. - 제23항에 있어서,
상기 파라미터 디코더(820)는,
역 양자화 정확성(dequantization precision)으로부터, 고도 알파벳(elevation alphabet)을 결정하거나, 또는
양자화된 고도 파라미터(quantized elevation parameter) 또는 역 양자화된 고도 파라미터(dequantized elevation parameter)로부터, 방위 알파벳(azimuth alphabet)을 결정하도록 구성된,
디코더. - 제23항에 있어서,
상기 파라미터 디코더(820)는,
상기 인코딩된 방향 파라미터들로부터, 양자화된 고도 파라미터를 디코딩 하고, 상기 인코딩된 방향 파라미터들로부터, 양자화된 방위 파라미터를 디코딩 하도록 구성되고,
상기 파라미터 역 양자화기(840)는,
상기 양자화된 고도 파라미터 또는 역 양자화된 고도 파라미터로부터, 방위 알파벳을 결정하도록 구성되고,
상기 방위 알파벳의 크기는,
제2 절대 고도 각(absolute elevation angle)의 고도를 나타내는 고도 데이터와 비교하여, 제1 절대 고도 각의 고도를 나타내는 고도 데이터에 대해 더 크고,
상기 제2 절대 고도 각은,
상기 제1 절대 고도 각보다 크고,
상기 파라미터 디코더(820)는, 양자화된 방위 파라미터를 생성하기 위해 상기 방위 알파벳을 사용하도록 구성되거나, 또는
상기 파라미터 역 양자화기는, 상기 양자화된 방위 파라미터를 역 양자화하기 위해 상기 방위 알파벳을 사용하도록 구성되는,
디코더. - 제23항에 있어서,
상기 파라미터 디코더(820)는,
양자화된 고도 파라미터를 획득하기 위해 인코딩된 방향 파라미터를 디코딩하도록 구성되고,
상기 파라미터 역 양자화기(840)는,
상기 양자화된 고도 파라미터 또는 역 양자화된 고도 파라미터로부터 방위 알파벳을 결정(852c)하도록 구성되고,
상기 파라미터 디코더(820)는,
상기 방위 알파벳을 사용하여 양자화된 방위 파라미터를 계산(852d)하도록 구성되거나, 또는 상기 파라미터 역 양자화기(840)는 상기 방위 알파벳을 사용하여 상기 양자화된 방위 파라미터를 역 양자화하도록 구성되는,
디코더. - 제23항에 있어서,
상기 파라미터 역 양자화기(840)는,
역 양자화 정확성을 사용하여 고도 알파벳을 결정(852a)하고,
상기 고도 알파벳을 사용하여 생성된 상기 양자화된 또는 역 양자화된 고도 파라미터 및 상기 역 양자화 정확성을 사용하여 방위 알파벳을 결정(852c)하도록 구성되고,
상기 파라미터 디코더(820)는,
양자화된 고도 파라미터를 획득하도록 상기 인코딩된 방향 파라미터를 디코딩하기 위해 상기 고도 알파벳을 사용하고, 양자화된 방위 파라미터를 획득하도록 상기 인코딩된 방향 파라미터를 디코딩하기 위해 상기 방위 알파벳을 사용하도록 구성되거나, 또는
상기 파라미터 역 양자화기(840)는,
상기 고도 알파벳을 사용하여 상기 양자화된 고도 파라미터를 역 양자화하고 상기 방위 알파벳을 사용하여 상기 양자화된 방위 파라미터를 역 양자화하도록 구성된,
디코더. - 제23항에 있어서,
상기 역 양자화된 확산 파라미터의 시간/주파수 해상도 또는 상기 역 양자화된 방위 또는 고도 파라미터의 시간 또는 주파수 해상도 또는 상기 역 양자화된 방위 파라미터 또는 역 양자화된 고도 파라미터로부터 도출된 파라미터의 표현(parametric representation)을 목표 시간 또는 주파수 해상도로 변환하기 위한 파라미터 해상도 변환기(parameter resolution converter)(710), 및
디코딩된 멀티 채널 오디오 신호(decoded multi-channel audio signal)를 획득하기 위해 상기 목표 시간 또는 주파수 해상도의 상기 방향 파라미터들 및 상기 확산 파라미터들을 오디오 신호에 적용하기 위한 오디오 렌더러(audio renderer)(420)
를 더 포함하는, 디코더. - 제30항에 있어서,
상기 멀티 채널 오디오 신호를 스펙트럼 도메인 표현(spectral domain representation)으로부터 상기 목표 시간 또는 주파수 해상도(target time or frequency resolution)의 상기 시간 해상도 보다 더 높은 시간 해상도를 갖는 시간 도메인 표현으로 변환하기 위한 스펙트럼/시간 변환기(spectrum/time converter)(440)
를 포함하는, 디코더. - 인코딩된 확산 파라미터들 및 인코딩된 방향 파라미터들을 포함하는 인코딩된 방향성 오디오 코딩 파라미터들을 포함하는 인코딩된 오디오 신호를 디코딩하기 위한 방법에 있어서,
상기 인코딩된 오디오 신호를 수신하고 상기 인코딩된 오디오 신호로부터 상기 인코딩된 확산 파라미터들 및 상기 인코딩된 방향 파라미터를 분리하는 단계(800);
양자화된 확산 파라미터들 및 양자화된 방향 파라미터들을 획득하기 위해 상기 인코딩된 확산 파라미터들 및 상기 인코딩된 방향 파라미터들을 엔트로피 디코딩하는 단계(820); 및
상기 양자화된 확산 파라미터들 및 상기 양자화된 방향 파라미터들로부터 역 양자화된(dequantized) 확산 파라미터들 및 역 양자화된 방향 파라미터들을 결정하는 단계(840)
를 포함하는, 방법. - 저장 매체에 있어서,
컴퓨터 또는 프로세서 상에서 실행될 때, 제22항 또는 제32항의 방법을 수행하기 위한 컴퓨터 프로그램을 저장한,
저장 매체.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17202393.9 | 2017-11-17 | ||
EP17202393 | 2017-11-17 | ||
PCT/EP2018/081623 WO2019097018A1 (en) | 2017-11-17 | 2018-11-16 | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
KR1020207017247A KR102599743B1 (ko) | 2017-11-17 | 2018-11-16 | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207017247A Division KR102599743B1 (ko) | 2017-11-17 | 2018-11-16 | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230110842A true KR20230110842A (ko) | 2023-07-25 |
Family
ID=60515115
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237024617A Ceased KR20230110842A (ko) | 2017-11-17 | 2018-11-16 | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 |
KR1020207017280A Active KR102535997B1 (ko) | 2017-11-17 | 2018-11-16 | 상이한 시간/주파수 해상도를 사용하여 지향성 오디오 코딩 파라미터를 인코딩 또는 디코딩 하기 위한 장치 및 방법 |
KR1020207017247A Active KR102599743B1 (ko) | 2017-11-17 | 2018-11-16 | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207017280A Active KR102535997B1 (ko) | 2017-11-17 | 2018-11-16 | 상이한 시간/주파수 해상도를 사용하여 지향성 오디오 코딩 파라미터를 인코딩 또는 디코딩 하기 위한 장치 및 방법 |
KR1020207017247A Active KR102599743B1 (ko) | 2017-11-17 | 2018-11-16 | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 |
Country Status (19)
Country | Link |
---|---|
US (6) | US11367454B2 (ko) |
EP (3) | EP3711048A1 (ko) |
JP (5) | JP7175979B2 (ko) |
KR (3) | KR20230110842A (ko) |
CN (4) | CN111656442B (ko) |
AR (2) | AR113525A1 (ko) |
AU (2) | AU2018368588B2 (ko) |
BR (2) | BR112020011026A2 (ko) |
CA (2) | CA3084225C (ko) |
ES (1) | ES2930374T3 (ko) |
FI (1) | FI3711047T3 (ko) |
MX (2) | MX2020005045A (ko) |
PL (1) | PL3711047T3 (ko) |
PT (1) | PT3711047T (ko) |
RU (2) | RU2763313C2 (ko) |
SG (2) | SG11202004389VA (ko) |
TW (3) | TWI759240B (ko) |
WO (2) | WO2019097017A1 (ko) |
ZA (2) | ZA202003473B (ko) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7175979B2 (ja) | 2017-11-17 | 2022-11-21 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 様々な時間/周波数分解能を使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
GB2572761A (en) * | 2018-04-09 | 2019-10-16 | Nokia Technologies Oy | Quantization of spatial audio parameters |
GB2575305A (en) * | 2018-07-05 | 2020-01-08 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
EP4462821A3 (en) | 2018-11-13 | 2024-12-25 | Dolby Laboratories Licensing Corporation | Representing spatial audio by means of an audio signal and associated metadata |
ES2974219T3 (es) | 2018-11-13 | 2024-06-26 | Dolby Laboratories Licensing Corp | Procesamiento de audio en servicios de audio inversivos |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
CN116978387A (zh) | 2019-07-02 | 2023-10-31 | 杜比国际公司 | 用于离散指向性数据的表示、编码和解码的方法、设备和系统 |
GB2586214A (en) * | 2019-07-31 | 2021-02-17 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2586586A (en) | 2019-08-16 | 2021-03-03 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2586461A (en) | 2019-08-16 | 2021-02-24 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
CN110660401B (zh) * | 2019-09-02 | 2021-09-24 | 武汉大学 | 一种基于高低频域分辨率切换的音频对象编解码方法 |
GB2587196A (en) * | 2019-09-13 | 2021-03-24 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
TWI861148B (zh) * | 2019-09-25 | 2024-11-11 | 美商松下電器(美國)知識產權公司 | 編碼裝置、解碼裝置、編碼方法、及解碼方法 |
GB2587614A (en) * | 2019-09-26 | 2021-04-07 | Nokia Technologies Oy | Audio encoding and audio decoding |
AU2020376851A1 (en) | 2019-10-30 | 2022-05-05 | Dolby Laboratories Licensing Corporation | Multichannel audio encode and decode using directional metadata |
GB2590650A (en) | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | The merging of spatial audio parameters |
GB2590651A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | Combining of spatial audio parameters |
GB2590913A (en) | 2019-12-31 | 2021-07-14 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2592896A (en) * | 2020-01-13 | 2021-09-15 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2595883A (en) * | 2020-06-09 | 2021-12-15 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2595871A (en) * | 2020-06-09 | 2021-12-15 | Nokia Technologies Oy | The reduction of spatial audio parameters |
KR20220012724A (ko) | 2020-07-23 | 2022-02-04 | 효성티앤에스 주식회사 | 매체 입금기의 번들모듈 |
GB2598104A (en) * | 2020-08-17 | 2022-02-23 | Nokia Technologies Oy | Discontinuous transmission operation for spatial audio parameters |
GB2598773A (en) * | 2020-09-14 | 2022-03-16 | Nokia Technologies Oy | Quantizing spatial audio parameters |
GB202014572D0 (en) * | 2020-09-16 | 2020-10-28 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
US20230377587A1 (en) * | 2020-10-05 | 2023-11-23 | Nokia Technologies Oy | Quantisation of audio parameters |
AU2021359777B2 (en) * | 2020-10-13 | 2024-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding a plurality of audio objects using direction information during a downmixing or apparatus and method for decoding using an optimized covariance synthesis |
EP4229631A2 (en) * | 2020-10-13 | 2023-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects |
WO2022129672A1 (en) * | 2020-12-15 | 2022-06-23 | Nokia Technologies Oy | Quantizing spatial audio parameters |
WO2022152960A1 (en) * | 2021-01-18 | 2022-07-21 | Nokia Technologies Oy | Transforming spatial audio parameters |
CN117278930A (zh) * | 2021-03-05 | 2023-12-22 | 华为技术有限公司 | Hoa系数的获取方法和装置 |
US20240185869A1 (en) * | 2021-03-22 | 2024-06-06 | Nokia Technologies Oy | Combining spatial audio streams |
WO2022223133A1 (en) * | 2021-04-23 | 2022-10-27 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
KR20240025550A (ko) * | 2021-05-27 | 2024-02-27 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 오디오 지향성 코딩 |
WO2023147864A1 (en) | 2022-02-03 | 2023-08-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method to transform an audio stream |
FR3132811A1 (fr) * | 2022-02-14 | 2023-08-18 | Orange | Codage et décodage de coordonnées sphériques utilisant un dictionnaire de quantification sphérique optimisé |
KR20240165992A (ko) * | 2022-03-22 | 2024-11-25 | 노키아 테크놀로지스 오와이 | 파라미터 공간 오디오 인코딩 |
WO2024208420A1 (en) | 2023-04-05 | 2024-10-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor, audio processing system, audio decoder, method for providing a processed audio signal representation and computer program using a time scale modification |
EP4475122A1 (en) * | 2023-06-06 | 2024-12-11 | Nokia Technologies Oy | Adapting spatial audio parameters for jitter buffer management |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
FR2810476B1 (fr) | 2000-06-14 | 2002-10-11 | De Palluel Darcel Vince Crette | Balises multifonctions d'emissions/reception et/ou de reemissions, des signaux codes ou non par emetteurs recepteurs d'ondes avec capteurs realises en technologie mikrotelec |
JP4396233B2 (ja) | 2003-11-13 | 2010-01-13 | パナソニック株式会社 | 複素指数変調フィルタバンクの信号分析方法、信号合成方法、そのプログラム及びその記録媒体 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2006003580A (ja) * | 2004-06-17 | 2006-01-05 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置及びオーディオ信号符号化方法 |
ATE378675T1 (de) * | 2005-04-19 | 2007-11-15 | Coding Tech Ab | Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter |
JP4640020B2 (ja) | 2005-07-29 | 2011-03-02 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
US7974713B2 (en) | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
MY144273A (en) * | 2006-10-16 | 2011-08-29 | Fraunhofer Ges Forschung | Apparatus and method for multi-chennel parameter transformation |
US8290167B2 (en) * | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
EP2077550B8 (en) | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
US8897359B2 (en) * | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
CN102138176B (zh) * | 2008-07-11 | 2013-11-06 | 日本电气株式会社 | 信号分析装置、信号控制装置及其方法 |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
WO2011000409A1 (en) * | 2009-06-30 | 2011-01-06 | Nokia Corporation | Positional disambiguation in spatial audio |
EP2346028A1 (en) * | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
US8897455B2 (en) | 2010-02-18 | 2014-11-25 | Qualcomm Incorporated | Microphone array subset selection for robust noise reduction |
WO2011104418A1 (en) * | 2010-02-26 | 2011-09-01 | Nokia Corporation | Modifying spatial image of a plurality of audio signals |
ES2656815T3 (es) | 2010-03-29 | 2018-02-28 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung | Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica |
JP2014506416A (ja) * | 2010-12-22 | 2014-03-13 | ジェノーディオ,インコーポレーテッド | オーディオ空間化および環境シミュレーション |
TWI573131B (zh) * | 2011-03-16 | 2017-03-01 | Dts股份有限公司 | 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器 |
CN102760437B (zh) * | 2011-04-29 | 2014-03-12 | 上海交通大学 | 实时声道控制转换的音频解码装置 |
JP2015509212A (ja) * | 2012-01-19 | 2015-03-26 | コーニンクレッカ フィリップス エヌ ヴェ | 空間オーディオ・レンダリング及び符号化 |
PL2965540T3 (pl) * | 2013-03-05 | 2019-11-29 | Fraunhofer Ges Forschung | Urządzenie i sposób wielokanałowego rozkładu na sygnał bezpośredni i sygnał otoczenia dla przetwarzania sygnału audio |
US9384741B2 (en) * | 2013-05-29 | 2016-07-05 | Qualcomm Incorporated | Binauralization of rotated higher order ambisonics |
US9466305B2 (en) * | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9854377B2 (en) * | 2013-05-29 | 2017-12-26 | Qualcomm Incorporated | Interpolation for decomposed representations of a sound field |
TWI615834B (zh) | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
US20150332682A1 (en) * | 2014-05-16 | 2015-11-19 | Qualcomm Incorporated | Spatial relation coding for higher order ambisonic coefficients |
CN106023999B (zh) * | 2016-07-11 | 2019-06-11 | 武汉大学 | 用于提高三维音频空间参数压缩率的编解码方法及系统 |
GB2554446A (en) * | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
US10483913B2 (en) | 2017-07-13 | 2019-11-19 | Qualcomm Incorporated | Low power crystal oscillator |
CN109274969B (zh) * | 2017-07-17 | 2020-12-22 | 华为技术有限公司 | 色度预测的方法和设备 |
JP7175979B2 (ja) * | 2017-11-17 | 2022-11-21 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 様々な時間/周波数分解能を使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
GB2577698A (en) | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
-
2018
- 2018-11-16 JP JP2020526987A patent/JP7175979B2/ja active Active
- 2018-11-16 CA CA3084225A patent/CA3084225C/en active Active
- 2018-11-16 CN CN201880086690.3A patent/CN111656442B/zh active Active
- 2018-11-16 BR BR112020011026-4A patent/BR112020011026A2/pt unknown
- 2018-11-16 CN CN202311255126.9A patent/CN117351970A/zh active Pending
- 2018-11-16 RU RU2020119761A patent/RU2763313C2/ru active
- 2018-11-16 SG SG11202004389VA patent/SG11202004389VA/en unknown
- 2018-11-16 WO PCT/EP2018/081620 patent/WO2019097017A1/en active Search and Examination
- 2018-11-16 EP EP18803987.9A patent/EP3711048A1/en active Pending
- 2018-11-16 KR KR1020237024617A patent/KR20230110842A/ko not_active Ceased
- 2018-11-16 MX MX2020005045A patent/MX2020005045A/es unknown
- 2018-11-16 MX MX2020005044A patent/MX2020005044A/es unknown
- 2018-11-16 KR KR1020207017280A patent/KR102535997B1/ko active Active
- 2018-11-16 PT PT188039853T patent/PT3711047T/pt unknown
- 2018-11-16 SG SG11202004430YA patent/SG11202004430YA/en unknown
- 2018-11-16 JP JP2020526994A patent/JP7175980B2/ja active Active
- 2018-11-16 RU RU2020119762A patent/RU2763155C2/ru active
- 2018-11-16 CN CN202410748798.1A patent/CN118609580A/zh active Pending
- 2018-11-16 CA CA3083891A patent/CA3083891C/en active Active
- 2018-11-16 WO PCT/EP2018/081623 patent/WO2019097018A1/en not_active Application Discontinuation
- 2018-11-16 FI FIEP18803985.3T patent/FI3711047T3/fi active
- 2018-11-16 CN CN201880086689.0A patent/CN111656441B/zh active Active
- 2018-11-16 AU AU2018368588A patent/AU2018368588B2/en active Active
- 2018-11-16 KR KR1020207017247A patent/KR102599743B1/ko active Active
- 2018-11-16 EP EP18803985.3A patent/EP3711047B1/en active Active
- 2018-11-16 PL PL18803985.3T patent/PL3711047T3/pl unknown
- 2018-11-16 ES ES18803985T patent/ES2930374T3/es active Active
- 2018-11-16 BR BR112020011035-3A patent/BR112020011035A2/pt unknown
- 2018-11-16 EP EP22192222.2A patent/EP4113512A1/en active Pending
- 2018-11-16 AU AU2018368589A patent/AU2018368589B2/en active Active
- 2018-11-19 TW TW110129069A patent/TWI759240B/zh active
- 2018-11-19 TW TW107141079A patent/TWI708241B/zh active
- 2018-11-19 TW TW107141081A patent/TWI752281B/zh active
- 2018-11-20 AR ARP180103392A patent/AR113525A1/es active IP Right Grant
- 2018-11-20 AR ARP180103391A patent/AR113524A1/es active IP Right Grant
-
2020
- 2020-05-06 US US16/867,856 patent/US11367454B2/en active Active
- 2020-05-11 US US16/871,223 patent/US11783843B2/en active Active
- 2020-06-10 ZA ZA2020/03473A patent/ZA202003473B/en unknown
- 2020-06-10 ZA ZA2020/03476A patent/ZA202003476B/en unknown
-
2022
- 2022-01-10 US US17/571,970 patent/US12106763B2/en active Active
- 2022-01-12 JP JP2022003012A patent/JP7372360B2/ja active Active
- 2022-08-24 JP JP2022133236A patent/JP2022171686A/ja active Pending
-
2023
- 2023-08-28 US US18/456,670 patent/US12112762B2/en active Active
- 2023-10-18 JP JP2023179870A patent/JP2024003010A/ja active Pending
-
2024
- 2024-04-24 US US18/644,449 patent/US20240274139A1/en active Pending
- 2024-09-03 US US18/823,006 patent/US20240428806A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102599743B1 (ko) | 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법 | |
HK40036674B (en) | Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions | |
HK40036674A (en) | Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
PA0104 | Divisional application for international application |
Comment text: Divisional Application for International Patent Patent event code: PA01041R01D Patent event date: 20230718 Application number text: 1020207017247 Filing date: 20200616 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20240304 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20250318 Comment text: Decision to Refuse Application Patent event code: PE06012S01D |