KR101764726B1 - 다중 중첩 부분을 이용하여 인코딩된 신호를 생성하거나 인코딩된 오디오 신호를 디코딩하는 장치 및 방법 - Google Patents
다중 중첩 부분을 이용하여 인코딩된 신호를 생성하거나 인코딩된 오디오 신호를 디코딩하는 장치 및 방법 Download PDFInfo
- Publication number
- KR101764726B1 KR101764726B1 KR1020157025743A KR20157025743A KR101764726B1 KR 101764726 B1 KR101764726 B1 KR 101764726B1 KR 1020157025743 A KR1020157025743 A KR 1020157025743A KR 20157025743 A KR20157025743 A KR 20157025743A KR 101764726 B1 KR101764726 B1 KR 101764726B1
- Authority
- KR
- South Korea
- Prior art keywords
- window
- frame
- window function
- block
- overlap
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000005236 sound signal Effects 0.000 title description 18
- 230000006870 function Effects 0.000 claims abstract description 234
- 230000003595 spectral effect Effects 0.000 claims abstract description 86
- 230000009466 transformation Effects 0.000 claims abstract description 29
- 230000001052 transient effect Effects 0.000 claims description 171
- 238000012545 processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002829 reductive effect Effects 0.000 claims description 12
- 238000012805 post-processing Methods 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 5
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 238000006243 chemical reaction Methods 0.000 description 50
- 238000001514 detection method Methods 0.000 description 16
- 230000000750 progressive effect Effects 0.000 description 13
- 238000007792 addition Methods 0.000 description 11
- 230000007704 transition Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 6
- 238000000844 transformation Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000007493 shaping process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000269435 Rana <genus> Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3044—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
도 1a는 중첩 스위칭 양태의 컨텍스트에서의 인코딩 장치를 나타내는 도면.
도 1b는 중첩 스위칭의 양태에 대한 디코딩 장치를 나타내는 도면.
도 2a는 인접하는 윈도우 사이의 전체 중첩(full overlap)을 갖는 윈도우 시퀀스를 나타내는 도면.
도 2b는 2개의 인접하는 윈도우 사이의 절반 중첩(half overlap)을 갖는 윈도우 시퀀스를 나타내는 도면.
도 2c는 인접하는 윈도우 사이의 1/4 중첩 및 인접하는 윈도우 사이의 절반 중첩 및 인접하는 윈도우 사이의 후속 전체 중첩을 갖는 윈도우 시퀀스를 나타내는 도면.
도 3a 및 3c는 TCX 20에서 20ms 변환 길이를 갖는 실시예에 대하여 상이한 과도 위치에 대한 상이한 중첩 폭을 나타내는 도면.
도 4a 내지 4g는 과도 위치에 의존하는 TCX 10 등의 10ms 변환 길이에 대한 변환 중첩 길이의 선택을 나타내는 도면.
도 5a 내지 5c는 중첩 폭의 인코딩을 나타내는 도면.
도 6a는 과도 위치에 기초한 중첩 폭 및 변환 길이의 코딩을 나타내는 도면.
도 6b는 변환 길이 결정 표를 나타내는 도면.
도 7은 이전 및 현재의 중첩 코드에 의존하는 상이한 윈도우 시퀀스를 나타내는 도면.
도 8a는 본 발명의 실시예에서의 다중 중첩 부분의 컨텍스트에서의 인코더를 나타내는 도면.
도 8d는 본 발명의 실시예에서의 다중 중첩 부분의 양태에 대한 디코더를 나타내는 도면.
도 9a는 인코더 측을 나타내는 바람직한 실시예에 따른 절차를 나타내는 도면.
도 9b는 인코더 측에 대하여 수행되는 바람직한 절차의 플로우챠트.
도 10a는 디코더 측에 대하여 수행되는 절차의 추가의 실시예를 나타내는 도면.
도 11a는 실시예의 인코더 측에 대하여 수행되는 동작을 나타내는 도면.
도 11b는 본 발명의 실시예에서의 디코더에 의해 수행되는 동작을 나타내는 도면.
도 12a 및 도 12b는 본 발명의 다중 중첩 양태의 컨텍스트에서 인코더/디코더 측에 대하여 수행될 절차의 추가의 실시예를 나타내는 도면.
도 13은 다중 중첩 부분을 갖는 상이한 윈도우 시퀀스를 나타내는 도면.
도 14a는 과도 위치에 의존하는 스위칭된 변환 길이를 갖는 윈도우 시퀀스를 나타내는 도면.
도 14b는 다중 중첩 부분을 갖는 추가의 윈도우 시퀀스를 나타내는 도면.
도 15a 내지 15f는 상이한 윈도우 시퀀스 및 해당 미리보기 부분 및 프리-에코(pre-echo)를 나타내는 도면.
도 16은 종래의 윈도우 형상을 나타내는 도면.
도 17은 도 16의 윈도우 형상에 의해 형성된 종래의 윈도우 시퀀스를 나타내는 도면.
Claims (34)
- 인코딩된 오디오 또는 이미지 신호를 생성하는 장치로서,
오디오 또는 이미지 신호를 윈도윙하는 윈도우 시퀀스 정보(809)를 생성하는 윈도우 시퀀스 제어기(808) - 상기 윈도우 시퀀스 정보는 스펙트럼 값의 제1 프레임을 생성하는 제1 윈도우 함수(1500), 제1 부분 및 제2 부분을 갖는 스펙트럼 값의 제2 프레임을 생성하는 제2 윈도우 함수(1502) 및 하나 이상의 제3 윈도우 함수(1503)를 나타내고, 상기 제1 윈도우 함수(1500), 상기 제2 윈도우 함수(1502) 및 상기 하나 이상의 제3 윈도우 함수(1503)는 다중 중첩 영역(1300) 내에서 중첩함 -;
보조 윈도우 함수(1100)를 이용하여 상기 제2 윈도우 함수(1502) 및 상기 하나 이상의 제3 윈도우 함수(1503)에 대응하는 샘플의 제2 블록을 윈도윙(902)하여 윈도윙된 샘플의 제2 블록을 얻고, 상기 다중 중첩 부분(1300)으로의 제1 블록과 중첩하는 상기 제2 블록의 일 부분의 폴딩-인(folding-in) 동작을 이용하여 윈도윙된 샘플의 제2 블록을 프리프로세싱(904)하여 변형된 다중 중첩 부분을 갖는 윈도윙된 샘플의 프리프로세싱된 제2 블록을 얻는 프리프로세서(802);
상기 제1 윈도우 함수(1500)를 이용하여 상기 샘플의 제1 블록에 앨리어싱 도입 변환(aliasing-introducing transform)을 적용(906)하여 상기 스펙트럼 값의 제1 프레임을 얻고, 상기 제2 윈도우 함수(1502)를 이용하여 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록의 제1 부분에 다른 앨리어싱 도입 변환을 적용하여 상기 제2 프레임의 스펙트럼 값의 제1 부분을 얻고, 상기 하나 이상의 제3 윈도우 함수(1503)를 이용하여 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록의 제2 부분에 다른 하나 이상의 앨리어싱 도입 변환을 적용하여 상기 제2 프레임의 스펙트럼 값의 제2 부분을 얻는 스펙트럼 변환기(804); 및
상기 제1 프레임 및 상기 제2 프레임을 프로세싱하여 상기 오디오 또는 이미지 신호의 인코딩된 프레임을 얻는 프로세서(806);를 포함하는, 인코딩된 오디오 또는 이미지 신호를 생성하는 장치. - 제1항에 있어서,
상기 제2 윈도우 함수(1502)는 상기 제1 윈도우 함수(1500)와 중첩하는 상기 제2 윈도우 함수(1502)의 제1 부분(1100a)을 갖고,
상기 하나 이상의 제3 윈도우 함수(1503)는 상기 하나 이상의 제3 윈도우 함수(1503)를 뒤따르는 제4 윈도우 함수와 중첩하는 상기 하나 이상의 제3 윈도우 함수(1503)의 제2 부분(1111)을 갖고,
상기 프리프로세서(802)는 상기 보조 윈도우 함수(1100)를 적용하도록 구성되고, 상기 보조 윈도우 함수는 상기 제2 윈도우 함수(1502)의 제1 부분(1100a)과 유사한 상기 보조 윈도우 함수(1100)의 제1 부분(1100a) 및 상기 하나 이상의 제3 윈도우 함수(1503)의 제2 부분(1111)과 유사한 상기 보조 윈도우 함수(1100)의 제3 부분(1100c)을 갖고, 보조 윈도우 함수(1100)의 제2 부분(1100b)은 상기 보조 윈도우 함수(1100)의 제1 부분(1100a) 및 상기 보조 윈도우 함수(1100)의 제3 부분(1100c) 사이에서 연장하는 장치. - 제2항에 있어서,
상기 보조 윈도우 함수(1100)는 상기 하나 이상의 제3 윈도우 함수(1503)의 제2 부분에 대응하는 상기 보조 윈도우 함수(1100)의 제2 부분(1100b)을 갖고, 또는
상기 보조 윈도우 함수(1100)의 제2 부분(1100b)은 1이거나 또는 0,9보다 큰 윈도우 계수를 가지며, 또는
상기 보조 윈도우 함수(1100)의 제2 부분의 길이는 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록이 상기 제1 프레임 내의 스펙트럼 값의 수와 동일한 수의 스펙트럼 값을 유발하도록 하는 장치. - 제1항에 있어서,
상기 윈도우 시퀀스 제어기(808)는 상기 제2 윈도우 함수(1502) 또는 상기 하나 이상의 제3 윈도우 함수(1503)가 상기 제1 윈도우 함수(1500)의 사이즈 또는 듀레이션보다 작은 사이즈 또는 듀레이션을 갖도록 상기 윈도우 시퀀스 정보(809)를 생성하도록 구성되는 장치. - 제1항에 있어서,
상기 프리프로세서(802)는, 상기 보조 윈도우 함수로서, 상기 윈도윙된 샘플의 제2 블록을 변환하여 상기 제2 프레임을 얻음으로써 도출된 스펙트럼 값의 수가 상기 제1 프레임의 스펙트럼 값의 수와 동일해지도록 하는 시작 윈도우 함수(1100)를 사용하도록 구성되는 장치. - 제1항에 있어서,
상기 스펙트럼 변환기(804)는 상기 제1 윈도우 함수를 이용하여 상기 샘플의 제1 블록을 윈도윙하여 윈도윙된 샘플의 제1 블록을 얻고 상기 윈도윙된 샘플의 제1 블록에 상기 앨리어싱 도입 변환을 적용하도록 구성되는 장치. - 제1항에 있어서,
상기 스펙트럼 변환기(804)는 상기 제2 윈도우 함수의 제2 부분을 이용하여 상기 프리프로세싱된 제2 블록의 제1 부분을 윈도윙하고 - 상기 제2 윈도우 함수의 제1 부분은 윈도윙에 사용되지 않음 - , 상기 프리프로세싱된 제2 블록의 윈도윙된 제1 부분에 상기 앨리어싱 도입 변환을 적용하도록 구성되는 장치. - 제1항에 있어서,
상기 스펙트럼 변환기(804)는 시간 또는 공간에 있어서 가장 최신인 제3 윈도우 함수의 제2 부분 또는 상기 하나의 제3 윈도우의 제2 부분을 제외하고 상기 하나 이상의 제3 윈도우 함수를 이용하여 상기 프리프로세싱된 제2 블록의 제2 부분을 윈도윙하도록 구성되는 장치. - 제1항에 있어서,
상기 프리프로세서(802)는 상기 폴딩-인에서 상기 부분의 시간 또는 공간 역전 및 상기 제2 블록의 부분이 폴딩-인된 부분으로의 시간 또는 공간 역전 부분의 가중 가산(weighted addition)을 수행하도록 구성되는 장치. - 제1항에 있어서,
상기 프리프로세서(802)는 시간 또는 공간에 있어서 상기 하나 이상의 제3 윈도우 함수를 뒤따르는 제4 윈도우 함수와 중첩하는 상기 제2 블록의 부분의 추가의 폴딩 동작을 추가로 이용하여 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록을 얻도록 구성되는 장치. - 제1항에 있어서,
상기 스펙트럼 변환기(804)는 MDCT(modified discrete cosine transform) 동작 또는 MDST(modified discrete sine transform) 동작을 수행하도록 구성되는 장치. - 제1항에 있어서,
상기 스펙트럼 변환기(804)는 폴딩 동작을 적용하여 샘플의 수를 감소시킴으로써 MDCT 또는 MDST 동작을 수행하고 상기 감소된 수의 샘플에 대하여 후속 이산 코사인 변환 또는 이산 사인 변환 동작을 수행하도록 구성되는 장치. - 제1항에 있어서,
상기 윈도우 시퀀스 제어기(808)는 상기 제1 프레임의 미리 보기(look-ahead) 영역 내의 과도 위치를 검출하는 과도 검출기(106)를 포함하고, 상기 윈도우 시퀀스 제어기(808)는 상기 미리 보기 영역의 특정 부분 또는 상기 미리 보기 영역 내의 과도 위치의 검출에 응답하여 상기 윈도우 시퀀스 정보(809)를 생성하도록 구성되고,
상기 윈도우 시퀀스 제어기(808)는, 상기 과도 상태가 상기 미리 보기 영역에서 검출되지 않거나 상기 특정 부분과 다른 미리 보기 영역의 부분에서 검출될 때, 중첩하는 제1 윈도우의 시퀀스를 나타내는 추가의 시퀀스 정보를 생성하도록 구성되는 장치. - 제13항에 있어서,
상기 특정 부분은 현재 프레임의 중심의 시작으로부터 1/4인 장치. - 제13항에 있어서,
상기 다중 중첩 부분은 시간 또는 공간에 있어서 상기 제1 프레임에서 상기 미리 보기 영역의 시작 전 또는 상기 미리 보기 영역의 일 부분에 위치하는 장치. - 제13항에 있어서,
상기 윈도우 시퀀스 제어기(808)는 과도 위치(107)에 따라 적어도 3개의 윈도우의 그룹으로부터 특정 윈도우를 선택하도록 구성되고, 상기 적어도 3개의 윈도우의 그룹은 제1 중첩 길이(203)를 갖는 제1 윈도우(201), 제2 중첩 길이(218)를 갖는 제2 윈도우(225) 및 제3 중첩 길이(229)를 갖거나 중첩이 없는 제3 윈도우(222)를 포함하고, 상기 제1 중첩 길이(203)는 상기 제2 중첩 길이(218)보다 크고, 상기 제2 중첩 길이(218)는 상기 제3 중첩 길이(229) 또는 제로 중첩보다 크고, 상기 특정 윈도우는 상기 과도 위치에 기초하여 선택되어 2개의 연속적인 중첩 윈도우 중의 하나는 상기 과도 위치에서 제1 윈도우 계수를 갖고 상기 2개의 연속적인 중첩 윈도우의 다른 하나는 상기 과도 위치에서 제2 윈도우 계수를 갖고, 상기 과도 위치에서의 제2 윈도우 계수는 상기 과도 위치에서의 제1 윈도우 계수보다 적어도 9배 큰 장치. - 인코딩된 제1 프레임 및 인코딩된 제2 프레임을 포함하는 인코딩된 오디오 또는 이미지 신호를 디코딩하는 장치로서,
상기 인코딩된 제1 프레임 및 상기 인코딩된 제2 프레임을 프로세싱하여 스펙트럼 값의 제1 프레임 및 스펙트럼 값의 제2 프레임을 얻는 프로세서(824) - 상기 스펙트럼 값의 제1 프레임 및 상기 스펙트럼 값의 제2 프레임은 앨리어싱 부분을 포함함 -;
제1 윈도우 함수(1500)를 이용하여 상기 스펙트럼 값의 제1 프레임에 변환을 적용하여(1000) 샘플의 제1 블록을 얻고, 제2 윈도우 함수(1502)를 이용하여 상기 스펙트럼 값의 제2 프레임의 제1 부분에 다른 변환을 적용하고(1010), 하나 이상의 제3 윈도우 함수(1503)를 이용하여 상기 스펙트럼 값의 제2 프레임의 제2 부분에 다른 하나 이상의 변환을 적용하여(1020) 샘플의 제2 블록을 얻는 시간 변환기(826) - 상기 제1 윈도우 함수(1500), 상기 제2 윈도우 함수(1502) 및 상기 제3 윈도우 함수는 다중 중첩 영역(1630)을 형성함 -; 및
폴딩-아웃(folding-out) 동작(1030)을 이용하여 상기 샘플의 제2 블록을 포스트프로세싱하여 상기 다중 중첩 영역(1630)에서 상기 샘플의 제1 블록과 중첩하는 상기 샘플의 제2 블록의 일 부분을 갖는 샘플의 포스트프로세싱된 제2 블록을 얻고, 보조 윈도우 함수(1100)를 이용하여 상기 샘플의 포스트프로세싱된 제2 블록을 윈도윙하고(1040), 상기 샘플의 포스트프로세싱되고 윈도윙된 제2 블록 및 상기 샘플의 제1 블록을 중첩 가산하여(1050) 디코딩된 오디오 또는 이미지 신호(1180)를 얻는 포스트프로세서(828);를 포함하는, 인코딩된 제1 프레임 및 인코딩된 제2 프레임을 포함하는 인코딩된 오디오 또는 이미지 신호를 디코딩하는 장치. - 제17항에 있어서,
상기 변환을 적용하는 것은 상기 샘플의 제2 블록의 제1 부분 및 상기 샘플의 제2 블록의 제2 부분의 중첩 가산(1172)을 수행하여 상기 샘플의 제2 블록을 얻는 것을 포함하는 장치. - 제18항에 있어서, 상기 폴딩-아웃 동작은 상기 샘플의 제2 블록의 경계에 대하여 샘플을 미러링하는 것을 포함하는 장치.
- 제17항에 있어서,
상기 시간 변환기(826)는 정확히 하나의 제3 윈도우 함수(1503)를 이용하도록 구성되고, 상기 제3 윈도우 함수(1503)의 길이는 상기 제1 프레임의 스펙트럼 값의 수의 50%와 동일한 스펙트럼 값의 수가 변환하도록 하고, 결과는 상기 제3 윈도우 함수에 의해 윈도윙되거나,
상기 시간 변환기는 정확히 2개의 제3 윈도우 함수를 이용하도록 구성되고 상기 제3 윈도우 함수의 길이는 상기 제1 프레임의 스펙트럼 값의 수의 1/8과 동일한 스펙트럼 값의 수가 변환하도록 하거나,
상기 시간 변환기는 정확히 하나의 제3 윈도우 함수를 이용하도록 구성되고 상기 제3 윈도우 함수의 길이는 상기 제1 프레임의 스펙트럼 값의 수의 1/4과 동일한 스펙트럼 값의 수가 변환되도록 하거나,
상기 시간 변환기는 정확히 4개의 제3 윈도우 함수를 이용하도록 구성되고 상기 제3 윈도우 함수의 길이는 스펙트럼 값의 수가 상기 제1 프레임의 스펙트럼 값의 수의 1/8과 동일하도록 하는 장치. - 제17항에 있어서,
상기 인코딩된 오디오 또는 이미지 신호는 상기 인코딩된 제1 프레임 및 상기 인코딩된 제2 프레임에 연관된 윈도우 지시(603)를 포함하고,
상기 장치는 상기 윈도우 지시를 추출하고 분석하는 인터페이스(820)를 더 포함하고,
상기 시간 변환기 또는 포스트프로세서(828)는 지시된 윈도우 형상 또는 윈도우 길이 또는 변환 길이를 적용하도록 상기 윈도우 지시에 의해 제어되도록 구성되는 장치. - 제17항에 있어서,
상기 제2 윈도우 함수(1502)는 상기 제1 윈도우 함수(1500)와 중첩하는 제1 부분(1100a)을 갖고, 상기 하나 이상의 제3 윈도우 함수(1503)는 상기 하나 이상의 제3 윈도우 함수(1503)를 뒤따르는 제4 윈도우 함수와 중첩하는 제2 부분(1111)을 갖고, 상기 포스트프로세서는 상기 보조 윈도우 함수(1100)를 적용하도록 구성되고, 상기 보조 윈도우 함수(1100)는 상기 제2 윈도우 함수(1502)의 제1 부분(1100a)과 유사한 제1 부분(1100a)을 갖고, 상기 보조 윈도우 함수(1100)는 상기 하나 이상의 제3 윈도우 함수(1503)의 제2 부분(1111)과 유사한 제3 부분(1100c)을 갖고, 상기 보조 윈도우 함수(1100)의 제2 부분(1100b)은 상기 보조 윈도우 함수(1100)의 제1 부분(1100a) 및 상기 보조 윈도우 함수(1100)의 제3 부분(1100c) 사이에서 연장하는 장치. - 제22항에 있어서,
상기 보조 윈도우 함수(1100)가 상기 하나 이상의 제3 윈도우 함수(1503)의 제2 부분(1111)에 대응하는 제2 부분(1100b)을 갖거나, 상기 보조 윈도우 함수(1100)의 제2 부분(1100b)이 1이거나 0,9보다 큰 윈도우 계수를 갖거나, 상기 보조 윈도우 함수(1100)의 제2 부분의 길이가 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록이 상기 제1 프레임 내의 스펙트럼 값의 수와 동일한 수의 스펙트럼 값을 유발하도록 하는 장치. - 제17항에 있어서,
윈도우 시퀀스 정보(809)는 상기 제2 윈도우 함수(1502) 또는 상기 하나 이상의 제3 윈도우 함수(1503)가 상기 제1 윈도우 함수(1500)의 사이즈 또는 듀레이션보다 작은 사이즈 또는 듀레이션을 갖도록 하는 장치. - 제17항에 있어서,
상기 포스트프로세서(828)는, 상기 보조 윈도우 함수로서, 상기 윈도윙된 샘플의 제2 블록을 변환하여 상기 제2 프레임을 얻음으로써 도출된 스펙트럼 값의 수가 상기 제1 프레임의 스펙트럼 값의 수와 동일해지도록 하는 시작 윈도우 함수(1100)를 사용하도록 구성되는 장치. - 제17항에 있어서,
상기 시간 변환기는 상기 제2 윈도우 함수의 제2 부분을 이용하여 상기 샘플의 제2 블록의 제1 부분 및 상기 샘플의 제2 블록의 제2 부분의 중첩 가산을 수행하도록 구성되고, 상기 제2 윈도우 함수의 제1 부분은 이용되지 않는 장치. - 제17항에 있어서,
상기 시간 변환기는 시간 또는 공간에 있어서 최신의 제3 윈도우 함수의 제2 부분 또는 상기 하나의 제3 윈도우 함수의 제2 부분을 제외하고 상기 하나 이상의 제3 윈도우 함수를 이용하여 상기 샘플의 제2 블록의 제1 부분의 중첩 가산을 수행하도록 구성되는 장치. - 제17항에 있어서,
상기 포스트프로세서는 시간 또는 공간에 있어서 상기 하나 이상의 제3 윈도우 함수를 뒤따르는 제4 윈도우 함수와 중첩하는 상기 제2 블록의 일 부분의 추가의 폴딩 동작을 추가적으로 이용하도록 구성되는 장치. - 제17항에 있어서,
상기 시간 변환기는 역 DCT 또는 역 DST 동작 및 후속의 폴딩-아웃 동작을 이용하여 변환을 적용하도록 구성되는 장치. - 제17항에 있어서,
상기 시간 변환기는 변환을 적용하여 상기 디코딩된 오디오 또는 이미지 신호의 과도 상태가 시간 또는 공간에 있어서 상기 다중 중첩 영역 다음에 위치하거나 상기 제2 윈도우 함수에 의해 커버되지 않는 시간 또는 공간 부분에 위치하도록 구성되는 장치. - 제17항에 있어서,
상기 제2 프레임의 제1 부분은 n/2 스펙트럼 값을 포함하고, 상기 제2 프레임의 제2 부분은 n/8개의 스펙트럼 값을 갖는 4개의 블록 또는 n/2개의 스펙트럼 값을 갖는 단일 블록 또는 스펙트럼 값에 대한 2개의 블록을 포함하는 장치. - 인코딩된 오디오 또는 이미지 신호를 생성하는 방법으로서,
오디오 또는 이미지 신호를 윈도윙하는 윈도우 시퀀스 정보(809)를 생성하는 단계(808) - 상기 윈도우 시퀀스 정보는 스펙트럼 값의 제1 프레임을 생성하는 제1 윈도우 함수(1500), 제1 및 제2 부분을 갖는 스펙트럼 값의 제2 프레임을 생성하는 제2 윈도우 함수(1502) 및 하나 이상의 제3 윈도우 함수(1503)를 나타내고, 상기 제1 윈도우 함수(1500), 상기 제2 윈도우 함수(1502) 및 상기 하나 이상의 제3 윈도우 함수(1503)는 다중 중첩 영역(1300) 내에서 중첩함 -;
보조 윈도우 함수(1100)를 이용하여 상기 제2 윈도우 함수(1502) 및 상기 하나 이상의 제3 윈도우 함수(1503)에 대응하는 샘플의 제2 블록을 윈도윙(902)하여 윈도윙된 샘플의 제2 블록을 얻는 단계;
상기 다중 중첩 부분(1300)으로의 제1 블록과 중첩하는 상기 제2 블록의 일 부분의 폴딩-인(folding-in) 동작을 이용하여 윈도윙된 샘플의 제2 블록을 프리프로세싱(904)하여 변형된 다중 중첩 부분을 갖는 윈도윙된 샘플의 프리프로세싱된 제2 블록을 얻는 단계;
상기 제1 윈도우 함수(1500)를 이용하여 상기 샘플의 제1 블록에 앨리어싱 도입 변환(aliasing-introducing transform)을 적용(906)하여 상기 스펙트럼 값의 제1 프레임을 얻고, 상기 제2 윈도우 함수(1502)를 이용하여 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록의 제1 부분에 다른 앨리어싱 도입 변환을 적용하여 상기 제2 프레임의 스펙트럼 값의 제1 부분을 얻고, 상기 하나 이상의 제3 윈도우 함수(1503)를 이용하여 상기 윈도윙된 샘플의 프리프로세싱된 제2 블록의 제2 부분에 다른 하나 이상의 앨리어싱 도입 변환을 적용하여 상기 제2 프레임의 스펙트럼 값의 제2 부분을 얻는 단계(804); 및
상기 제1 프레임 및 상기 제2 프레임을 프로세싱하여 상기 오디오 또는 이미지 신호의 인코딩된 프레임을 얻는 단계(806);를 포함하는 인코딩된 오디오 또는 이미지 신호를 생성하는 방법. - 인코딩된 제1 프레임 및 인코딩된 제2 프레임을 포함하는 인코딩된 오디오 또는 이미지 신호를 디코딩하는 방법으로서,
상기 인코딩된 제1 프레임 및 상기 인코딩된 제2 프레임을 프로세싱하여 스펙트럼 값의 제1 프레임 및 스펙트럼 값의 제2 프레임을 얻는 단계(824) - 상기 스펙트럼 값의 제1 프레임 및 상기 스펙트럼 값의 제2 프레임은 앨리어싱 부분을 포함함 -;
제1 윈도우 함수(1500)를 이용하여 상기 스펙트럼 값의 제1 프레임에 변환을 적용하여(1000) 샘플의 제1 블록을 얻고, 제2 윈도우 함수(1502)를 이용하여 상기 스펙트럼 값의 제2 프레임의 제1 부분에 다른 변환을 적용하고(1010), 하나 이상의 제3 윈도우 함수(1503)를 이용하여 상기 스펙트럼 값의 제2 프레임의 제2 부분에 다른 하나 이상의 변환을 적용하여(1020) 샘플의 제2 블록을 얻는 단계 - 상기 제1 윈도우 함수(1500), 상기 제2 윈도우 함수(1502) 및 상기 제3 윈도우 함수는 다중 중첩 영역(1630)을 형성함 -; 및
폴딩-아웃(folding-out) 동작(1030)을 이용하여 상기 샘플의 제2 블록을 포스트프로세싱하여 상기 다중 중첩 영역(1630)에서 상기 샘플의 제1 블록과 중첩하는 상기 샘플의 제2 블록의 일 부분을 갖는 샘플의 포스트프로세싱된 제2 블록을 얻고, 보조 윈도우 함수(1100)를 이용하여 상기 샘플의 포스트프로세싱된 제2 블록을 윈도윙하고(1040), 상기 샘플의 포스트프로세싱되고 윈도윙된 제2 블록 및 상기 샘플의 제1 블록을 중첩 가산하여(1050) 디코딩된 오디오 또는 이미지 신호(1180)를 얻는 단계(828);를 포함하는,
인코딩된 제1 프레임 및 인코딩된 제2 프레임을 포함하는 인코딩된 오디오 또는 이미지 신호를 디코딩하는 방법. - 컴퓨터 또는 프로세서 상에서 실행될 때 32항의 방법 또는 제33항의 방법을 수행하는 컴퓨터 프로그램을 저장한 컴퓨터 판독가능 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361767115P | 2013-02-20 | 2013-02-20 | |
US61/767,115 | 2013-02-20 | ||
PCT/EP2014/053287 WO2014128194A1 (en) | 2013-02-20 | 2014-02-20 | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150126864A KR20150126864A (ko) | 2015-11-13 |
KR101764726B1 true KR101764726B1 (ko) | 2017-08-14 |
Family
ID=50179586
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157025744A Active KR101764725B1 (ko) | 2013-02-20 | 2014-02-20 | 과도-위치 의존 중첩을 이용하여 오디오 신호를 인코딩 또는 디코딩하는 장치 및 방법 |
KR1020157025743A Active KR101764726B1 (ko) | 2013-02-20 | 2014-02-20 | 다중 중첩 부분을 이용하여 인코딩된 신호를 생성하거나 인코딩된 오디오 신호를 디코딩하는 장치 및 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157025744A Active KR101764725B1 (ko) | 2013-02-20 | 2014-02-20 | 과도-위치 의존 중첩을 이용하여 오디오 신호를 인코딩 또는 디코딩하는 장치 및 방법 |
Country Status (19)
Country | Link |
---|---|
US (8) | US9947329B2 (ko) |
EP (4) | EP3525207B1 (ko) |
JP (2) | JP6196324B2 (ko) |
KR (2) | KR101764725B1 (ko) |
CN (5) | CN110097889B (ko) |
AR (2) | AR096576A1 (ko) |
AU (2) | AU2014220725B2 (ko) |
BR (2) | BR112015019543B1 (ko) |
CA (2) | CA2901186C (ko) |
ES (2) | ES2736309T3 (ko) |
MX (2) | MX348506B (ko) |
MY (2) | MY185210A (ko) |
PL (2) | PL2959481T3 (ko) |
PT (2) | PT2959482T (ko) |
RU (2) | RU2625560C2 (ko) |
SG (2) | SG11201506542QA (ko) |
TR (1) | TR201910956T4 (ko) |
TW (2) | TWI550600B (ko) |
WO (2) | WO2014128197A1 (ko) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2980791A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
WO2017050398A1 (en) * | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
WO2017125563A1 (en) * | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for estimating an inter-channel time difference |
JP6976277B2 (ja) * | 2016-06-22 | 2021-12-08 | ドルビー・インターナショナル・アーベー | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 |
US10210874B2 (en) | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
CN110892478A (zh) * | 2017-04-28 | 2020-03-17 | Dts公司 | 音频编解码器窗口和变换实现 |
CN111183476B (zh) * | 2017-10-06 | 2024-03-22 | 索尼欧洲有限公司 | 基于子窗口序列内的rms功率的音频文件包络 |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
CN113365055B (zh) * | 2019-03-09 | 2023-03-14 | 杭州海康威视数字技术股份有限公司 | 进行编码和解码的方法、解码端、编码端和系统 |
US12322405B2 (en) * | 2019-05-07 | 2025-06-03 | Voiceage Corporation | Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack |
CN117336468A (zh) | 2019-08-10 | 2024-01-02 | 北京字节跳动网络技术有限公司 | 视频比特流中的子图片相关信令通知 |
WO2021073631A1 (en) | 2019-10-18 | 2021-04-22 | Beijing Bytedance Network Technology Co., Ltd. | Interplay between subpictures and in-loop filtering |
CN112803959B (zh) * | 2019-11-13 | 2022-05-10 | 瑞昱半导体股份有限公司 | 收发电路与应用于收发电路的信号处理方法 |
CN115280774A (zh) | 2019-12-02 | 2022-11-01 | 抖音视界有限公司 | 在仿射模式下与运动向量差分merge |
CN115349254A (zh) | 2020-03-23 | 2022-11-15 | 抖音视界有限公司 | 控制编解码视频中不同级别的去块滤波 |
JP7485037B2 (ja) * | 2020-06-24 | 2024-05-16 | 日本電信電話株式会社 | 音信号復号方法、音信号復号装置、プログラム及び記録媒体 |
US11942078B2 (en) | 2021-02-26 | 2024-03-26 | International Business Machines Corporation | Chunking and overlap decoding strategy for streaming RNN transducers for speech recognition |
US12361975B1 (en) * | 2024-02-28 | 2025-07-15 | Moises Systems, Inc. | Stem separation systems and devices |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1991005412A1 (de) | 1989-10-06 | 1991-04-18 | Telefunken Fernseh Und Rundfunk Gmbh | Verfahren zur übertragung eines signals |
Family Cites Families (99)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4920426A (en) * | 1986-11-10 | 1990-04-24 | Kokusai Denshin Denwa Co., Ltd. | Image coding system coding digital image signals by forming a histogram of a coefficient signal sequence to estimate an amount of information |
DE3902948A1 (de) | 1989-02-01 | 1990-08-09 | Telefunken Fernseh & Rundfunk | Verfahren zur uebertragung eines signals |
US5040217A (en) | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5502789A (en) | 1990-03-07 | 1996-03-26 | Sony Corporation | Apparatus for encoding digital data with reduction of perceptible noise |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
JP3186307B2 (ja) | 1993-03-09 | 2001-07-11 | ソニー株式会社 | 圧縮データ記録装置及び方法 |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5701389A (en) * | 1995-01-31 | 1997-12-23 | Lucent Technologies, Inc. | Window switching based on interblock and intrablock frequency band energy |
KR0154387B1 (ko) | 1995-04-01 | 1998-11-16 | 김주용 | 음성다중 시스템을 적용한 디지탈 오디오 부호화기 |
JP3552811B2 (ja) * | 1995-09-29 | 2004-08-11 | 三菱電機株式会社 | ディジタル映像信号符号化装置および復号化装置 |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
DK0985328T3 (da) | 1997-04-16 | 2006-04-10 | Emma Mixed Signal Cv | Filterbankstruktur og fremgangsmåde til filtrering og separering af et informationssignal i forskellige bånd, især til audiosignaler i höreapparater |
DE19736669C1 (de) * | 1997-08-22 | 1998-10-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals |
JP2000000247A (ja) | 1998-06-15 | 2000-01-07 | Yoshihiro Adachi | ウルトラ ラグ スクリュー |
US6173255B1 (en) * | 1998-08-18 | 2001-01-09 | Lockheed Martin Corporation | Synchronized overlap add voice processing using windows and one bit correlators |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
KR100633720B1 (ko) | 1999-04-19 | 2006-10-16 | 에이티 앤드 티 코포레이션 | 패킷 손실 또는 프레임 삭제 은폐를 수행하는 방법 및 장치 |
DE10000934C1 (de) * | 2000-01-12 | 2001-09-27 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals |
US7246057B1 (en) | 2000-05-31 | 2007-07-17 | Telefonaktiebolaget Lm Ericsson (Publ) | System for handling variations in the reception of a speech signal consisting of packets |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
JP4596197B2 (ja) | 2000-08-02 | 2010-12-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
KR100898879B1 (ko) * | 2000-08-16 | 2009-05-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템 |
US7031926B2 (en) | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
FR2822980B1 (fr) * | 2001-03-29 | 2003-07-04 | Ela Medical Sa | Procede de traitement de donnees d'electogrammes d'un dispositif medical implantable actif pour l'aide au diagnostic par un praticien |
US7313519B2 (en) * | 2001-05-10 | 2007-12-25 | Dolby Laboratories Licensing Corporation | Transient performance of low bit rate audio coding systems by reducing pre-noise |
FR2830970B1 (fr) | 2001-10-12 | 2004-01-30 | France Telecom | Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole |
US7460993B2 (en) | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
EP1394772A1 (en) | 2002-08-28 | 2004-03-03 | Deutsche Thomson-Brandt Gmbh | Signaling of window switchings in a MPEG layer 3 audio data stream |
US7876966B2 (en) | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
DE10345996A1 (de) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
KR20070001115A (ko) * | 2004-01-28 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복소수 값 데이터를 이용하는 오디오 신호 디코딩 |
KR20070001185A (ko) * | 2004-03-17 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
US7937271B2 (en) | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
US8744862B2 (en) * | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
WO2006046546A1 (ja) * | 2004-10-26 | 2006-05-04 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
KR100668319B1 (ko) * | 2004-12-07 | 2007-01-12 | 삼성전자주식회사 | 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치 |
US7386445B2 (en) | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
RU2409874C9 (ru) * | 2005-11-04 | 2011-05-20 | Нокиа Корпорейшн | Сжатие звуковых сигналов |
SG136836A1 (en) | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
JP2007304258A (ja) * | 2006-05-10 | 2007-11-22 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化およびその復号化装置、方法ならびにプログラム |
JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US7680099B2 (en) | 2006-08-22 | 2010-03-16 | Nokia Corporation | Jitter buffer adjustment |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
GB2443832B (en) | 2006-11-14 | 2010-08-18 | Schlumberger Holdings | Method and system of deploying one or more optical fiber waveguides in conjunction with a pipeline |
JP2008129250A (ja) * | 2006-11-20 | 2008-06-05 | National Chiao Tung Univ | Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法 |
KR20080053739A (ko) | 2006-12-11 | 2008-06-16 | 삼성전자주식회사 | 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법 |
PL2052548T3 (pl) | 2006-12-12 | 2012-08-31 | Fraunhofer Ges Forschung | Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu |
KR100964402B1 (ko) | 2006-12-14 | 2010-06-17 | 삼성전자주식회사 | 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치 |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
FR2911227A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
RU2459283C2 (ru) * | 2007-03-02 | 2012-08-20 | Панасоник Корпорэйшн | Кодирующее устройство, декодирующее устройство и способ |
EP2157573B1 (en) | 2007-04-29 | 2014-11-26 | Huawei Technologies Co., Ltd. | An encoding and decoding method |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
CN101790756B (zh) * | 2007-08-27 | 2012-09-05 | 爱立信电话股份有限公司 | 瞬态检测器以及用于支持音频信号的编码的方法 |
CN101970573B (zh) * | 2008-03-25 | 2013-10-16 | 旭化成化学株式会社 | 弹性体组合物和气囊装置的收纳罩 |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8447591B2 (en) | 2008-05-30 | 2013-05-21 | Microsoft Corporation | Factorization of overlapping tranforms into two block transforms |
MX2011000369A (es) * | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
ES2372014T3 (es) * | 2008-07-11 | 2012-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral. |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
BRPI0910512B1 (pt) | 2008-07-11 | 2020-10-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | codificador e decodificador de áudio para codificar e decodificar amostras de áudio |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
AU2013200680B2 (en) | 2008-07-11 | 2015-01-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
WO2010003532A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
CA2730196C (en) | 2008-07-11 | 2014-10-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and discriminator for classifying different segments of a signal |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US9384748B2 (en) * | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101609678B (zh) | 2008-12-30 | 2011-07-27 | 华为技术有限公司 | 信号压缩方法及其压缩装置 |
WO2010086373A2 (en) * | 2009-01-28 | 2010-08-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
PL2234103T3 (pl) * | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
JP5699141B2 (ja) * | 2009-06-23 | 2015-04-08 | ヴォイスエイジ・コーポレーション | 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し |
WO2011013983A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
MY163358A (en) | 2009-10-08 | 2017-09-15 | Fraunhofer-Gesellschaft Zur Förderung Der Angenwandten Forschung E V | Multi-mode audio signal decoder,multi-mode audio signal encoder,methods and computer program using a linear-prediction-coding based noise shaping |
KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
PT2491559E (pt) | 2009-10-19 | 2015-05-07 | Ericsson Telefon Ab L M | Método e estimador de fundo para a detecção de actividade de voz |
ES2453098T3 (es) | 2009-10-20 | 2014-04-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Códec multimodo de audio |
TR201900663T4 (tr) * | 2010-01-13 | 2019-02-21 | Voiceage Corp | Doğrusal öngörücü filtreleme kullanarak ileri doğru zaman alanı alıasıng iptali ile ses kod çözümü. |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
CN102222505B (zh) | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
EP4398248A3 (en) | 2010-07-08 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
MX2013009344A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral. |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
US9280982B1 (en) | 2011-03-29 | 2016-03-08 | Google Technology Holdings LLC | Nonstationary noise estimator (NNSE) |
CN103648540B (zh) | 2011-04-21 | 2016-06-01 | 弗雷塞尼斯医疗保健控股公司 | 医疗流体泵送系统及相关装置和方法 |
US20130144632A1 (en) | 2011-10-21 | 2013-06-06 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
EP2860729A4 (en) * | 2012-06-04 | 2016-03-02 | Samsung Electronics Co Ltd | AUDIOCODING METHOD AND DEVICE, AUDIO DECODING METHOD AND DEVICE AND MULTIMEDIA DEVICE THEREWITH |
CN108074579B (zh) | 2012-11-13 | 2022-06-24 | 三星电子株式会社 | 用于确定编码模式的方法以及音频编码方法 |
KR20140075466A (ko) * | 2012-12-11 | 2014-06-19 | 삼성전자주식회사 | 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치 |
BR112015014212B1 (pt) | 2012-12-21 | 2021-10-19 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Geração de um ruído de conforto com alta resolução espectro-temporal em transmissão descontínua de sinais de audio |
-
2014
- 2014-02-20 MX MX2015010596A patent/MX348506B/es active IP Right Grant
- 2014-02-20 TR TR2019/10956T patent/TR201910956T4/tr unknown
- 2014-02-20 CN CN201910368646.8A patent/CN110097889B/zh active Active
- 2014-02-20 PL PL14706528T patent/PL2959481T3/pl unknown
- 2014-02-20 PT PT14706529T patent/PT2959482T/pt unknown
- 2014-02-20 BR BR112015019543-1A patent/BR112015019543B1/pt active IP Right Grant
- 2014-02-20 ES ES14706529T patent/ES2736309T3/es active Active
- 2014-02-20 CA CA2901186A patent/CA2901186C/en active Active
- 2014-02-20 PT PT147065288T patent/PT2959481T/pt unknown
- 2014-02-20 EP EP19164500.1A patent/EP3525207B1/en active Active
- 2014-02-20 BR BR112015019270-0A patent/BR112015019270B1/pt active IP Right Grant
- 2014-02-20 MX MX2015010595A patent/MX348505B/es active IP Right Grant
- 2014-02-20 MY MYPI2015002060A patent/MY185210A/en unknown
- 2014-02-20 RU RU2015139597A patent/RU2625560C2/ru active
- 2014-02-20 ES ES14706528.8T patent/ES2634621T3/es active Active
- 2014-02-20 AR ARP140100545A patent/AR096576A1/es active IP Right Grant
- 2014-02-20 SG SG11201506542QA patent/SG11201506542QA/en unknown
- 2014-02-20 PL PL14706529T patent/PL2959482T3/pl unknown
- 2014-02-20 SG SG11201506543WA patent/SG11201506543WA/en unknown
- 2014-02-20 JP JP2015558443A patent/JP6196324B2/ja active Active
- 2014-02-20 WO PCT/EP2014/053293 patent/WO2014128197A1/en active Application Filing
- 2014-02-20 CN CN201811631280.0A patent/CN110047498B/zh active Active
- 2014-02-20 TW TW103105681A patent/TWI550600B/zh active
- 2014-02-20 RU RU2015139596A patent/RU2626666C2/ru active
- 2014-02-20 AU AU2014220725A patent/AU2014220725B2/en active Active
- 2014-02-20 CN CN201910452024.3A patent/CN110232929B/zh active Active
- 2014-02-20 CN CN201480009744.8A patent/CN105378835B/zh active Active
- 2014-02-20 EP EP14706529.6A patent/EP2959482B1/en active Active
- 2014-02-20 CN CN201480009722.1A patent/CN105074819B/zh active Active
- 2014-02-20 KR KR1020157025744A patent/KR101764725B1/ko active Active
- 2014-02-20 JP JP2015558442A patent/JP6175148B2/ja active Active
- 2014-02-20 TW TW103105684A patent/TWI550599B/zh active
- 2014-02-20 AU AU2014220722A patent/AU2014220722B2/en active Active
- 2014-02-20 EP EP24167580.0A patent/EP4375996A3/en active Pending
- 2014-02-20 CA CA2900437A patent/CA2900437C/en active Active
- 2014-02-20 EP EP14706528.8A patent/EP2959481B1/en active Active
- 2014-02-20 AR ARP140100544A patent/AR094845A1/es active IP Right Grant
- 2014-02-20 WO PCT/EP2014/053287 patent/WO2014128194A1/en active Application Filing
- 2014-02-20 KR KR1020157025743A patent/KR101764726B1/ko active Active
- 2014-02-28 MY MYPI2015002058A patent/MY173774A/en unknown
-
2015
- 2015-08-19 US US14/830,484 patent/US9947329B2/en active Active
- 2015-08-19 US US14/830,453 patent/US10354662B2/en active Active
-
2017
- 2017-07-26 US US15/660,902 patent/US10685662B2/en active Active
-
2019
- 2019-06-21 US US16/448,260 patent/US10832694B2/en active Active
-
2020
- 2020-05-28 US US16/886,066 patent/US11621008B2/en active Active
- 2020-08-17 US US16/995,581 patent/US11682408B2/en active Active
-
2023
- 2023-02-17 US US18/111,445 patent/US12272365B2/en active Active
-
2025
- 2025-01-17 US US19/030,619 patent/US20250166646A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1991005412A1 (de) | 1989-10-06 | 1991-04-18 | Telefunken Fernseh Und Rundfunk Gmbh | Verfahren zur übertragung eines signals |
Non-Patent Citations (2)
Title |
---|
Jeremie Lecomte, et al. Efficient cross-fade windows for transitions between LPC-based and non-LPC based audio coding. Audio Engineering Society Convention 126. 2009.05.10.* |
Marina Bosi, et al. ISO/IEC MPEG-2 advanced audio coding. Journal of the Audio engineering society, 1997.10, Vol.45, No.10, pp.789-814.* |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101764726B1 (ko) | 다중 중첩 부분을 이용하여 인코딩된 신호를 생성하거나 인코딩된 오디오 신호를 디코딩하는 장치 및 방법 | |
HK1218988B (en) | Apparatus and method for generating an encoded audio or image signal or for decoding an encoded audio or image signal in the presence of transients using a multi overlap portion | |
HK1219343B (en) | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0105 | International application |
Patent event date: 20150918 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20160819 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20170523 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20170728 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20170731 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20200630 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20210719 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20220719 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20230718 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20240716 Start annual number: 8 End annual number: 8 |