TWI564882B - 利用重疊變換之資訊信號表示技術(一) - Google Patents
利用重疊變換之資訊信號表示技術(一) Download PDFInfo
- Publication number
- TWI564882B TWI564882B TW103134392A TW103134392A TWI564882B TW I564882 B TWI564882 B TW I564882B TW 103134392 A TW103134392 A TW 103134392A TW 103134392 A TW103134392 A TW 103134392A TW I564882 B TWI564882 B TW I564882B
- Authority
- TW
- Taiwan
- Prior art keywords
- information signal
- transform
- sample rate
- overlapping regions
- successive overlapping
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 20
- 238000012952 Resampling Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 description 44
- 238000003786 synthesis reaction Methods 0.000 description 44
- 238000005070 sampling Methods 0.000 description 38
- 230000008859 change Effects 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 32
- 230000005540 biological transmission Effects 0.000 description 19
- 239000000872 buffer Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000001228 spectrum Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 9
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000011010 flushing procedure Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Description
本案係有關於使用重疊變換之資訊信號表示型態,及更明確言之係有關於使用要求例如用在音訊壓縮技術的混疊抵消之一資訊信號之一重疊變換表示型態之該資訊信號的表示型態。
大部分壓縮技術係針對資訊信號的特定型別及已壓縮資料串流之特定傳輸狀況諸如最大容許延遲及可用傳輸位元率而設計。舉例言之,以較高可用位元率為例及以編碼樂音而非編碼語音為例,於音訊壓縮中,以變換為基礎的編解碼器諸如高階音訊編碼(AAC)其效能傾向於優於以線性預測為基礎的時域編解碼器諸如代數代碼激勵線性預測編碼器(ACELP)。舉例言之,統一語音與音訊編碼(USAC)編解碼器尋求藉由將不同音訊編碼原則統一在一個編解碼器內部而涵蓋應用景況之更大量變化。但更進一步提高對不同編碼狀況諸如變動可用傳輸位元率的適應性而可利用該適應性來達成例如更高編碼效率等將更為有
利。
因此,本發明之一目的係提出此種構思,藉由提供重疊變換資訊信號表示型態方案,該方案允許藉要求混疊抵消的重疊變換表示型態來表示資訊信號,使得其可能將該重疊變換表示型態調整適應於實際需求,藉此提供達成更高編碼效率之可能。
此項目的係藉審查中之申請專利範圍獨立項之主旨而予達成。
引領至本發明之主要思考如下。資訊信號之重疊變換表示型態經常用來就例如速率/失真比意義而言,形成該資訊信號之有效編碼的前驅態。此種編解碼器之實例有高階音訊編碼(AAC)或變換編碼激勵(TCX)等。但重疊變換表示型態也可用來藉由以不同頻譜解析度而級聯(concatenating)變換及重新變換而執行重新取樣。一般而言,重疊變換表示型態造成該資訊信號之接續時區的開窗版本之變換的個別重新變換在重疊部分混疊,該重疊變換表示型態就欲編碼而表示該重疊變換表示型態的變換係數位準數目較低而言有其優點。在極端形式中,重疊變換係經「臨界取樣」。換言之,比較該資訊信號之時樣數目,不會增加於該重疊變換表示型態中的係數數目。重疊變換表示型態之一個實例為MDCT(修正離散餘弦變換)或QMF(正交鏡像濾波器)濾波器組。據此,經常有利地使用此種重疊
變換表示型態作為有效率地編碼資訊信號中的前驅態。但也有利地能夠允許該資訊信號使用該重疊變換表示型態表示的樣本率即時改變,因而調整適應於例如可用傳輸位元率或其它環境狀況。設想變動的可用傳輸位元率。每當可用傳輸位元率降至低於某個預定臨界值時,例如可有利地降低樣本率;而當可用傳輸位元率再度升高時,則能夠提高重疊變換表示型態表示該資訊信號之樣本率將為有利。不幸地,重疊變換表示型態之重新變換的重疊混頻部分似乎形成妨礙此等樣本率改變的障礙,於樣本率變化之情況下,該障礙似乎唯有藉完全地中斷重疊變換表示型態才能予以克服。但本發明之發明人想出對前摘問題的解決之道,因而使得有效使用涉及所考慮的混疊及樣本率變之重疊變換表示型態。更明確言之,藉內插法,資訊信號之先行區域及/或後繼區域係在兩區域間之邊界,依據樣本率變化而在該混疊抵消部分重新取樣。然後組合器能針對如藉在該混疊抵消部分的重新取樣所得之先行區域及後繼區域的重新變換間之邊界執行混疊抵消。藉此手段,樣本率變化皆被有效地障礙,避免樣本率變化/變遷有任何重疊變換表示型態的不連續。在變換端相似手段也可行因而適當地產生重疊變換。
運用恰在前述概念,可能提供資訊信號壓縮技術諸如音訊壓縮技術,藉由將傳輸樣本率調整適應環境編碼狀況,其具有於寬廣環境編碼狀況諸如可用傳輸帶寬之高編碼效率,而無由樣本率變化例本身帶來的罰則。
10‧‧‧資訊信號編碼器
12、26‧‧‧輸入、輸入信號、資訊信號
14、24、72、107‧‧‧重新取樣器
16‧‧‧核心編碼器
18、28、78、110‧‧‧輸出
20‧‧‧解碼器
22‧‧‧核心解碼器
30、109‧‧‧變換器
32‧‧‧壓縮器
34‧‧‧解壓縮器
36、70‧‧‧重新變換器
38、40‧‧‧分析濾波器組、正交鏡像濾波器組(OMF)
42、44‧‧‧合成濾波器組、QMF-1、反濾波器組
46‧‧‧頻譜
48‧‧‧時變、雙箭頭
50‧‧‧低頻部分
52、52’‧‧‧高頻部分
54‧‧‧參數波封編碼器
56‧‧‧核心資料串流
58‧‧‧參數編碼資料串流
60‧‧‧參數波封解碼器
74‧‧‧組合器
76、105‧‧‧輸入
80‧‧‧資訊信號重建器
82‧‧‧邊界、時間點、時間瞬間
84‧‧‧先行區域、時區
86‧‧‧後繼區域、時區
90‧‧‧資訊信號、重建信號
92、92’‧‧‧重疊變換表示型態
94‧‧‧變換
96‧‧‧時間波封、重新變換
98‧‧‧外部信號、控制信號
100‧‧‧重新變換
102‧‧‧混疊抵消部分、時間區間
104‧‧‧內插
106‧‧‧獲取器
108‧‧‧開窗器
111‧‧‧預定時間瞬間
112‧‧‧樣本
113‧‧‧時間瞬間
114a-d‧‧‧區域
115‧‧‧偏移值
120‧‧‧樣本率控制器
122、126‧‧‧編碼分支
124、128‧‧‧解碼分支
126‧‧‧ACELP編碼器
128‧‧‧ACELP解碼器
130‧‧‧先進先出(FIFO)、狀態緩衝器
本發明之優異構面為審查中申請專利範圍集合的附屬項主旨。此外,後文參考附圖描述本發明之較佳實施例,附圖中:第1a圖顯示可體現本發明之實施例之資訊信號編碼器之方塊圖;第1b圖顯示可體現本發明之實施例之資訊信號解碼器之方塊圖;第2a圖顯示第1a圖之核心編碼器的可能內部結構之方塊圖;第2b圖顯示第1b圖之核心解碼器的可能內部結構之方塊圖;第3a圖顯示第1a圖之重新取樣器的可能體現之方塊圖;第3b圖顯示第1b圖之重新取樣器的可能內部結構之方塊圖;第4a圖顯示可體現本發明之實施例之資訊信號編碼器之方塊圖;第4b圖顯示可體現本發明之實施例之資訊信號解碼器之方塊圖;第5圖顯示依據一實施例資訊信號重建器之方塊圖;第6圖顯示依據一實施例資訊信號變換器之方塊圖;第7a圖顯示依據又一實施例資訊信號編碼器之方塊圖,於該處可使用依據第5圖之資訊信號重建器;第7b圖顯示依據又一實施例資訊信號解碼器之方塊
圖,於該處可使用依據第5圖之資訊信號重建器;第8圖為一示意圖顯示依據一實施例出現在第6a及6b圖之資訊信號編碼器及解碼器的樣本率切換景況。
為了激勵本發明之實施例,容後詳述,初步討論可使用本案實施例之實施例,及使得容後詳述之本案實施例之立意及優點更為清晰之實施例。
第1a及1b圖例如顯示一對編碼器及解碼器,於該處可優異地使用後文說明之實施例。第1a圖顯示編碼器,第1b圖顯示解碼器。第1a圖之資訊信號編碼器10包含輸入資訊信號之一輸入12、一重新取樣器14、及一核心編碼器16,其中重新取樣器14及核心編碼器16係串聯在編碼器10的該輸入12與一輸出18間。於輸出18,編碼器10輸出表示輸入12之資訊信號的資料串流。同理,第1b圖中以元件符號20顯示之解碼器包含一核心解碼器22,及以第1b圖所示方式串接在解碼器20之輸入26與輸出28間之一重新取樣器24。
若用以在輸出18傳輸資料串流輸出至解碼器20的輸入26的可用傳輸位元率為高,則就編碼效率而言,有利地表示在資料串流內部的資訊信號12係在高樣本率,因而涵蓋該資訊信號頻譜的寬廣頻帶。換言之,編碼效率測量值諸如比率/失真比測量值可揭示當比較資訊信號12的較低樣本率版本的壓縮時,若核心編碼器16係以較高樣本
率來壓縮該輸入信號12,則編碼效率為較高。另一方面,於較低可用傳輸位元率情況下,當資訊信號12係以較低樣本率編碼時,可能出現編碼效率測量值為較高。就此點而言,須注意失真可以心理聲學激勵方式測量,亦即比較知覺上較不相關的頻率區域亦即人耳例如較不敏感的頻率區域,考慮在知覺上較為相關的頻率區域失真較為敏感。一般而言,低頻區傾向於比高頻區更為相關,據此,較低樣本率編碼排除位在尼奎斯特(Nyquist)頻率上方的輸入12之該信號的頻率成分被編碼,但另一方面,從其中所得位元率節省,就比率/失真比意義而言,結果導致此種較低樣本率編碼係優於較高樣本率編碼。較低頻與較高頻部分間就失真意義而言同樣的不相一致也存在於其它資訊信號,諸如測量信號等。
據此,重新取樣器14係用以改變資訊信號12的取樣率。藉由依據外部傳輸狀況諸如藉輸出18與輸入26間的可用傳輸位元率所定義等,適當地控制樣本率,編碼器10能達成提高編碼效率,儘管外部傳輸狀況隨時間而改變亦復如此。解碼器20轉而包括核心解碼器22,核心解碼器22解壓縮資料串流,其中重新取樣器24再度要求在輸出28輸出的已重建資訊信號輸出具有常數樣本率。
但每當重疊變換表示型態用在第1a及1b圖的成對編碼器/解碼器時造成問題。涉及在重新變換之重疊區域混疊的重疊變換表示型態涉及有效編碼工具,但因需要時間混疊抵消故,若樣本率改變則出現問題。例如參考第2a
及2b圖。第2a及2b圖顯示針對核心編碼器16及核心解碼器22可能的體現,假設二者係屬變換編碼型。於是,核心編碼器16包括變換器30接著為壓縮器32,及第2b圖所示核心解碼器包括解壓縮器34接著轉而為重新變換器36。第2a及2b圖不應解譯至並無其它模組可存在於核心編碼器16及核心解碼器22內部的程度。舉例言之,濾波器可位著變換器30前方,使得變換器30並非直接地變換藉重新取樣器14所得的重新取樣資訊信號,反而係以預濾波形式變換。同理,具有反轉移函式的濾波器可接在重新變換器36後方,使得重新變換信號隨後可被反濾波。
壓縮器32可壓縮藉變換器30輸出的所得重疊變換表示型態,諸如藉使用無損耗編碼諸如熵編碼包含霍夫曼(Huffman)編碼或算術編碼等實例,及解壓縮器34可進行反處理,換言之,藉熵解碼諸如霍夫曼解碼或算術解碼,獲得重疊變換表示型態,其然後饋至重新變換器36。
於第2a及2b圖之變換編碼環境中,每當重新取樣器14改變取樣率則出現問題。在編碼端問題較不嚴重,原因在於存在有資訊信號12故,據此,變換器30可被提供以使用個別區域的開窗版本針對個別變換的連續取樣區域,即便橫跨取樣率變化情況亦復如此。據此體現變換器30之可能實施例係於後文中參考第6圖作說明。概略言之,變換器30可被提供以於目前取樣率之該資訊信號先行區域之開窗版本,然後變換器30藉重新取樣器14提供以該資訊信號之下個部分重疊區域,然後藉變換器30產生其開窗版本之
變換。不會出現額外問題,原因在於需要的時間混疊抵消係需在重新變換器36進行而非在變換器30進行。但於重新變換器36,取樣率變化引發問題在於當前述緊接其後區域的重新變換係關不同取樣率時,重新變換器36無法執行時間混疊抵消。容後詳述之實施例克服此等問題。依據此等實施例,重新變換器36可由資訊信號重建器所置換,容後詳述。
但於就第1a及1b圖所述環境中,問題不僅出現在核心編碼器16及核心解碼器22係屬變換編碼型的情況。反而,問題也可能出現在使用以重疊變換為基礎的濾波器組分別地用以形成重新取樣器14及24的情況。例如參考第3a及3b圖。第3a及3b圖顯示用以實現重新取樣器14及24之一個特定實施例。依據第3a及3b圖之實施例,兩個重新取樣器係藉使用分析濾波器組38及40接著為合成濾波器組32及44分別的級聯(concatenation)而體現。如第3a及3b圖例示說明,分析及合成濾波器組38至40可體現為QMF濾波器組,亦即以MDCT為基礎之濾波器組使用QMF來事先分裂資訊信號,及然後再度重新接合信號。QMF可以類似於用在MPEG HE-AAC或AAC-ELD的SBR部分之QMF般體現,表示有10區塊重疊的多通道調變濾波器組,其中10僅為其中一例。如此,藉分析濾波器組38及40產生重疊變換表示型態,及於合成濾波器組42及44之情況下,從此種重疊變換表示型態重建重新取樣信號。為了獲得取樣率變化,合成濾波器組42及分析濾波器組40可經體現來以不等變換長度操作,但其中濾波器組或QMF率,亦即一方面藉分析濾波
器組38及40所產生的接續變換及,另一方面,藉合成濾波器組42及44所作重新變換之比率為常數且針對全部組件38至44皆為相同。但改變變換長度導致取樣率變化。例如考慮成對分析濾波器組38及合成濾波器組42。假設分析濾波器組38係使用常數變換長度及常數濾波器組或變換率操作。於此種情況下,針對具有常數樣本長度的該輸出信號之接續重疊區域史自,藉分析濾波器組38輸出的輸入信號之重疊變換表示型態包括該個別區域之開窗版本之一變換,該變換也具有常數長度。換言之,分析濾波器組38將前傳常數時/頻解析度之光譜圖給合成濾波器組42。但合成濾波器組的變換長度將改變。例如,考慮從在分析濾波器組38之輸入的輸入樣本率與在合成濾波器組42之輸出的輸出信號的取樣率間之第一縮減取樣率至第二縮減取樣率的縮減取樣率情況。只要第一縮減取樣率為有效,則由分析濾波器組38輸出的重疊變換表示型態或光譜圖將僅只部分用來饋送合成濾波器組42內部的重新變換。合成濾波器組42之重新變換將單純施加至分析濾波器組38之光譜圖內部的接續變換之低頻部分。由於用在合成濾波器組42之重新變換的較低變換長度故,比較已經以重疊時間部分之簇集而接受濾波器組38中變換的樣本數目,合成濾波器組42之重新變換內部的樣本數目也將較低,因而比較進入分析濾波器組38之輸入的資訊信號之原先取樣率,結果導致較低取樣率。只要縮減取樣率維持相同則沒問題,彷彿合成濾波器組42在濾波器組42之輸出端之該輸出信號的接續重新
變換與接續重疊區域間之重疊進行時間混疊抵消般沒問題。
每當縮減取樣率改變時諸如從第一縮減取樣率改成第二較大的縮減取樣率時出問題。於此種情況下,用在合成濾波器組42之重新變換內部的變換長度將進一步縮短,因而導致在取樣率變化時間點之後,個別隨後區域的取樣率甚至更低。合成濾波器組42再度成問題,原因在於有關緊接在取樣率變化時間點之前的該區域之重新變換與有關緊接在取樣率變化時間點之後的該區域之重新變換間之時間混疊抵消干擾該等關注的重新變換間之時間混疊抵消。據此,不太有幫助,類似問題不會出現在解碼端,於該處具有變動變換長度的分析濾波器組40係在具有常數變換長度的合成濾波器組44前方。此處,合成濾波器組44施加至常數QMF/變換率的光譜圖,但具有不同頻率解析度,換言之,接續變換以恆定比率從分析濾波器組40前傳至合成濾波器組44,但具有不同的或時變變換長度,來保有合成濾波器組44之整個變換長度之低頻部分,而整個變換長度之高頻部分係以零填補。由合成濾波器組44所輸出的接續重新變換間之時間混疊抵消不成問題,原因在於在合成濾波器組44之輸出端輸出的重建樣本之取樣率具有常數樣本率。
如此,嘗試實現前文就第1a及1b圖呈示的樣本率變化/調適有問題,但此等問題可藉依據後文針對資訊信號重建器解說的若干實施例,體現第3a圖之反濾波器組或合成濾波器組42而予解決。
前述有關取樣率調適/變化之思考在考慮下述編碼構思時甚至更令人關注,依據該編碼構思,欲編碼之資訊信號的高頻部分係以參數方式編碼,例如使用譜帶複製器(SBR)編碼,而其低頻部分係使用變換編碼及/或預測編碼等而編碼。例如參考第4a及4b圖顯示一對資訊信號編碼器及資訊信號解碼器。於編碼端,核心編碼器16接在重新取樣器之後,如第3a圖所示之體現,亦即分析濾波器組38與變動變換長度合成濾波器組42之級聯。如前記,為了達成分析濾波器組38之輸入與合成濾波器組42之輸出間的時變縮減取樣率,合成濾波器組42施加其重新變換至由分析濾波器組38所輸出的該常數範圍頻譜之一小部分,亦即常數長度及常數變換率之變換46,其中該等小部分具有合成濾波器組42之變換長度的時變長度。時間係以雙頭箭頭48例示說明。藉分析濾波器組38及合成濾波器組42之級聯所重新取樣的低頻部分50係藉核心編碼器16編碼,但其餘部分亦即組成頻譜46之其餘頻率部分的高頻部分52可於參數波封編碼器54內接受其波封的參數編碼。如此核心資料串流56伴有由參數波封編碼器54所輸出的參數編碼資料串流58。
在解碼端,解碼器同樣地包括核心解碼器22,接著為如第3b圖所示體現的重新取樣器,亦即接著為分析濾波器組40接著為合成濾波器組44,分析濾波器組40具有與編碼端的合成濾波器組42之變換長度的時變同步化的時變變換長度。當核心解碼器22接收核心資料串流56來解碼之時,設置參數波封解碼器60來接收參數資料串流58,及從
其中推衍出高頻部分52’與變動變換長度之低頻部分50互補,換言之,該長度係與由在編碼端的合成濾波器組42所使用的變換長度之時變同步化,且與由核心解碼器22輸出的取樣率變化同步化。
以第4a圖之編碼器為例,較佳存在有分析濾波器組38使得重新取樣器的形成只需添加合成濾波器組42。藉由切換樣本率,可調整適應頻譜46之低頻(LF)部分之比,比較高頻(HF)部分只接受參數波封編碼,LF部分接受較準確的核心編碼。更明確言之,取決於外部狀況,該比值可以有效方式控制,諸如用以傳輸總資料串流等的可用傳輸帶寬。在編碼端控制的時變透過個別側邊資訊資料(舉例)容易信號化至解碼端。
如此,就第1a至4b圖而言,業已顯示若有一種構思可有效地允許取樣率變化,儘管使用需要時間混疊抵消的重疊變換表示型態時亦復如此則為有利。第5圖顯示資訊信號重建器之實施例,若用來體現第2b圖中的合成濾波器組42或重新變換器36,則可克服前摘問題及達成前摘探討此種樣本率變化的優點。
第5圖所示資訊信號重建器包含一重新變換器70、一重新取樣器72及一組合器74,係以所述順序串聯在資訊信號重建器80之輸入76與輸出78間。
第5圖所示資訊信號重建器係用以使用混疊抵消而從進入輸入76的資訊信號之重疊變換表示型態重建資訊信號。換言之,資訊信號重建器係運用如進入輸入76的此
一資訊信號之重疊變換表示型態而以時變樣本率,用以於輸出78輸出該資訊信號。針對該資訊信號之各個接續重疊時區(或時間區間),該資訊信號之重疊變換表示型態包括個別區域之開窗版本之一變換。如以進一步細節摘述如後,資訊信號重建器80係經組配來以一樣本率而重建該資訊信號,該樣本率係在該資訊信號90之先行區域84與後繼區域86間之邊界82改變。
為了解說資訊信號重建器80之個別模組70至74的功能,初步假設於輸入76進入的資訊信號之重疊變換表示型態具有常數時/頻解析度,亦即時間及頻率上為恆定的解析度。後來討論另一種情況。
依據恰在前述的假設,重疊變換表示型態可視為如第5圖於92所示。如圖所示,重疊變換表示型態包括一序列變換,在時間上以某個變換率△t為接續。各個變換94表示該資訊信號之個別時區i之開窗版本之一變換。更明確言之,針對表示型態92於時間上的頻率解析度為常數,故各個變換94包括常數變換係數數目亦即Nk。如此有效地表示表示型態92為包括Nk個頻譜成分或子帶的該資訊信號之光譜圖,該等頻譜成分或子帶可嚴格地沿著頻譜軸k排序,如第5圖描述。於各個頻譜成分或子帶中,光譜圖內部的變換係數係以變換率△t出現。
如3a圖所示,具有此種常數時/頻解析度的重疊變換表示型態92例如係藉QMF分析濾波器組輸出。於此種情況下,各個變換係數將為複合值化,亦即各個變換係數
例如將有個實際部分及一虛擬部分。但重疊變換表示型態92之變換係數並非必要為複合值化,反而也可以是單獨實際值化,諸如於純粹MDCT的情況。此外,發現第5圖之實施例也可轉移至其它重疊變換表示型態上,造成在時區重疊部分的混疊,其變換94係接續地排列在重疊變換表示型態92內部。
重新變換器70係經組配來對變換94施加重新變換,使得針對各個變換94,獲得由個別時間波封96針對接續時區84及86例示說明之重新變換,時間波封粗略地相對應於施加至前述資訊信號之時間部分來獲得該變換94序列的窗。考慮先行時區84,第5圖假設重新變換器70已將重新變換施加至於重疊變換表示型態92中與該時區84相聯結的完整變換94,使得時區84之重新變換96包括例如Nk個樣本或兩倍Nk個樣本,總而言之,與組成獲得個別變換94之開窗部同等多個樣本,取樣時區84之完整時間長度△t.a,而因數a為以產生表示型態92之變換94為單位的決定接續時區間的重疊因數。此處須注意時區84內部的時間樣本數目與屬於該時區84的變換94內部之變換係數數目等數(或倍數)僅只選用為舉例說明之用,取決於所使用的重疊變換細節,依據另一實施例,等數(或倍數)也可由二數目間的另一常數比替代。
現在假設資訊信號重建器尋求改變時區84與時區86間之資訊信號樣本率。如此進行之動機係植基於外部信號98。舉例言之,若資訊信號重建器80係用以體現第3a
圖及第4a圖之合成濾波器組42,則每當樣本率變化有希望更有效編碼時,諸如資料串流傳輸狀況的改變過程時可提供信號98。
本例中,用於例示說明目的,假設資訊信號重建器80尋求減低時區84與86間的樣本率。據此,重新變換器70也施加重新變換器在後繼區域86之開窗版本的變換上,來獲得後繼區域86之重新變換100,但本次重新變換器70使用較低變換長度來執行重新變換。更明確言之,重新變換器70只對後繼區域86的變換之變換係數的最低Nk’<Nk,亦即變換係數1...Nk’上執行重新變換,使得所得重新變換100包括較低樣本率,亦即只以Nk’取樣而非以Nk(或後者的相對應分數)取樣。
如第5圖中例示說明,重新變換96與100間出現的問題如下。先行區域84的重新變換96及後繼區域86的重新變換100重疊在先行區域84與後繼區域86間之邊界82的混疊抵消部分102,混疊抵消部分之時間長度為(a-1).△t,但在此混疊抵消部分102內部的重新變換96之樣本數目係與在相同混疊抵消部分102內部的重新變換100之樣本數目不同(恰在本例中為較高)。因此,執行於該時間區間102內的兩個重新變換96及100之重疊加法之時間混疊抵消並非直捷。
據此,重新取樣器72係連結在重新變換器70與組合器74間,後者負責執行時間混疊抵消。更明確言之,重新取樣器72係經組配來依據在邊界82的樣本率變化而藉內插在混疊抵消部分102,重新取樣先行區域84的重新變換96
及/或後繼區域86的重新變換100。因重新變換96比重新變換100更早到達重新取樣器72之輸入端,故較佳重新取樣器72針對先行區域84的重新變換96執行重新取樣。換言之,藉內插104,含在混疊抵消部分102內部的重新變換96之相對應部分將被重新取樣,因而相對應於在相同混疊抵消部分102內部的重新變換100之取樣條件或樣本位置。然後組合器74單純將來自重新變換96及重新變換100的重新取樣版本之共同定位樣本相加,來以新樣本率獲得該時間區間102內部的重建信號90。於該種情況下,輸出重建信號裡的樣本率將從前者切換至在時間部分86的前端(起點)的新樣本率。但內插也可差異地針對時間區間102的前半及後半施加,因而達成於重建信號90中針對樣本率切換的另一個時間點82。因此,時間瞬間82在第5圖中畫成在部分84與86間之重疊中央,僅供例示說明之用,依據其它實施例相同時間點可位在部分86起點與部分84終點(二者皆含)間之某個位置。
因此,組合器74然後可分別地針對先行及後繼區域84及86的重新變換96與100間進行混疊抵消,如在混疊抵消部分102藉重新取樣獲得。更明確言之,為了抵消混疊抵消部分102內部的混疊,組合器74使用如藉重新取樣器72所得的重新取樣版本而在部分混疊抵消部分102內部的重新變換96與100間執行重疊加法處理。重疊加法處理連同用以產生變換94的開窗,即便橫過邊界82獲得資訊信號90在輸出78的無混疊及恆定地放大重建,即便在時間瞬間82,資
訊信號90從較高樣本率變化至較低樣本率亦復如此。
如此,從前文第5圖之說明可知,施加至先行時區84之開窗版本的變換94之重新變換之變換長度對先行時區84之時間長度比,係與施加至後繼時區86之開窗版本的變換94之重新變換之變換長度對後繼時區86之時間長度比差異達一個因數,該因數係相對應於在兩個時區84與86間之邊界82的樣本率變化。於剛才描述之實例中,此一比值變化係例示說明地藉外部信號98起始。前行及後繼時區84及86的時間長度已經假設為彼此相等,重新變換器70係經組配來限制重新變換之施加在後繼時區86之開窗版本的變換94上,在其低頻部分上例如至多至變換之第Nk’個變換係數。當然此種獲取也已經就先行時區84之開窗版本的變換94進行。此外,與前文說明相反地,邊界82的樣本率變化也以另一個方向執行,如此就後繼區域86而言不會進行任何獲取,反而只有對先行時區84之開窗版本的變換94進行獲取。
更明確言之,至目前為止,已經針對下述情況例示說明第5圖之資訊信號重建器之操作模式,於該處該資訊信號各區域的開窗版本的變換94之變換長度及該資訊信號之各區域的時間長度為常數,亦即重疊變換表示型態92為具有常數時/頻解析度的光譜圖。為了定位邊界82,欲回應於控制信號98舉例說明資訊信號重建器80。
據此,於本組態中第5圖之資訊信號重建器80可以是第3a圖之重新取樣器14的一部分。換言之,第3a圖之
重新取樣器14可以由用以提供資訊信號之重疊變換表示型態之濾波器組38與包含資訊信號重建器80之反濾波器組組成,後述反濾波器組係經組配來使用混疊抵消而從至目前為止所述的資訊信號之重疊變換表示型態重建該資訊信號。據此第5圖之重新變換器70可經組配為QMF合成濾波器組,而例如濾波器組38係體現為QMF分析濾波器組。
如從第1a及4a圖之說明顯然易知,資訊信號編碼器可包括此種重新取樣器連同壓縮階段,諸如核心編碼器16或聚集核心編碼器16及參數波封編碼器54。壓縮階段可經組配來壓縮已重建之資訊信號。如第1a及4a圖所示,此種資訊信號編碼器更可包括樣本率控制器,係經組配來依據外部資訊而控制可用傳輸位元率上的控制信號98(舉例)。
但另外,第5圖之資訊信號重建器可經組配來藉由檢測在重疊變換表示型態內部之該資訊信號各區域之開窗版本的變換長度變化而定位邊界82。為了讓此種可能的體現更清晰,參考第5圖之92’,於該處顯示向內的重疊變換表示型態,據此在表示型態92’內部的接續變換94仍然於常數變換率△t到達重新變換器70,但個別變換之變換長度改變。第5圖中,例如假設先行時區84之開窗版本的變換之變換長度(亦即Nk)係大於後繼時區86之開窗版本的變換之變換長度,假設只有Nk’。重新變換器70能正確地剖析來自輸入資料串流的重疊變換表示型態92’上的資訊,及據此,重新變換器70可將施加至該資訊信號之接續區域的開窗版本的變換之重新變換之變換長度調整適應於重疊變換表示
型態92’的接續變換之變換長度。因此,重新變換器70可運用先行時區84之開窗版本的變換94之重新變換之變換長度Nk及後繼時區86之開窗版本的變換之重新變換之變換長度Nk’,藉此獲得兩個重新變換間之樣本率歧異,已經討論如前且顯示於第5圖頂部中央。據此,考量第5圖之資訊信號重建器80之操作模式,此一操作模式符合前文說明,只有調整重新變換的變換長度適應於重疊變換表示型態92’內部的變換之變換長度的剛才所述差異除外。
如此依據後述功能,資訊信號重建器無需回應於外部控制信號98。反而,向內的重疊變換表示型態92’即足夠用以通知資訊信號重建器該時間點的樣本率變化。
恰如前述操作的資訊信號重建器80可用來形成第2b圖之重新變換器36。換言之,資訊信號解碼器可包括解壓縮器34,組配來重建得自一資料串流之該資訊信號的重疊變換表示型態92’。如前文說明,重建可涉及熵解碼。變換94之時變變換長度可以適當方式在進入解壓縮器34的資料串流內部傳訊。如第5圖所示之資訊信號重建器可用作為重建器36。同樣也可經組配來使用混疊抵消而從如藉解壓縮器34所提供的重疊變換表示型態而重建資訊信號。於後述情況下,重新變換器70例如可執行而使用IMDCT來執行重新變換,及變換94可藉實際值化係數而非複合值化係數表示。
如此,前述實施例允許達成許多優點。針對在完整位元率範圍例如每秒8kb至每秒128kb操作的音訊編解
碼器而言,最佳樣本率可取決冷位元率,諸如前文就第4a及4b圖已述。針對較低位元率,例如只有低頻可以更準確的編碼方法例如ACELP或變換編碼而編碼,但高頻應以參數方式編碼。針對高位元率,整個頻譜例如可以準確方法編碼。如此表示例如該等準確方法應經常性地以最佳表示型態編碼信號。該等信號之樣本率須經最佳化,允許依據尼奎斯特原理傳送最相關的信號頻率成分。如此,注意第4a圖。其中顯示的樣本率控制器120可經組配來取決於可用傳輸位元率,控制資訊信號饋入核心編碼器16的樣本位元率。如此相對應於只將分析濾波器組頻譜的低頻子部分饋進核心編碼器16。其餘高頻部分可饋進參數波封編碼器54。如前文說明,樣本率及傳輸位元率之時間變化不成問題。
第5圖之描述係有關資訊信號重建,可用來因應在樣本率變化時間案例中的時間混疊抵消問題。如前文就第1至4b圖已述,在第1至4b圖景況中之接續模組間之界面須採行某些措施,於該處變換器係產生重疊變換表示型態,然後輸入第5圖之資訊信號重建器。
第6圖顯示資訊信號變換器之此一實施例。第6圖之資訊信號變換器包括用以呈樣本序列形式接收資訊信號之輸入105;組配來獲取資訊信號之接續重疊區域的獲取器106;重新取樣器107其係經組配來施加重新取樣至接續重疊區域的至少一個子集,使得接續重疊區域各自具有常數樣本率,但其中常數樣本率在接續重疊區域間各異;組
配來施加開窗於接續重疊區域上的開窗器108;及變換器其係經組配來個別地施加變換至開窗部分,因而獲得形成重疊變換表示型態92’的一序列變換94,然後於第6圖之資訊信號變換器之輸出110輸出。開窗器108可使用漢明(Hamming)開窗等。
獲取器106可經組配來執行獲取,使得該資訊信號之接續重疊區域具有相等時間長度,諸如各20毫秒。
如此,獲取器106前傳一序列資訊信號部分給重新取樣器107。假設向內資訊信號具有時變樣本率,例如係於預定時間瞬間從第一樣本率切換至第二樣本率,則重新取樣器107可經組配來藉內插而重新取樣器向內資訊信號部分,時間上涵蓋該預定時間瞬間,使得接續樣本率變化從第一樣本率切換至第二樣本率,如第6圖例示說明於111。為了更清晰,第6圖例示說明顯示一序列樣本112,於該處樣本率係於某個時間瞬間113切換,其中常數時間長度區域114a至114d係以常數區域偏移值115△t獲取,連同常數區域時間長度界定接續區域114a至114d間之預定重疊,諸如每個接續成對區域50%重疊,但須瞭解如此僅為一例。在時間瞬間113前的第一樣本率係例示說明為δt1,在時間瞬間113後的樣本率係指示為δt2。如於111例示說明,重新取樣器107例如可經組配來重新取樣區域114b,因而有常數樣本率δt1,但其中時間上接續其後的區域114c係經重新取樣而具有常數樣本率δt2。原則上,若重新取樣器107藉內插重新取樣尚未具有目標樣本率而時間上涵蓋時間瞬間113的
個別區域114b及114c的子部分即足。舉例言之,以區域114b為例,若重新取樣器107重新取樣時間上超過時間瞬間113之其子部分即足;而於區域114c之情況下,可以只重新取樣在時間瞬間113之前的子部分。於該種情況下,由於獲取區域114a至114d之常數時間長度,各個重新取樣區域具有相對應於個別常數樣本率δt1,2的時樣數目N1,2。開窗器108可將其窗或窗長度調整適應於各個向內部分之此種樣本數目,同等適用於變換器109,其可據此而調整其變換之變換長度。換言之,於第6圖之111例示說明之實例之情況下,於輸出110的重疊變換表示型態具有一序列變換,其變換長度依據接續區域之樣本數目,及又轉而依據個別區域已經重新取樣之常數樣本率而線性地改變,亦即增減。
須注意重新取樣器107可經組配來接續區域114a至114d間的樣本率變化亦排齊,使得在個別區域內部必須重新取樣的樣本數目為最小。但另外,重新取樣器107可有不同組態。舉例言之,重新取樣器107可經組配來優先向上取樣而非縮減取樣,或反之亦然,亦即執行重新取樣使得與時間瞬間113重疊的全部區域係重新取樣成第一樣本率δt1或第二樣本率δt2。
第6圖之資訊信號變換器例如可用來體現第2a圖之變換器30。於該種情況下,例如變換器109可經組配來執行MDCT。
就此點而言,須注意藉變換器109所施加變換之變換長度可甚至大於以重新取樣樣本測量的區域114c大
小。於該種情況下,延伸超出由開窗器108輸出的開窗區域之變換長度區在藉變換器109施加變換前可設定為零。
在前進至以進一步細節描述用以實現第5圖之內插104及第6圖之重新取樣器107內部的內插之可能體現之前,參考第7a及7b圖顯示第1a及1b圖之編碼器及解碼器之可能體現。更明確言之,重新取樣器14及24係實施為如第3a及3b圖所示,而核心編碼器16及核心解碼器22分別地實施為編解碼器,因而在一方面以MDCT為基礎之變換編碼及另一方面CELP編碼諸如ACELP編碼間切換。以MDCT為基礎之編碼/解碼分支122及124分別地例如可以是TCX編碼器及TCX解碼器。另外,可使用AAC編碼器/解碼器對。至於CELP編碼,ACELP編碼器126可形成核心編碼器16之另一編碼分支,而ACELP解碼器128可形成核心解碼器22之另一解碼分支。兩個編碼分支間之切換可以逐一訊框為基礎進行,如同USAC[2]或AMR-WB+[1]的情況,有關此等編碼模組之進一步細節請參考標準文獻。
以第7a及7b圖之編碼器及解碼器作為又一特例,允許輸入編碼分支122及126及藉解碼分支124及128重建的內部取樣率之切換方案係容後詳述。更明確言之,載入輸入12的輸入信號具有常數樣本率諸如32千赫茲。信號可以前述方式,使用QMF分析及合成濾波器組對38及42重新取樣,亦即具有有關帶數的適當分析及合成比諸如1.25或2.5,結果導致進入核心編碼器16的內部時間信號具有例如25.6千赫茲或12.8千赫茲的專用樣本率。如此縮減取樣信
號係使用編碼模式之編碼分支中之任一者編碼,諸如於編碼分支122之情況下使用MDCT表示型態及傳統變換編碼方案,或例如於編碼分支126時於時域使用ACELP編碼。如此藉核心編碼器16之編碼分支126及122所形成的資料串流係經輸出及傳送給解碼端,於該處則接受重建。
為了切換內部樣本率,濾波器組38至44須依據核心編碼器16及核心解碼器22操作的內部樣本率以逐一訊框為基礎調整適應。第8圖顯示若干可能切換情況,其中第8圖只顯示編碼器及解碼器之MDCT編碼路徑。
特別,第8圖顯示輸入樣本率假設為32千赫茲,可縮減取樣至25.6、12.8或8千赫茲中之任一者,進一步可能維持輸入樣本率。取決於輸入樣本率與內部樣本率間之選用樣本率比,一方面分析濾波器組與另一方面合成濾波器組間有個變換長度比。該比值係從第8圖之灰色陰影框內部推衍:於濾波器組38及44中之40子帶係與所選用樣本率比獨立無關,而於濾波器組42及40為40、32、16或10子帶係取決於選用樣本率比。用在核心編碼器內部的MDCT之變換長度係調整適應於所得內部樣本率,使得於時間測量得的變換率或變換間距區間為常數,或與選用樣本率比獨立無關。例如可以是恆定20毫秒,取決於選用樣本率比,導致640、512、256及160的變換長度。
使用前摘原理,可能切換內部樣本率,遵照下列有關濾波器組切換之限制:-切換期間未導致額外延遲;
-切換或樣本率變化可自發發生;-切換假影可最小化或至少減低;及-計算複雜度低。
基本上,濾波器組38至44及核心編碼器內部的MDCT為重疊變換,其中該等濾波器組比較核心編碼器及解碼器的MDCT可使用更高的開窗區域重疊。舉例言之,針對濾波器組可施加10倍重疊,而針對MDCT 122及124可施加2倍重疊。針對重疊變換,狀態緩衝器可描述為針對分析濾波器組及MDCT的分析-窗緩衝器,及針對合成濾波器組及IMDCT之重疊-加法緩衝器。以比率切換為例,該等狀態緩衝器應可以前文已經就第5圖及第6圖描述之方式,依據樣本率切換調整。後文中,有關內插在第6圖討論之分析端也可執行進一步細節討論,而非就第5圖討論之合成情況。重疊變換之原型或窗可經調整適應。為了減少切換假影,於狀態緩衝器中的信號成分須經保留來維持重疊變換之混疊抵消性質。
後文中,有關如何在重新取樣器72內部執行內插104提供進一步細節說明。
可區別兩種情況:
1)向上切換為一項處理據此樣本率從先行時間部分84至隨後或後繼時間部分86增加。
2)向下切換為一項處理據此樣本率從先行時間部分84至隨後或後繼時間部分86減低。
假設向上切換,亦即從12.8千赫茲(每20毫秒256
樣本)切換至32千赫茲(每20毫秒640樣本),狀態緩衝器諸如重新取樣器72之狀態緩衝器,第5圖中以元件符號130例示說明,於給定實例中其內容需以相對應於樣本率變化之因數諸如2.5放大。放大而不會造成額外延遲的可能解決之道有例如線性內插或樣條內插。換言之,重新取樣器72可在行進間將有關先行時區84的重新變換96尾端例如位在時間區間102內部的樣本內插至狀態緩衝器130內部。如第5圖所示,狀態緩衝器可作為先進先出(FIFO)緩衝器。當然,並非全部完整混疊抵消所需頻率成分皆可藉此程序獲得,但至少低頻諸如0至6.4千赫茲可被產生而無任何失真,及從心理聲學觀點,該等頻率乃最相關者。
用於向下切換至較低樣本率的情況,線性內插或樣條內插也可用來據此十進制化狀態緩衝器而不會造成額外延遲。換言之,重新取樣器72可藉內插法而十進制化樣本率。但向下切換至樣本率於該處之十進制化因數為大,諸如從32千赫茲(每20毫秒640樣本)切換至12.8千赫茲(每20毫秒256樣本),於該處十進制化因數為2.5,若不去除高頻成分則可能造成嚴重干擾混疊。為了應付此種現象,可進行合成濾波,於該處高頻成分可藉「沖洗」濾波器組或重新變換器而予去除。如此表示在切換瞬間濾波器組合成較低頻成分,因而從重疊加法緩衝器清除高頻譜成分。更精確言之,設想從先行時區84的第一樣本率向下切換成後繼時區86的較低樣本率。從前文說明導出,重新變換器70可經組配來準備向下切換,不讓先行時區84的開窗版本的
變換94之全頻成分參與重新變換。反而,重新變換器70可將變換94之非相關高頻成分從重新變換排除,排除方式係藉設定為0(舉例)或否則藉諸如徐緩遞增衰減此等高頻成分而減低其對重新變換的影響。舉例言之,受影響的高頻成分可以是高於頻率成分Nk’者。據此,於結果所得資訊信號中,時區84被蓄意地重建於頻譜帶寬,該頻譜帶寬係低於在輸入76之重疊變換表示型態輸入中可用的帶寬。但另一方面,避免混疊問題,否則儘管內插104,於重疊加法處理過程中非蓄意將高頻部分導入組合器74內部的混疊抵消過程。
至於替代之道,可同時產生額外低樣本率表示型態,用在適當狀態緩衝器用以從較高樣本率表示型態切換。如此將確保十進制化因數(於需要十進制化之情況下)係經常性地維持相對低(亦即小於2),因而不會出現混疊所造成的干擾假影。如前述,如此不會保有全頻成分,但至少保有有關心理聲學上關注的低頻成分。
如此,依據特定實施例,可以下述方式修改USAC編解碼器來獲得USAC之低延遲版本。首先,只容許TCX及ACELP編碼模式。可避免AAC模式。訊框長度可選擇來獲得20毫秒訊框。然後,取決於操作模式(超寬帶(SWB)、寬帶(WB)、窄帶(NB)、全帶寬(FB))及取決於位元率可選擇下列系統參數。系統參數之綜論給定於下表。
至於考慮窄帶模式,可避免樣本率增加,替代以設定內部樣本率等於輸入樣本率,亦即8千赫茲,據此選擇訊框長度為亦即160樣本長。同理16千赫茲可選用於寬帶操作模式,選定用於TCX之MDCT之訊框長度為320樣本長而非256。
更明確言之,經由整個操作點列表可能支援切換操作,亦即支緩取樣率、位元率及寬帶。下表摘述有關USAC編解碼器之前文預期低延遲版本之內部樣本率的各個組態。
表顯示低延遲USAC編解碼器之內部樣本率模式之矩陣
作為側邊資訊,須注意無需使用依據第2a及2b圖的重新取樣器。另可提供IIR濾波器組來負責從輸入樣本率至專用核心取樣頻率的重新取樣功能。該等IIR濾波器之
延遲係低於0.5毫秒,但因輸入頻率與輸出頻率間之奇數比,故複雜度相當高。假設全部IIR濾波器有相同延遲,許可在不同取樣率間切換。
據此使用第2a及2b圖之重新取樣器實施例為較佳。參數波封模組(亦即SBR)之QMF濾波器組可參與共同操作來實現前述重新取樣功能。以SWB為例,如此將合成濾波器組階段加至編碼器,但因SBR編碼器模組已經使用分析階段。於解碼器端,QMF已經負責當SBR被致能時提供向上取樣功能。本方案可用在全部其它帶寬模式。下表提供需要的QMF組態之綜論。
假設常數輸入取樣頻率,藉切換QMF合成原型可得內部取樣率間之切換。於解碼器端可施加反向操作。注意歷操作點之整個範圍一個QMF帶之帶寬為相同。
雖然已經以裝置脈絡描述若干構面,但顯然此等構面也表示相對應方法的描述,於該處一方塊或一裝置係相對應於一方法步驟或一方法步驟之特徵。同理,以方法
步驟之脈絡描述的構面也表示相對應裝置之相對應方塊或項或特徵結構之描述。部分或全部方法步驟可藉(或使用)硬體設備例如微處理器、可程式規劃電腦或電子電路執行。於若干實施例中,最重要的方法步驟之某一者或多者可藉此種設備執行。
取決於某些體現要求,本發明之實施例可於硬體或於軟體體現。體現可使用數位儲存媒體執行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,具有可電子讀取控制信號儲存於其上,該等信號與(或可與)可程式規劃電腦系統協作,因而執行個別方法。因而該數位儲存媒體可以是電腦可讀取。
依據本發明之若干實施例包含具有可電子式讀取控制信號的資料載體,該等控制信號可與可程式規劃電腦系統協作,因而執行此處所述方法中之一者。
大致言之,本發明之實施例可體現為具有程式代碼的電腦程式產品,該程式代碼係當電腦程式產品在電腦上跑時可執行該等方法中之一者。該程式代碼例如可儲存在機器可讀取載體上。
其它實施例包含儲存在機器可讀取載體或非過渡儲存媒體上的用以執行此處所述方法中之一者的電腦程式。
換言之,因此,本發明方法之實施例為一種具有一程式代碼之電腦程式,該程式代碼係當該電腦程式於一電腦上跑時用以執行此處所述方法中之一者。
因此,本發明方法之又一實施例為資料載體(或數位儲存媒體或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式記錄於其上。資料載體、數位儲存媒體或記錄媒體典型地為具體有形及/或非過渡。
因此,本發明方法之又一實施例為表示用以執行此處所述方法中之一者的電腦程式的資料串流或信號序列。資料串流或信號序列例如可經組配來透過資料通訊連結,例如透過網際網路轉移。
又一實施例包含處理構件例如電腦或可程式規劃邏輯裝置,其係經組配來或適用於執行此處所述方法中之一者。
又一實施例包含一電腦,其上安裝有用以執行此處所述方法中之一者的電腦程式。
依據本發明之又一實施例包含一種設備或系統其係經組配來傳輸(例如電子式或光學式)用以執行此處所述方法中之一者的電腦程式給接收器。接收器例如可以是電腦、行動裝置、記憶體裝置或其類。設備或系統包含檔案伺服器用以轉移電腦程式給接收器。
於若干實施例中,可程式規劃邏輯裝置(例如可現場程式規劃閘陣列)可用來執行此處描述之方法的部分或全部功能。於若干實施例中,可現場程式規劃閘陣列可與微處理器協作來執行此處所述方法中之一者。大致上該等方法較佳係藉任何硬體裝置執行。
前述實施例係僅供舉例說明本發明之原理。須瞭
解此處所述配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此,意圖僅受審查中之專利申請範圍所限而非受藉以描述及解說此處實施例所呈示之特定細節所限。
參考文獻:
[1]: 3GPP, “Audio codec processing functions; Extended Adaptive Multi-Rate-Wideband (AMR-WB+) codec; Transcoding functions”, 2009, 3GPP TS 26.290.
[2]: USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003-3 dated September 24, 2010
70‧‧‧重新變換器
72‧‧‧重新取樣器
74‧‧‧組合器
76‧‧‧輸入
78‧‧‧輸出
80‧‧‧資訊信號重建器
82‧‧‧邊界、時間點、時間瞬間
84‧‧‧先行區域、先行時區
86‧‧‧後繼區域、後繼時區
90‧‧‧資訊信號
92、92’‧‧‧重疊變換表示型態
94‧‧‧變換資料
96、100‧‧‧時間波封、重新變換
98‧‧‧外部信號、控制信號
102‧‧‧混疊抵消部分
104‧‧‧內插
130‧‧‧先進先出(FIFO)、狀態緩衝器
Claims (7)
- 一種組配來使用一引起混疊之重疊變換來產生一資訊信號之重疊變換表示型態之資訊信號變換器,該資訊信號變換器包含:一輸入部,用以接收呈一樣本序列之形式的該資訊信號;一獲取器,經組配來獲取該資訊信號之接續重疊區域;一重新取樣器,經組配來藉內插而施加一重新取樣至該等資訊信號之該等接續重疊區域之至少一個子集,使得該等接續重疊區域各自具有一個別常數樣本率,但在該等接續重疊區域中該個別常數樣本率各異;一開窗器,經組配來施加一開窗至該資訊信號之該等接續重疊區域上;及一變換器,經組配來個別地施加一變換至該等開窗區域上。
- 如請求項1之資訊信號變換器,其中該獲取器經組配來執行該資訊信號之該等接續重疊區域的獲取使得該資訊信號之該等接續重疊區域具有常數時間長度。
- 如請求項1之資訊信號變換器,其中該獲取器經組配來執行該資訊信號之該等接續重疊區域的獲取使得該資訊信號之該等接續重疊區域具有常數時間偏移。
- 如請求項2之資訊信號變換器,其中該樣本序列具有於 一預定時間瞬間從一第一樣本率切換至一第二樣本率之一變動樣本率,其中該重新取樣器經組配來施加該重新取樣至與該預定時間瞬間重疊之該等接續重疊區域,使得其常數樣本率只有從該第一樣本率切換至該第二樣本率一次。
- 如請求項4之資訊信號變換器,其中該變換器經組配來將各個開窗區域的該變換之一變換長度調整適應於該個別開窗區域之多個樣本。
- 一種使用引起混疊重疊變換來產生一資訊信號之重疊變換表示型態之方法,該方法包含:接收呈一樣本序列之形式的該資訊信號;獲取該資訊信號之接續重疊區域;藉內插施加一重新取樣至該等資訊信號之該等接續重疊區域之至少一個子集,使得該等接續重疊區域各自具有一個別常數樣本率,但在該等接續重疊區域中該個別常數樣本率各異;施加一開窗至該資訊信號之該等接續重疊區域上;及於該等開窗區域個別地施加一變換。
- 一種具有一程式碼之電腦程式,當該電腦程式在一電腦上運行時,用以執行如請求項6之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
PCT/EP2012/052458 WO2012110478A1 (en) | 2011-02-14 | 2012-02-14 | Information signal representation using lapped transform |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201506906A TW201506906A (zh) | 2015-02-16 |
TWI564882B true TWI564882B (zh) | 2017-01-01 |
Family
ID=71943597
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101104678A TWI483245B (zh) | 2011-02-14 | 2012-02-14 | 利用重疊變換之資訊信號表示技術 |
TW103134392A TWI564882B (zh) | 2011-02-14 | 2012-02-14 | 利用重疊變換之資訊信號表示技術(一) |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101104678A TWI483245B (zh) | 2011-02-14 | 2012-02-14 | 利用重疊變換之資訊信號表示技術 |
Country Status (18)
Country | Link |
---|---|
US (1) | US9536530B2 (zh) |
EP (1) | EP2550653B1 (zh) |
JP (2) | JP5712288B2 (zh) |
KR (1) | KR101424372B1 (zh) |
CN (1) | CN102959620B (zh) |
AR (1) | AR085222A1 (zh) |
AU (1) | AU2012217158B2 (zh) |
BR (1) | BR112012029132B1 (zh) |
CA (1) | CA2799343C (zh) |
ES (1) | ES2458436T3 (zh) |
HK (1) | HK1181541A1 (zh) |
MX (1) | MX2012013025A (zh) |
MY (1) | MY166394A (zh) |
PL (1) | PL2550653T3 (zh) |
RU (1) | RU2580924C2 (zh) |
SG (1) | SG185519A1 (zh) |
TW (2) | TWI483245B (zh) |
WO (1) | WO2012110478A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2014003610A (es) * | 2011-09-26 | 2014-11-26 | Sirius Xm Radio Inc | Sistema y metodo para incrementar la eficiencia del ancho de banda de transmision ("ebt2"). |
US9842598B2 (en) | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
CN105247613B (zh) | 2013-04-05 | 2019-01-18 | 杜比国际公司 | 音频处理系统 |
MY175355A (en) * | 2013-08-23 | 2020-06-22 | Fraunhofer Ges Forschung | Apparatus and method for processing an audio signal an aliasing erro signal |
JP6086999B2 (ja) | 2014-07-28 | 2017-03-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
JP6976277B2 (ja) * | 2016-06-22 | 2021-12-08 | ドルビー・インターナショナル・アーベー | 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法 |
KR102632136B1 (ko) | 2017-04-28 | 2024-01-31 | 디티에스, 인코포레이티드 | 오디오 코더 윈도우 사이즈 및 시간-주파수 변환 |
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
US11456007B2 (en) | 2019-01-11 | 2022-09-27 | Samsung Electronics Co., Ltd | End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization |
CN115299075B (zh) | 2020-03-20 | 2023-08-18 | 杜比国际公司 | 扬声器的低音增强 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
TW200943279A (en) * | 2008-04-04 | 2009-10-16 | Fraunhofer Ges Forschung | Audio processing using high-quality pitch correction |
TWI320172B (en) * | 2005-11-03 | 2010-02-01 | Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal |
Family Cites Families (213)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3432822B2 (ja) | 1991-06-11 | 2003-08-04 | クゥアルコム・インコーポレイテッド | 可変速度ボコーダ |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
JP3304717B2 (ja) * | 1994-10-28 | 2002-07-22 | ソニー株式会社 | ディジタル信号圧縮方法及び装置 |
US5537510A (en) | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) * | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) * | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ES2247741T3 (es) | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
CN1145928C (zh) | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
JP4907826B2 (ja) | 2000-02-29 | 2012-04-04 | クゥアルコム・インコーポレイテッド | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US20040142496A1 (en) | 2001-04-23 | 2004-07-22 | Nicholson Jeremy Kirk | Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US7206739B2 (en) | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) * | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP3815323B2 (ja) * | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
DE10200653B4 (de) * | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) * | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP3646939B1 (ja) | 2002-09-19 | 2005-05-11 | 松下電器産業株式会社 | オーディオ復号装置およびオーディオ復号方法 |
BR0315179A (pt) | 2002-10-11 | 2005-08-23 | Nokia Corp | Método e dispositivo para codificar um sinal de fala amostrado compreendendo quadros de fala |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
US7876966B2 (en) * | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
WO2005001814A1 (en) | 2003-06-30 | 2005-01-06 | Koninklijke Philips Electronics N.V. | Improving quality of decoded audio by adding noise |
DE10331803A1 (de) * | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US7565286B2 (en) | 2003-07-17 | 2009-07-21 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada | Method for recovery of lost speech data |
DE10345995B4 (de) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
DE10345996A1 (de) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7418396B2 (en) * | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
CN1875402B (zh) | 2003-10-30 | 2012-03-21 | 皇家飞利浦电子股份有限公司 | 音频信号编码或解码 |
KR20070001115A (ko) * | 2004-01-28 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복소수 값 데이터를 이용하는 오디오 신호 디코딩 |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
EP1722359B1 (en) | 2004-03-05 | 2011-09-07 | Panasonic Corporation | Error conceal device and error conceal method |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
ES2338117T3 (es) | 2004-05-17 | 2010-05-04 | Nokia Corporation | Codificacion de audio con diferentes longitudes de trama de codificacion. |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
EP1846921B1 (en) | 2005-01-31 | 2017-10-04 | Skype | Method for concatenating frames in communication system |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
EP1845520A4 (en) | 2005-02-02 | 2011-08-10 | Fujitsu Ltd | SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
RU2381572C2 (ru) | 2005-04-01 | 2010-02-10 | Квэлкомм Инкорпорейтед | Системы, способы и устройство широкополосного речевого кодирования |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
EP1897085B1 (en) | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
JP5032314B2 (ja) * | 2005-06-23 | 2012-09-26 | パナソニック株式会社 | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
US20110057818A1 (en) | 2006-01-18 | 2011-03-10 | Lg Electronics, Inc. | Apparatus and Method for Encoding and Decoding Signal |
CN101371296B (zh) | 2006-01-18 | 2012-08-29 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) * | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) * | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US8255213B2 (en) | 2006-07-12 | 2012-08-28 | Panasonic Corporation | Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method |
US8812306B2 (en) | 2006-07-12 | 2014-08-19 | Panasonic Intellectual Property Corporation Of America | Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
JP5031030B2 (ja) | 2006-07-24 | 2012-09-19 | ソニー株式会社 | ヘア/ファーパイプラインにおいて使用するためのヘアモーション合成システム及び最適化技術 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US20080046233A1 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Packet Loss Concealment for Sub-band Predictive Coding Based on Extrapolation of Full-band Audio Waveform |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8041578B2 (en) * | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8126721B2 (en) * | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
EP3848928B1 (en) | 2006-10-25 | 2023-03-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
ATE547898T1 (de) | 2006-12-12 | 2012-03-15 | Fraunhofer Ges Forschung | Kodierer, dekodierer und verfahren zur kodierung und dekodierung von datensegmenten zur darstellung eines zeitdomänen-datenstroms |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
WO2008108083A1 (ja) | 2007-03-02 | 2008-09-12 | Panasonic Corporation | 音声符号化装置および音声符号化方法 |
CN101622665B (zh) | 2007-03-02 | 2012-06-13 | 松下电器产业株式会社 | 编码装置以及编码方法 |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
KR101196506B1 (ko) * | 2007-06-11 | 2012-11-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 임펄스형 부분 및 정적 부분을 갖는 오디오 신호를 인코딩하는 오디오 인코더 및 인코딩 방법, 디코더, 디코딩 방법 및 인코딩된 오디오 신호 |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
DK2186088T3 (en) | 2007-08-27 | 2018-01-15 | ERICSSON TELEFON AB L M (publ) | Low complexity spectral analysis / synthesis using selectable time resolution |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
KR101253278B1 (ko) * | 2008-03-04 | 2013-04-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 복수의 입력 데이터 스트림을 믹싱하는 장치 및 방법 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MY181247A (en) | 2008-07-11 | 2020-12-21 | Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144171B1 (en) | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
CN102089812B (zh) * | 2008-07-11 | 2013-03-20 | 弗劳恩霍夫应用研究促进协会 | 用以使用混叠切换方案将音频信号编码/解码的装置与方法 |
RU2621965C2 (ru) * | 2008-07-11 | 2017-06-08 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
EP2346030B1 (en) | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
CN102177426B (zh) | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
MY205240A (en) | 2009-01-16 | 2024-10-09 | Dolby Int Ab | Cross product enhanced harmonic transposition |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
RU2542668C2 (ru) | 2009-01-28 | 2015-02-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Звуковое кодирующее устройство, звуковой декодер, кодированная звуковая информация, способы кодирования и декодирования звукового сигнала и компьютерная программа |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
EP2446539B1 (en) * | 2009-06-23 | 2018-04-11 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
EP2473995B9 (en) | 2009-10-20 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
MX2012004648A (es) | 2009-10-20 | 2012-05-29 | Fraunhofer Ges Forschung | Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing. |
CN102859589B (zh) | 2009-10-20 | 2014-07-09 | 弗兰霍菲尔运输应用研究公司 | 多模式音频编译码器及其适用的码簿激励线性预测编码 |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
WO2011127832A1 (en) | 2010-04-14 | 2011-10-20 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
TWI480856B (zh) | 2011-02-14 | 2015-04-11 | Fraunhofer Ges Forschung | 音訊編解碼器中之雜訊產生技術 |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
-
2012
- 2012-02-14 JP JP2013519117A patent/JP5712288B2/ja active Active
- 2012-02-14 TW TW101104678A patent/TWI483245B/zh active
- 2012-02-14 AR ARP120100476A patent/AR085222A1/es active IP Right Grant
- 2012-02-14 CA CA2799343A patent/CA2799343C/en active Active
- 2012-02-14 RU RU2012148250/08A patent/RU2580924C2/ru active
- 2012-02-14 TW TW103134392A patent/TWI564882B/zh active
- 2012-02-14 EP EP12705255.3A patent/EP2550653B1/en active Active
- 2012-02-14 MY MYPI2012004908A patent/MY166394A/en unknown
- 2012-02-14 PL PL12705255T patent/PL2550653T3/pl unknown
- 2012-02-14 ES ES12705255.3T patent/ES2458436T3/es active Active
- 2012-02-14 MX MX2012013025A patent/MX2012013025A/es active IP Right Grant
- 2012-02-14 CN CN201280001344.3A patent/CN102959620B/zh active Active
- 2012-02-14 SG SG2012083069A patent/SG185519A1/en unknown
- 2012-02-14 AU AU2012217158A patent/AU2012217158B2/en active Active
- 2012-02-14 WO PCT/EP2012/052458 patent/WO2012110478A1/en active Application Filing
- 2012-02-14 BR BR112012029132-7A patent/BR112012029132B1/pt active IP Right Grant
- 2012-02-14 KR KR1020127029497A patent/KR101424372B1/ko active IP Right Grant
- 2012-11-09 US US13/672,935 patent/US9536530B2/en active Active
-
2013
- 2013-07-24 HK HK13108708.1A patent/HK1181541A1/zh unknown
-
2014
- 2014-08-04 JP JP2014158475A patent/JP6099602B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
TWI320172B (en) * | 2005-11-03 | 2010-02-01 | Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal | |
TW200943279A (en) * | 2008-04-04 | 2009-10-16 | Fraunhofer Ges Forschung | Audio processing using high-quality pitch correction |
Also Published As
Publication number | Publication date |
---|---|
TW201506906A (zh) | 2015-02-16 |
AR085222A1 (es) | 2013-09-18 |
RU2580924C2 (ru) | 2016-04-10 |
US9536530B2 (en) | 2017-01-03 |
CA2799343A1 (en) | 2012-08-23 |
AU2012217158B2 (en) | 2014-02-27 |
PL2550653T3 (pl) | 2014-09-30 |
CA2799343C (en) | 2016-06-21 |
SG185519A1 (en) | 2012-12-28 |
ES2458436T3 (es) | 2014-05-05 |
BR112012029132A2 (pt) | 2020-11-10 |
BR112012029132B1 (pt) | 2021-10-05 |
AU2012217158A1 (en) | 2012-12-13 |
TW201246186A (en) | 2012-11-16 |
JP2014240973A (ja) | 2014-12-25 |
RU2012148250A (ru) | 2014-07-27 |
CN102959620B (zh) | 2015-05-13 |
JP2013531820A (ja) | 2013-08-08 |
MX2012013025A (es) | 2013-01-22 |
MY166394A (en) | 2018-06-25 |
KR20130007651A (ko) | 2013-01-18 |
JP6099602B2 (ja) | 2017-03-22 |
HK1181541A1 (zh) | 2013-11-08 |
JP5712288B2 (ja) | 2015-05-07 |
EP2550653B1 (en) | 2014-04-02 |
US20130064383A1 (en) | 2013-03-14 |
WO2012110478A1 (en) | 2012-08-23 |
EP2550653A1 (en) | 2013-01-30 |
TWI483245B (zh) | 2015-05-01 |
KR101424372B1 (ko) | 2014-08-01 |
CN102959620A (zh) | 2013-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI564882B (zh) | 利用重疊變換之資訊信號表示技術(一) | |
AU2009267518B2 (en) | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme | |
KR101016224B1 (ko) | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 | |
JP6214160B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
US9583110B2 (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
WO2011147950A1 (en) | Low-delay unified speech and audio codec | |
WO2013061584A1 (ja) | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 | |
CN106663442A (zh) | 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序 | |
AU2020201239B2 (en) | Improved Harmonic Transposition | |
AU2023282303B2 (en) | Improved Harmonic Transposition |