TW201419269A - 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、電腦程式、與編碼音訊信號 - Google Patents
用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、電腦程式、與編碼音訊信號 Download PDFInfo
- Publication number
- TW201419269A TW201419269A TW102130443A TW102130443A TW201419269A TW 201419269 A TW201419269 A TW 201419269A TW 102130443 A TW102130443 A TW 102130443A TW 102130443 A TW102130443 A TW 102130443A TW 201419269 A TW201419269 A TW 201419269A
- Authority
- TW
- Taiwan
- Prior art keywords
- audio signal
- signal
- frequency band
- frequency
- data
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 276
- 238000000034 method Methods 0.000 title claims description 65
- 238000004590 computer program Methods 0.000 title claims description 15
- 230000008439 repair process Effects 0.000 claims description 64
- 230000003595 spectral effect Effects 0.000 claims description 23
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims 2
- 230000001052 transient effect Effects 0.000 description 19
- 238000012805 post-processing Methods 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 10
- 239000000463 material Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004321 preservation Methods 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 229910001369 Brass Inorganic materials 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本案揭示一種用以基於第一資料及第二資料再現一音訊信號之裝置,該第一資料表示該音訊信號在一第一頻帶中的一第一部分的一編碼版本,該第二資料表示關於該音訊信號在一第二頻帶中的一第二部分之旁側資訊,其中該第二頻帶包含高於該第一頻帶之頻率,該裝置包含一第一再現器,該第一再現器經組配來基於該第一資料再現該音訊信號的該第一部分。一提供器經組配來提供在該第二頻帶中的一修補信號,其中該修補信號至少部分地與該音訊信號的該第一部分不相關或至少部分地係已頻移至該第二頻帶之該音訊信號的該第一部分的一解相關版本。一第二再現器經組配來基於該第二資料及該修補信號再現該音訊信號在該第二頻帶中的該第二部分。一組合器經組配來:在由該第二再現器再現該音訊信號的該第二部分之前將該音訊信號的該再現的第一部分與該修補信號組合,或將該音訊信號的該再現的第一部分與該音訊信號的該再現的第二部分組合。
Description
本發明係關於一種用以再現音訊信號之裝置、方法及電腦程式,且具體而言,係關於一種用以在可利用的資料速率有所降低的情形中再現音訊信號之裝置、方法及電腦程式。此外,本發明係關於一種用以產生編碼音訊信號之裝置、方法及電腦程式以及對應的編碼音訊信號。
用以有效率地儲存及傳輸此等資料速率有所降低的信號之感知適應性音訊信號編碼在許多領域已獲接受。編碼演算法係已知的,詳言之為MPEG 1/2、層3「MP3」、MPEG2/4進階音訊編碼(AAC)或MPEG-H統一語音及音訊編碼(USAC)。基礎編碼技術,尤其當達成最低位元速率時,導致音訊品質降低。損害通常主要係由將要傳輸之音訊信號頻寬的編碼器側限制所導致。
在此情形中,習知的目前技術現況為:使音訊信
號在編碼器側遭受頻帶限制,以及藉由高品質音訊編碼器來僅編碼音訊信號的下頻帶(lower band)。然而,上頻帶(upper band)僅由一組參數非常粗略地表徵,該等參數例如傳達上頻帶的頻譜包絡。在解碼器側,接著可藉由以下操作來合成上頻帶:將經解碼的下頻帶信號修補至否則為空的上頻帶中,以及執行後續的參數控制式調整。
用於有限頻寬音訊信號的頻寬擴展之標準方法
使用將低頻信號部分(LF)複製至高頻率範圍(HF)中之功能,以便估計由於頻帶限制引起的資訊遺漏。原則上,此複製功能在技術上等效於藉由單邊帶(SSB)調變在時域中計算之頻譜頻移,但在計算上要簡單得多。此等方法,例如頻譜帶複製(SBR),描述於以下文獻中:M.Dietz,L.Liljeryd,K.Kjörling及0.Kunz,「Spectral Band Replication,a novel approach in audio coding」,第112屆AES大會,慕尼黑,2002年5月;S.Meltzer,R.Böhm及F.Henn,「SBR enhanced audio codecs for digital broadcasting such as「Digital Radio Mondiale」(DRM)」,第112屆AES大會,慕尼黑,2002年5月;T.Ziegler,A.Ehret,P.Ekstrand及M.Lutzky,「Enhancing mp3 with SBR:Features and Capabilities ofthe new mp3PRO Algorithm」,第112屆AES大會,慕尼黑,2002年5月;國際標準ISO/IEC 14496-3:2001/FPDAM l,「Bandwidth Extension」,ISO/IEC,2002年,或Vasu Iyengar等人的美國專利Nr.5,455,888
「Speech bandwidth extension method and apparatus」。
在此等方法中,不進行諧波變換,但下頻帶的連
續帶通信號被引入至上頻帶的連續濾波器組頻道中。藉此達成音訊信號的上頻帶的粗略估計。接著在另一步驟中,藉由後處理使用自原始信號獲得之控制資訊來使該信號的此粗略估計接近於原始信號。此處,例如,比例因數用來調適頻譜包絡、逆濾波及添加雜訊底部來調適音調及由正弦信號部分之補充,如在MPEG4標準中亦描述。
自以下文獻中描述的諧波頻寬擴展技術已知,在
合成上頻帶時,不期望之聽覺粗糙度可能被引入信號中:Nagel,F.;Disch,S.A Harmonic Bandwidth Extension Method for Audio Codecs,IEEE的聲學、語音及信號處理國際會議(ICASSP),2009年;Nagel,F.;Disch,S.;Rettelbach,N.A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs,第126屆AES大會,2009年;Zhong,H.;Villemoes,L.;Ekstrand,P.等人的QMF Based Harmonic Spectral Band Replication,第131屆音訊工程協會大會,2011年;Villemoes,L.;Ekstrand,P.;Hedelin,P.Methods for enhanced harmonic transposition,IEEE的信號處理的音訊及聲學應用研討會(WASPAA),2011年。該粗糙度之一個原因(許多原因中的一個)係修補之頻譜未對準及/或在下頻帶與第一修補之間或在連續修補之間的過渡區域中的失諧效果。諧波頻寬擴展技術經設計來改良此等兩個方面,但以計算複雜度為代
價。
在濾波器組域中,尤其在諧波頻寬擴展中,濾波
器組計算及修補實際上可能變成很高的計算工作量。在WO 98/57436中描述進階修補技術,該技術在某種有限程度上,藉由在不同頻譜修補之間引入所謂的保護頻帶及藉由進行修改後的向上複製修補以減少頻譜未對準,來避免失諧效果,同時使計算複雜度保持適度。
除此之外,存在另外的方法,諸如所謂的「盲目
頻寬擴展」,其描述於E.Larsen,R.M.Aarts及M.Danessis,「Efficient high frequency bandwidth extension of music and speech」,第112屆AES大會,德國,慕尼黑,2002年5月,其中不使用關於原始HF範圍之資訊。此外,亦存在所謂的「人工頻寬擴展」方法,該方法描述於K.Käyhkö,A Robust Wideband Enhancement for Narrowband Speech Signal;赫爾辛基技術大學,聲學及音訊信號處理實驗室,2001年的研究報告。
在J.Mäkinen等人的:AMR-WB+:a new audio
coding standard for 3rd generation mobile audio services Broadcasts,IEEE,ICASSP '05中,描述一種用於頻寬擴展的方法,其中根據SBR技術之藉由連續帶通信號之向上複製的頻寬擴展的複製操作由鏡像操作,例如,由向上取樣所取代。
用於頻寬擴展之另外的技術描述於以下文獻中。R.M.Aarts,E.Larsen及O.Ouweltjes,「A unified
approach to low and high frequency bandwidth extension」,第115屆AES大會,美國,紐約,2003年10月;E.Larsen及R.M.Aarts,「Audio Bandwidth Extension Application to psychoacoustics,Signal Processing and Loudspeaker Design」,John Wiley & Sons公司,2004年;E.Larsen,R.M.Aarts及M.Danessis,「Efficient high frequency bandwidth extension of music and speech」,第112屆AES大會,慕尼黑,2002年5月;J.Makhoul,「Spectral Analysis of Speech by Linear Prediction」,IEEE音訊及電聲學學報,AU 21(3),1973年6月;美國專利申請案08/951,029;美國專利第6,895,375號。
諧波頻寬擴展之已知方法展示出高複雜度。另一
方面,複雜度有所降低的頻寬擴展之方法展示出品質損失。尤其在低位元速率的情況下,且結合LF範圍的低頻寬,可能發生假影,諸如粗糙度及感覺不好的音色。其原因主要係如下事實:所估計的HF部分係基於頻譜之LF部分的一或多個直接複製或鏡像操作。
本發明之一目標係提供一種用於以改良的方式再現音訊信號的裝置及方法。此外,本發明之一目標係提供一種用於產生編碼音訊信號的裝置及方法,該編碼音訊信號可以改良的方式再現。本發明之另一目標係提供對應的電腦程式及對應的編碼音訊信號。
此目標係藉由以下各者來達成:如請求項1之用
以再現音訊信號之裝置,如請求項13之用以再現音訊信號之方法,如請求項12之用以產生編碼音訊信號之裝置,如請求項13之用以產生編碼音訊信號之方法,如請求項14之電腦程式及如請求項15之編碼音訊信號。
本發明的實施例提供一種用以基於第一資料及第二資料再現一音訊信號之裝置,該第一資料表示音訊信號在第一頻帶中的第一部分的編碼版本,該第二資料表示關於音訊信號在第二頻帶中的第二部分之旁側資訊,其中第二頻帶包含高於第一頻帶的頻率,設備包含:第一再現器,其經組配來基於第一資料來再現音訊信號的第一部分;提供器,其經組配來提供在第二頻帶中的修補信號,其中修補信號與音訊信號的第一部分不相關或係已頻移至第二頻帶之音訊信號的第一部分的解相關版;第二再現器,其經組配來基於第二資料及修補信號來再現音訊信號在第二頻帶中的第二部分;以及組合器,其用以在由第二再現器再現音訊信號的第二部分之前組合音訊信號的再現的第一部分與修補信號,或組合音訊信號的再現的第一部分與音訊信號的再現的第二部分。
本發明的實施例提供一種用以再現音訊信號之方法,該方法基於第一資料及第二資料再現一音訊信號之裝置,該第一資料表示音訊信號在第一頻帶中的第一部分
的編碼版本,該第二資料表示關於音訊信號在第二頻帶中的第二部分之旁側資訊,其中第二頻帶包含高於第一頻帶的頻率,該方法包含:基於第一資料再現第一頻帶中的音訊信號;提供在第二頻帶中的修補信號,其中修補信號與音訊信號的第一部分不相關或係已頻移至第二頻帶之音訊信號的第一部分的解相關版本;基於第二資料及修補信號再現第二頻帶中的音訊信號;以及在再現音訊信號的第二部分之前組合音訊信號的再現的第一部分與修補信號,或組合音訊信號的再現的第一部分與音訊信號的再現的第二部分。
本發明的實施例係關於音訊信號之再現,其提供使用解相關的子頻帶音訊信號之頻寬擴展。與已存在的方法相對比,可藉由將解相關的子頻帶音訊信號用於頻寬擴展,而不是相關的(向上複製或鏡像操作後的)子頻帶音訊信號,來避免大部分信號失真及假影,信號失真及假影對於頻寬擴展而言當前係典型的。此係藉由提供音訊信號來達成,其形成再現音訊信號的高頻部分之基礎,與音訊信號的第一部分(LF部分)不相關或解相關。本發明的實施例係基於如下認知:當再現音訊信號的第二信號部分時,不需要維持低頻部分與高頻部分之間的相關性。相反,發明人瞭解,可藉由利用解相關或完全不相關的修補信號來避免假影,諸如粗糙度及感覺不好的音色。
本發明的實施例提供一種用以產生編碼音訊信號之裝置,該編碼音訊信號包含第一資料及第二資料,第一資料表示音訊信號在第一頻帶中的第一部分的編碼版本,第二資料表示關於音訊信號在第二頻帶中的第二部分的旁側資訊,其中第二頻帶包含高於第一頻帶的頻率,該裝置包含:解相關資訊添加器,其經組配來添加編碼音訊信號資訊,該編碼音訊信號資訊係關於在音訊信號的第一部分與修補信號之間將要使用之解相關程度,當自編碼音訊信號再現音訊信號時,基於該資訊再現音訊信號的第二部分。
本發明的實施例提供一種用以產生編碼音訊信號之方法,該編碼音訊信號包含第一資料及第二資料,第一資料表示音訊信號在第一頻帶中的第一部分的編碼版本,第二資料表示關於音訊信號在第二頻帶中的第二部分的旁側資訊,其中第二頻帶包含高於第一頻帶的頻率,該方法包含:添加編碼音訊信號資訊,該編碼音訊信號資訊係關於在音訊信號的第一部分與修補信號之間將要使用的解相關程度,當自編碼音訊信號再現音訊信號時,基於該資訊再現音訊信號的第二部分。
本發明的實施例提供一種編碼音訊信號,該編碼音訊信號包含:第一資料,其表示音訊信號在第一頻帶中的第一部分的編碼版本;
第二資料,其表示關於音訊信號在第二頻帶中的第二部分的旁側資訊,其中第二頻帶包含高於第一頻帶的頻率;以及資訊,該資訊係關於在音訊信號的第一部分與修補信號之間將要使用的解相關程度,當自編碼音訊信號再現音訊信號時,基於該資訊再現音訊信號的第二部分。
因此,本發明的實施例允許以一種方式產生編碼音訊信號,該方式允許使用適合的解相關程度以適合的方式來解碼編碼音訊信號。可在編碼器側基於音訊信號的第一部分及/或第二部分之性質來確定適合的解相關程度。
2、130‧‧‧音訊信號
4‧‧‧低頻部分
6、10‧‧‧高頻部分
8‧‧‧基頻信號/信號部分
10‧‧‧頻移後的信號
12、206‧‧‧修補單元
14、210‧‧‧後處理單元
16‧‧‧旁側資訊
100‧‧‧第一再現器
102‧‧‧提供器
104‧‧‧組合器
106‧‧‧第二再現器
108‧‧‧偵測器/過渡偵測器
120、321‧‧‧第一資料
122、204‧‧‧修補信號
124、208‧‧‧組合信號
126、212、322‧‧‧第二資料
128‧‧‧再現的音訊信號
200‧‧‧頻移單元
202a~202p‧‧‧解相關單元
214‧‧‧全頻帶輸出
300‧‧‧解相關資訊添加器
320‧‧‧編碼音訊信號
323‧‧‧資訊
700‧‧‧輸入
703‧‧‧有限頻寬音訊信號
704‧‧‧音訊編碼器
705‧‧‧音訊信號/音訊信號部分
706‧‧‧音訊信號的第二部分/高頻部分/輸出/上頻帶
707‧‧‧參數計算器
708‧‧‧參數部分/參數表示/參數
709‧‧‧資料串流格式器
710‧‧‧編碼音訊信號/資料串流
711‧‧‧資料串流解譯器
712‧‧‧參數解碼器
713‧‧‧經解碼的參數
714‧‧‧音訊解碼器
715‧‧‧第一輸出
720‧‧‧頻寬擴展
777‧‧‧音訊信號的第一部分/頻移後的信號
以下,參考隨附圖式更詳細闡述本發明之實施例,其中:圖1a展示用以再現音訊信號之裝置之一實施例的方塊圖;圖1b展示用以再現音訊信號之裝置之另一實施例的方塊圖;圖2展示用以再現音訊信號之裝置之另一實施例的方塊圖;圖3展示用以產生編碼音訊信號之裝置之一實施例的方塊圖;圖4a展示在本發明的實施例之情境中的編碼器側的示意說明;圖4b展示在本發明的實施例之情境中的解碼器側的示
意說明;圖5a及圖5b展示例示出本發明的實施例之優勢的圖;圖6展示用以再現音訊信號之裝置之方塊圖,本發明自該裝置開始;以及圖7a至圖7d展示可用來闡述圖6所示之裝置之操作的信號圖。
在詳細闡述本發明的實施例之前,有必要簡要論述本發明之基礎理論思想。
如以上所闡述,基於諸如SBR(SBR=頻譜帶複製)之複製操作(或鏡像操作)之頻寬擴展將LF頻譜之大部分直接複製至HF範圍中。
參照圖6及圖7描述SBR裝置之實例。圖7A中展示音訊信號2之包絡。音訊信號2包含低頻部分(或低頻帶)4及高頻部分(或高頻帶)6。通常,在音訊信號之感知編碼中,低頻部分4係藉由諸如PCM編碼器(PCM=脈衝碼調變)之高品質音訊編碼器來編碼,而上頻帶僅由旁側資訊非常粗略地表徵。使用對應的核心編碼解碼器來傳輸表示經編碼的低頻部分之資料及表示旁側資訊之資料。圖6展示來自核心編碼解碼器的基頻信號8,該基頻信號8表示圖7b所展示之低頻部分4。將此信號8施加至單邊帶調變/向上複製單元,在此單元中將信號8頻移至高頻部分6的頻率範圍。此頻移後的信號在圖7c中展示為信號10。將頻移
後的信號10及信號8施加至修補單元12,在此單元中將兩個信號組合(相加)來獲得圖7c所展示之頻譜。信號部分8可頻移至p個不同的較高頻率範圍中,其中p1。因此,一或多個(p個)頻移後的信號及信號8之組合可在修補單元12中發生。
將修補單元12的輸出信號施加至後處理單元
14,該後處理單元14亦接收表示高頻部分6中的音訊信號之旁側資訊16。因此,基於旁側資訊16及低頻部分4的音訊信號來再現音訊信號6的高頻部分10’。圖7d中展示所得的音訊信號。後處理單元14輸出全頻帶輸出,其涵蓋低頻部分4及高頻部分6的頻率範圍。
因此,基於諸如SBR之複製操作(或鏡像操作)
的頻寬擴展將低頻頻譜之大部分直接複製至高頻率範圍中。此可藉由使用音訊信號的時域表示的單邊帶調變或藉由音訊信號的頻譜表示中的直接複製過程(向上複製)來達成。此處理步驟通常稱為「修補」。
通常,可能有多個修補被複製至不同高頻帶中。
個別頻帶可重疊或不重疊。對應的HF修補中之每一者因此與低頻率範圍(該HF修補係自其中提取)完全相關。發明人瞭解,因此,可藉由將兩個信號與頻率疊加而發生時間包絡調變,該頻率取決於LF帶與個別HF修補之頻譜位置之間的頻譜距離。
根據系統理論觀點,此現象應被視為對於有限脈衝響應(FIR)梳形濾波器之操作係二元的,該濾波器包含為
n個樣本之延遲,以Fs作為採樣頻率。此濾波器具有一幅度頻率響應,該幅度頻率響應具有為1/n*Fs之梳形寬度(幅度頻率響應之兩個最大值之間的頻譜距離)。因此,系統理論二元性具有以下直接對應:時間延遲<->頻率轉移
幅度頻率響應<->時間包絡。
發明人瞭解,由此所得的時間調變係以令人厭惡之方式可以聽見的,且可使其在波形幅度的自相關函數中可見,呈週期性重複的邊最大值之形式。圖5a中展示在針對向上複製SBR之雜訊信號包絡的自相關序列中的此等週期性重複的邊最大值。圖5a展示白雜訊的幅度包絡的自相關函數,其中用三個直接向上複製修補來擴展頻寬,該等修補彼此完全相關且與LF帶完全相關。
僅當LF信號及HF信號展示相同振幅時,才達
成最大調變深度。實踐中,調變效果因此通常略低,因為HF範圍通常比LF範圍顯著地更安靜(較不響)。應將具有明顯的泛音結構之雜訊狀信號或準固定信號當作與調變假影尤其至關重要。
對於彼此完全相關之若干修補(圖6中為p個)之
存在,以上提及之二元性當然同樣有效。幅度包絡的時間調變出現,其對於對應的FIR過濾器之幅度頻率響應而言係二元的。
因此,根據本發明之實施例,該修補或該等修補
係彼此解相關的且與LF帶解相關的。在本發明之實施例
中,使用一或多個解相關器,其分別在自低頻信號分量導出的信號被插入至較高頻率範圍中以及被後處理(可能係此種情況)之前解相關該信號。
本發明的實施例藉由使用互相解相關的修補來
避免由於複製操作或鏡像操作而發生之已闡述的問題。在本發明之實施例中,使用解相關器以個別方式將個別HF修補與LF頻帶解相關,例如,藉由全通濾波器或其他已知的解相關方法,或者以自然解相關方式立即以合成發生產生該等修補。
在本發明之實施例中,解相關程度可在解碼器側
固定地確定或調整,或者可作為參數自編碼器傳輸至解碼器。此外,可解相關整個修補或僅解相關修補之特定部分。
修補之將被解相關之部分亦作為參數自編碼器傳輸至解碼器,作為添加至編碼音訊信號之對應的資訊之部分。
與用於頻寬擴展之習知方法相比,本發明之方法
係有益的,因為藉由本發明之方法,可固有地避免對於基於LF頻帶之單邊帶調變/向上複製之當前方法而言存在的由干擾或寄生包絡調變引起之失真及聲音染色。此藉由使用HF修補來達成,該等HF修補係LF信號部分的解相關版本或與LF信號部分完全不相關。
現在參照圖4a及圖4b描述可實行本發明的實施
例之狀況。
圖4a中展示編碼器側及圖4b中展示解碼器側。
音訊信號在輸入700處被饋送至低通/高通組合中。低通/
高通組合一方面包括低通(LP)來產生音訊信號的低通濾波版本,在圖7a中例示為703。此低通濾波音訊信號由音訊編碼器704編碼。音訊編碼器係例如MP3編碼器(MPEG-1/2層3)或在MPEG-2/4標準中描述之AAC編碼器。可在編碼器704中使用提供有限頻寬音訊信號703之透明的或有利地為感知透明的表示之替代性音訊編碼器,來分別產生完全編碼的或感知編碼的及感知透明編碼的音訊信號705。由濾波器702的高通部分在輸出706處輸出音訊信號的上頻帶,該高通部分由「HP」表示。將音訊信號的高通部分,即,上頻帶或HF頻帶(亦表示為HF部分),供應至參數計算器707,該參數計算器707被實行來計算不同參數(表示旁側資訊,該旁側資訊表示音訊信號的高頻部分)。此等參數係例如呈相對粗略解析度之上頻帶706的頻譜包絡,例如,藉由針對在感知調適尺度上的每一頻率群(臨界頻帶),例如針對Bark尺度上的每一Bark頻帶,之比例因數之表示。可由參數計算器707計算之另一參數係上頻帶中的雜訊底部,其每個頻帶的能量可與此頻帶中的包絡之能量有關。可由參數計算器707計算之另外的參數包括對於上頻帶的每一部分頻帶之音調量測,該音調量測指示頻譜能量在頻帶中如何分佈,即,頻帶中的頻譜能量是否相對均勻地分佈,則其中此頻帶中存在非音調信號,或者指示此頻帶中的能量是否相對強地集中在頻帶中的某個位置,則相反,其中此頻帶存在音調信號。另外的參數在於顯式編碼峰值,該等顯式編碼峰值就其高度及其頻率而言在上頻帶
中相對強地突出,因為在沒有對上頻帶中的顯著正弦部分之此顯式編碼的情況下,頻寬擴展概念在重新建構中將僅非常初步地恢復或完全不恢復顯式編碼峰值。
在任何情況下,參數計算器707被實行來僅產生
針對上頻帶的參數708,其可遭受類似的熵降低步驟,因為該等步驟亦可在音訊編碼器704中進行以獲得量化頻譜值,例如差分編碼、預測或Huffman編碼等。接著將參數表示708及音訊信號705供應至資料串流格式器709,該資料串流格式器709被實行來提供輸出側資料串流710,該輸出側資料串流710通常將係根據某種格式之位元串流,因為其係例如按MPEG4標準來正規化。
圖7b中展示可適合於本發明之解碼器側。資料串流710進入資料串流解譯器711,該資料串流解譯器711被實行來將參數部分708與音訊信號部分705分開。參數部分708由參數解碼器712解碼來獲得經解碼的參數713。
平行於此,音訊信號部分705由音訊解碼器714解碼來獲得音訊信號777,例如,該音訊信號777在圖6中例示為8。
取決於實行方案,可經由第一輸出715輸出音訊
信號777。在輸出715處,則可獲得具有小頻寬且因此亦具有低品質之音訊信號。然而,為獲得品質改良,可利用在以下參照圖1a、圖1b及圖2所描述之本發明之方法進行頻寬擴展720,以在輸出側獲得分別具有擴展頻寬或高頻寬及高品質之音訊信號112。
圖1a中展示本發明之裝置之一個實施例,該裝
置用以再現音訊信號且因此擴展其頻寬。裝置包含第一再現器100、提供器102、組合器104及第二再現器106。任則地,可提供過渡偵測器108。第一再現器100在其輸入端接收第一資料120,該第一資料120表示音訊資料在第一頻帶中的第一部分的編碼版本。例如,第一資料120可對應於圖4b所展示之音訊信號部分705。第一再現器100基於第一資料120再現第一頻帶中的音訊信號。例如,第一再現器100可由圖4b所展示之音訊解碼器714形成。第一再現器110輸出第一頻帶中的音訊信號,該第一頻帶中的音訊信號可對應於圖4b所展示之音訊信號777。將音訊信號777施加至提供器102,該提供器102提供第二頻帶中的修補信號122。修補信號122至少部分地與音訊信號的第一部分777不相關或至少部分地係已頻移至第二頻帶之音訊信號的第一部分的解相關版本。在組合器104中將音訊信號777與修補信號122組合,諸如相加。將組合信號124輸出及施加至第二再現器106。第二再現器106接收組合信號124及第二資料126,該第二資料126表示關於音訊信號在第二頻帶中的第二部分的旁側資訊。例如,第二資料126可對應於以上關於圖4b所描述之經解碼的參數713。第二再現器106基於修補信號(位於組合信號124內)且基於第二資料126再現第二頻帶中的音訊信號。
在本發明之實施例中,第一頻帶可對應於與圖
7a所展示之音訊信號的第一部分相關聯的頻率範圍,且第二頻帶可對應於與圖7a所展示之音訊信號的第二部分相關
聯的頻率範圍。
根據圖1a所展示之實施例,第二再現器106輸出具有高頻寬之經再現的音訊信號128。
在圖1b所展示之替代實施例中,提供器102的輸出耦接至第二再現器106,且第二再現器106的輸出耦接至組合器104。因此,根據圖1b所展示之實施例,在將修補信號與音訊信號的第一部分777組合之前,根據提供器102所提供之修補信號來再現第二頻帶中的音訊信號130。同樣地,第二再現器基於第二資料126及修補信號122再現第二頻帶中的音訊信號130。根據圖1b所展示之實施例,組合器104輸出經再現的音訊信號128。
在本發明之實施例中,提供器包含頻移單元及解相關器,上述兩者經組配來將修補信號產生為已頻移至第二頻帶之音訊信號的第一部分的解相關版本。在本發明之實施例中,提供器經組配來提供與音訊信號的第一部分不相關之合成修補信號。在本發明之實施例中,提供器經組配來針對多個較高頻帶提供多個修補信號。在此等實施例中,第二再現器及第二組合器經調適來再現多個第二信號部分且將多個信號部分組合成經再現的音訊信號。
圖2中展示使用頻寬擴展來再現音訊信號之裝置的實施例,該頻寬擴展使用解相關的子頻帶音訊信號。裝置接收來自核心編碼解碼器之基頻信號,該基頻信號可為圖4b所展示之信號777。將信號777施加至頻移單元200。頻移單元200經組配來將信號777自低頻率範圍頻移
至高頻率範圍,諸如自與圖7a中的低頻部分4相關聯的頻率範圍至與圖7a中的高頻部分6相關聯的頻率範圍。
頻移單元200可經組配來將信號部分777直接向
上複製至頻域中的高頻率範圍。或者,頻移單元200可實行為單邊帶調變單元,該單邊帶調變單元經組配來在時域中進行單邊帶調變以將音訊信號的第一部分自第一頻帶頻移至第二頻帶。
將音訊信號的頻移後的第一部分施加至解相關
單元202a。音訊信號的頻移後的解相關的第一部分由解相關單元202a輸出為修補信號204。將修補信號204施加至修補單元206,在此單元中將修補信號204與音訊信號的第一部分777組合。例如,在修補單元206中將修補信號與音訊信號的第一部分串連或相加。自修補單元206輸出組合信號且將其施加至後處理單元210。
後處理單元210接收第二資料212且表示第二再
現器,該第二再現器經組配來基於第二資料212及修補信號204(包括在組合信號208中)來再現音訊信號在第二頻帶中的第二部分。同樣,第二資料212表示旁側資訊且可對應於以上關於圖4b所闡述之經解碼的參數713。後處理單元210的全頻帶輸出214表示經再現的音訊信號。
在圖2所展示之實施例中,頻移單元200及解相關單元202a表示經組配來提供修補信號204之提供器。
在本發明之實施例中,頻移單元200可經組配來將音訊信號的第一部分777頻移至多個(p個)不同頻帶。可
針對每一頻移後的版本提供一解相關單元202a-202p以提供p個修補信號。在使用一個以上的修補(諸如p個修補)之情況下,p個修補應彼此不相關且與LF頻帶不相關。接著,在修補單元206中組合與每一頻帶相關聯的頻移後的版本。可將表示較高頻帶中之每一者之旁側資訊的第二資料提供至後處理單元210,使得在後處理單元210中再現音訊信號之多個較高頻部分。
在本發明之實施例中,第一及第二頻帶(及任擇地另外的頻帶)沿頻率方向可重疊或可不重疊。
因此,在本發明之實施例中,提供器包含:頻移器單元,其經組配來將音訊信號在第一頻帶中的第一部分頻移至第二頻帶或頻移至多個不同的第二頻帶;以及解相關器,其用以將音訊信號的第一部分的頻移後的版本與音訊信號的第一部分解相關。在本發明之實施例中,解相關器的性質可與例如自空間音訊編碼解相關所已知的性質相同。在本發明的實施例中,解相關器可提供足夠的解相關,以避免信號失真及假影,信號失真及假影對於使用頻譜帶複製之習知頻寬擴展而言係典型的。解相關器可提供音訊信號的第一部分的頻譜包絡之保存及/或可提供時間包絡,即,音訊信號的第一部分之瞬態之保存。設計適合的解相關器因此通常可涉及在瞬態保存與解相關之間進行折衷。
在本發明之實施例中,解相關器可實行為時域或子頻帶時域中的IIR(IIR=無限脈衝響應)濾波器,例如,全
通濾波器,其中經由群延遲變化來達成解相關。在本發明之實施例中,解相關器可經組配來在複雜(過度採樣)的變換/濾波器組表示(DFT表示、QMF表示)(DFT=離散傅立葉變換;QMF=正交鏡像濾波器)中提供頻譜係數的相位隨機化。在本發明之實施例中,解相關器可經組配來在濾波器組表示中提供依頻率而定的時間延遲之應用。
本發明的實施例可包含信號適應性解相關器,該
信號適應性解相關器改變解相關程度以保存瞬態。針對準固定信號可提供高解相關,且針對瞬態信號可提供低解相關。因此,在本發明之實施例中,用以提供修補信號之提供器可在不同解相關程度之間切換。
在實施例中,用以提供修補信號之提供器取決於
第一信號部分是否包含指示項而可在不同解相關程度之間切換,該指示項係針對音訊信號的第一部分與音訊信號的第二部分之間的強相關性。此指示項之實施例係音訊信號的第一部分中的瞬態、音訊信號的第一部分中由脈衝列組成之有聲語音,及/或音訊信號的第一部分中的銅管樂器聲音。以下描述指示項係音訊信號的第一部分中的瞬態之實施例。
在本發明之實施例中,裝置可包含偵測器,該偵
測器經組配來偵測音訊信號的第一部分是否包含瞬態。圖1a及圖1b中示意性地展示此偵測器108。取決於偵測器108的輸出信號,提供器102可經組配來提供修補信號,針對準固定信號,即,當音訊信號的第一部分不具有瞬態時,
該修補信號具有高解相關,且若音訊信號的第一部分具有瞬態信號,則該修補信號具有低解相關。
在本發明之替代實施例中,裝置可包含信號適應
性解相關器,該信號適應性解相關器針對準固定信號啟動且針對瞬態信號部分停用。換言之,提供器可經組配來:在第一信號部分包含瞬態信號部分之情況下輸出頻移後的第一信號部分而不對其進行解相關;且僅在第一信號部分不包含瞬態或瞬態信號部分之情況下輸出解相關的修補信號。在此類實施例中,第二再現器經組配來當音訊信號的第一部分不包含瞬態時基於第二資料及修補信號再現第二頻帶中的音訊信號,且經組配來當音訊信號的第一部分包含瞬態時基於第二資料及音訊信號的第一部分之一版本來再現第二頻帶中的音訊信號,該版本已頻移至第二頻帶且未解相關。
可將瞬態或瞬態部分視為在於如下事實:音訊信
號總共改變很多,即,例如,音訊信號之能量自一個時間部分至下一時間部分改變超過50%,即,增大或減小。然而,50%臨界值僅係實例,且其亦可為更小或更大值。或者,對於瞬態偵測而言,亦可考慮能量分佈之改變,例如在自元音至噝音之過渡中。
在本發明之實施例中,提供器可經組配來提供與
音訊信號的第一部分不相關之合成修補信號。換言之,若參數後處理係細微粒度(高位元速率編碼解碼器狀況),或若信號之HF頻帶無論如何很嘈雜,則用不相關的合成修補信
號(諸如合成雜訊)進行修補可能已足夠。
在本發明之實施例中,在頻寬擴展(例如SBR)
中的LF頻帶與HF頻帶之相關性仍然對增強以下各者有所幫助:參數後處理之太粗略的時間格線(例如,由於低位元速率編碼解碼器狀況)、瞬態之精確再現,以及具有富泛音結構之音調之保存(通常,解相關不會影響音調,且因此音調之保存不會在設計解相關器時產生問題)。
就例如自空間音訊編碼解相關所已知的解相關
器而言,參考例如WO 2007/118583 A1。
在本發明之實施例中,提供器102可包含適應性
解相關器,該適應性解相關器基於自編碼器傳輸至解碼器之參數來調整HF修補之解相關。在此實施例中,裝置經組配來基於第一資料、第二資料及第三資料來再現音訊信號,該第三資料包含關於在音訊信號的第一部分與修補信號之間將要使用的解相關程度之資訊,當自編碼音訊信號再現音訊信號時,基於該資訊再現第二部分。在編碼器側,可諸如藉由本申請案之圖3所展示之解相關資訊添加器300將此第三資料添加至編碼音訊資料。除解相關資訊添加器之外,圖3所展示之裝置對應於圖4a所展示之裝置。
解相關資訊添加器300接收低通濾波器702之輸
出且可偵測來自低通濾波器702之輸出信號的性質。例如,解相關資訊添加器可偵測低通濾波器702之輸出信號中的瞬態。取決於低通濾波器702之輸出之性質,解相關資訊添加器向編碼音訊信號710添加關於在音訊信號的第一部
分與修補信號之間將要使用的解相關程度之資訊,當自編碼音訊信號再現音訊信號時,基於該資訊再現第二部分。
例如,解相關資訊可命令解碼器側的提供器執行低解相關,或在音訊信號的低頻部分中存在瞬態部分之情況下完全不進行任何解相關。
在本發明之實施例中,解相關資訊添加器亦可接
收音訊信號的高頻部分706且可經組配來自該高頻部分706導出性質。例如,在解相關資訊添加器偵測到HF頻帶係雜訊狀的情況下,解相關資訊添加器可建議解碼器側上的提供器基於合成雜訊信號來提供修補信號。
在此類實施例中,由資料串流710表示之編碼音
訊信號320包含:第一資料321,其表示音訊信號的第一部分的編碼版本;第二資料322,其表示關於音訊信號在第二頻帶中的第二部分的旁側資訊;以及資訊323,其係關於在音訊信號的第一部分與修補信號之間將要使用的解相關程度,當自編碼音訊信號再現音訊信號時,基於該資訊323來再現第二部分。
因此,本發明的實施例提供一種改良的方法,其
用於再現音訊信號,即,用於音訊信號頻寬的解碼器側擴展。在其他實施例中,本發明提供一種用以產生編碼音訊信號之裝置。在再其他的實施例中,本發明係關於此類編碼音訊信號。
藉由對如下兩者的比較,可使得本發明之方法所達成之有利效果可見:針對向上複製SBR之雜訊信號包絡
的自相關序列(展示於圖5a中),與解相關的修補的雜訊信號包絡的自相關序列(如本申請案之圖5b所展示)。圖5b係白雜訊的幅度包絡的自相關函數,其中用彼此不相關且與LF頻帶不相關之三個修補來擴展頻寬。圖5b清楚展示圖5a所展示之不期望之側最大值的消失。
本申請案並不適用於或適合於不可利用所有頻
寬的所有音訊應用。本發明之方法可用於音訊內容之散佈或廣播,例如數位無線電、網際網路串流傳輸及音訊通訊應用。本發明的實施例係關於使用解相關的子頻帶音訊信號之頻寬擴展。
雖然已在裝置之情境中描述一些態樣,但很明顯
此等態樣亦表示對應的方法之描述,其中方塊或設備對應於方法步驟或方法步驟之特徵。類似地,在方法步驟之情境中描述之態樣亦表示對應的方塊或項目或對應的裝置之特徵之描述。
取決於特定的實行方案要求,本發明的實施例可
以硬體或軟體來實行。可使用儲存有電子可讀控制信號的數位儲存媒體,例如,軟碟片、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,來進行該實行,該等電子可讀控制信號與可規劃電腦系統合作(或能夠合作)以便進行個別方法。
根據本發明的一些實施例包含具有電子可讀控
制信號的資料載體,該等電子可讀控制信號能夠與可規劃電腦系統合作以便進行本文描述之方法中之一者。
通常可將本發明之實施例實行為具有程式碼之
電腦程式產品,其中當電腦程式產品在電腦上運行時,程式碼可操作來進行方法中之一者。程式碼可例如儲存在有形機器可讀載體上。
其他實施例包含儲存在機器可讀載體或非暫時
性儲存媒體上的用以進行本文描述之方法中之一者的電腦程式。
換言之,本發明方法之一實施例因此係具有程式
碼之電腦程式,當電腦程式在電腦上運行時,程式碼用以進行本文描述之方法中之一者。
本發明方法之另一實施例因此係資料載體(或數
位儲存媒體或電腦可讀媒體),該資料載體包含記錄於其上的用以進行本文描述之方法中之一者之電腦程式。
本發明方法之另一實施例因此係資料串流或信
號序列,其表示用以進行本文描述之方法中之一者之電腦程式。資料串流或序列之信號可例如經組配來經由資料通訊連接,例如經由網際網路,被轉移。
另一實施例包含處理構件,例如,電腦或可規劃
邏輯設備,其被組配或調適來進行本文描述之方法中之一者。
另一實施例包含安裝有用以進行本文描述之方
法中之一者之電腦程式的電腦。
在一些實施例中,可規劃邏輯設備(例如,現場
可規劃閘陣列)可用來進行本文描述之方法之功能中的一
些或全部。在一些實施例中,現場可規劃閘陣列可與微處理器合作來進行本文描述之方法中之一者。通常,方法較佳由任何硬體裝置進行。
以上描述之實施例僅例示出本發明之原理。應瞭解,其他熟習此項技術者將易於瞭解對本文描述之配置及細節之修改及變更。本發明因此意欲僅受緊接在後面的專利申請專利範圍之範疇的限制,而不受特定細節的限制,該等特定細節係由本文中對實施例之描述及闡述呈現。
100‧‧‧第一再現器
102‧‧‧提供器
104‧‧‧組合器
106‧‧‧第二再現器
108‧‧‧偵測器/過渡偵測器
120‧‧‧第一資料
122‧‧‧修補信號
124‧‧‧組合信號
126‧‧‧第二資料
128‧‧‧再現的音訊信號
777‧‧‧音訊信號的第一部分/頻移後的
信號
Claims (15)
- 一種用以基於第一資料及第二資料來再現一音訊信號的裝置,該第一資料表示該音訊信號在一第一頻帶中的一第一部分的一編碼版本,該第二資料表示關於該音訊信號在一第二頻帶中的一第二部分之旁側資訊,其中該第二頻帶包含高於該第一頻帶之頻率,該裝置包含:一第一再現器,其經組配來基於該第一資料再現該音訊信號的該第一部分;一提供器,其經組配來提供在該第二頻帶中的一修補信號,其中該修補信號至少部分地與該音訊信號的該第一部分不相關,或至少部分地係已頻移至該第二頻帶之該音訊信號的該第一部分的一解相關版本;一第二再現器,其經組配來基於該第二資料及該修補信號來再現該音訊信號在該第二頻帶中的該第二部分;以及一組合器,其在由該第二再現器再現該音訊信號的該第二部分之前將該音訊信號的該再現的第一部分與該修補信號組合,或將該音訊信號的該再現的第一部分與該音訊信號的該再現的第二部分組合。
- 如請求項1之裝置,其中該第二再現器經組配來:在該音訊信號的該第一部分不包含針對該音訊信號的該第一部分與該音訊信號的該第二部分之間的一強相關性的一指示項之情況下,基於該第二資料及該修補信號來 再現該第二頻帶中的該音訊信號;且其中該第二再現器經組配來:在該音訊信號的該第一部分包含針對該音訊信號的該第一部分與該音訊信號的該第二部分之間的一強相關性的一指示項之情況下,基於該第二資料及該音訊信號之該第一部分之一版本來再現該第二頻帶中的該音訊信號,該版本已頻移至該第二頻帶且未解相關。
- 如請求項1或2之裝置,其中該提供器經組配來提供一合成修補信號,該合成修補信號與該音訊信號的該第一部分不相關。
- 如請求項3之裝置,其中該合成修補信號係一雜訊信號。
- 如請求項1或2之裝置,其中該提供器包含一頻移單元及一解相關器,上述兩者經組配來將該修補信號產生為頻移至該第二頻帶之該音訊信號的該第一部分的一解相關版本。
- 如請求項5之裝置,其中該解相關器經組配來保存該音訊信號的該第一部分的一頻譜包絡及該音訊信號的該第一部分的一時間包絡中的至少一者。
- 如請求項5或6之裝置,其中該解相關器包含以下各者中之一者:一全通濾波器,其經組配來導致該音訊信號的該第一部分中的群延遲變化;一相位隨機化器,其經組配來導致該音訊信號的該第一部分的頻譜係數的相位隨機化;以及 一施加器,其經組配來將一依頻率而定的時間延遲施加至該音訊信號的子部分該第一部分。
- 如請求項5至7中之一項之裝置,其中該解相關器包含一信號適應性解相關器,該信號適應性解相關器經組配來改變解相關程度,以便:在該音訊信號的該第一部分不包含針對該音訊信號的該第一部分與該音訊信號的該第二部分之間的一強相關性的一指示項之情況下,應用一較高解相關;且在該音訊信號的該第一部分包含針對該音訊信號的該第一部分與該音訊信號的該第二部分之間的一強相關性的一指示項之情況下,應用一較低解相關或不應用一解相關。
- 如請求項1至8中之一項之裝置,其包含一偵測器,該偵測器經組配來偵測該音訊信號的該第一信號部分是否包含一指示項,該指示項係針對該音訊信號的該第一部分與該音訊信號的該第二部分之間的一強相關性。
- 如請求項1至9中之一項之裝置,其中該提供器經組配來提供在一第三頻帶中的一第二修補信號,其中該第二修補信號與該音訊信號的該第一部分不相關或係已頻移至該第三頻帶之該音訊信號的該第一部分之一解相關版本,其中該第二修補信號與該第一修補信號不相關或解相關,其中該裝置包含一第三再現器,其中該第三再現器經組配來基於該第二修補信號及第三資料來再現該音訊信號的一第三部分,該第三資料表示關於該音訊信號在該第三頻帶中的該第三部分之旁側資訊,其中 該第三頻帶包含高於該第二頻帶之頻率。
- 一種用以基於第一資料及第二資料來再現一音訊信號的方法,該第一資料表示該音訊信號在一第一頻帶中的一第一部分的一編碼版本,該第二資料表示關於該音訊信號在一第二頻帶中的一第二部分之旁側資訊,其中該第二頻帶包含高於該第一頻帶之頻率,該方法包含:基於該第一資料再現該第一頻帶中的該音訊信號;提供在該第二頻帶中的一修補信號,其中該修補信號至少部分地與該音訊信號的該第一部分不相關,或至少部分地係已頻移至該第二頻帶之該音訊信號的該第一部分的一解相關版本;基於該第二資料及該修補信號來再現該音訊信號在該第二頻帶中的該第二部分;以及在再現該音訊信號的該第二部分之前將該音訊信號的該再現的第一部分與該修補信號組合,或將該音訊信號的該再現的第一部分與該音訊信號的該再現的第二部分組合。
- 一種用以產生一編碼音訊信號之裝置,該編碼音訊信號包含第一資料及第二資料,該第一資料表示該音訊信號在一第一頻帶中的一第一部分的一編碼版本,該第二資料表示關於該音訊信號在一第二頻帶中的一第二部分之旁側資訊,該第二頻帶包含高於該第一頻帶之頻率,該裝置包含:一解相關資訊添加器,其經組配來向該編碼音訊信號 添加資訊,該資訊係關於在該音訊信號的該第一部分與一修補信號之間將要使用的一解相關程度,當自該編碼音訊信號再現該音訊信號時,基於該資訊再現該音訊信號的該第二部分。
- 一種用以產生一編碼音訊信號的方法,該編碼音訊信號包含第一資料及第二資料,該第一資料表示該音訊信號在一第一頻帶中的一第一部分的一編碼版本,該第二資料表示關於該音訊信號在一第二頻帶中的一第二部分之旁側資訊,該第二頻帶包含高於該第一頻帶之頻率,該方法包含:向該編碼音訊信號添加資訊,該資訊係關於在該音訊信號的該第一部分與一修補信號之間將要使用的一解相關程度,當自該編碼音訊信號再現該音訊信號時,基於該資訊再現該音訊信號的該第二部分。
- 一種包含程式碼之電腦程式,當該電腦程式在一電腦上運行時,該程式碼用以進行如請求項11或13之方法。
- 一種編碼音訊信號,其包含:第一資料,其表示該音訊信號在一第一頻帶中的一第一部分的一編碼版本;第二資料,其表示關於該音訊信號在一第二頻帶中的一第二部分之旁側資訊,其中該第二頻帶包含高於該第一頻帶之頻率;以及資訊,其關於在該音訊信號的該第一部分與一修補信號之間將要使用的一解相關程度,當自該編碼音訊信號再 現該音訊信號時,基於該資訊再現該音訊信號的該第二部分。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261693575P | 2012-08-27 | 2012-08-27 | |
EP12187265.9A EP2704142B1 (en) | 2012-08-27 | 2012-10-04 | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201419269A true TW201419269A (zh) | 2014-05-16 |
TWI523004B TWI523004B (zh) | 2016-02-21 |
Family
ID=47010331
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102130443A TWI523004B (zh) | 2012-08-27 | 2013-08-26 | 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、與電腦程式 |
Country Status (15)
Country | Link |
---|---|
US (1) | US9305564B2 (zh) |
EP (2) | EP2704142B1 (zh) |
JP (1) | JP6229957B2 (zh) |
KR (1) | KR101711312B1 (zh) |
CN (1) | CN104603872B (zh) |
AR (1) | AR092228A1 (zh) |
BR (1) | BR112015004556B1 (zh) |
CA (1) | CA2882775C (zh) |
ES (2) | ES2549953T3 (zh) |
MX (1) | MX347592B (zh) |
PL (1) | PL2888737T3 (zh) |
PT (1) | PT2888737T (zh) |
RU (1) | RU2607262C2 (zh) |
TW (1) | TWI523004B (zh) |
WO (1) | WO2014033131A1 (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
WO2014126688A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
EP3028274B1 (en) * | 2013-07-29 | 2019-03-20 | Dolby Laboratories Licensing Corporation | Apparatus and method for reducing temporal artifacts for transient signals in a decorrelator circuit |
US9831843B1 (en) | 2013-09-05 | 2017-11-28 | Cirrus Logic, Inc. | Opportunistic playback state changes for audio devices |
US9774342B1 (en) | 2014-03-05 | 2017-09-26 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system |
US10284217B1 (en) | 2014-03-05 | 2019-05-07 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system |
US10785568B2 (en) | 2014-06-26 | 2020-09-22 | Cirrus Logic, Inc. | Reducing audio artifacts in a system for enhancing dynamic range of audio signal path |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP2980789A1 (en) | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
US9596537B2 (en) | 2014-09-11 | 2017-03-14 | Cirrus Logic, Inc. | Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement |
CN104195726B (zh) * | 2014-09-23 | 2016-04-13 | 宜兴市华恒高性能纤维织造有限公司 | 一种自动化2.5d立体编织装置 |
US9503027B2 (en) | 2014-10-27 | 2016-11-22 | Cirrus Logic, Inc. | Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator |
CA2991913C (en) * | 2015-06-11 | 2020-06-02 | Interactive Intelligence Group, Inc. | System and method for outlier identification to remove poor alignments in speech synthesis |
US9959856B2 (en) | 2015-06-15 | 2018-05-01 | Cirrus Logic, Inc. | Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter |
US9955254B2 (en) | 2015-11-25 | 2018-04-24 | Cirrus Logic, Inc. | Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system |
US9543975B1 (en) | 2015-12-29 | 2017-01-10 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths |
US9880802B2 (en) | 2016-01-21 | 2018-01-30 | Cirrus Logic, Inc. | Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system |
US9998826B2 (en) | 2016-06-28 | 2018-06-12 | Cirrus Logic, Inc. | Optimization of performance and power in audio system |
US10545561B2 (en) | 2016-08-10 | 2020-01-28 | Cirrus Logic, Inc. | Multi-path digitation based on input signal fidelity and output requirements |
US10263630B2 (en) | 2016-08-11 | 2019-04-16 | Cirrus Logic, Inc. | Multi-path analog front end with adaptive path |
US9813814B1 (en) | 2016-08-23 | 2017-11-07 | Cirrus Logic, Inc. | Enhancing dynamic range based on spectral content of signal |
US9780800B1 (en) | 2016-09-19 | 2017-10-03 | Cirrus Logic, Inc. | Matching paths in a multiple path analog-to-digital converter |
US9929703B1 (en) | 2016-09-27 | 2018-03-27 | Cirrus Logic, Inc. | Amplifier with configurable final output stage |
US9967665B2 (en) * | 2016-10-05 | 2018-05-08 | Cirrus Logic, Inc. | Adaptation of dynamic range enhancement based on noise floor of signal |
EP3382704A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
US10321230B2 (en) | 2017-04-07 | 2019-06-11 | Cirrus Logic, Inc. | Switching in an audio system with multiple playback paths |
US10008992B1 (en) | 2017-04-14 | 2018-06-26 | Cirrus Logic, Inc. | Switching in amplifier with configurable final output stage |
US9917557B1 (en) | 2017-04-17 | 2018-03-13 | Cirrus Logic, Inc. | Calibration for amplifier with configurable final output stage |
US10896684B2 (en) * | 2017-07-28 | 2021-01-19 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
US11158297B2 (en) * | 2020-01-13 | 2021-10-26 | International Business Machines Corporation | Timbre creation system |
GB202203733D0 (en) * | 2022-03-17 | 2022-05-04 | Samsung Electronics Co Ltd | Patched multi-condition training for robust speech recognition |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5757973A (en) * | 1991-01-11 | 1998-05-26 | Sony Corporation | Compression of image data seperated into frequency component data in a two dimensional spatial frequency domain |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE60143327D1 (de) * | 2000-08-09 | 2010-12-02 | Sony Corp | Sprachdatenverarbeitungsvorrichtung und -verarbeitungsverfahren |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
PT1423847E (pt) * | 2001-11-29 | 2005-05-31 | Coding Tech Ab | Reconstrucao de componentes de frequencia elevada |
JP4227772B2 (ja) * | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
CN1774957A (zh) * | 2003-04-17 | 2006-05-17 | 皇家飞利浦电子股份有限公司 | 音频信号生成 |
JP4597967B2 (ja) * | 2003-04-17 | 2010-12-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号生成 |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP4821131B2 (ja) * | 2005-02-22 | 2011-11-24 | 沖電気工業株式会社 | 音声帯域拡張装置 |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
WO2007118583A1 (en) | 2006-04-13 | 2007-10-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decorrelator |
US8015368B2 (en) * | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2176862B1 (en) * | 2008-07-11 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
EP2291842B1 (en) * | 2008-07-11 | 2014-03-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal |
RU2491658C2 (ru) * | 2008-07-11 | 2013-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Синтезатор аудиосигнала и кодирующее устройство аудиосигнала |
AU2009267532B2 (en) * | 2008-07-11 | 2013-04-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | An apparatus and a method for calculating a number of spectral envelopes |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102725791B (zh) * | 2009-11-19 | 2014-09-17 | 瑞典爱立信有限公司 | 用于音频编解码中的响度和锐度补偿的方法和设备 |
JP5651980B2 (ja) * | 2010-03-31 | 2015-01-14 | ソニー株式会社 | 復号装置、復号方法、およびプログラム |
WO2011148230A1 (en) * | 2010-05-25 | 2011-12-01 | Nokia Corporation | A bandwidth extender |
KR101697550B1 (ko) * | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
KR101572034B1 (ko) * | 2011-05-19 | 2015-11-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 파라메트릭 오디오 코딩 방식들의 포렌식 검출 |
-
2012
- 2012-10-04 EP EP12187265.9A patent/EP2704142B1/en active Active
- 2012-10-04 ES ES12187265.9T patent/ES2549953T3/es active Active
-
2013
- 2013-08-26 TW TW102130443A patent/TWI523004B/zh active
- 2013-08-26 AR ARP130103011A patent/AR092228A1/es active IP Right Grant
- 2013-08-27 PL PL13756417.5T patent/PL2888737T3/pl unknown
- 2013-08-27 RU RU2015110702A patent/RU2607262C2/ru active
- 2013-08-27 BR BR112015004556-1A patent/BR112015004556B1/pt active Search and Examination
- 2013-08-27 CN CN201380045118.XA patent/CN104603872B/zh active Active
- 2013-08-27 MX MX2015002509A patent/MX347592B/es active IP Right Grant
- 2013-08-27 PT PT137564175T patent/PT2888737T/pt unknown
- 2013-08-27 WO PCT/EP2013/067730 patent/WO2014033131A1/en active Application Filing
- 2013-08-27 KR KR1020157007971A patent/KR101711312B1/ko active Active
- 2013-08-27 EP EP13756417.5A patent/EP2888737B1/en active Active
- 2013-08-27 ES ES13756417.5T patent/ES2593072T3/es active Active
- 2013-08-27 JP JP2015528988A patent/JP6229957B2/ja active Active
- 2013-08-27 CA CA2882775A patent/CA2882775C/en active Active
-
2015
- 2015-02-27 US US14/634,118 patent/US9305564B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
TWI523004B (zh) | 2016-02-21 |
US20150170663A1 (en) | 2015-06-18 |
MX347592B (es) | 2017-05-03 |
JP2015526769A (ja) | 2015-09-10 |
US9305564B2 (en) | 2016-04-05 |
EP2704142B1 (en) | 2015-09-02 |
EP2888737A1 (en) | 2015-07-01 |
EP2888737B1 (en) | 2016-06-22 |
CA2882775C (en) | 2017-08-29 |
RU2015110702A (ru) | 2016-10-20 |
WO2014033131A1 (en) | 2014-03-06 |
CA2882775A1 (en) | 2014-03-06 |
JP6229957B2 (ja) | 2017-11-15 |
MX2015002509A (es) | 2015-06-10 |
KR101711312B1 (ko) | 2017-02-28 |
CN104603872B (zh) | 2017-08-11 |
ES2593072T3 (es) | 2016-12-05 |
PT2888737T (pt) | 2016-10-04 |
BR112015004556B1 (pt) | 2021-10-13 |
AR092228A1 (es) | 2015-04-08 |
PL2888737T3 (pl) | 2016-12-30 |
ES2549953T3 (es) | 2015-11-03 |
KR20150047607A (ko) | 2015-05-04 |
BR112015004556A2 (pt) | 2017-07-04 |
EP2704142A1 (en) | 2014-03-05 |
RU2607262C2 (ru) | 2017-01-10 |
CN104603872A (zh) | 2015-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI523004B (zh) | 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、與電腦程式 | |
JP7507207B2 (ja) | 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器 | |
JP6568566B2 (ja) | 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム | |
CN107077858B (zh) | 使用具有全带隙填充的频域处理器以及时域处理器的音频编码器和解码器 | |
JP6992024B2 (ja) | 独立したノイズ充填を用いた強化された信号を生成するための装置および方法 | |
CN102473414A (zh) | 带宽扩展编码器、带宽扩展解码器和相位声码器 | |
US20150187360A1 (en) | Apparatus and Method for Generating a Bandwidth Extended Signal from a Bandwidth Limited Audio Signal |