[go: up one dir, main page]

TW519629B - Data framing for adaptive-block-length coding system - Google Patents

Data framing for adaptive-block-length coding system Download PDF

Info

Publication number
TW519629B
TW519629B TW089101300A TW89101300A TW519629B TW 519629 B TW519629 B TW 519629B TW 089101300 A TW089101300 A TW 089101300A TW 89101300 A TW89101300 A TW 89101300A TW 519629 B TW519629 B TW 519629B
Authority
TW
Taiwan
Prior art keywords
sequence
audio
length
information
segment
Prior art date
Application number
TW089101300A
Other languages
English (en)
Inventor
Louis Dunn Fielder
Michael Mead Truman
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Application granted granted Critical
Publication of TW519629B publication Critical patent/TW519629B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

519629 A7 B7 五、發明說明( 部 智 慧 財 產 局 員 工 消 費 合 it 社 印 製 [發明之技術領域] *本發明係與音頻訊號的處理有關,其中音頻的資 流係、經過編碼並被組裝&編碼資 ⑷繼)。本發明尤其與改善經過編碼資訊框傳遞或是^ 復的音頻資訊串流的品質有關。 疋口 [發明背景與習知技術] &值在/多視頻7音頻线中,視頻崎頻f訊係透過資訊串 ML專遞’且其中的資訊串流則包含與、+ (align)的編碼音頻資訊框,也 …、由、,、、5玉刀梵 的立頻破編碼到給定音頻框 的曰頻貝_音_容,係純頻 而此處的視_基本上係與給定的音將 給疋的音頻框前移或是延後_固㈣量。—般而言,二 ,訊是透過需要較少t訊容量要求的編碼 = 道數-例如三到八個聲道―的音頻資訊= 在已有的頻寬中傳遞。, 這些視頻/音頻資訊經常會經過種種的編 理操作個常見的編輯操作是將—或數個= 頻/音頻貧訊切割成區段(s⑽職),並將兩寵段的尾端 接=在起开> 成新的資訊串流。通常切割的點會是在與視 頻貧訊相切齊(allgn) 4,因為這樣在新的資訊_流中, 視,同步可以被保持。剪接動畫(細腦咖⑽)的流程 即疋個簡單的範例。預計接合的兩個區段可能有不同的 ^源,例如不同頻道的資訊,或是係來自同一來源。不管 疋那個情形,此等接合通常會在音頻資訊產生可感或不 可感的不連續情形。 頁 訂 線 本紙張尺度適用中關家標準(CNS)A4規格⑵G χ 297公复 519629 ! i
'發明說明( 經濟部智慧財產局員工消費合作社印製 音頻編碼 數位音頻的成長使得沒有在處理的資訊中建立可被聽 到的人為附加物(artifact)的音頻越來越難編輯。造成此 等困難的部分原因在於數位音頻通常被處理或是編碼成 舄要視為一個整體處理的數位樣本的段落(segment)或 是方塊(block)。許多可感知或是精神聲響學音頻編碼系 統利用滤波為組或是轉換(transformations)將訊號樣本 轉換為編碼副頻(sub-band)訊號樣本或是轉換係數,此 處的係數需要經過合成濾波或是反轉成為完整的方塊以 回復成原有音頻段落的複製版本。由於被處理音頻訊號的 編輯需要在方塊間完成,所以編輯的動作會較為困難;不 這樣做的話,由切割處任一端的部分方塊所表示的音頻資 訊將無法適當地被回復。 處理節目材料(program material)重疊區段的編碼系統 會k成編輯上的頭外限制。由於編碼方塊所代表的資訊的 重疊本質的關係,就算在有完整編碼樣本方塊或係數的情 形下,原始的訊號區段也沒有辦法完整地被回復。 這個限制可以清楚地在常用的重疊方塊轉換中見到,此 轉換係一經過修正的離散餘弦轉換(discrete cosine transform, DCT),詳細的方法可以在期刊ICASSP 1987 Conf. Proc·,May 1987,ρρ·2161_64 作者為 Princen、 Johnson 與 Bradley 的文章 “Subband/Transform Coding
Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”中找到。此一特殊的時域鋸齒消除(time domain alias cancellation,TDAC)轉換係奇堆疊嚴格取樣 單邊頻分析合成系統(oddly-stacked critically sampled single side-band analysis-synthesis system)在時域上的等 * ί , - Ψ ^--------^---------線---- (請先閱讀背面之注意事項再填寫本頁) 519629 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明( 價轉換,在下文中將以奇堆疊時域鋸齒消除作為此類系統 名稱。 對利用分析視窗函式計算權重以及彼此重疊區段1/2 長的樣本區段施以前向或是分析轉換。分析轉換透過將產 生的轉換係數巨幅地降低2的方式達到嚴袼取樣;但是 此等巨幅降低會造成回復崎在時域上_ 此 2 象。透過對轉換係數方塊的反轉換或是合成轉 樣本的方塊,並在合成樣本的區段上施以適當形 二 視窗函數而後將被切成視窗的區段重疊並相加的方式二人 成流程可以消除此等鑛齒現象。例如假設有一個TDAC 刀析轉換系統產生一連串可以用來回復回原有的s 區段的方塊BKB2,則區段S!的後半段與區段 的」 半段將彼此互消。 2 、刚 但是如果來自於TDAC編碼系統的兩個編碼資訊串 流接合在兩方塊間的一個點上,則接合兩端的任一^將不 會消去另一邊的鋸齒情況。例如假設一個編碼資訊串流切 割後串流的結束點位於方塊BrB2間,而另一個資訊:流 在切割後,其起點則位於Β^Β4間。如果這兩二編碼^ 訊串流以h緊接在Β4之前的方式接合,則由方塊”匕 回復產生的區段s〗的後半段的鋸齒現象(artlfact)與由 方塊a;回復產生的區段S4的前半段的鋸齒現象就^有 辦法相互消去。 / 音頻以及視頻的同步 在同時處理音頻以及視頻的編輯應用上,最少有兩個理 由會使這類系統遭遇到更大的限制。一個理由是視頻框的 長度與音頻方塊的程度通常是不同的。另一個理由僅 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 x 297公釐) 、 m ^----------------^ (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 音頻標準 方塊長度 PCM 28 μ sec MPEG II 24 msec. MPEG III 24 msec. AC-3 32 msec. 音頻框 表格2 A7 B7 五、發明說明(4 ) 在如NTSC視頻標準這類視頻框的取樣率不是音頻取樣 率的整數倍的標準上。在下面討論的範例中係假設音頻的 取樣率是每秒鐘48 K。大部分的專業設備都使用此一取 樣率。同樣的考慮也可以應用到其它如每秒44 1 κ的取 樣率,此取樣率常被用於消費性設備上。 不同視頻以及音頻編碼標準的框長以及區段長度分別 在表格1與表格2中說明。表格中的MPEG II與 MPEG III項目係指由國際標準組織(International Standard Organization, ISO)的動態圖片專家群組 (Motion Picture Experts Group, MPEG)在標準 IS/IEC 13818-3 所規範的 MPEG-2 Layer II 與 MPEG-2 Layer III編碼技術。項目“AC-3”則是指由Dolby Laboratories 所開發並經 Advanced Television Systems Committee 在 標準A-52中規範的編碼技術。48 KHz PCM的方塊長 度係指兩相連樣本間的時間間隔。 視頻標準 框長度 DTV (30Hz) 33.333 msec. NTSC 33.367 msec. PAL 40 msec. Film 41.667 msec. 視頻框 表格1 在整合遵循這些標準的視頻與音頻的應用中,音頻方塊 以及視頻框很少是同步的。視頻/音頻同步的最小時間間 隔表示在表格3中。例如在表格中就顯示動態畫面影片 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公餐) * ^ p -------------裝--------訂---------線 . * (請先閱讀背面之注意事項再填寫本頁) 519629
五、發明說明(5 ) (每秒24個影像框)在每3秒的週期中與MPEG音 頻方塊的邊界將最多同步一次,而與AC-3音頻方塊在 每4秒的週期中,則最多僅同步一次。
音頻標準 PCM
MPEG II
MPEG III AC-3 DTV(30 Hz) 33.333 msec. 600 msec. 600 msec. 800 msec·
NTSC
PAL
Film 166.833 msec. 24.024 msec. 24.024 msec. 32.032 msec. 40 msec. 41.667 msec. 120 msec. 120 msec. 160 msec. sec. sec. 4 sec. 視頻/音頻同步的最小時間間隔 表格3 士以音頻方塊與視頻框數目比表示的同步發生的最 寸、〗間卩问列在表格4中。例如在5個音頻方塊以及h 個現頻框所成的間隔時間裡,AC-3與PAL框間的同步 發生次數不會多於一次。 4
__llUUl:VbU p:4 視頻/音頻同步的框數間隔 主故 A 12: 表格4 §視頻以及音頻係整合在一起時,編輯通常發生在視 頻,的邊界。由表格3與表格4列出的資訊顯示,這樣 的編輯很少會發生在音頻框的邊界。例如在NTSC視頻 本紙張尺㈣財 297公釐) 經濟部智慧財產局員工消費合作社印製 519629 A7 B7 五、發明說明(6 ) 以及AC-3音頻中,編輯同時發生在視頻以及音頻方塊 邊界的機訊不會大於1/960,也就是大約0.1 %。當然對 於經過切割以及接合的兩個資訊串流而言,這樣的同步是 必須的;否則有些音頻資訊就會遺失;所以對於兩個隨機 編輯的NTSC/AC-3資訊的接合幾乎都會發生在音頻方 塊邊界之外的地方,並造成一個或是兩個音頻資訊的遺 失。但是由於AC-3係利用TDAC轉換,所以就算是在 沒有資訊方塊會遺失的情況裡,也會因為前述的原因而產 生沒有對消掉鋸齒情況。 C.區段以及方塊長度的考量 除了上述會影響視頻/音頻同步的考量外,對於音頻資 訊區段長度的考量也是需要的,因為此一長度會在許多方 面影響到視頻/音頻系統的效能。 區段以及方塊長度的一個影響是資訊經過系統傳輸 時,系統延遲(latency)或是的延誤(delay)量的大小。 在編碼時接收以及緩衝儲存(buffer)音頻資訊區段,以及 對用以產生編碼資訊方塊的緩衝儲存區段進行預計的編 碼動作,都會造成延遲,此處的緩衝儲存區段可用來回復 音頻資訊區段,並產生輸出音頻訊號。由於音頻編碼以及 解碼時的傳輸延遲會使得維持音頻以及視頻資訊的切齊 (alignment)變得困難,所以我們不希望有這樣的延遲發 在利用方塊轉換以及量化(quantization)編碼的系統 中,區段以及方塊長度的另一個影響是對編碼解碼流程中 回復的音頻品質的影響。一方面,使用較長的區段長度可 以讓方塊轉換有較高頻率的選擇性,由於較高頻的選擇性 可使感知(perceptual)編碼決策一如位元配置--較為 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) * 、 · ^--------^..--------線 (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(7 ) 精確’因此對感知編碼流程較為合適。 用較長的區段長度會造成方塊轉換時的在低另時擇: (1〇w temp〇ral selectlvlty) ’ *由於低時間選擇性會使得如 位7L配置等感知編碼決策無法足夠快速地適應轉換 (adapt)以充分地配合人類聽覺系統的精神聲學特徵,所 以不利於f知編碼流程。尤其是如果區段程度超過人類聽 覺系統的刖置時間遮罩區間時,像瞬間變化等高产不穩定 訊號的編碼訊號就可能在回復的音頻訊號中二$可 聽覺的。因此,、固定長度的編碼流程就必須折衷出調和高 時間解析度要求與高頻率解析度要求的區段長度。 一個解決方法是根據預計編碼的音頻資訊"的一或數 個特徵調適區段的長度。例如當一瞬間足夠震幅被偵測到 日守,方塊編碼流程就可以透過暫時將區段長度縮短的方 式,為此瞬間事件將系統的時間與頻率解析度最佳化。由 於需要滿足某些的限制以維持轉換的鋸齒對消性質,在使 用TDAC轉換的系統中,整個調整機制會變得複雜許多。 在美國專利U.S· patent 5,394,473中討論了對於調整 TDAC轉換的長度有許多考量。 [發明的揭露] 鑑於前述的諸項考量,本發明的一個目地係在於提供 編碼與解碼方式給利用跟視頻資訊框切齊的框架(frame) 傳輸的音頻資訊,並允許包含時域鋸齒消除轉換在内的方 塊編碼流程能依據訊號的特徵調整區段以及方塊的長度。 根據本發明的各個方面可以實現的好處包含:避免或 是至少將由接合等編輯操作所產生的可聽覺雜訊 (artifact)降到最低,以及控制處理造成的延緩以便較容易 地維持視頻以及音頻的同步。
-裝--- (請先閱讀背面之注意事項再填寫本頁) kw. •線· 519629 A7 B7 五、發明說明(8 - - 一 U -------------裝--- (請先閱讀背面之注意事項再填寫本頁) 根據本%明一部份的教導,一音頻資訊的編碼方式應 包έ •接收參考说號,此一參考訊號係傳送一連串的視 頻資訊框的視頻資訊框切齊資訊;接收一傳送音頻資訊的 音頻訊號;分析該音頻訊號以辨識出該音頻資訊的特徵; 根據别述a頻資訊的特徵產生一控制訊號;利用變動方塊 編碼流程將音頻訊號區段疊合,以產生多個編碼資訊方 塊,其中方塊編碼流程係根據控制訊號調整區段的長度; 將多個編碼資訊方塊以及傳輸區段長度的控制資訊組 合,形成一與參考訊號切齊的編碼資訊框。 根據本發明的另一部份的教導,一音頻資訊的解碼應 包含:接收一參考訊號,此一參考訊號係傳送一連串的視 頻資=框的視頻資訊框切齊資訊;接收與參考訊號切齊的 編碼貢訊框與編碼音頻資訊;根據控制資訊產生一控制訊 號,利用變動方塊解碼流程將位於對應的編碼資訊框中的 多個編碼音頻資訊解碼,其中方塊解碼流程係根據控制訊 號調整以產生連續的重疊音頻資訊區段。 -I線* 根據本發明的又另—個教導,—資訊储存媒體如光 碟、磁碟、與磁帶,係'載有以視頻框方式安排的視頻資訊, 以及以編碼貢訊框方式安排的編碼音頻資訊,其中一個別 經 濟 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製 (^ _ ve)的 扁碼資sfL框係與—個別的視頻框對應,且 t ,載有序列重$區段的音頻資訊區段的長度的控 .1貝SfL、一與相連區段有個別重疊間1¾ (overlapped nrTL的區段,上述序”(sequenee)的長度係等於- 古t 度加上—個框的重4_的長度、編碼音頻資訊 變動方堍度與個別内容的方塊’當此方塊經由 j錢¥碼流程處理時,會產生重叠區中的一個 音頻貢訊區段。 ^_在本專利况明書中’編碼(codlng)與編碼器、(coder 本紙張尺度顧巾(eNS)A4 519629 V、才‘ η A7 經濟部智慧財產局員工消費合作社印製 B7 五、發明說明(9 ) 係指用來作訊號處理各種方式以及設備,而其餘如編碼後 (encoded)與解碼後(decoded)係指上述處理的結果。這 些用詞通常是用來指稱或是表示如可感知編碼流程之類 的處理流程,此類處理流程允許音頻資訊在降低資訊容量 要求的情形下傳遞或是儲存。但是在此處,這些用詞並不 暗示這類的處理。例如用詞「編碼」就包括如產生脈衝碼 調變(pulse code modulation,PCM)樣本來表示一個訊號 以及安排或是根據規範將資訊組成袼式等較為廣泛的程 序。 在本專利說明書中,用詞「區段」(segment)、「方塊」 (blocks)、與「框」(frames)係用來指稱一組或是一間隔 的資訊,而與其它的參考資料如ANSIS4.40_1992 -有時 被稱為AES-3/EBU數位音頻標準-對這些用詞的定義 可能有所不同。 、 用詞「濾波器」(filter)以及「濾波器組」(fiiterbank)在 此處係包括如垂直相位差映射濾波器(quadrature mirr〇r filter,QMF)在内的任何型式的遞迴以及非遞迴渡波。除 非在文中另有說明,否則這些用詞在此專利說明書中也用 來表示轉換。用詞「濾波後」(filtered)資訊,用來表示經 過分析濾波後的結果。 本發明的諸項特徵以及較佳實施透過參考下文中的討 淪以及伴隨的圖式可以有較佳的瞭解,在圖式中相近的參 考數目在幾個圖式中係代表相近的元件。 圖式各個設備的圖形中表示了有助於瞭解本發明的各 :f要元件。為了清楚起見,這些圖形省略了許多在實際 貝%時可此重要’但在瞭解本發明的精神時卻不那麼重要 的特徵。 實際實施本發明的訊號處理可以經由許多方式達到, 本紙張尺度適用中(eNSM4 ---- •.. > --------------裝--I (請先閱讀背面之注意事項再填寫本頁) . -線· 經濟部智慧財產局員工消費合作社印製 519629 B7 五、發明說明(l〇) 這些方式包括:經由微處理器、數位訊號處理處理器、邏 輯陣列(logic array)或其它型式的計算電路執行的程 式。實施本發明的各個部分且由指令組成可經由機器執行 的程式,可以藉由任何可以被機器讀取的儲存媒體實施, 這些媒體包含:磁性與光學媒體如光碟、磁碟、磁帶與如 可程式唯讀記憶體等固定狀態的設備。訊號濾波器可以透 過任何包括遞迴、非遞迴與數位點陣(lattice)濾波器的 方式實施。根據應用的特性以及需要,可以任意地組合數 位以及類比技術。 較為特定的提示係從屬在處理音頻以及視頻資訊串 流;但是本發明的各個部分可以被實施在不包含處理視頻 資訊的應用裡。 下列探討以及圖式的内容在此僅作為說明範例用,不 應被理解為對本發明的範疇的限制。 [圖式之簡單說明] 圖一係音頻資訊以區段方式安排以及編碼後資訊利 用與一參考訊號切齊的方塊安排的簡要圖式。 圖二係音頻資訊區段以框的方式安排以及編碼後資 訊被安排在一與一參考訊號切齊的框的簡要圖。 圖二係對音頻貢訊區段施以適應方塊編碼處理的音 頻編碼器的一個實施方式的方塊圖。 圖四係一透過對編碼後資訊框施以適應方塊解碼處 理產生音頻資訊區段的音頻解碼器的一個實施的方塊圖。 圖五係利用數個濾波器組中的一個將音頻資訊處理 成區段的方塊編碼器的一個實施的方塊圖。 圖六係對編碼後音頻資訊方塊施以眾多濾波器組之 一的方塊解碼器的一個實施例的方塊圖。 本紙張尺度適用中國國家標準(CNS)A4規恪(210 X 297公釐) ^------^---------^ (請先閱讀背面之注意事項再填寫本頁) 519629 A7 五、發明說明(11 ) 圖七係可以用來分析音頻資訊區段的瞬間變化债測 器的方塊圖。 圖八係A明®七中的瞬間變化伯測器的區塊以及子 區塊的階層架構圖。 圖九係說明建立圖七中的瞬間變化偵測器的比較器 的一個方法的步驟。 圖十係說明控制方塊編碼流程方法的步驟。 圖十:係-時域録命消除分析合成系統的方塊圖。 圖十一至十五係遵守2個控制方案的區段的多個態 樣(p象Γη)的分析以及合成視窗函式的增益輪廓圖。 圖十,、Α至十六C係說明依照一第一框格式的控制資 訊以及編碼後音頻資訊的組合。 圖十七A至十七C係說明依照一第二框格式的控制資 δίΐ以及編碼後音頻資訊的組合。 [實施本發明的模式] Α·訊號以及處理 1·區段、方塊與框 本發明係、有關於與_視頻f訊框方式傳輸的晝面 相關聯的音頻資訊的編碼以及解碼。參考圖一所一 經濟部智慧財產局員工消費合作社印製 I · I I . (請先閱讀背面之注意事項再填寫本頁) -丨線.
音頻資訊頻道的音頻訊號10的一部份被切割成重疊的 I1至18區段。根據本發明,一或多個音頻資訊頻道的 區段經過一方塊編碼流程的處理,產生由方塊21至 的編碼後資訊所組成的資訊串流2G 後方塊22 i 25 βρ是利用在一音頻資訊頻m 15音頻區段串流施以方塊編碼流程產生。如圖所示,一 個別的編碼後方塊與對應的音頻區段間有一延遲,此情形 疋由於區塊編碼流程遭遇了最少需要與接收以及緩衝儲 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公f ) 519629 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(12 ) 存(祕^:完,音頻區段所需時間的延避。在圖中 示的延遲量並不是故意要將其量放大。 … 在圖-中:音;訊號丨。的每—個區段係由 示,此形狀係用來建議可以在方塊編碼流 = 視窗函式-如轉換編碼一的時 用的刀析 \曰里^ί面圖 (gain pr〇me)。分析心函式的增量斷面圖係視窗函式作為時間 函式時的增量。-區段的視窗函式增量斷面圖與接續的另 -區段的視窗函式增量斷面圖係以此處稱為區段重Μ 隔(segment overlapped lnterval)的間隔大小相重疊。ς铁 在本發明的較佳實施中使用轉換編碼是可以預期的,但是 本發明基本上可以制用在任何根據音㈣訊區段產生 編碼後資訊方塊的方塊編碼流程中。 參考訊號30搭載視頻資訊串流内的視頻框切齊訊息 (alignment)。在顯示的範例中,框參考31至32運載^ 個連續視頻框的切齊訊息。參考訊息(reference)可以桿 示視頻框的起始或是任何想要的點。在NTSC視頻中二 個帛用的切背點係一個別視頻框的第一個場的第 10 線(tenth line)。 、本發明可以利用在音頻資訊與視頻資訊框一起傳輸 的視頻/音頻系統。此處的視頻/音頻資訊串流經常會被施 以各種的編輯以及訊號處理動作。這些動作經常會以與視 頻框切背的點為切割點,將一或數個視頻/音頻資訊切成 區段;所以將編碼後音頻資訊組合成與視頻框切齊的袼式 是較可接受的,如此可讓這些動作不會在編碼後方塊内部 做切割。 參,日、?、圖一,一 a頻資訊頻道的一序列(sequence)或框 19的區段經過處理,產生數個編碼後區塊,此等編碼後 區塊係會被組合成與框參考31切齊的框29。在此 本紙張尺度適用中國國家標準规格(210 x 297公爱)----- 圖 (請先閱讀背面之注意事項再填寫本頁) 訂· --線- 519629 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(13 ) 中,斷線係表示個別區段與方塊的界線,而實線則表示區 段框與編碼後方塊框間的界線。特別是區段框的實線 的形狀係對此框中一連串重疊區段的分析視窗函式的增 姐輪廊圖的建5義。一區段框-如框19 —的增益輪廊圖 與接續區段框的增益輪廓圖的重疊量,在此處稱之為框重 疊間隔(frame overlapped interval)。 在利用分析視窗函式與轉換的實施方式中,分析視窗 函式的形狀會影響系統的時域增益以及轉換的頻率反應 特徵。視窗函式的選擇在編碼系統的效能、效益上有重要 的影響;但是對於本發明的實踐而言,沒有任何一個特殊 的視ή形狀疋特別關鍵的。有關解釋視窗函式的影響的資 訊可以在美國專利 U.S· patent 5,109,417、U.S. patent 5,394,473、與 U.S· patent 5,903,872 中取得。 在實際的實施中,編碼後資訊的框間會加上一間隔 (gap)或保護帶(guard band)以提供編輯或是切割進行 時的容錯能力。關於這些保護帶形成方法的其餘資訊可以 在1999年3月11日申請的國際專利申請案號為 PCT/US99/05249的專利申請案中找到。至於如何在這些 保護帶傳載有用的資訊的方式則揭露在1999年11月 11曰申請的國際專利申請案號為PCT/US99/26324的專 利申請案中。 2·訊號處理概要 雖然說有些段落的音頻在大體上可以是很穩定,但 疋’通系音頻sfl號是不夠穩定(stati〇nary)的。這些段落 利用較長的區段長度進行方塊編碼會比較有效。一個例子 是像block-companded PCM此類編碼流程,透過對較長 的樣本區段編碼,可以較少的位元數達到要求的精準程 度,對穩定音頻串流進行編碼。在精神聲學轉換編碼系統 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) ---------------------訂·-------- (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(14 ) 裡,使用較長的區段可以增加轉換的頻率解析度,以達到 對個別頻譜組成成分的區分精準度,以及較為正確的精神 聲學編碼決定。 但不幸地是這些優點在高度不穩定的音頻段落中並不 存在。比方說,在有巨幅震幅瞬變現象的段落裡,長區段 的block-companded PCM編碼就非常沒有效率。在精神 聲學轉換編碼系統中,瞬變頻譜成分(comp〇nent)會^落 在整個將由合成轉換回復的區段裡;如果此一區段的長度 夠長’這些人為造成的影響將會擴散超過人類聽覺系統的 時間 置遮斷區間(pre-temporal masking interval)。所以 通常在咼度不穩定的音頻段落中,較短的區段長度是比較 合適的。 透過將編碼系統調適成可以對不同長度的區段做編碼 以及解碼可以增進編碼系統的效能。但是在一些編碼流程 裡,區^又長度的更動需要遵從一或數個條件限制。比方 說’如果要達到鋸齒消除的效果,利用時域鋸齒消除 (time-domam almsmg cancelladon,TDAC)轉換的編碼系 統就需要遵守一些限制。本發明滿足TDAC限制的實施 例將在此處說明。 a·編碼 圖三示範了音頻編碼器40的一個實施例,其係對一 或多個音頻頻道的一序列或多個框的音頻資訊區段施以 適應方塊編碼流程,產生編碼音頻資訊方塊,而這些方塊 將被、、且成編碼資訊區段。這些編碼方塊框可以與視頻資訊 框組合在一起或是嵌入視頻資訊框中。 在此實施中,分析(analyze) 45識別出透過路徑 (ρ μ ) 傳遞的音頻資訊所傳載的一或數個音頻訊號的 特欲。這些特徵的例子包括每一音頻訊號頻寬的全部或一 m ^-----I--^---------線 (請先閱讀背面之注意事項再填寫本頁)
519629 A7 五、發明說明(15 ) (請先閱讀背面之注意事項再填寫本頁) 部份在振幅或是能量上的快速變化、在頻率上經歷快速變 化的訊號能量的組成(component)、以及此類事件發生所 在的訊號段落的時間或相對位置。對應於這些偵測到的特 徵,控制46沿著路徑47產生一控制訊號,搭載預計為 母* §'頻頻道處理的區段的框裡的區段長度。編碼5 0根 據經由路徑47處接收的控制訊號調適(adapt) —方塊 編碼流程,並對由路徑44處接收來的音頻資訊施以該調 適後方塊編碼流程,以產生編碼後音頻資訊的方塊。格式 (format) 48將編碼後資訊方塊與控制訊號的一代表組合 成編碼後資訊框,此框係與經由路徑42傳遞來且載送視 頻資訊框切齊訊息的參考訊號相切齊。轉換(convert) 43 係一個選擇性元件(component),在下文中將有較詳細的 介紹。 經濟部智慧財產局員工消費合作社印製 在處理超過一個音頻資訊頻道的編碼器40的實施 方式中,編碼50可以調整一訊號編碼流程,並將其應用 到一些或全部的音頻頻道上。但是在較佳實施中,分析 45、控制46、與編碼50係對每一音頻頻道調整以及施 以獨立的編碼流程。例如在一較佳實施例中,當在某音頻 頻道偵測到瞬間變化時,編碼器40僅針對該一音頻頻道 調整編碼50所實施的編碼流程的方塊的長度。在這些較 佳實施中,在一音頻頻道所偵測到的瞬間變化並不會用來 調整其它頻道的編碼流程。 b.解碼 圖四介紹了音頻解碼器60的一個實施,此解碼器透 過對編碼後資訊的框施以適應方塊解碼流程產生一或多 個音頻頻道的音頻資訊區段,此處的編碼後資訊可以經由 搭載視頻資訊框的訊號得到。 在此實施中,解格式(deformat) 63接收與由路徑62 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629
經濟部智慧財產局員工消費合作社印製 五、發明說明(1δ ) 處得來的視頻參考相切齊的編碼後資訊框。編碼後資訊框 遞送控制資訊與方塊編碼後音頻資訊。控制65沿著路徑 67產生一搭載在一框的區段中的音頻資訊區段長度的控 制说號’這一框的區段係預計從編碼後音頻資訊方塊中回 復。可以選擇性地讓控制65也偵測在編碼後資訊框中的 不連縯並沿著路徑66產生一接合察覺(Spiice-detect) 訊號’此訊號可以用來調整解碼70的動作。解碼70根 據由路徑67處接收的控制訊號或可選擇地根據由路徑 66處接收的接合察覺訊號,調適一方塊解碼流程,並對 經由路徑64得來的編碼後音頻資訊方塊施以調適後方 塊解碼流程,以產生與透過控制訊號傳遞的長度相吻合的 音頻資訊區段。轉換68是一個選擇性的元件,在下文中 有較為詳細的說明。 B·轉換編碼的實施(Transformation Coding Implementation) 1·方塊編碼 Is (block encoder) 如前所述,編碼50可以執行許多的方塊編碼流程, 其包括 block-companded PCM, 、delta 調變 (modulation)、垂直相位差映射濾波器(quadrature minOr filter,QMF)或許多遞迴與非遞迴與點陣(丨attlce)濾波器 所提供的濾波、TDAC轉換與離散傅立葉轉換(dlscreate Fourier transform,DFT)以及離散餘弦轉換(dlscrete cosine transform,DCT)與小波轉換(waveiet transf〇rm) 所提供的方塊轉換、以及根據適應位元配置(adaptive bit allocation)的方塊量化(quantization)。雖然對於本發明的 基本觀念而言,沒有任何一個特殊的方塊編碼程序是必須 的,但是因為要達成鑛齒消除時的一些額外考量,在此處 對於利用TDAC轉換的程序會較多的說明。 本紙張尺度適用中國國家標準(CNS)A4規烙(210 X 297公釐) . 麯 I--— II-- I I I 1 屋 I I t 1111111 *;^ (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 A7 - ~~—-^——__ 五、發明說明(I7 ) 圖五說明編碼50的一個實施,此編碼對一個音頻頻 道的音頻資訊區段施以利用TDAC轉換建構的多個濾波 器組中的一個。在此實施中,緩衝暫存器(buffer) 5丨接 收來自路徑44的音頻資訊,並將此音頻資訊組合成一框 的相互重疊區段,此等區段的長度係根據由路徑47處接 收的控制訊號調適。區段與鄰接區段間重疊的量在此處稱 為區段重疊區間。開關(swltch)52依照由路徑47處接 收來的控制訊號,由多個濾波器組選出一個,實施到該框 的,段中。雖然說,在圖中的實施顯示了三個滤波器組, 但是基本上要用多少個濾、波器組都可以。 在一個實施中,開關52選擇濾波器組54施用到該 框的第一個區段,選擇濾波器組56作用到該框的最後一 =區&,並遥用濾波态組55做用到該框的其餘所有區 段。在發明實施中可以加入額外的濾波器組,並選用這些 濾波器組作用到接近該框第一個以及最後一個區段。如此 調適性地選擇濾波器組可以得到的優點將在下文中討 娜。從濾波杰組取得的資訊在緩衝暫存器58中被組合成 編碼後資訊框,此等資訊框經過路徑59傳輸至格式 48。方塊的長度係根據經由路徑47處接收而來的控制訊 號而改變。 在實際的系統中許多精神聲學感知模型的元件、適應 ,(adapdve)位元配置、以及量化可能是需要的,但為了 次月β疋起見,在圖中並沒有加入。向這些元件在實際實 施本發明時,可以被使用,但並不是必須的。、、 在編碼50的一個替代實施裡,僅使用 器組,並將其作用到做緩衝暫存器51中形成的音鮮訊 的區段。在使用如方塊編碼pCM或其餘遽波器的非重疊 方塊編碼流程裡,相鄰區段是不需要重疊的。 本紙張尺度顧中國國家標準(CNsHi^7i1Q x 297公髮) Μ-------- --------^ (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(18 ) 在圖五中或是構成各個替代發明實施的元件可以複 製使用,以提供多個音頻頻道的平行處理,或是利用串列 (serial)或多路傳輸(multiplexed)的方式使用這些元件 以處理多個音頻頻道。 2·方塊解碼器 如前所述,解碼70可以執行範圍廣泛的各種方塊解 碼流程。在一實際系統中,解碼流程應與用來準備將要解 碼的資訊的方塊編碼流程相搭配。與之前的理由相同,為 了達成鋸齒消除時的一些額外考量,在此處對於利用 TDAC轉換的程序會較多的說明。 圖六說明解碼70的一個實施,此一實施對一個音頻 頻道的編碼後音頻資訊的方塊施以利用TDAC轉換所建 構的眾多逆或合成濾波器組中的一個。在此實施中,緩衝 暫存器71由路徑64處接收編碼後音頻資訊的方塊,其 長度係根據由路徑67處接收來的控制訊號變化。開關 72依照由路徑67處接收到的控制訊號,以及選擇性地 根據從路徑67處接收到的接合察覺訊號,選擇眾多合成 濾波器組中的一個應用到編碼後資訊方塊上。在圖說明的 實施中有3個合成濾波器組;但是基本上任何數目的濾 波器組都是可以的。 在一個實施中,開關72選擇濾波器組74應用到表 示一框的區段的第一個音頻區段的方塊,選擇合成濾波器 組56作用到該框的最後一個區段,並選用濾波器組55 作用到該框的其餘所有區段。在發明實施中可以加入額外 的濾波器組,並選用這些濾波器組作用到表示接近該框第 一個以及最後一個區段的區段的方塊。如此調適性地選擇 合成濾波器組可以得到的優點將在下文中討論。從合成濾 波器組取得的資訊在緩衝暫存器78中被組合成該框區 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) % ---------------------^--------- (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(i9 ) 段中的音頻資訊重疊區段。區段的長度係根據經由路徑 67處接收而來的控制訊號而改變。相接連的區段可以該 重疊區段中加在一起以沿著路徑79產生一連串的音頻 資訊。例如在包含轉換68的實施中,音頻資訊可以沿著 路徑79傳送到轉換68。 為了解釋上的清楚,許多實際系統上需要的適應位元 配置以及解數量化(dequantization)元件在圖中並沒有顯 示。像這些特徵在實施本發明時可以被使用,但並不是必 須。 在解碼70的一個替代實施中,係採用單一個反濾波 器組,並將其作用到在緩衝暫存器71建立的編碼後資訊 方塊上。在解碼70的其它實施中,解碼流程產生的相鄰 區段並不需要重疊。 在圖六中或是構成各個替代發明實施的元件可以複 製使用,以提供多個音頻頻道的平行處理,或是利用串列 (serial)或多路傳輸(multiplexed)的方式使用這些元件 以處理多個音頻頻道。 C·主要的元件以及特徵(feature) 下文將對圖三與4所介紹的編碼器40與解碼器 60的主要元件的具體實施做較詳細的解釋。這些具體的 實施係參照單一音頻頻道做解釋,但是它們可以藉由許多 方法擴展到處理多個音頻頻道,這些方法包括元件的複製 或是利用串列(serial)或多路傳輸(multiplexed)的方式 使用這些元件。 在下列的範例中,假設一框或是一序列的音頻資訊的 區段長度係與2048個樣本的長度相等,而一框與鄰接的 框間的框重豐區間長為2 5 6個樣本。此一框長度與框重 疊區間寬係處理框頻率約30 Hz或更低的視頻框資訊系 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -· ---------------------^--------- (請先閱讀背面之注意事項再填寫本頁)
519629 五、發明說明(2〇 ) 統的較佳值。 1·音頻訊號分析 分析45可以利用許多方式建構,以辨識任何想要的 訊號特徵。在圖七所介紹的實施中,分析45係一有5個 主要部分(section)的瞬變偵測器,可以識別瞬變的發生 以及其發生的位置,或是訊號震幅快速地變化。在本實施 中’2048個音頻資訊樣本的框被切分成32個不重疊的 64-樣本方塊,且每一個方塊都經過分析以判斷在該方塊 中是否有瞬變發生。 瞬變彳貞測器的第一個部分係高通濾波器1〇1 (high-pass filter·,HPF),其將訊號分析流程中的低頻訊號組 成部分予以排除。在一較佳的實施中,HPF 101係由一具 有約7K Hz的細微(nominai) 3 dB遮斷頻率的二階無窮 脈衝回應濾波器建構而成。此一最佳遮斷頻率可以依照個 人的偏好而偏離此一細微值(nominal value)。如果需要的 話,此一細微遮斷頻率可以根據經驗上的試聽測試做修 正。 此瞬變偵測器的第二個部分係子方塊102,其將由 HPF 101處接收來的濾波後音頻資訊的框處理成方塊與 子方塊階層性架構。子方塊102在階層架構的第一層中 建立64-樣本的方塊,而在階層的第二層中,則將64-樣本方塊分成32-樣本的子方塊。 此一階層架構在圖八中介紹。方塊Bill是階層1 中的一個64-樣本方塊。在階層2的子方塊B121與 B122係方塊Bill的32-樣本分割。在本文中,方塊 Bill係指「現行」方塊,而方塊B112則是指「前一」 方塊。同樣地,方塊B120係指緊接在子方塊B121的 方塊之前,且為B110的32-樣本子方塊。在現行方塊是 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) - - t -------------裝----I---訂·--------線 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 519629 A7 B7 五、發明說明(21 ) (請先閱讀背面之注意事項再填寫本頁) 一個框的第一個方.塊的情形下,前一個方塊則代表前一個 框的最後一個方塊。如將在下文中所做說明,瞬變係透過 比較現行方塊與前一方塊的訊號階層(level)偵測。 瞬變偵測器的第三部分係波峰(peak)偵測1〇3。波 峰偵測103由第2層開始將子方塊B121中震幅最大 的樣本標示(identify)為波峰值P121,並將子方塊B122 中震幅最大的樣本標示為波峰值P122。繼續在階層1, 波峰偵測器以波峰值P121與P122中較大的值作為方 塊Bill的波峰值pill。方塊B110與B120的波峰 值P110與P120在方塊B110為現行方塊的時候,即 分別為波峰彳貞測103所決定。 瞬變偵測器的第四個部分係比較器104,其對波峰值 做比較已決定在某一方塊中是否有瞬變發生。比較器104 建立的一個方式顯示在圖九。步驟S451檢驗階層2中 的子方塊B120與B121的波峰值。步驟S452檢驗階 層2中的子方塊B121與B122的波峰值。步驟S453 則檢驗階層1中的方塊的波峰值。此一檢驗係透過比較 兩方塊的波峰值的比(ratio)與一適於該階層層次的門檻 值(threshold)完成。例如對階層2中的子方塊B120與 B121而言,步驟S451的比較可以表示成 尸120 經濟部智慧財產局員工消費合作社印製 <TH2 (la) P121 其中TH2 =階層2的門檻值。如果需要的話,在步 驟S452中可以對子方塊B121與B122的波峰值做相 近似的比較。 如果在階層2中接鄰子方塊的比較S451與S452 中沒有一個步驟的結果為真,則在步驟S453中進行階層 1方塊B110與Β Π 1的波峰值的比較。此可表示成 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629
明說明(22 尸110 乂ΤΗ\ (lb) 尸111 其中TH1=階層1的門植值。 在一個實施中,TH2為0.15而TH1則為0.25 ;但 是這些門檻值係根據個人的喜好而定。如果需要的話,這 些值可以根據試聽測試做經驗性調整。 在較佳的實施中,這些比較係在沒有使用除法的情況 下完成,這是因為若作為分母的波岭值為0,則商數就沒 有定義。上述的子方塊B120與B121例子中,步驟 S451可以表示為 P120<TH2^P121 (2) 假若從步驟S451到步驟S453的比較值沒有一個 為真,則步驟S457產生一表示現行64-樣本方塊沒有瞬 變發生的訊號,在此範例中現·行64-樣本方塊係方塊 Bill。現行64-樣本方塊的分析就此結束。 如果從步驟S451到步驟S453的比較值的任何一 個為真,則步驟S454與S455決定現行64-樣本方塊的 说5虎的大小用來驗證(justify)調整方塊編碼流程改變其 區段長度是否足夠。步驟S454將現行方塊Bill的波 峰值P111與一最小波峰值門檻做比較。在一個實施中, 此一門檻值被設定為相對於最大可能波峰值-70dB。 如果步驟S454的測試條件為真,則步驟S454接著 比較方塊 ΒΠ0與 Bill的兩個訊號能量度量 (measure)。在一實施中,一方塊的訊號能量度量係此一方 塊中的64個樣本的平方的平均值。現行方塊Bill的 訊號能量度量會拿來與相同於兩倍前一方塊B110訊號 能量度量的值相比。如果現行方塊的波峰值與訊號能量度 量通過在步驟S454與S455的測試,步驟S457會產 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公釐) - * » ^--------^--------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 51962$
五、發明說明(23 ) A7 生一代表在現行方塊Blu中有瞬 一樣測試失敗,則步驟S457產生表^在若其中 沒有瞬變發生的訊號。 行方塊Bill 此一瞬變偵測流程係對每一個 的方塊重複進行。 里的所有具重要性 2·區段長度控制 現在解釋控制46與控制65的實 第:各式的處頻Ϊ: 好_:二::=頻 :=Γ根據第二個格式,與—视頻框相對應音頻區 段序列的處理,被切割成應用到兩個序列或是子框,且彼 此分開但是相關的程序。根據第一個袼式處理音頻資訊框 的^統的控制讀(seheme)係與根據第二個格式處理音 頻資訊框的系統的控制方案相當地類似,此處的第二格式 將在下文中說明。在這些依循第一個袼式的系統中,處理 與一視頻框相對應的音頻區段的方式基本上與在第二 格式中應用到個別子串列或是子框的流程之一是一樣的 a.編瑪器 在上文以及圖三中所解釋的編碼器的實施中,控制 46由分析45處接收到一搭載在一框音頻資訊中所偵測 到的瞬變存在以及位置資訊。回應此控制訊號,控制46 產生一控制訊號’此一控制訊號搭載將框切分成重疊區段 子框的區段的長度,這些重疊區段將被一方塊編碼流程處 理。 兩個調適方塊編碼流程的方案在下文中解釋。在每個 --------t-·--------線 (請先閱讀背面之注意事項再填寫本頁) 個 經濟部智慧財產局員工消費合作社印製 519629 产~一 ί " fC - * A7 I---------— B7_ 五、發明說明(24 ) 方案中,2048個樣本的框會被切割成長度從最小的256 樣本長,到有效最長長度Π52樣本長的重疊區段。 如圖十所介紹的基本控制方法可以被用來控制任一 個方案。控制兩個方案的方法的差別僅在於測試瞬變發生 的方塊或是框間隔而已。兩個方案的間隔表列在表袼5。 W如在第-個方案中,「間隔-2」延伸範圍係從樣本128 到樣本831,此係與從2號方塊到12號方塊的一序列 66樣本方塊相對應。在第二個方案中,「間隔一2」從樣 本128延伸到樣本8卯,此係與第2到13號方塊相 對應。 —參考圖十,步驟S461檢查來自分析45的訊號以決 定在「間隔·3」裡的任-個方塊巾,是否有瞬變或是其餘 的觸發事件發生。如果此情況是真,則步驟S462產^一' 控制訊號,指示根據一「短-1」(sh〇rM)區 子框切分成區段,且步驟S463產生—個訊號;; 框依照「短-2」區段態樣將其切分成區段。 如果在步驟S461所測試的情況非為真,則步驟 本紙張尺錢財關家鮮(CNS)A4規格(210 X 297公爱"7
---i--- (請先閱讀背面之注意事項再填寫本頁)
訂 線 經濟部智慧財產局員工消費合作社印製 經濟部智慧財產局員工消費合作社印製 519629 f r; Τ: : : a? --- ---------ι'........-— ---^~1-2L_____ 五、發明說明(25 ) S464分析由分析45處接收來的訊號決定在「間隔2 中的任一方塊是否有瞬變或是其餘的觸發事件產生。女果 該條件為真,則步驟S465產生一控制訊號表示第一 = 依照區段「橋-1」(biidge-1)態樣切分成區段。如果| S463所測試的條件非為真,則步驟S460產生一押 號表示第一子框依照區段「長-1」態樣切分成區段:,汛 步驟S467檢驗來自分析45的控制訊號,決定在 「間隔-4」中的任一方塊是否有瞬變或是其它觸發事=發 生。如果該條件為真,則步驟S468產生一控制訊號表乂 第二子框依照區段「橋_2」態樣切分成區段。如果= S467所測試的條件非為真,則步驟S469產生一押制γ 號表示第二子框依照區段「長_2」態樣切分成區段二 前述的區段態樣在下文中較更仔細地討論。 b.解碼器 在上述解釋以及圖四表示的解碼器60的實施中,押制 65從經由路徑61取得的編碼後資訊框處取得控^資 訊,並相應地產生沿著路徑67產生一搭載音頻資訊區1 長度的控制訊號,此處的音頻資訊區段將由一方塊解碼= 程自其編碼後音頻資訊方塊回復。在一替代實施中,控制 65也偵測編碼後資訊的框的不連續性,並沿著路徑 產生一接合察覺(splice-detect)訊號,此訊號可以用來調 玉方塊解碼流程。此一選擇性特徵(feature)將在下文; 討論。 通常控制65會產生一個控制訊號表示在多個區段 態樣倆個將被由編碼後方塊的兩個子框回復。與前述討論 的怒樣相對應的區段態樣係與編碼器相關聯,且將在下文 中更仔細地討論。
--------------^ (請先閱讀背面之注意事項再填寫本頁) • n I n ff— _ 訂· --線· 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 χ 297公釐) 519629 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(26 ) 3·適應(adaptive)濾波器組 此處將討論對分析以及合成音頻資訊重疊區段施以 TDAC滤波組的編碼5 0與解碼7 〇。接續討論的實施 係利用名為奇堆疊時域鑛齒消除(Oddly-Stacked Time-Domain Aliasing Cancellation,0-TDAC)的 TDAC 轉換系統。在這些實施中,視窗函式以及轉換核心函式經 過適應(adapted)以處理一串列的區段或是區段的子 框’在此處區段的長度會根據前面所提及的幾個態樣變 動。在下文中,在TDAC轉換的一般介紹後,將接著解 釋各個態樣(pattern)中每一區段的區段長度、視窗函 式、以及轉換核心函式。 a.TDAC概要 (1)轉換 根據Princen等人的著作以及圖十一的介紹,一 TDAC轉換分析-合成系統包括一運用到訊號樣本重疊區 段的分析視窗函式131、一運用在視窗化區段的分析轉換 132、 一運用到從分析轉換所取得的係數方塊的合成轉換 133、 一應用到從合成轉換取得的樣本區段的合成視窗函 式134、以及一重疊匯增(overlap-acid)流程135,此流 程將對應的重疊視窗化區段加入以消除時域的鋸齒並回 復原有的訊號。 前向(forward)或分析Ο-TDAC轉換可以表示成 •It· 成 - ♦ %--------^---------^ (請先閱讀背面之注意事項再填寫本頁) 2π Ν k for 0<k<N (3 a) 且遺逆O-TDAC或合成O-TDAC轉換可以被表示 519629 A7 B7 fV< ^五、發明說明(27) N-1 X(") = Ix(々)c〇s k 二() 其中k =
2π N (” + ”V)
for 0<k<N (3b) 經濟部智慧財產局員工消費合作社印製 頻率索引(index), 訊號樣本數, 放大(scaling)常數, 區段長度’ 鋸齒消除用的項(term), 視窗化輸入訊號樣本乃, 抑幻=轉換係數众。 這些轉換的特徵係由G、#以及〜決定。其中G係 用來使分析-合成系統達到一個點·對-點(end-t⑴end)增 益(gam)的增益參數。#參數與每一個區段的樣本數相 對應’且通¥稱之為轉換長度。如前所述,此長度可能會 為了平衡轉換在頻率以及時間上的解析度而跟著變動。〜 參數則控制轉換的鑛齒產生以及錯齒消除特徵。 分析合成系統產生的時域鑛齒物(artifact)基本上係 原始訊號的時間倒轉(time_reversed)複製 謝的…制每一個區段中鑛齒物倒轉 (reflect)發生所在的反射點。透過控制反射點以及鋸齒物 的正負號,經由重疊以及相加相鄰區段的方式可以消除這 些鋸齒物。關於鋸齒消除的其它資訊可以在美國專利辽 patent 5,394,473 中找到。 (2)視窗函式 在較佳的實施中,分析以及合成視窗係由從基底視 函式得到的-或數個基本函式建構而成。一些基本 由三角視窗基底函式得到 * 二 p f〇r 〇<n<N (4)其餘的基本函式係由其它的基底視窗函式得到,使用 Μ氏張尺度適用中國國家標準(CNS)Al^i (21〇 X 297^3---- n = G N ·· n〇 S. - , 雌^--------^---------^ (請先閱讀背面之注意事項再填寫本頁) 519629 A7 B7 這些基底視窗的技術在將下一段中說明。任何對TDAC 而言具有合適重疊匯增性質的函式都可以作為此基底視 窗函式;但是在較佳的實施中,利用的基底視窗函式係 Kaiser-Bessel視窗函式。此事窗函式的第一部份可以表示 為 παΛ\· W^in.a.v) η - ν 1 ) v/2 λπα] for 0<n< v(5) 其中a = Kaiser-Bessel視窗函式的阿法(alpha)係 數(factor), w =視窗樣本數’ 取得的視窗函式的區段重疊間隔,且 ' {X12? /〇Μ-Σ· k\ 此事窗函式的最後一部分係算式5的前v個樣本的 時間反轉複製。 Kaiser-Bessel-Derived (KBD)視窗函式 [(%α,Α〇 可以從核心 Kaiser-Bessel視窗函式 Κ^,α,ν)得到。KBD視窗函式的第一個部分可以根據 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 k 二0
KBD for <n<
N (6) 得到。KBD視窗函式的最後一個部分係算式6的 時間反轉複製。 (a)分析視窗函式 在此特殊(particular)實施中所使用的每一個分 析視窗函式都是經由連接表格6-A中的兩個或是多個基 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629 .B7 A7 五、發明說明(29 ) 本函式而成。 基本函式 函式長度 說明 E064(n) 64 0(/7, ν 二 0, TV 二 64) E〇i2s(n) 128 φ{η,ν -〇^Ν- 128) E〇896(n) 896 ¢5(/7, ν = 〇, tV = 896) Ε164(π) 64 φ{η^ ν — \Ν — 64) Ε164〇(η) 640 φ{η^ν -\Ν - 640) ΕΑ〇(η) 64 (/7,α = 3.2,# = 128) for 0 < /7 -< 64 ΕΑι⑻ 128 fF狐>(/7,α 二 3.0,/^ = 256)f〇r 0 幺 128 ΕΑ2(η) 256 ^kbd - 3.0, ^ = 512) for 0 幺 < 256 ΕΛ〇(-η) 64 EA〇(n)的時間反轉複製(time-reversed replica) EAj(^n) 128 凡4;㈨的時間反轉複製 ΕΑ2(-η) 256 凡42㈨的時間反轉複製 裝--- (請先閱讀背面之注意事項再填寫本頁) 訂:
基本視窗函式 表格6-A 在兩個不同控制方案中使用的數個區段態樣的分析 視窗函式係經由下述的方式從基本函式建立出。 (b)合成視窗函式 經濟部智慧財產局員工消費合作社印製 在一般的TDAC系統中,會對每一個區段施以相同 (identical)分析與合成視窗函式。在前解釋的實施中,對 每一個區段所使用的通常也都是相同分析與合成視窗函 式,但是對一些區段則是使用替代或是「修正過」的合成 視窗函式,以增加分析合成系統的點對點效能。通常替代 或是修正過合成視窗函式係使用在「短」或是「橋」(bridge) 區段態樣結尾的區段上,以取得重疊間隔為256個樣本 的框的點對點框增益輪廓圖。 替代合成視窗函式的使用可以透過如圖六所介紹的方 塊解碼器的一個實施達成,此方塊解碼器的實施係根據經 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629
經濟部智慧財產局員工消費合作社印製 五、發明說明(3〇 ) 由路徑67或可選擇地由路徑66處所取得的控制訊號 對框中的各個區段施以不同的合成濾波器組。例如使用替 代和程式窗函式的濾波器組74與濾波器組%可以被 應用到位於框末端的區段,而採用一般合成視窗函式的濾 波為75則可應用到框内的區段。 (1)纟支更頻率響應特徵(frequency reSp〇nse characteristics) 、透過在框重疊間隔末端區段上使用替代合成視窗函 式,方塊解碼流程可以取得框末端的區段的點對點分析合 成系統頻域回應(frequenCy domain response)或時域響應 (增盈輪廓圖)。每一區段的點對點回應基本上係與從應 用到該區段的分析視窗函式與合成視窗函式的乘積得到 的視窗函式回應相同。這可透過代數表示為: WP(n) - WA(n)WS(n) 其中灰4⑻=分析視窗#式’ 阶:=合成視窗函武’ 阶P㈨=乘積視窗函式。 如果一合成視窗函式被修改來將點對點頻率響 應轉換成其它想要的回應,則該合成視窗函式更動後,其 本身與分析視窗函式的乘積係與具有想要的回應的乘積 視窗相等。如果我們想要的係與阶?D相對應的頻率響 應’且用來作訊號分析的係分析視窗函式灰4,則此關係 可以表示為 WPD(n)^WA(n)WSx(n) (8) 其中PF5V⑻=轉換頻率響應所品的合成視窗函式。 這可改寫為: 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公爱) -------------^--------^---------,Μ (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(31 ) WS (n) = ' fVA(n) (9) 如果框重疊間隔延伸到與區段結尾才目重疊的鄰 接區I又日守’一個框的末尾區段的視窗函#崎⑻的實際 形狀就有些較為複雜。但不論如何,算式(express腿” 都精確地表示出不與框中其它區段相重疊的區段的末尾 部分的視窗函式對於使用〇-TDAC的系統而 言,該部分係相等於該區段長的一半,或是丄 如果KBD乘積視窗函式阶㈨的阿^係數 大過KKBD分析視窗函式%4的阿法係數相當地多, 則用來修正點對頻率響應的合成視窗函式^^必須要有 接近框邊界的極大的值。但不幸地,有此形狀的合成視窗 函式的頻率響應特徵相當不良,·且會將低回復後訊號的音 頻品質。 此一問題可透過捨棄位於框邊緣附近且分析視 窗函式有最小值的一些樣本將其最小化或是避免。這些捨 棄的樣本可以被設定為〇或是直接排除在處理之外。 使用具有較低阿法值KBD視窗函式來處理一 般編碼的系統,通常需要對合成視窗函式做些微的更動, 以及捨棄框末尾的一些樣本。 關於修正合成視窗函式以改變一分析合成系統 的點對點頻率響應與時域增益輪廓圖特徵的其餘資訊可 以在美國專利U.Spatent 5,903,872中找到。 要求的乘積視窗函式也應提供要求的 時域響應會增益輪廓圖。一個想要的增益輪廓圖的範例顯 示在算式10中’並在下一段中討論。 (ii) 改變框的增益輪扉圖(gain profile) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) -------------^--------^---------^ (請先閱讀背面之注意事項再填寫本頁) 519629 己
7 7 A B 五、發明說明(32 ) 替代合成視窗函式的使用也讓方塊解碼流程可以取得 所想要每一個框的時域增益輪廓圖。當所想要的框增益輪 廓圖與使用傳統未修正合成視窗函式所產生的增益輪廓 圖所有不同時,就在匡重疊區間隔的區段上使用替代或是 修正後合成視窗函式。 一框的「初始」(initial)增益輪廓圖,在修正合成視窗 函式之前,可以表示為 GP{n,a,x,v) 0 for Ο < η < x {η,α,ΐν - 4χ) for χ < χ <ν - χ (10) for ν - χ < η <ν
KBD 其中位於框邊界且被捨棄的樣本的數目,以及 V =框重疊間隔。 (111)基本函式 在此特定實施中所使用的每一個合成視窗函式 都是經由連接(concatenating)表格6-Α與6-Β中兩 個以上的基本函式取得。 --------------裝--- (請先閱讀背面之注意事項再填寫本頁) 訂: -丨線· 經濟部智慧財產局員工消費合作社印製 基本函 式 函式 長度 說 明 ES〇(n) 192 'GP(/7,a = 3,χ = 0,ν = 256) v for 0 < π < 64 ⑽。⑻ GP(n, a = 3,x = Ο,ν = 256) · WA0 (/?) for 64 < /? < 192 ES^n) 256 J GP{n^r6A,a -2,x -0,v - 256)'WAQ{n) for 0 < /7 < 192 I WAx{n) for 192 < a? <256 ES2(n) 128 J GP(^ + 192,a = 3,x = 0,v = 256).奶4丨⑻ for 0 < a? < 64 [ WAX {n) for 64 <«<256 ES3(n) 256 G^a = 3,x = 0,v = 256) 0 <,?<128 叫⑻ a = 3, x = 0, v 二 256). for 128 <n< 256 ES4(n) 128 GP(" + 128,a = 3,x = 0, v = 256). _0(/7) for 0 < /7 < 128 本紙張尺度適用中國國家標準(CNS)A4規格(210 χ 297公釐) \9 2 6 9 11 5 經濟部智慧財產局員工消費合作社印製 五、發明說明(
ES〇(-n) 192 ESi(-n) 256 ES2(-n) 128 ES3(-n) 256 ES4(-n) 128
時間反身j复製 時間 基本視窗函式 表袼6_B (time-reserved repl 個基ΐίΐ :所顯示的函“切係-經由連接. 窗函式。而ΪΓ2神,而成的--樣本: 石山㈨十£>1沪~ 則疋一經由連接基本函, 在兩個不同的抑 ®函式。 成視窗函式係經由:二案J使用的數㈣ b·方塊編碼的控制方^蘭的方式建立。 〆個方素編碼流程的方案將在此處做說明。在一 μ 48個樣本的框都將被切分為長度由最/ 的 ㈣本到有效最大長度為II52個樣本的重㈤ 段。在處理框頻率約為3〇 Ηζ或是更低的儲存於框中《 資訊的系統的較佳實施中,每個框的兩個子框都被切分乂 具不同長度的重疊區段。 每一個子框都依照幾個區段態樣的其中一個做i 分。每一個態樣都指定了一序列的區段,其中每一個區4 係被一特定的分析視窗函式給視窗化,且經由一特定的: 析轉換進行轉換。在每一特定區段態樣中使用的特定分; 視窗函式與分析轉換列表在表格7中。 (請先閱讀背面之注意事項存填寫本貢) g尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629 齡,, 五、發明說明(34 ) Α7 ------------ Β乙 區段識別符 號 分析視窗函式 分析轉換 G Ν η〇 A256-A ΕΑ〇(η)+ΕΑ1Μ + Ε064 (η) 1.15 256 257/2 A256-B ΕΑ ι(η) + ΕΑ ι(-η) 1.00 256 129/2 A256-C Ε640 (η) + ΕΑ! (η) + ΕΑ “-η) 1.15 256 1/2 A384-A ΕΑΙ~(η)+ΕΑ1^η)+Ε0}28(η) 1.50 384 385/2 A384-B ΕΑ 2(νι) ^ΕΑι(-η) 1.22 384 129/2 A384-C ] ΕΑι(η) +ΕA 2(-11) 1.22 384 257/2 A3 84-D \E0128(n)+EA1(n)^EA1M 1.50 384 1/2 A512-A EA2(n) +El64fn) ^EAj(^) +E 〇64(n) 1.41 512 257/2 A512-B Ε064(η)^ΕΑ1(η)+Εΐ64(η)^Ε Λ2(-η) 1.41 512 257/2 A2048-A ΕΑ2(π) ^Ε164〇(π) Λ~ΕΑ2(-η) + Ε〇896(Η) 3.02 2048 2049/2 A2048-B Ε〇896⑻ + ΕΑ2(η) + Ε1640(η) + ΕΑ2(-η) 3.02 2048 1/2 -------------^--- (請先閱讀背面之注意事項再填寫本頁) 分析區段型別(type) 訂 ά 表袼7 透過指定運用到區段上的分析視窗函式與運用到視 窗化樣本區段的分析轉換,表袼的每一個列代表了 一個別 的區段型別(type)。在表格中的分析視窗函式係以前面討 論的基本視窗函式的連接表示。分析轉換則是以前述的參 數G、yv、與…做解釋。 經濟部智慧財產局員工消費合作社印製 (1)第一個方案 在第-個方案中,每-個態樣的區段的長^被限制成 需為2的整數次方。此-限制可以降低建$分析與合成 轉換時所需的處理資源。 在短-1態樣中包含有8個區段,其中第一個區&係 一 A256-A型別的區段,而接續的7個區1又則是 A256-B型別的區段。而在短-2態樣中也包含有個區 段,其中前7個區段係A256-B型別的區段’而最後— 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629 A7 B7 五、發明說明(35 ) 個區段則是A256-C型別的區段。 裝---- (請先閱讀背面之注意事項再填寫本頁) 橋-1態樣則包含7個區段,其中第一個區段係— A256-A型別的區段,中間的5個區段則是A256B型 別的區段,而最後的一個區段則是一 A512-A型別的區 段。而橋-2態樣也包含7個區段,其中第一個區段係— A512-B型別的區段,中間的5個區段則是A256B型& 的區段,而最後的一個區段則是一 A256-C型別的區段。 長-1態樣則僅包含單一個Α2048-Α型別的區段。雖 然說此一區段的實際長度是2048個樣本長,但是實際的 時間解析度(temporal resolution)有效長度僅為Π52個 樣本,這是由於在分析視窗函式中,僅有1152個點的值 不為0。長-2態樣包括單一 A2048-B型別的區段。該區 段的有效長度是1152。 這些區段的態樣整理在表格8-A中。
ΐ段 態樣 區段型別序歹丨J (sequence of segment types) 短-1 A256-A A256-B A256-B A256-B A256-B A256-B A256-B A256-B 短-2 A256-B A256-B A256-B A256-B A256-B A256-B A256-B A256-C 橋-1 A256-A A256-B A256-B A256-B A256-B A256-B A512-A 橋-2 A512-B A256-B A256-B A256-B A256-B A256-B A256-C 長-1 A2048-A 長-2 A2048-B --線-
第' —控制方案的分析區段悲樣 表格8-A 經濟部智慧財產局員工消費合作社印製 根據如圖十二所示的第一控制方案,控制46可以指 定各種組合的區段態樣。標示「短-短」的列說明「短-1」 到「短-2」區段^&樣組合的分析視窗函式增益輪廓圖。而 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 經濟部智慧財產局員工消費合作社印製 519629 m ': _ A? B7 五、發明說明(36) 標示「長-橋」的列則說明「長-1」到「橋-2」區段態樣組 合的分析視窗函式增益輪廓圖。圖的其它列則是表示其它 橋與長區段態樣組合的分析視窗函式的增益輪廓圖。 (2)第二方案 在第二個方案中,一些態樣的某些區段的長度係為 384,此數目不是2的整數次方。此一區段長度的使用會 引致額外的成本(cost)但是與第一個控制方案相較下有 一個優點。額外的成本產生的原因是因為建立384-樣本 區段的轉換需要額外的處理資源。此額外的成本可以透過 將每一個384-樣本區段切割成3個128-樣本的子區 段、兩兩組合每一區段的樣本以產生32個複數 (complex value)、對每一個複數值樣本區段施以複數快速 傅立葉轉換(Fast Fourier Transform, FFT)、組合結果以取 得想要的轉換係數。關於此處理技巧的額外資訊可以在美 國專利 U.S· patent 5,394,473、U.S. patent 5,297,236 與 U.S· patent 5,890,106 號,以及 Oppenheim and Schafer 所 著的「Digital Signal Processing」,Englewood Cliffs, N.J.:Prentice-Hall,Inc·,1975 中找到。使用 384_樣本方塊 的好處在於可以使用有較好頻率響應特徵的視窗函式,以 及降低處理的延遲。 「短-1」態樣包含8個區段,其中第一個區段係一 A384-A型別的區段,而接著的7個區段則是A256-B 型別的區段。A3 84-A型別區段的有效長度疋256。在「短 -2」態樣中則包含7個區段,其中前6個區段係A256-B 型別的區段,而最後一個區段則是A384-D型別的區段。 A384-D型別區段的有效長度是256。與其餘區段態樣的 組合不同,此態樣組合的兩個子區段的長度是不同的。 「橋-1」態樣包含7個區段,其中第一個區段係一 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -------------裝·-------訂·--------線 (請先閱讀背面之注意事項再填寫本頁) 519629
區段 態樣 區段態樣序列 短-1 A384-A A256-B A256-B A256-B A256-B A256-B A256-B A256-B 短-2 A256-B A256-B A256-B A256-B A256-B A256-B A384-D 橋-1 A384-A A256-B A256-B A256-B A256-B A256-B A384-C 橋-2 A384-B A256-B A256-B A256-B A256-B A256-B A384-D 長-1 A2048-A 長-2 A2048-B A7 B7 五、發明說明(37 ) A384-A型別的區段,中間的5個區段是A256B型別 的區段’而最後的區段則是A384-C型別的區段。A384-A 型別區段的有效長度是256。「橋-2」態樣則包含7個 區段,其中第一個區段係一 A384-B型別的區段,中間 的5個區段是A256B型別的區段,而最後的區段則是 A3 84-D型別的區段。 「長-1」態樣僅包含單一個A2048-A態樣區段。此區 段的有效長度是1152。「長-2」態樣僅包含單一個 A2048-B態樣區段。此區段的有效長度是1152。 這些區段態樣整理在表格8_B。
第二控制方案的分析區段態樣 表格8-B 根據如圖十三所示的第二控制方案,控制46可以指 定各種組合的區段態樣。標示「短-短」的列說明「短-1」 到「短-2」區段態樣組合的分析視窗函式增益輪廓圖。而 標示「長-橋」的列則說明「長-1」到「橋-2」區段態樣組 合的分析視窗函式增益輪廓圖。圖的其它列則是表示其它 橋與長區段態樣組合的分析視窗函式的增益輪廓圖。「橋 -1」與「橋-2」組合雖然沒有顯示,但是在此控制方案中 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) --------t---------^ (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 519629 A7 B7 五 、發明說明(38 也是一個合法的組合。 c•方塊解碼的控制方案 兩個調適方塊解流程的方案將在此處做說明。在每一 個方案中,編碼資訊的框將被解碼產生2〇48個樣本,這 些樣本被切分為長度由最小的256個樣本到有效最大長 度為1152個樣本的重疊區段。在處理框頻率約為30 Hz 或是更低的儲存於框中的資訊的系統的較佳實施中,每個 框的兩個子框都被切分成具不同長度的重臺區段。 每一個子框都依照幾個區段態樣的其中一個做切 分。每一個態樣都指定了 一序列的區段,其中每一個區段 係經由一特定的合成轉換產生,且轉換的結果都經由一特 定的合成視窗函式做視窗化。每一特定區段態樣中使用的 特定合成視窗函式與合成轉換列表在表格9中。 經濟部智慧財產局員工消費合作社印製 座段識別 ^^7 ο K 合成視窗函式 合成轉換 N n〇 ES〇(n) +E〇64 ⑻ 256 257/2 S256-B EA1(n)^-EAI(-n) ' 256 129/2 S256-C E(S4〇(yi) ^ES〇(-yi) 256 1/2 S256-D1 ESi(n) ^ 256 129/2 ^256^02 ES+n) ~^^ 256 129/2 525^03 ESM+EAJ-n) -一 256 129/2 525^04 ΕΑι(η)^Ε82(-η) 256 129/2 ES4(n) -一 256 129/2 ES4(-n) ^-一 256 129/2 ES3(n)^E0128(n) 〜-一 384 385/2 EA2(n) + EA1(-n) ~— 一 384 129/2 EAi(n) +EA2(-n) 384 257/2 S384^d E〇i2s(^) + ES3(-n) 384 1/2 S5j2^A EA2(n)^El 64(n)^EA}^n)^E〇64fn) 512 257/2 [S512-B \E064(n) + EA i ⑻ + E 512 257/2 本紙張尺度適用;家標準(CNS)A4規格(21G X 297公$ A7 B7 ΕΑ2(η)^Ε164〇fn)+EA2(-n)^E〇896(n) 2048 2049/2 Ε〇896(η) +ΕΑ)(η) +E164〇(n) +EA2(-n) 2048 1/2 519629 五、發明說明(39 ) S2〇iiA 82048^ 合成區段型別(type) 表格9 透過指定實施到用以產生樣本區段的編碼後資訊方 塊的合成轉換以及實施在用以產生視窗化區段樣本的結 果區段的合成視窗函式,表格的每一個列代表了 一個別的 區段型別(type)。表格中的合成轉換係透過前面所討論的 參數#以及心表示。而表格中的合成視窗函式則是以 前面討論過的基本視窗函式的連接表示。解碼流程進行時 的一些合成視窗函式係表格所列方成的修正版。這些修正 或是替代視窗函式係用來增進點對點系統的效能。 (1)第一個方案 在第一個方案中,每一個態樣的區段的長度被限制成 需為2的整數次方。此一限制可以降低建立分析與合成 轉換時所需的處理資源。 經濟部智慧財產局員工消費合作社印製 在短-1態樣中包含有8個區段,其中第一個區段係 一 S256-A型別的區段,第二個區段係一 S256-D1型別 的區段,第三個區段則是一 S256-D3型別區段,而接續 的5個區段則是S256-B型別的區段。而在短-2態樣中 也包含有8個區段,其中前5個區段係S256-B型別 的區段,第六個區段是S256-D4型別的區段,第七個區 段則係一 S256-D2型別的區段,而最後一個區段則是 S256-C型別的區段。 「短-1」態樣中第一區段的分析以及合成視窗函式的 形狀,以及分析與合成轉換的W以及~參數如此設計 的原因在於如此一來,此一第一區段的音頻資訊可以在該 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐)
區I又的則64個樣本沒有鋸齒物的情況下獨立於其它的 區段做回復。這樣做可以讓根據「短_!」態樣被切分成區 段的資訊框不时慮㈣消除便將其貼在任意資訊串流 之後。 「短-2」態樣中最後一個區段的分析以及合成視窗函 式的形狀,以及分析與合成轉換如此設計的原因在於如此 一來,此一最末尾區段的音頻資訊可以在該區段的後64 個樣本沒有鋸齒物的情況下獨立於其它的區段做回復。這 樣做可以讓減「短_2」態樣被切分成區段的資訊框不用 考慮鋸齒消除便讓任意資訊串流貼在其後頭。 關於視窗函式與轉換的各種考量在美國專利us patent5,913,191中有深入的介紹。 519629 五、發明說明(40) 「橋-1」態樣則包含7個區段,其中第一個區段係 一 S256-A型別的區段,第二個區段則是一 S256-D1型 別的區段’第二個區段是一 S256-D3型別的區段,而接 續的3個區段則是S256B型別的區段,最後的一個區段 則是一 S512-A型別的區段。而「橋_2」態樣也包含7個 區段’其中第一個區段係一 S512-B型別的區段,接續的 3個區段則是S256B型別的區段,第五個區段是一 S256-D4型別的區段,第六個區段是S256-D2型別的區 段,而最後的一個區段則是一 S256-C型別的區段。 「橋-1」態樣的第一個區段與「橋_2」態樣的最後一 個區段可以分別在前64個樣本與後64個樣本沒有鋸 齒物的情形下,獨立於其它的區段做回復。如此可以讓「橋 -1」態樣的區段不用考慮鑛齒消除即接到任意的資訊串流 之後,也可讓「橋-2」態樣的區段在不用考慮鋸齒消除的 情況下後接任意的資訊申流。 「長-1」態樣則僅包含單一個S2048-A型別的區 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) - - 、 一 --------^---------^ (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 519629 A7 --------B7___ 五、發明說明(41 ) ^^ (請先閱讀背面之注意事項再填寫本頁) 段。雖然說此一區段的實際長度是2048個樣本長,曰日 實際的時間解析度(temporal resolution)有效長户僅= 1152個樣本’這是由於在合成視窗函式中,僅有Hu : 點的值不為〇。長-2態樣包括單一 S2048-B型別的區 段。該區段的有效長度是1152。 「長-1」怨樣的第一個區段與「長-2」態樣的最後一 個區段可以分別在前256個樣本與後256個樣本沒有 鋸齒物的情形下,獨立於其它的區段做回復。如此可以讓 「長-1」態樣的區段不用考慮蘇齒消除即接到任意的資訊 串流之後’也可讓「長-2」悲樣的區段在不用考慮錯齒消 除的情況下後接任意的資訊串流。 這些區段的態樣整理在表格10-A中。
態樣 區段型別序列(sequence of segment types) 短-1 S256-A S256-D1 S256-B S256-B S256-B S256-B S256-B S256-B 1 S256-B S256-B S256-B S256-B S256-B S256-D4 S256-D2 S256-C 橋-1 S256-A S256-D1 S256-D3 S256-B S256-B S256-B S512-A 橋-2 S512-B S256-B S256-B S256-B S256-D4 S256-D2 S256-C 長 S2048-A 長-2 S2048-B 弟一控制方案的合成區段態樣 經濟部智慧財產局員工消費合作社印製
表格10-A 根據如圖十四所示的第一控制方案,控制65可以指 定各種組合的區段態樣。標示「短-短」的列說明「短-1」 到「短-2」區段態樣組合的合成視窗函式增益輪廓圖。而 標示「長-橋」的列則說明「長-1」到「橋-2」區段態樣組 合的合成視窗函式增益輪廓圖。圖的其它列則是表示其它 ^紙張尺度適用中_家標準(CNS)A4規格(210 X 297公釐) 519629
經濟部智慧財產局員工消費合作社印製 五、發明說明(42) 橋與長區段態樣組合的合成視窗函式的增益輪廓圖。 (2)第二方案 在第二個方案中,一些態樣的某些區段的長度係為 384,此數目不是2的整數次方。此方案的優點與缺點在 前面已經有討論過。 短1」悲樣包含8個區段,其中第一個區段係一 S384-A型別的區段,第二個區段係一 S256_E1型別的區 段,而接接續的6個區段則是S256-B型別的區段。在 「短-2」恶樣中則包含7個區段,其中前5個區段係 S256-B型別的區段,第六個區段是S_256_E2型別的區 段,而最後一個區段則是S384_D型別的區段。與其餘區 段悲樣的組合不同,此態樣組合的兩個子區段的長度是不 同的。 「短-1」態樣的第一個區段與「短_2」態樣的最後一個 區段可以分別在前128個樣本與後128個樣本沒有鋸 齒物的情形下,獨立於其它的區段做回復。如此可以讓根 據「短-1」與「短-2」態樣切分區段的框,在不用考慮鋸 齒消除即接到任意的資訊串流之後或後接任意的資訊串 流。 「橋-1」態樣包含7個區段,其中第一個區段係一 S384-A型別的區段,中間的5個區段是S256B型別的 區段’而最後的區段則是S384-C型別的區段。A384-A型 別區段的有效長度是256。「橋-2」態樣則包含7個區 段,其中第一個區段係一 S384-B型別的區段,中間的5 個區段是S256B型別的區段,而最後的區段則是 S384-D 型別的區段。3384_八、8384_8、3384_0與3384七 型別區段的有效長度為256。 「橋-1」態樣的第一個區段與「橋_2態樣的最後一個 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) 』 ^ - — — —1 — — — — — — — — — ·1111111 ·11111111 (社明先閱讀背面之注音?事項再填寫本頁} 519629 魅 A7 B7 五、發明說明(43 ) (請先閱讀背面之注意事項再填寫本頁) 區段可以分別在前128個樣本與後128個樣本沒有鋸 齒物的情形下,獨立於其它的區段做回復。如此可以讓「橋 -1」態樣的區段不用考慮鋸齒消除即接到任意的資訊串流 之後,也可讓「橋-2」態樣的區段在不用考慮鋸齒消除的 情況下後接任意的資訊串流。 「長-1」態樣僅包含單一個S2048-A態樣區段。此區 段的有效長度是1152。「長-2」態樣僅包含單一個 S2048-B態樣區段。此區段的有效長度是1152。第二方 案的的「長-1」與「長-2」怨樣係與苐一方案的「長-1」 與「長-2」態樣一模一樣。 這些區段態樣整理在表格10-B。
區段 態樣 區段態樣序列 短-1 S384-A S256-E1 S256-B S256-B S256-B S256-B S256-B S256-B 短-2 S256-B S256-B S256-B S256-B S256-B S256-E2 S384-D 橋-1 S384-A S256-B S256-B S256-B S256-B S256-B S384-C 橋-2 S384-B S256-B S256-B S256-B S256-B S256-B S384-D 長-1 S2048-A 長-2 S2048-B
第二控制方案的合成區段態樣 表格10-B 經濟部智慧財產局員工消費合作社印製 根據如圖十五所示的第二控制方案,控制65可以指 定各種組合的區段悲樣。標不「短-短」的列說明「短-1」 到「短-2」區段態樣組合的合成視窗函式增益輪廓圖。而 標示「長-橋」的列則說明「長-1」到「橋-2」區段態樣組 合的合成視窗函式增益輪廓圖。圖的其它列則是表示其它 橋與長區段態樣組合的合成視窗函式的增益輪廓圖。「橋 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629 m. A7 B7 五、發明說明(44) -1」與橋-2」組合雖然沒有顯示,但是在此控制方案中 也是一個合法的組合。 4·框的格式(Frame Formatting) 框可以根據許多種袼式將編碼後資訊組合成框。在此 介紹兩個替代的方案。根據這兩個方案,每一個框搭载了 來自一或數個音頻頻道上同時發生的區段的編碼後資 訊,這些框可以與其它的框獨立地進行解碼。傳輸每一個 框的資成的較佳方式是透過整理為組(secti〇n)的_或數 個固疋位元長度的數位「字詞」(w〇rcj)。對於使用在特定 框上的字詞長度最好的方式是透過框的内容來決定,因為 這樣可以讓解碼器根據此長度調適其處理。如果編碼後資 訊串流會遇到傳輸或是儲存上的錯誤,那麼在每一個框的 組或是/以及整個框中,可以加入像循環冗位檢查 (cyclical redundancy check,CRC)或是 Fletcher’s 檢查總 和(checksum) 〇 a.第一格式 經濟部智慧財產局員工消費合作社印製 第一個框格式顯示在圖十六A中。如圖所示,編碼後 資汛串流80包含遵守一第一格式組合而成的資訊框。相 鄰的框間係由間隔(gap)或保護帶(guard band)所區 隔,以提供從事編輯以及剪輯的區間避免造成資訊的遺 漏。例如在圖中一特定的框就藉由保護帶81與88與相 鄰的框刀開。根據第一格式,框段落(frame section) 82載 有依據特有((ilstlnct)資料態樣的同步字詞,可以讓訊號 處理設備用以同步動作與資訊串流内容。框段落83載有 附屬於經由框段落84傳送的編碼後音頻資訊的控制資 汛,但此控制訊號並非編碼後音頻資訊本身的一部份。框 段洛84傳送一或多個音頻頻道的編碼後音頻資訊。框段 落87可用來將框成襯(pa幻成想要的總長度。除 本紙張尺度賴㈣S家標準(CNS)A4規格(210 X 297公爱 1 519629 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(45 ) 墊(padding)框之外,框段落87也可η田十⑼< μ ,—_ a ^ M用來傳遞資訊。 此一貧訊可以傳遞以編碼後音頻資訊表示的音頻訊號特 徵,例如難以由邊碼後數位音頻資訊取得的類1計量二讀 數(meter reading)。 參考圖十六B’框段落83運載了整理成數個子段落 (sub-secdon)的控制資訊。子段落叫搭載了該框的辨 識符號_遍er)以及該框格式的指示。框的辨識符號 可以是_個每遇__框即加_L 1的8位讀字,並從 值256環繞(wrappmg around)到〇。框的指示標示出經 由該框傳輸的資訊範圍以及位置。子段落幻_2 ^遞合: 地解碼框段落84中的編碼後音頻資訊所需的一或^個 參數。子段落83-3搭載音頻頻道數目以及經由框段落 84裡的編碼後音頻資訊表示的這些頻道的程式設定。此 程式設定可以指示例如一或多個單音程式、一或多個雙頻 道程式或一個具有三頻道「左-中-右」與兩頻道環場=程 式。子段落84-4傳送了框段落83的CRc碼或是其它 錯誤偵測碼。 /' 參照圖十六C,框段落84傳輸被安排成一或數個子 段落的編碼後音頻資訊,每一子段落係表示對應音頻頻道 的同日守區段’此處的音頻頻道最大可到8個頻道。例如 在子段落84-1、84-2與84-8中,框段落84搭載了分 別代表音頻頻道號碼為1、2與8的頻道的同時 (concurrent)音頻區段的編碼後音頻資訊。而子段落84-9 貝J格載框段落84的CRC碼或是其他的錯誤彳貞測碼。 b.第二格式 第二格式在圖十七A中做介紹。第二袼式與第一格式 相似,但是在視頻框頻率約為30 Hz或是更低頻率的 視頻/音頻應用中,較第一格式合適。相鄰的框間係由間 私紙張尺度適用票準(CNS)A7i^r⑵〇 x 297TS ) -- • « 裝--------訂---------線 (請先閱讀背面之注意事項再填寫本頁) A7
519629 五、發明說明(46) 隔(gap)或保護帶(guard band)所區隔,如保護帶91 與98,以提供從事編輯以及剪輯的區間避免造成資訊 的遺漏。 根據弟一格式’框段落92傳輸一同步字詞。框段 落93與94分別搭載與前述第一格式中的框段落83 與84相似的控制資訊與編碼後音頻資訊。框段落87 可以用來將框襯貼(pad)成想要的總長度,並且/或是 搭載例如類比計量器讀數之類的資訊。 第二格式與第一格式的不同點在於音頻資訊係被 切分為兩個子框。框段落94搭載代表一或數個音頻頻 道的同時(concurrent)區段的框的第一部份的編碼後 音頻資訊的第一子框。框段落96搭載代表同時 (concurrent)區段的框的第二部份的編碼後音頻資訊的 第二子框。透過將音頻資訊切分為兩個子框,如下所解 釋的一般可以降低方塊解碼流程時的延遲(delay)。 參照圖十七B,框段落95搭載與框段落96所傳 輸的編碼後資訊相關連的額外控制資訊。子段落95-1 搭載框格式的指示(in(iicati〇n)。而子段落94_4則搭載 框I又洛95的CRC碼或是其他的錯誤偵測碼。 ^參照圖十七C,框段落96搭載編碼後音頻資訊的 =二子框,此處的編碼後資訊係安排成一或多個子段 其中每一個子段落係搭載一個別音頻頻道的編碼後 資Λ例如在子段落96-1、96_2與96-8中,框段落96 即搭載了分別代表音頻頻道號碼為1、2與8的第二 子框的編碼後音頻資訊。而子段落94-9則搭載框段落 95的CRC碼或是其他的錯誤偵測碼。 C 額外的特徵(additional features) 在一些編碼/解碼系統中,會希望防止經由框傳送的編
ffl t ® a (210 x 297 ^iT --------^---------線 (請先閱讀背面之注意事項再填寫本頁} 經濟部智慧財產局員工消費合作社印製 519629 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(47 ) 碼資訊產生某些資料態樣。例如前面所提到的同步字詞 (word)即含有一不應出現在框的其它地方的獨有資料 態樣。假使此獨有的資料態樣真的發生在其他的地方, 就會被當成為合法的同步字詞,使得設備失去與資料串 流的同步。另一個例子是在一些處理16位元PCM 資料字詞的音頻設備會保留資料值-32768 (表示為十 六進位表示時為 0x8000)搭載控制或是通知 (signaling)資訊;所以在一些系統中也會希望避免這個. 值的出現。幾個避免保留(reserved)或是禁止 (forbidden)資料態樣的技術揭露在1999年九月27 曰申請之國際專利申請號碼為PCT/US99/22410的申 請案中。這些技術係修正或是在對資訊編碼時會避免任 何特別資料態樣的發生,並在傳輸編碼後資訊時也傳送 一可透過反轉修正或是編碼,回復原有資訊的機碼(key) 或是其他控制資訊。在較佳的實施中,與某一特定框段 落資訊相關連的機碼或是控制資訊係搭載在此相關的 框段落内,或是將與整個框相關連的一個機碼或控制資 訊搭載在相對應的框内。 5·接合偵測(Splice Detection) 前述的兩個控制方案將訊號分析與訊號合成流程 做調適’以增進處理有時基本上穩定有時高度不穩定的 音頻訊號的編碼與解碼系統整體的效能。但是在較佳的 實施^對於需要做接合之類的編輯動作的音頻資訊的 編碼,額外的特徵(feature)可以提供進一步地改羔。 ’接合通常會在一串列的刪訊 m 無Ϊ感知的不連續。如果是使用一般 刀:成流私,則接合兩端的鋸齒物通常幾 乎不曾被植。㈣討論的兩個控財輯過回復沒有 木紙張尺度適用中國國家標準(CNS)A4^ (21〇 X 297公爱) -------------^--------^---------線 (請先閱讀背面之注意事項再填寫本頁) 519629 A7 B7 五、發明說明(48) 鑛齒物的㈣(lndlvidual)音财贿的方式避免此一 問題。整個結果是,根據任—控制方案編碼與解碼的音 頻貧訊框,可以在不需要煩_㈣除 彼此接合與合併。 〜卜 更進-步地’在前述「短」或「橋」區段態樣的结 尾區段上使用替代錢修正合成視窗函式,兩個控制方 案都可以將增显輪廓圖在256-樣本框重疊間隔内重最 與相加的區段框序列予以回復,以得到基本上為常數ς 時域:所以,對於橫跨接合處的任一對框而言,其 框重疊間隔内的框增益輪廓圖皆是正確的。 、 訂 到目所為止所討論的特徵,基本上係透過建立頻率 響應特徵為具有較廣遽波器帶通(passband)的攄波器 組,為可感知(perceptual)編碼程序做最佳化,此處較 寬的的濾、波器帶通係以渡波器截止頻_ 衰 減(attenuation)增加為代價。但不幸地,接合編輯通常 經濟部智慧財產局員工消費合作社印製 會在-般不認為屬於截止頻帶範圍的頻率内產生可觀 的頻譜添加物(artlfact)或「頻譜潑濺」(spectral splatter)/所以根據上述討論特徵建立的濾波器組,係 設計來最佳化一般可感知編碼的效益,但並沒有提供足 夠的衰減來產生(render)接合編輯產生的這些無法聽 覺的頻譜添加物。 系統的效能可以透過偵測接合的發生與相應地調 整合成濾波組的頻率響應以使上述頻譜潑濺稀釋增 進。達成此要求的一個方式將在下文中討論。其餘的資 訊可以由美國專利U.S.patent 5,903,872處取得。 參照圖四,控制65可以透過檢驗經由路徑61處 接收的每一個框的某些控制資訊或是r框識別符號」 (frame idendfier)偵測到接合的發生。例如編碼器4〇 本紙張尺度適用中國國家標準(CNS)A4規格(2^ X 297公釐) 519629
五、發明說明(49 ) 即可以透過每遇到一個接續(successlve)的框時就將 一個數值增加或疋產生一日期時間指示的方式提供框 識別符號,並將此事別符號組合到對應的框中。當控制 65偵測到由一序列的框所取得的一序列的框識別符號 中有不連續的情形發生時,即沿著路徑66產生/「接 合-感知」訊號。相應於由路徑66處接收到的「接合· 感知」訊號,解碼70可以調適合成濾波器組的頻率響 應,或是選擇一具有想要的頻率響應的替代濾波器組來 處理接合發生處的框的邊界兩端的一或多個區段。 在較佳的實施中,接合兩端的框的頻率響應可以 透過一接合視窗流程取得。這可以透過對整個框的區段 施以一框接合-視窗函式,此處的區段係由上述的控制 方案取得,歧在控制方案中,對由合成轉換取得的每 一個區段施以接合-視窗函式。基本上這兩個流程是 價的(equivalent)。 一各別區段的區段接合-視窗函式可以透過對誃 段的一般合成視窗函式,如表格9所示,乘以與兮: 段切齊(ahgn)的框接合視窗函式的一部份得到了 =區 合-視窗函式係透過連接表格6_c所示的兩個或 以上的基本函式得到。 < 〜個 I I I I I----· I I (請先閱讀背面之注意事項再填寫本頁) 4. 經濟部智慧財產局員工消費合作社印製
基本函式 函式長度 說明 ~ Eli536(n) 1536 — 多 〇,v = = 1536) — E() 1792(n) 1792 φ{η,ν- = 1792) ~ ES5(n) 256 GP(n,a = l,x = 16,v = 256) GP(/7,a = l,x = 16,v = 256) J ES5(-n) 256 ~ 互的時間反轉複製 表格6-C
本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公爱) 519629 五、發明說明(50 二個型別的框的框接合_ 視窗函式列表在表格11 訂 會將框重疊間隔視窗函式,接合視窗流程基本上 值3的咖^ =點對點分析合成視窗,由具阿法 視窗函式。此侈正可m文變成為具阿法值1的KBD 帶的衰減層次(1二降 濺的頻率響應。 于可以有效地壓制可感頻譜潑 —从的 6·訊號轉換 到任器的實施基本上可以被運用 線 頻樣本頻率資在= kHz的樣本頰率則 專業α又備上,而44.1 部 智 慧 財 產 局 員 工 消 費 社 印 製 地,前面討論的====備上。更進—步 廣泛範圍標準的框解的視 H的袼式以及遵循 框,頻率約為3G Ηζ或是更低二對於視頻 的處理可以崎前轉_第= ’資訊較佳 實際設偫的建立可以透過:;:。 音頻樣本率,以使得音 扁::々換到内部的 本頻率或是__相立的㈣射卜部音頻樣 轉換43係用來將音頻資^ 本紙張尺度適用家鮮(cns)A4 ---__、以輅換成適 519629 視頻標準 視頻框率 (Hz) 每一個框的 音頻樣本數 内部樣本率(kHz) DTV 30 2048 53.76 NTSC 29.97 2048 53.706 PAL 25 2048 44.8 Film 24 ' ' 2048 43.008 DTV 23.976+ 2048 42.96 内部樣本率 表格12 A7 B7 五、發明說明(51) 合的内部樣本頻率,且轉換68係用來將音頻資訊從内部 樣本頻率轉換為想要的外部音頻樣本頻率。轉換係遵循内 部音頻樣本頻率為視頻框的頻率的整數倍的原則進行 的。幾個視頻框的頻率的合宜内部樣本頻率的例子顯示在 表格7中此轉換允5午同樣數目的音頻樣本被編碼並與 視頻框一起傳輸。 在表格中顯示的NTSC (29.97 Hz)與DTV (23.976
Hz)内部樣本率僅是近似值。這兩個視頻標準的内部樣本 率分別為 53,760,000/1001 與 43,008,000/1001。 基本上任何的樣本率轉換技術都可以使用。關於樣本 率轉換的各種考量以及實施揭露在Adams and Kw叫
Theory and VLSI Architectures for Asynchronous Sample Rate Converters,” J· of Audio Engr. Soc., July 1993, vol. 41, no. 7/8, pp.539-555 中。 如果有進行樣本率轉換,前面解釋的分析45的瞬變 偵測器内的HPF101的濾波器係數可能需要修正以保持 常數切斷(cutoff)頻率。此特徵的好處可以經由經驗來決 定。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) -------------裝--------訂---------線 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 519629 A7
線 I 請 先 閱 言i 背 面 之 注 意 事 項 再 ά |裝 I * 訂 519629 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(53 ) 多因素,所以很難用一般的說詞說明在解碼器60處的最 大延遲。 當使用第一格式時,在區段控制方法開始前,應先將 整個框接收與緩衝暫存。由於無法同時執行編碼與訊號樣 本率轉換流程,故一個框的延遲對於編碼器40而言是不 可能的。在此情形下整體延遲為兩個框的延遲是較佳的。 對於解碼器60而言,是有相同的限制的。 [主要元件符號對照說明] 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -------------^-----------------線 (請先閱讀背面之注意事項再填寫本頁) 519629 經濟部智慧財產局員工消費合作社印製 Α7 Β7 五、發明說明(54 ) 音頻訊號10 音頻區段 11、12、13、14、15、16、17、18 區段框19 資訊串流20、80 資訊方塊 21、22、23、24、25、26、27、28 資訊框29 參考訊號30 框參考31、32 編碼器40 路徑 42、44、47、59、6卜 62、64、66、67、79 轉換43、68 分析45 控制46、65 格式48 編碼50 開關52、72 濾波器組 54、55、56、74、75、76 緩衝暫存器51、58、71、78 解碼器60 解格式63 解碼70 保護帶 81、88、91、98 框段落 82、83、84、87、92、93、94、95、96 子段落 83-1、83-2、83-3、84-1、84-2、84-4、84-8、 84-9 、 94·4 、 94-9 、 95-1 、 96-1 、 96-2 、 96-8 高通濾波器101 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -----— — It· — — —----- (請先閱讀背面之注意事項再填寫本頁) 519629 A7 B7 五、¥明說明(55 ) 子方塊102 波峰偵測103 比較器104 分析視窗函式131 分析轉換132 合成轉換133 合成視窗函式134 重疊匯增流程135 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐)

Claims (1)

  1. 519629 A8 B8 C8 D8 六、一▼讀專利範圍 1. 一種音頻編碼方法,其包含執行以下動作的步驟: (請先閱讀背面之注意事項再填寫本頁) 接收一參考訊號,此參考訊號搭載一序列的視頻 資訊框的視頻資訊框切齊,此序列中相鄰的框係由一 框間隔所分開; 接收一搭載音頻資訊的音頻訊號; 分析該音頻訊號以辨識該音頻資訊的特徵; 產生一控制訊號,其搭載一序列重疊區段的音頻 貢訊區段的長度、一^與相鄰區段具有個別重豐間隔的 個別區段、以及此序列的長度係等於框的間隔加上一 框重疊間隔,其中區段的長度係根據音頻資訊的特徵 而做適應; 對該序列施以一適應方塊編碼流程以產生複數個 編碼後資訊方塊,其中方塊編碼流程係根據控制訊號 做適應;以及 組合複數個編碼後資訊方塊以及搭載區段長度的 控制資訊,形成一與參考訊號切齊的編碼後資訊框。 2. 如申請專利範圍第1項所述之音頻編碼方法,其中方 塊編碼流程對音頻資訊區段施以一堆的帶通濾波器或 是轉換,以分別產生副頻帶訊號方塊或是轉換係數。 經濟部智慧財產局員工消費合作社印製 3. 如申請專利範圍第1項所述之音頻編碼方法,其中方 塊編碼流程對音頻資訊的每一個區段施以一個別的分 析視窗函式以產生視窗化區段,並對該視窗化區段施 以一時域鋸齒消除分析轉換以產生轉換係數方塊。 4. 如申請專利範圍第3項所述之音頻編碼方法,此方法 調適分析視窗函式與時域分析轉換以產生代表一個別 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) 519629
    六、申請專利範圍 編碼後資訊框的區段序列的結尾區段的方塊,且此處 的編碼後資訊框可利用一搭配合成轉換以及合成視窗 函式回復在序列結尾區段的重疊間隔中原則上沒有時 域蘇齒音頻資訊。 5. 如申凊專利範圍第丨至4的任一項所述之音頻編碼 方法,其中方塊編碼流程限制區段的長度需為2的整 數次方。 6. 如申請專利範圍第1至4的任一項所述之音頻編碼 方法’其中方塊編碼流程在一極大區段長度與一極小 區段長度間調適區段長度,且針對一個別編碼後資訊 框,施以下列之一: 對一序列長度為極大區段長度的區段序列施以一 「長-長」序列的分析視窗函式; 對一序列有效長度等同於極小區段長度的區段序 列施以一「短-短」序列的分析視窗函式;. 對序列長度由極小區段長度移到極大區段長度 的區段序列施以一「橋-長」序列的分析視窗函式,其 中「橋-長」序列包括一第一橋視窗函式序列,且接續 著長度為最大區段長度的區段的視窗函式; 對一序列長度由極大區段長度移到極小區段長度 的區段序列施以一「長-橋」序列的分析視窗函式,其 中「長-橋」序列包括一長度為最大區段長度的區段的 視窗函式’接續著一第二橋視窗函式序列;或 對一序列具有不同長度的區段施以一「橋-橋」序 列的分析視窗函式,其中「橋_橋」序列包括第一橋序 列’接績者第二橋序列。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) "《 -------------I --------訂--I------ (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 519629 A8 B8 C8 D8 7. 申請專利範圍 如申請專利範圍第6項所述之音頻編碼方法,其中所 有在短"短」序列中的區段都有相同的長度。 δ·如申請專利範圍第6項所述之音頻編碼方法,其中所 有在短·短」序列中的分析視窗函式的非零部分在形 狀以及長度上都相同且一或多個分析視窗函式一裳 部分。 ^ 9.如申請專利範圍第丨1 4的任—項所述之音頻編瑪 方法,其包括在進行方塊編碼流程之前先將音頻資訊 從輸入音頻樣本率轉換到内部音頻樣本率,其中參考 訊號搭載視頻資訊框率,且内部音頻樣本率係為視頻 資訊框率的整數倍。 ' " 10· —種音頻解碼方法,其包含實施下列動作的步驟: 接收一搭載一序列視頻資訊框裡的視頻資訊框的 切齊的參考訊號,此視頻資訊框序列中相鄰的框間係 由一框間隔所分隔; 接收與參考訊號切齊的編碼後資訊框,且每一個 框皆包括控制資訊以及複數個編碼後音頻資訊方塊; 產生搭載一序列重疊區段中的音頻資訊區段的區 段長度的參考訊號、一與相鄰區段具有個別重疊間隔 的,別區段,且該序列的長度係等於框間隔加上一框 重疊區間,其中區段長度係回應控制資訊做調適; 對一個別編碼後資訊框裡的複數個編碼後音頻資 訊方塊施以適應方塊解碼流程,其中方塊解碼流程根 據控制訊號調適以產生音頻資訊重疊區段序列 Κ紙張尺度適用中國國家標準(CNS)A4規格(⑽χ 297公髮)_ -------------^--------^---------^ (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 519629 A8 B8 C8 D8 六、申請專利範圍 (請先閱讀背面之注意事項再填寫本頁) 11. 如申請專利範圍第10項所述之音頻解碼方法,其中 方塊解碼流程對複數個編碼後資訊方塊施以一堆的帶 通合成濾波器或是一合成轉換,以產生音頻資訊的重 疊區段。 12. 如申請專利範圍第10項所述之音頻解碼方法,其中 方塊解碼流程對複數個編碼後資訊方塊施以一時域鋸 齒消除(aliasing cancellation)合成轉換,並對合成轉 換產生的結果施以個別的合成視窗函式,以產生音頻 資訊的重疊區段。 13. 如申請專利範圍第12項所述之音頻解碼方法,其調 適時域鋸齒消除合成轉換,並對產生的結果施以一合 成視窗函式,以回復個別編碼後資訊框序列中的末尾 區段,此處的編碼後資訊框在序列末尾區段的重疊間 隔裡基本上係沒有時域鋸齒的。 經濟部智慧財產局員工消費合作社印制衣 14. 如申請專利範圍第10至13的任一項所述之音頻解 碼方法,其中方塊解碼流程被限制在僅產生長度為2 的整數次方的區段。 15. 如申請專利範圍第10至13的任一項所述之音頻解 碼方法,其中方塊解碼流程解碼表示長度在一極大區 段長度與一極小區段長度間的音頻資訊區段,且針對 一個別編碼後資訊框,施以下列之一: 對一序列長度為極大區段長度的區段序列施以一 「長-長」序列的合成視窗函式; 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 519629
    A8 B8 C8 D8 經濟部智慧財產局員工消費合作社印製 "對序列有效長度專同於極小區段長度的區段序 列施以一「短-短」序列的合成視窗函式; 。對一序列長度由極小區段長度移到極大區段長度 的,段序舰以—「橋·長」相的合成視窗函式,其 :「橋-長」序列包括一第一橋視窗函式序列,且接續 著長度為最大區段長度的區段的視窗函式; 、 。對一序列長度由極大區段長度移到極小區段長度 的,段序列施以一「長_橋」序列的合成視 窗函式,其 中「長-橋」序列包括一長度為最大區段長度的區段的 視窗函式,接續著一第二橋視窗函式序列;或 對一序列具有不同長度的區段施以一「橋_橋」序 列的合成視窗函式,其中「橋_橋」序列包括第一橋序 列,接續著第二橋序列。 16.如申請專利範圍第15項所述之音頻解碼方法,其中 所有從「短-短」序列中的區段都有相同的長度。 17·如申請專利範圍第15項所述之音頻解碼方法,其中 所有在「短-短」序列中的合成視窗函式的非零部分在 形狀以及長度上都相同且一或多個合成視窗函式有一零部分。 18·如申請專利範圍第1〇至13的任一項所述之音頻解 碼方法’其分析由兩個編碼後資訊框處取得的控制資 訊’以偵測不連續,並且在回復兩個編碼後資訊框的 個別區段序列中的音頻資訊的第一或是末尾區段時回 應地調適方塊解碼流程的頻率響應特徵。
    ---------1---产裝·! (請先閱讀背面之注意事項再填寫本頁) i線· H . . 本纸張尺度適用中國國家標準χ 297公髮) 申清專利範圍 19. 一種資訊儲存媒體,其搭載: 安排在視頻框的視頻資訊;及 安排在編碼後資訊框的編碼後音頻資訊,其中一 個別編碼後資訊框係與一個別視頻框相對應,且包括 才合載重豐區^又序列中的音頻資訊區段的變動區 段長度的控制資訊,一與相鄰區段具有個別重疊間隔 的個別區段,以及長度等同於框間隔加上一框重疊間 隔的序列,與 編碼後音頻資訊方塊,一具有個別長度與個別内容 的個別方塊,當經過適應方塊解碼流程的處理後,會 產生重疊區段序列中的個別音頻資訊區段。 20. 如申請專利範圍第19之資訊儲存媒體,其中個別的 編碼後資訊具有各別的内容,在經過一適應解碼流程 處理後,形成音頻資訊的個別區段,此處的適應解碼 流程包括施以一時域鋸齒消除合成轉換與施以一合成 視窗函式。 21. 如申請專利範圍第2〇之資訊儲存媒體,其中適應方 塊%碼流程調適時域雜齒消除合成函式與合成視窗函 式’以產生原則上彼此獨立地不包含時域蘇齒的音頻 資訊的重疊區段序列。 22·如申請專利範圍第19至21的任一項所述之資訊儲 存媒體,其中所有的編碼後音頻資訊的方塊代表個別 長度為2的整數次方的音頻資訊的區段。 23·如申請專利範圍第19至21的任一頊所述之資訊儲 519629 A8 B8 C8 D8 、 經濟部智慧財產局員工消費合作社印製 申請專利範圍 存媒體,其中控制資訊包含一邊碼後資訊框序列裡的 個別編碼後資訊框的次序的指示。 24. —種音頻編碼裝置,其包括: 接收一參考訊號之裝置,此參考訊號搭載一序列 的視頻資訊框的視頻資訊框切齊,此序列中相鄰的框 係由一框間隔所分開; 接收一搭載音頻資訊的音頻訊號之裝置; 分析該音頻訊號以辨識該音頻資訊的特徵之裝 置; 產生一控制訊號,其搭載一序列重疊區段的音頻 資訊區段的長度之裝置,一與相鄰區段具有個別重疊 間隔的個別區段,且此序列的長度係等於框的間隔加 上一框重疊間隔,其中區段的長度係根據音頻資訊的 特徵而做適應; 對該序列施以一適應方塊編碼流程以產生複數個 編碼後資訊方塊之裝置,其中方塊編碼流程係根據控 制訊號做適應;以及 組合複數個編碼後資訊方塊以及搭載區段長度的 控制資訊,形成一與參考訊號切齊的編碼後資訊框之 裝置。 25. 如申請專利範圍第24項所述之音頻編碼裝置,其中 方塊編碼流程對音頻資訊區段施以一堆的帶通濾波器 或是轉換,以分別產生副頻帶訊號方塊或是轉換係數。 26. 如申請專利範圍第24項所述之音頻編碼裝置’其中 方塊編碼流程對音頻資訊的每一個區段施以一個別的 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ---------------------訂·-------- (請先閱讀背面之注意事項再填寫本頁) 519629
    、申請專利範圍 經 濟 部 智 慧 財 產 局 員 工 消 費 合 社 印 製 分析視窗函式以產生視窗化區段,並對該視窗化區段 施以一時域鋸齒消除分析轉換以產生轉換係數方塊。 27·如申請專利範圍第26項所述之音頻編碼裝置,其包 括一调適分析視窗函式與時域分析轉換以產生代表一 個別編碼後資訊框的區段序列的結尾區段的方塊之方 式,且此處的編碼後資訊框可利用一搭配合成轉換以 及合成視窗函式回復在序列結尾區段的重疊間隔中原 則上沒有時域鋸齒的音頻資訊。 28.如申請專利範圍第24至27的任一項所述之音頻編 碼裝置,其中方塊編碼流程限制區段的長度需為2的 整數次方。 29·如申請專利範圍第24至27的任一項所述之音頻編 碼裝置,其令方塊編碼流程在一極大區段長度與一極 小區段長度間調適區段長度,且針對一個別編碼後資 訊框,施以下列之一: 對一序列長度為極大區段長度的區段序列施以一 「長-長」序列的分析視窗函式; 對一序列有效長度等同於極小區段長度的區段序 列施以一「短-短」序列的分析視窗函式; 對一序列長度由極小區段長度移到極大區段長度 的區段序列施以一「橋-長」序列的分析視窗函式;其 中「橋-長」序列包括一第一橋視窗函式序列,且接續 著長度為最大區段長度的區段的視窗函式; 對一序列長度由極大區段長度移到極小區段長度 的區段序列施以一「長-橋」序列的分析視窗函式;其 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 裝--------訂---------線 (請先閱讀背面之注意事項再填寫本頁) 519629
    經濟部智慧財產局員工消費合作社印制衣 長-橋」序列包括一長度為最大區段長度的區段的 視窗函式,接續著一第二橋視窗函式序列;或 對一序列具有不同長度的區段施以一「橋-橋」序 列的分析視窗函式,其中「橋-橋」序列包括第_橋序 列’接續著第二橋序列。 3〇·如申請專利範圍第29項所述之音頻編碼裝置,其中 所有在「短-短」序列中的區段都有相同的長度。 31.如申明專利範圍第29項所述之音頻編碼裝置,其中 所有在短-短」序列中的分析視窗函式的非零部分在 形狀以及長度上都相同且一或多個分析視窗函 零部分。 32·如申士請專利範圍第24至27的任_項所述之音頻編 碼裝置,其包括在進行方塊編碼流程之前先將音頻資 訊從輸入音頻樣本率轉換到内部音頻樣本率之方式, 其中筝考訊號搭載視頻資訊框率,且内部音頻樣本率 係為視頻資訊框率的整數倍。 33·—種音頻解碼裝置,其包括實施下列動作的步驟: 接收一搭載一序列視頻資訊框裡的視頻資訊框的 切齊的參考訊號之裝置,此處的視頻資訊框序列中相 鄰的框間係由一框間隔所分隔; 接收與參考矾號切齊的編碼後資訊框之裝置,且 每一個框皆包括控制資訊以及複數個編碼後音頻資訊 方塊; 、、。 (請先閱讀背面之注意事項再填寫本頁) 幻· -線- 產生搭載一序列重疊區段中的音頻資訊區段的區
    A8 B8 C8 D8 519629 .::霜_ 六、申請專利範圍 段長度的參考訊號、一與相鄰區段具有個別重疊間隔 的個別區段之裝置,且該序列的長度係等於框間隔加 上一框重疊區間,其中區段長度係回應控制資訊做調 適; 對一個別編碼後資訊框裡的複數個編碼後音頻資 訊方塊施以適應方塊解碼流程之裝置,其中方塊解碼 流程根據控制訊號調適以產生音頻資訊重疊區段序 列。 34. 如申請專利範圍第33項所述之音頻解碼裝置,其中 方塊解碼流程對複數個編碼後資訊方塊施以一堆的帶 通合成濾波器或是一合成轉換,以產生音頻資訊的重 疊區段。 35. 如申請專利範圍第33項所述之音頻解碼裝置,其中 方塊解碼流程對複數個編碼後資訊方塊施以一時域鋸 齒消除合成轉換,並對合成轉換產生的結果施以個別 的合成視窗函式,以產生音頻資訊的重疊區段。 36. 如申請專利範圍第35項所述之音頻解碼裝置,其包 括一調適時域鋸齒消除合成轉換,並對產生的結果施 以一合成視窗函式,以回復個別編碼後資訊框序列中 的末尾區段之方式’此處的編碼後貧訊框在序列末尾 區段的重豐間隔裡基本上係沒有時域鑛齒的。 3 7.如申請專利範圍第3 3至3 6的任一項所述之音頻解 碼裝置,其中方塊解碼流程被限制在僅產生長度為2 的整數次方的區段。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) --------^--------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 申請專利範圍 38.如申請專利範圍第33至36的任一項所述之音頻解 碼裝置’其中方塊解碼流程解碼表示長度在一極大區 段長度與一極小區段長度間的音頻資訊區段,且針對 一個別編碼後資訊框,施以下列之一: 對一序列長度為極大區段長度的區段序列施以一 「長-長」序列的合成視窗函式; 對一序列有效長度等同於極小區段長度的區段序 列施以一「短-短」序列的合成視窗函式; 對一序列長度由極小區段長度移到極大區段長度 的區段序列施以一「橋-長」序列的合成視窗函式;其 中「橋-長」序列包括一第一橋視窗函式序列,且接續 著長度為最大區段長度的區段的視窗函式; 對一序列長度由極大區段長度移到極小區段長度 的區段序列施以一「長-橋」序列的合成視窗函式;其 中「長-橋」序列包括一長度為最大區段長度的區段的 視窗函式,接續著一第二橋視窗函式序列;或 對一序列具有不同長度的區段施以一「橋_橋」序 列的合成視窗函式,其中「橋_橋」序列包括第一橋序 列,接續著第二橋序列。 39.如申請專利範圍第38項所述之音頻解碼裝置,其中 所有從「短-短」序列中的區段都有相同的長度。 •40.如申請專利範圍第38項所述之音頻解碼裝置,其中 所有在「短-短」序列中的合成視窗函式的非零部分在 形狀以及長度上都相同且一或多個合成視窗函式有一 零部分。 A8 B8 C8 D8 519629 多1 申請專利範圍 41.如申請專利範圍第33至36的任一項所述之音頻解 碼裝置,其包括分析由兩個編碼後資訊框處取得的控制 資訊,以偵測不連續,並且在回復兩個編碼後資訊框的 個別區段序列中的音頻資訊的第一或是末尾區段時回 應地調適方塊解碼流程的頻率響應特徵之方式。 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印制衣 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐)
TW089101300A 1999-01-28 2000-01-26 Data framing for adaptive-block-length coding system TW519629B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/239,345 US6226608B1 (en) 1999-01-28 1999-01-28 Data framing for adaptive-block-length coding system

Publications (1)

Publication Number Publication Date
TW519629B true TW519629B (en) 2003-02-01

Family

ID=22901762

Family Applications (1)

Application Number Title Priority Date Filing Date
TW089101300A TW519629B (en) 1999-01-28 2000-01-26 Data framing for adaptive-block-length coding system

Country Status (18)

Country Link
US (1) US6226608B1 (zh)
EP (1) EP1151435B1 (zh)
JP (1) JP4540232B2 (zh)
KR (1) KR100702058B1 (zh)
CN (1) CN1255809C (zh)
AR (1) AR022335A1 (zh)
AT (1) ATE223612T1 (zh)
AU (1) AU771332B2 (zh)
BR (1) BR0007775A (zh)
CA (1) CA2354396C (zh)
DE (1) DE60000412T2 (zh)
DK (1) DK1151435T3 (zh)
ES (1) ES2179018T3 (zh)
HK (1) HK1043429B (zh)
MX (1) MXPA01007547A (zh)
MY (1) MY128069A (zh)
TW (1) TW519629B (zh)
WO (1) WO2000045389A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8438015B2 (en) 2006-10-25 2013-05-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
TWI447708B (zh) * 2009-06-23 2014-08-01 Sony Corp An audio signal processing system, an audio signal decoding device, and a processing method and program thereof
USRE50158E1 (en) 2006-10-25 2024-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
WO2001001570A1 (de) * 1999-06-25 2001-01-04 Infineon Technologies Ag Programmierbares digitales bandpass-filter für eine kodec-schaltung
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
EP1076297A1 (en) * 1999-08-09 2001-02-14 Deutsche Thomson-Brandt Gmbh Method for fast Fourier transformation of audio signals
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
JP2002050996A (ja) * 2000-07-31 2002-02-15 Sony Corp 整数倍相互関係を有するブロック長を用いて符号化された信号を通信伝送路を介して送信する通信システム
JP2005506643A (ja) * 2000-12-22 2005-03-03 ミュビー テクノロジーズ ピーティーイー エルティーディー メディアプロダクションシステムとその方法
WO2002071731A1 (de) * 2001-03-07 2002-09-12 T-Mobile Deutschland Gmbh Verfahren und vorrichtung zur verbesserung der sprachqualität auf transparenten telekommunikations-übertragungswegen
US6650762B2 (en) * 2001-05-31 2003-11-18 Southern Methodist University Types-based, lossy data embedding
DE10138650A1 (de) * 2001-08-07 2003-02-27 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschlüsseln eines diskreten Signals sowie Verfahren und Vorrichtung zur Entschlüsselung
JP3779580B2 (ja) * 2001-09-27 2006-05-31 株式会社東芝 信号処理方法及び装置、信号再生方法及び装置、記録媒体
US7840412B2 (en) * 2002-01-18 2010-11-23 Koninklijke Philips Electronics N.V. Audio coding
US7328151B2 (en) 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US20030233230A1 (en) * 2002-06-12 2003-12-18 Lucent Technologies Inc. System and method for representing and resolving ambiguity in spoken dialogue systems
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
US7389226B2 (en) * 2002-10-29 2008-06-17 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
US7508846B2 (en) * 2002-11-22 2009-03-24 Nortel Networks Ltd. Physical capacity aggregation system and method
US7512534B2 (en) * 2002-12-17 2009-03-31 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
US7117453B2 (en) * 2003-01-21 2006-10-03 Microsoft Corporation Media frame object visualization system
US7509321B2 (en) * 2003-01-21 2009-03-24 Microsoft Corporation Selection bins for browsing, annotating, sorting, clustering, and filtering media objects
US7383497B2 (en) * 2003-01-21 2008-06-03 Microsoft Corporation Random access editing of media
US7904797B2 (en) * 2003-01-21 2011-03-08 Microsoft Corporation Rapid media group annotation
US6973538B2 (en) * 2003-04-02 2005-12-06 Motorola, Inc. Adaptive segmentation of shared cache
KR100546398B1 (ko) * 2003-11-25 2006-01-26 삼성전자주식회사 압축된 오디오 비트스트림에서 싱크 워드를 찾는 방법 및상기 방법을 기록한 기록 매체
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
EP1743326B1 (en) * 2004-03-25 2011-05-18 DTS, Inc. Lossless multi-channel audio codec
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
TWI253059B (en) * 2004-08-04 2006-04-11 Via Tech Inc Sound fast-forward method and device
KR20070074546A (ko) * 2004-08-31 2007-07-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코딩을 위한 방법 및 디바이스
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US8744862B2 (en) 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
US8050915B2 (en) * 2005-07-11 2011-11-01 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding
WO2007010785A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ
US20070081663A1 (en) * 2005-10-12 2007-04-12 Atsuhiro Sakurai Time scale modification of audio based on power-complementary IIR filter decomposition
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
KR100735417B1 (ko) * 2006-01-24 2007-07-04 삼성전자주식회사 음성 신호에서의 피크 특징 추출이 가능한 윈도우를정렬하는 방법 및 그 시스템
US20100211690A1 (en) * 2009-02-13 2010-08-19 Digital Fountain, Inc. Block partitioning for a data stream
JP2010503875A (ja) * 2006-06-29 2010-02-04 エヌエックスピー ビー ヴィ 音声フレーム長の適応化
JP5093514B2 (ja) * 2006-07-07 2012-12-12 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびそのプログラム
US7672842B2 (en) * 2006-07-26 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for FFT-based companding for automatic speech recognition
CN100489965C (zh) * 2006-08-18 2009-05-20 广州广晟数码技术有限公司 音频编码系统
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
ATE547898T1 (de) * 2006-12-12 2012-03-15 Fraunhofer Ges Forschung Kodierer, dekodierer und verfahren zur kodierung und dekodierung von datensegmenten zur darstellung eines zeitdomänen-datenstroms
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
US7852197B2 (en) * 2007-06-08 2010-12-14 Sensomatic Electronics, LLC System and method for inhibiting detection of deactivated labels using detection filters having an adaptive threshold
HUE031920T2 (en) * 2007-06-18 2017-08-28 Panasonic Ip Corp America Sequence selection procedure, transmission method, and wireless mobile station device
US9495971B2 (en) * 2007-08-27 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
DK2186088T3 (en) * 2007-08-27 2018-01-15 ERICSSON TELEFON AB L M (publ) Low complexity spectral analysis / synthesis using selectable time resolution
CN101918999B (zh) 2007-11-12 2013-11-13 尼尔森(美国)有限公司 执行音频水印嵌入以及水印检测和提取的方法和设备
US8457951B2 (en) * 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
US20090287489A1 (en) * 2008-05-15 2009-11-19 Palm, Inc. Speech processing for plurality of users
US8630848B2 (en) 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
CN102089812B (zh) * 2008-07-11 2013-03-20 弗劳恩霍夫应用研究促进协会 用以使用混叠切换方案将音频信号编码/解码的装置与方法
MY181247A (en) * 2008-07-11 2020-12-21 Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
EP2301019B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
JP5245622B2 (ja) * 2008-07-31 2013-07-24 富士通株式会社 ノイズ検出装置及びノイズ検出方法
US8108887B2 (en) 2008-10-30 2012-01-31 The Nielsen Company (Us), Llc Methods and apparatus for identifying media content using temporal signal characteristics
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
JP5163545B2 (ja) * 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
JP2010232861A (ja) * 2009-03-26 2010-10-14 Sony Corp 情報処理装置、音声信号処理方法、およびプログラム
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI484481B (zh) 2009-05-27 2015-05-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8909531B2 (en) * 2009-10-02 2014-12-09 Mediatek Inc. Methods and devices for displaying multimedia data emulating emotions based on image shuttering speed
CN101694773B (zh) * 2009-10-29 2011-06-22 北京理工大学 一种基于tda域的自适应窗切换方法
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
WO2011119111A1 (en) * 2010-03-26 2011-09-29 Agency For Science, Technology And Research Methods and devices for providing an encoded digital signal
WO2012048472A1 (en) * 2010-10-15 2012-04-19 Huawei Technologies Co., Ltd. Signal analyzer, signal analyzing method, signal synthesizer, signal synthesizing method, windower, transformer and inverse transformer
US9197888B2 (en) 2012-03-13 2015-11-24 Dolby Laboratories Licensing Corporation Overlapped rate control for video splicing applications
US8725508B2 (en) * 2012-03-27 2014-05-13 Novospeech Method and apparatus for element identification in a signal
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
MY175355A (en) * 2013-08-23 2020-06-22 Fraunhofer Ges Forschung Apparatus and method for processing an audio signal an aliasing erro signal
PL3140831T3 (pl) * 2014-05-08 2018-12-31 Telefonaktiebolaget Lm Ericsson (Publ) Dyskryminator i koder sygnału audio
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10861475B2 (en) * 2015-11-10 2020-12-08 Dolby International Ab Signal-dependent companding system and method to reduce quantization noise
EP3616196A4 (en) 2017-04-28 2021-01-20 DTS, Inc. Audio coder window and transform implementations
CN112567751A (zh) * 2018-09-26 2021-03-26 华为技术有限公司 一种3d图形数据压缩和解压缩的方法及装置
CN111179970B (zh) * 2019-08-02 2023-10-20 腾讯科技(深圳)有限公司 音视频处理方法、合成方法、装置、电子设备及存储介质
CN116368497A (zh) * 2020-10-16 2023-06-30 杜比实验室特许公司 利用深度神经网络的自适应块切换

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222189A (en) 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
CA2026213C (en) * 1989-01-27 1995-04-04 Louis Dunn Fielder Low bit rate transform coder, decoder and encoder/decoder for high-quality audio
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5369724A (en) * 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
US5933567A (en) * 1993-01-13 1999-08-03 Hitachi America, Ltd. Method and apparatus for controlling the position of the heads of a digital video tape recorder during trick play operation and for recording digital data on a tape
US6137834A (en) 1996-05-29 2000-10-24 Sarnoff Corporation Method and apparatus for splicing compressed information streams
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
US5913190A (en) 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by audio sample rate conversion

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE50144E1 (en) 2006-10-25 2024-09-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50158E1 (en) 2006-10-25 2024-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8775193B2 (en) 2006-10-25 2014-07-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50194E1 (en) 2006-10-25 2024-10-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE49999E1 (en) 2006-10-25 2024-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50009E1 (en) 2006-10-25 2024-06-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50132E1 (en) 2006-10-25 2024-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50015E1 (en) 2006-10-25 2024-06-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8452605B2 (en) 2006-10-25 2013-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8438015B2 (en) 2006-10-25 2013-05-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50157E1 (en) 2006-10-25 2024-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50159E1 (en) 2006-10-25 2024-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
USRE50054E1 (en) 2006-10-25 2024-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
TWI447708B (zh) * 2009-06-23 2014-08-01 Sony Corp An audio signal processing system, an audio signal decoding device, and a processing method and program thereof

Also Published As

Publication number Publication date
MY128069A (en) 2007-01-31
MXPA01007547A (es) 2002-07-02
ATE223612T1 (de) 2002-09-15
CN1255809C (zh) 2006-05-10
ES2179018T3 (es) 2003-01-16
CA2354396C (en) 2008-10-21
AU2621500A (en) 2000-08-18
DE60000412T2 (de) 2003-08-07
AR022335A1 (es) 2002-09-04
KR20010101749A (ko) 2001-11-14
WO2000045389A1 (en) 2000-08-03
HK1043429A1 (en) 2002-09-13
CA2354396A1 (en) 2000-08-03
DK1151435T3 (da) 2002-10-14
AU771332B2 (en) 2004-03-18
CN1338104A (zh) 2002-02-27
EP1151435A1 (en) 2001-11-07
JP4540232B2 (ja) 2010-09-08
DE60000412D1 (de) 2002-10-10
EP1151435B1 (en) 2002-09-04
HK1043429B (zh) 2006-10-06
JP2002536681A (ja) 2002-10-29
BR0007775A (pt) 2002-02-05
KR100702058B1 (ko) 2007-03-30
US6226608B1 (en) 2001-05-01

Similar Documents

Publication Publication Date Title
TW519629B (en) Data framing for adaptive-block-length coding system
KR101822032B1 (ko) 인코딩된 오디오 신호를 디코딩하기 위한 장치, 방법 및 컴퓨터 프로그램
JP7317882B2 (ja) インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法
KR101478438B1 (ko) 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101868821B (zh) 用于处理信号的方法和装置
JP5400059B2 (ja) オーディオ信号処理方法及び装置
TW434529B (en) In the united states patent and trademark office application for united states patent
RU2661776C2 (ru) Заполнение шумом при многоканальном кодировании аудио
EP2625688B1 (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
JP6377110B2 (ja) 信号をインタリーブするためのオーディオ復号器
BR122018077099B1 (pt) método para decodificação de sinal de áudio e decodificador de sinal de áudio
US10770084B2 (en) Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
KR20070011100A (ko) 다채널 오디오 코딩에서 오디오 신호의 에너지 보정방법 및그 보정을 위한 부호화된 오디오 신호 생성방법

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MK4A Expiration of patent term of an invention patent