TW201642248A

TW201642248A - 編碼或解碼一多聲道訊號之裝置與方法

Info

Publication number: TW201642248A
Application number: TW105105526A
Authority: TW
Inventors: 薩斯洽迪克; 弗羅里恩史庫; 尼可拉斯里特貝屈; 陶比亞斯史屈瓦格勒; 李查弗格; 強尼斯希爾佩特; 曼薩斯紐新傑
Original assignee: 弗勞恩霍夫爾協會
Priority date: 2015-03-09
Filing date: 2016-02-24
Publication date: 2016-12-01
Also published as: PT3268959T; WO2016142375A1; SG11201707180SA; BR122023021855A2; CA2978818C; EP3268959A1; AU2016231238A1; US11508384B2; PL3268959T3; MX364419B; JP7617154B2; MX2017011495A; EP3268959B1; EP3067885A1; EP3506259A1; BR112017019187A2; AR103873A1; AU2016231238B2; JP2023052219A; KR102109159B1

Abstract

實施例係提供為了編碼具有至少三個聲道之一多聲道訊號之一裝置。該裝置包含一疊代處理器、一聲道編碼器及一輸出介面。疊代處理器係用以在一第一疊代步驟中計算在該至少三聲道之各對之間之聲道內相關值，以為了在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值的一對，並且為了藉由使用一多聲道處理作業而處理該被選擇之對，以得到針對該被選擇之對之多個第一多聲道參數並得到多個第一被處理聲道。此外，該疊代處理器係用以在一第二疊代步驟中藉由使用該等被處理聲道之至少一而執行該計算、該選擇及該處理，以得到多個第二多聲道參數與第二被處理聲道。聲道編碼器係用以編碼從藉由疊代處理器所執行之一疊代處理所產生之聲道以得到被編碼聲道。輸出介面係用以產生具有該等被編碼聲道與該等第一及第二多聲道參數之一被編碼多聲道訊號。

Description

編碼或解碼一多聲道訊號之裝置與方法

本發明係關於音源編碼/解碼，特別關於利用聲道內訊號相依(inter-channel signal dependencies)之音源編碼。

音源編碼係為壓縮域並處理利用在音源訊號中的冗餘(redundancy)及無關係(irrelevancy)。在MPEG USAC[ISO/IEC 23003-3：2012-Information technology-MPEG audio technologies Part 3：Unified speech and audio coding]中，兩聲道之聯合立體聲編碼係藉由使用複預測(complex prediction)、MPS 2-1-2或統一立體聲連同有限頻帶或全頻帶殘餘訊號而進行。MPEG surround[ISO/IEC 23003-1：2007-Information technology-MPEG audio technologies Part 1：MPEG Surround]係針對多聲道音源的聯合編碼而等級地結合OTT與TTT盒(OTT and TTT boxes)並且是在有或沒有殘餘訊號的傳輸之下。MPEG-H四聲道元件(Quad Channel Elements)係等級地應用MPS 2-1-2立體聲盒，而建立一固定的4*4再混合樹之複預測/MS立體聲盒係接在其後。AC4[ETSI TS 103 190 V1.1.1(2014-04)-Digital Audio Compression(AC-4)Standard]係引入新的3-、4-、5-聲道元件，其係考慮到經由一被傳輸之混合矩陣與後續的聯合立體聲編碼資訊而再混合被傳輸聲道。此外，先前技術係建議使用正交轉換，就如針對增強之多聲道音源編碼之Karhunen-Loeve轉換(KLT)[Yang,Dai and Ai,Hongmei and Kyriakakis,Chris and Kuo,C.-C.Jay,2001：Adaptive Karhunen-Loeve Transform for Enhanced Multichannel Audio Coding,http：//ict.usc.edu/pubs/Adaptive%20Karhunen-Loeve%20Transform%20for%20 Enhanced %20Multichannel%20Audio%20Coding.pdf]。

在3D音源上下文中，擴音器聲道係分佈在多個高度層中，並導致水平與垂直的聲道對。僅有兩個聲道之聯合編碼，就如在USAC中所定義的，並不足以考慮到聲道之間的空間及感知關係。環繞MPEG(MPEG Surround)係應用於一額外的預/後處理步驟，殘餘訊號係在沒有聯合立體聲編碼的可能性之下，被個別傳輸，以例如利用在左與右垂直殘餘訊號之間的相依。在AC-4中，專用的N聲道元件係被引入以考慮到聯合編碼參數的高效率編碼，但無法考慮到具有更多聲道之一般擴音器設定，其係針對新的浸入錄放場景(7.1+4,22.2)而被提出。MPEG-H四聲道元件(Quad Channel Elements)亦被限制在僅僅4個聲道並且無法被動態地應用在任意的聲道而只能應用在一預配置且固定數量的聲道。

本發明之一目的係在於提供一改良的編碼/解碼概念。

該目的係藉由依據申請專利範圍第1項之一裝置而達到，該裝置係為了編碼具有至少三個聲道之一多聲道訊號；或藉由依據申請專利範圍第12項之一裝置而達到，該裝置係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號；或藉由依據申請專利範圍第21項之一方法而達到，該方法係為了編碼具有至少三個聲道之一多聲道訊號；或藉由依據申請專利範圍第22項之一方法而達到，該方法係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號；或藉由依據申請專利範圍第23項之一電腦程式而達到。

實施例係提供為了編碼具有至少三個聲道之一多聲道訊號之一裝置。該裝置包含一疊代處理器、一聲道編碼器及一輸出介面。疊代處理器係用以在一第一疊代步驟中計算在該至少三個聲道之各對之間之聲道內相關值，以為了在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值的一對，並且為了藉由使用一多聲道處理作業而處理該被選擇之對，以得到針對該被選擇之對之多個第一多聲道參數並得到多個第一被處理聲道。此外，該疊代處理器係用以在一第二疊代步驟中藉由使用該等被處理聲道之至少一而執行該計算、該選擇及該處理，以得到多個第二多聲道參數與第二被處理聲道。聲道編碼器係用以編碼聲道以得到被編碼聲道，該等聲道係從藉由疊代處理器所執行之一疊代處理而產生。該輸出介面係用以產生具有該等被編碼聲道與該等第一及第二多聲道參數之一被編碼多聲道訊號。

另外，實施例係提供為解碼一被編碼多聲道訊號之一裝置，該被編碼多聲道訊號係具有被編碼聲道與至少第一及第二多聲道參數。該裝置包含一聲道解碼器以及一多聲道處理器。聲道解碼器係用以解碼該等被編碼聲道以得到被解碼聲道。該多聲道處理器係用以藉由使用由第二多聲道參數所識別之被解碼聲道之一第二對與藉由使用該等第二多聲道參數而執行一多聲道處理，以得到被處理聲道並藉由使用由第一多聲道參數所識別之聲道之一第一對及使用該等第一多聲道參數而執行另一多聲道處理，其中聲道之該第一對係包含至少一被處理聲道。

與使用一固定訊號路徑(例如立體聲編碼樹)之常見的多聲道編碼概念相比，本發明的實施例係使用一動態訊號路徑，其係適應於多聲道輸入訊號之該至少三個輸入聲道之特性。詳細地說，疊代處理器102係可適應於在該第一疊代步驟中並基於在該至少三個聲道CH1~CH3之各對之間之一聲道內相關值而建立該訊號路徑(例如立體聲樹)，以在該第一疊代步驟中選擇具有該最高值或超過一閥值之一值之一對，並且在該第二疊代步驟中並基於在該至少三個聲道之各對與對應先前被處理聲道之間之聲道內相關值，而在該第二疊代步驟中選擇具有該最高值或超過一閥值之一值之一對。

更有實施例係提供一方法以編碼具有至少三聲道之一多聲道訊號。該方法包含：●在一第一疊代步驟中，計算在該至少三聲道之各對之間的聲道內相關值，並在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對，以及藉由使用一多聲道處理作業而處理該被選擇之對，以得到為了該被選擇之對之第一多聲道參數並得到第一被處理聲道；●在一第二疊代步驟中並藉由使用該等被處理聲道之至少一而執行該計算、該選擇及該處理，以得到第二多聲道參數及第二被處理聲道； ●編碼由藉由該疊代處理器所執行之一疊代處理所產生之聲道以得到被編碼聲道；以及●產生具有該等被編碼聲道與該等第一及第二多聲道參數之一被編碼多聲道訊號。

更有實施例係提供一方法以解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。該方法包含：●解碼該等被編碼聲道以得到被解碼聲道；及●藉由使用由該等第二多聲道參數所識別之該等被解碼聲道之一第二對並藉由使用該等第二多聲道參數而執行一多聲道處理以得到被處理聲道，並且藉由使用由該等第一多聲道參數所識別之聲道之一第一對並藉由使用該等第一多聲道參數而執行另一多聲道處理，其中聲道之該第一對係包含至少一被處理聲道。

100‧‧‧裝置(編碼器)

101‧‧‧多聲道訊號

102‧‧‧疊代處理器

104‧‧‧聲道編碼器

106‧‧‧輸出介面

107‧‧‧多聲道訊號

110、112、114、116‧‧‧立體聲盒、立體聲工具、處理盒

120_1~120_3‧‧‧單音編碼器

200‧‧‧裝置(解碼器)

202‧‧‧聲道解碼器

204‧‧‧多聲道處理器

206_1~206_3‧‧‧單音解碼器

212‧‧‧輸入介面

300、400‧‧‧方法

302、304、306、308、402、404‧‧‧步驟

C‧‧‧中間聲道

CH1~CH3‧‧‧聲道

D1~D3‧‧‧被解碼聲道

E1~E3‧‧‧被編碼聲道

I1、I2‧‧‧輸入訊號

L‧‧‧左聲道

LFE‧‧‧低頻效用聲道

Ls‧‧‧左環繞聲道

MCH_PAR1‧‧‧第一多聲道參數

MCH_PAR2‧‧‧第二多聲道參數

O1、O2‧‧‧輸出訊號

P1~P8、P1*~P4*‧‧‧被處理聲道

R‧‧‧右聲道

Rs‧‧‧右環繞聲道

S1~S4‧‧‧s-參數

圖中示意地出示：圖1係為本發明一實施例之一裝置的方塊示意圖，其係為編碼具有至少三聲道之一多聲道訊號。

圖2係為本發明一實施例之一裝置的方塊示意圖，其係為編碼具有至少三聲道之一多聲道訊號。

圖3為本發明一實施例之一立體聲盒之一方塊示意圖。

圖4為本發明一實施例之一裝置的方塊示意圖，其係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。

圖5為本發明一實施例之一方法的流程圖，其係為編碼具有至少三聲道之一多聲道訊號。

圖6為本發明一實施例之一方法的流程圖，其係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。

具有相等或等效功能之相等或等效元件係在下面的敘述中以相等或等效的參考標號來表示。

在下面的敘述中，多個細節被提出以提供對本發明之實壽例之一更完全的解釋。然而，對於該項領域具有通常知識者是明顯的，本發明之實施例可不具有這些特定的細節。在其他例子中，熟知的結構及構件係以方塊形式來顯示而不顯示其細節，以避免使本發明之實施例模糊。此外，以下所描述之不同實施例的特徵可相互結合，除非有特定例外的說明。

圖1係為本發明一實施例之一裝置(編碼器)100的方塊示意圖，其係為編碼具有至少三聲道CH1~CH3之一多聲道訊號101。裝置100係包含一疊代處理器102、一聲道編碼器104以及一輸出介面106。

疊代處理器102係用以在一第一疊代步驟中計算在該至少三個聲道CH1~CH3之各對之間之聲道內相關值，以為了在第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值的一對，並且為了藉由使用一多聲道處理作業而處理該被選擇之對，以得到針對該被選擇之對之多個第一多聲道參數MCH_PAR1並得到多個第一被處理聲道P1、P2。此外，該疊代處理器102係用以在一第二疊代步驟中藉由使用該等被處理聲道P1、P2之至少一而執行該計算、該選擇及該處理，以得到多個第二多聲道參數MCH_PAR2與第二被處理聲道P3、P4。

舉例來說，如圖1所示，疊代處理器102可在第一疊代步驟中計算在該至少三聲道CH1~CH3之一第一對之間之一聲道內相關值、在該至少三聲道CH1~CH3之一第二對之間之一聲道內相關值、及在該至少三聲道CH1~CH3之一第三對之間之一聲道內相關值，其中該第一對係由一第一聲道CH1與一第二聲道CH2組成，該第二對係由第二聲道CH2與一第三聲道CH3組成，該第三對係由第一聲道CH1與第三聲道C3組成。

在圖1中，其係假設由第一聲道CH1與第三聲道C3組成之該第三對具有最高聲道內相關值，如此該疊代處理器102係在第一疊代步驟中選擇具有最高聲道內相關值之該第三對並且藉由使用一多聲道處理作業來處理該被選擇之對，亦即該第三對，以得到針對該被選擇之對之第一多聲道參數MCH_PAR1並且得到第一被處理聲道P1、P2。

此外，疊代處理器102係可用以在第二疊代步驟中計算在至少三聲道CH1~CH3之各對之間之聲道內相關值與被處理聲道P1、P2，以為了在第二疊代步驟中選擇具有一最高聲道內相關值或具有超過一閥值之一值之一對。藉此，疊代處理器102可用以在第二疊代步驟中(或在任何另外的疊代步驟中)不選擇該第一疊代步驟之被選擇之對。

關於圖1所示之例子，疊代處理器102可更計算聲道之由第一聲道CH1與第一被處理聲道P1所組成之一第四對之間之一聲道內相關值、由第一聲道C1與第二被處理聲道P2所組成之一第五對之間之一聲道內相關值、由第二聲道C2與第一被處理聲道P1所組成之一第六對之間之一聲道內相關值、由第二聲道C2與第二被處理聲道P2所組成之一第七對之間之一聲道內相關值、由第三聲道C3與第一被處理聲道P1所組成之一第八對之間之一聲道內相關值、由第三聲道C3與第二被處理聲道P2所組成之一第九對之間之一聲道內相關值、以及由第一被處理聲道P1與第二被處理聲道P2所組成之一第十對之間之一聲道內相關值。

在圖1中，其係假設在第二疊代步驟中由第二聲道CH2與第一被處理聲道P1所組成之該第六對具有最高聲道內相關值，如此該疊代處理器102係在第二疊代步驟中選擇該第六對並且藉由使用一多聲道處理作業來處理該被選擇之對，亦即該第六對，以得到針對該被選擇之對之第二多聲道參數MCH_PAR2並且得到第二被處理聲道P3、P4。

疊代處理器102可用以僅選擇一對，當該對之程度差(level difference)小於一閥值時。該閥值係小於40dB、25dB、12dB、或小於6dB。藉此，25dB或40dB之閥值係對應3度或0.5度之旋轉角度。

疊代處理器102可用以計算正規化整數相關值。其中疊代處理器102可用以選擇一對，當整數相關值係大於例如0.2或較佳0.3時。

此外，疊代處理器102可提供由多聲道處理所產生之聲道給聲道編碼器104。舉例來說，請參照圖1，疊代處理器102可提供由在第二疊代步驟中執行之多聲道處理所產生之第三被處理聲道P3及第四被處理聲道P4並提供由在第一疊代步驟中所執行之多聲道處理所產生之第二被處理聲道P2給聲道編碼器104。藉此，疊代處理器102可僅提供那些未在一後續疊代步驟中被(另外)處理之被處理聲道給聲道編碼器104。如圖1所示，第一被處理聲道P1未被提供給聲道編碼器104，這是由於它在第二疊代步驟中被另外處理。

聲道編碼器104可用以編碼由該疊代處理器102所執行之疊代處理(或多聲道處理)所產生之聲道P2~P4，以得到被編碼聲道E1~E3。

舉例來說，聲道編碼器104可用以使用單音編碼器(或單音盒或單音工具)120_1~120_3來編碼由疊代處理(或多聲道處理)所產生之聲道P2~P4。該等單音盒可用以編碼該等聲道，如此與編碼具有較高能量(或一較高振幅)之一聲道相比，編碼具有較少能量(或一較小振幅)之一聲道可需要較少的位元。單音盒120_1~120_3可例如為運用轉換音源編碼器(transformation based audio encoders)。此外，聲道編碼器104可用以使用立體聲編碼器(例如參數立體聲編碼器(parametric stereo encoders)、或耗損立體聲編碼器(lossy stereo encoders))來編碼由疊代處理(或多聲道處理)所產生之聲道P2~P4。

輸出介面106可用以產生被編碼之多聲道訊號107，被編碼之多聲道訊號107係具有被編碼聲道E1~E3以及第一與第二多聲道參數MCH_PAR1、MCH_PAR2。

舉例來說，輸出介面106可用以產生被編碼多聲道訊號107而作為一串列訊號(serial signal)或串列位元流(serial bit stream)，並且如此該第二多聲道參數MCH_PAR2係在第一多聲道參數MCH_PAR1之前而在被編碼訊號107內。如此，一解碼器，會在以下配合圖4說明之一實施例，將會在第一多聲道參數MCH_PAR1之前接收第二多聲道參數MCH_PAR2。

在圖1中，疊代處理器102係例示地執行兩個多聲道處理作業，其中一多聲道處理作業係在第一疊代步驟，而另一多聲道處理作業係在第二疊代步驟。自然地，疊代處理器102亦可後續的疊代步驟中執行另外的多聲道處理作業。藉此，疊代處理器102可用以執行疊代步驟直到一疊代終止判定標準被達到。疊代終止判定標準可係為疊代步驟之一最大數量與多聲道訊號101之聲道之一總數量相等或高過多聲道訊號101之聲道之一總數量兩個，或者疊代終止判定標準可係為當聲道內相關值不具有大於閥值之一值時成立，而閥值較佳可大於0.2或等於0.3。在其他實施例中，疊代終止標準可係為疊代步驟之一最大數量與多聲道訊號101之聲道之一總數量相等或高過多聲道訊號101之聲道之一總數量，或者疊代終止判定標準可係為當聲道內相關值不具有大於閥值之一值時成立，而閥值較佳可大於0.2或等於0.3。

為了說明目的，由疊代處理器102在第一疊代步驟與第二疊代步驟中所執行之多聲道處理作業係例示地由圖1及處理盒110、112來說明。處理盒110、112可以硬體或軟體實現。處理盒110、112可例如為立體聲盒。

藉此，聲道內訊號相依可藉由等級地應用已知的聯合立體聲編碼工具而被利用。與先前的MPEG方式相比，要被處理之訊號對不是由一固定訊號路徑(例如立體聲編碼樹)來預先確定，而是可被動態地改變以適應於輸入訊號特性。實際立體聲盒之輸入可為(1)未處理聲道，例如聲道CH1~CH3、(2)一前立體聲盒之輸出，例如被處理之訊號P1~P4、或(3)一未處理聲道與一前立體聲盒之一輸出之一結合。

在立體聲盒110、112內的處理可為運用預測的(prediction based)(例如在USAC中的複預測盒)或運用KLT/PCA的(KLT/PCA based)(輸入聲道係在編碼器中被旋轉(例如經由一2x2旋轉矩陣)以最大化能量濃縮，亦即將訊號能量集中於一聲道內，在解碼器內該等被旋轉訊號將會再轉換到原有輸入訊號方向)。

在編碼器100之一可能的實現中，(1)該編碼器係計算在各聲道對之間之一聲道內相關並從輸入訊號選擇一合適的訊號對，並且應用立體聲工具到被選擇聲道；(2)該編碼器係再計算在所有聲道(未處理聲道及被處理之中間輸出聲道)之間之聲道內相關並從輸入訊號選擇一合適的訊號對，並且應用立體聲工具到被選擇聲道；以及(3)該編碼器係重覆步驟(2)直到所有聲道內相關係低於一閥值或假使轉換之一最大數量被應用。

如前所述，要被編碼器100，更精確來說是疊代處理器102，所處理之訊號對並未由一固定訊號路徑(例如立體聲編碼樹)所確定，而是可以動態地改變以適應於輸入訊號特性。藉此，編碼器100(或疊代處理器102)可用以依據多聲道(輸入)訊號101之至少三聲道CH1~CH3而建立該立體聲樹。換言之，編碼器100(或疊代處理器102)可用以基於一聲道內相關而建立立體聲樹(例如藉由在第一疊代步驟中計算在該至少三聲道CH1~CH3之各對之間之聲道內相關值，以為了在第一疊代步驟中選擇具有最高值或超過一閥值之一值之一對，並且藉由在一第二疊代步驟中計算在該至少三聲道之各對之間之聲道內相關值以為了在第二疊代步驟中選擇具有最高值或超過一閥值之一值之一對)。依據一單一步驟方法，一相關矩陣可針對可能包含所有在先前疊代中可能被處理之聲道之相關之各疊代而被計算。

如前所述，疊代處理器102可用以在第一疊代步驟中得到針對被選擇之對之第一多聲道參數MCH_PAR1並在第二疊代步驟中得到針對被選擇之對之第二多聲道參數MCH_PAR2。第一多聲道參數MCH_PAR1可包含一第一聲道對識別(或索引)，其可識別(或標示)在第一疊代步驟中被選擇之聲道對，其中第二多聲道參數MCH_PAR2可包含一第二聲道對識別(或索引)，其可識別(或標示)在第二疊代步驟中被選擇之聲道對。

以下係描述輸入訊號之一高效率索引。舉例來說，聲道對可藉由依據聲道的總數量使用針對各對之獨一的索引而被有效地標示。舉例來說，針對六聲道之對之索引可以下表顯示：

舉例來說，在上表中，索引5可標示由第一及第二聲道組成之對。相似地，索引6可標示由第一及第三聲道組成之對。

針對n個聲道之可能聲道對索引的總數量可計算如下：numPairs=numChannels*(numChannels-1)/2

因此，需要用來標示一聲道對的位元量係如下： numBits=floor(log2(numPairs-1))+1

此外，編碼器100可使用一聲道遮罩。多聲道工具之配置可包含一聲道遮罩用以指示該工具對於哪些聲道是有效的。如此，在考慮到一個更有效率的編碼，LFEs(LFE=低頻效應/增強聲道(low frequency effects/enhancement channels))可從該聲道對索引中移除。例如，對於一個11.1設定，這可使聲道對索引的數量從12*11/2=66減少到11*10/2=55，在容許標示具有6位元而非7位元的情況下。此機制亦可被用來排除用來作為單音物件(例如多語言音軌)之聲道。在聲道遮罩之解碼上，一聲道圖(channelMap)可被產生以容許聲道對索引再映像(re-mapping)至解碼器聲道。

此外，疊代處理器102可用以得到針對一第一訊框(frame)之複數被選擇對指示，其中輸出介面106可用以包含一保持指示器，其係轉入多聲道訊號107並針對接在第一訊框之後之一第二訊框，並且指示第二訊框具有與第一訊框相同多個被選擇對指示。

保持指示器或保持樹旗標可用以標示沒有新的樹被傳送，但是最後的立體聲樹應被使用。假使聲道相關性在一段較長時間維持不變，這可用來避免相同的立體聲樹配置之多重傳送。

圖2係顯示一立體聲盒110、112之一示意方塊圖。立體聲盒110、112包含針對一第一輸入訊號I1與一第二輸入訊號I2之輸入並包含針對一第一輸出訊號O1與一第二輸出訊號O2之輸出。如圖2所示，從輸入訊號I1、I2之輸出訊號O1、O2之相依可藉由s-參數S1~S4來描述。

疊代處理器102可使用(或包含)立體聲盒110、112以執行在輸入聲道及/或被處理聲道上之多聲道處理作業，以得到(另外的)被處理聲道。舉例來說，疊代處理器102可用以使用一般的、運用預測的或運用KLT(Karhunen-Loève-Transformation)之旋轉立體聲盒110、112。

一種一般性的編碼器(或編碼器側之立體聲盒)可用以編碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2：

一種一般性的解碼器(或解碼器側之立體聲盒)可用以解碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2：

一種運用預測之編碼器(或編碼器側之立體聲盒)可用以編碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2：，其中p係為預測係數。

一種運用預測之解碼器(或解碼器側之立體聲盒)可用以解碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2：

一種運用KLT之旋轉編碼器(或編碼器側之立體聲盒)可用以編碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2：

一種運用KLT之旋轉解碼器(或解碼器側之立體聲盒)可用以解碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2(反向旋轉)：

以下係描述針對運用KLT之旋轉之旋轉角度α之一計算。

針對運用KLT之旋轉之旋轉角度α可定義如下：，其中c _xy係為一非正規化相關矩陣之元素(entries)，其中c ₁₁、c ₂₂係為聲道能量。

這可藉由使用atan2函數而被實現，以考慮到在分子中的負相關之間之區別以及在分母中的負能量差：alpha=0.5*atan2(2*correlation[ch1][ch2],(correlation[ch1][ch1]-correlation[ch2][ch2]))；此外，疊代處理器102可用以藉由使用包含複數頻帶之各聲道之一訊框而計算一聲道內相關，藉此可得到針對該等頻帶之一單一聲道內相關值，其中疊代處理器102可用以執行針對各該等頻帶之多聲道處理，使得該第一或第二多聲道參數可從各該等頻帶被得到。

藉此，疊代處理器102可用以計算在多聲道處理中之立體聲參數，其中疊代處理器102可用以在多個頻帶中僅執行一立體聲處理，其中一立體聲參數係高於由一立體聲量化器(例如運用KLT之旋轉編碼器)所定義之一量化到零(quantized-to-zero)閥值。立體聲參數可例如為MS On/Off、或旋轉角度、或預測係數。

舉例來，疊代處理器102可用以計算在多聲道處理中之旋轉角度，其中疊代處理器102可用以在多個頻帶中僅執行一旋轉處理，其中一旋轉角度係高於由一立體聲量化器(例如運用KLT之旋轉編碼器)所定義之一量化到零(quantized-to-zero)閥值。

如此，編碼器100(或輸出介面106)可用以傳輸該轉換/旋轉資訊，其可作為針對完整頻譜(全頻盒(full band box))之一參數或針對部分頻譜之多個頻率相依參數。

編碼器100可用以基於下表而產生位元流107：

圖3係顯示依據一實施例之一疊代處理器102之一示意的方塊示意圖。在圖3所示之實施例中，多聲道訊號101係為一5.1聲道訊號，其具有六聲道：一左聲道L、一右聲道R、一左環繞聲道Ls、一右環繞聲道Rs、一中間聲道C以及一低頻效用(low frequency effects)聲道LFE。

如圖3所示，LFE聲道並未被疊代處理器102處理。這可能是由於在LFE聲道與各其他五個聲道L、R、Ls、Rs、C之間之之聲道內相關值太小，或是由於聲道遮罩指示不要處理LFE聲道，這在下面敘述中會被假設。

在一第一疊代步驟中，疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間之聲道內相關值，以在第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中，其係假設左聲道L與右聲道R具有最高值，使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)110，其係執行多聲道作業處理作業，而處理左聲道L與右聲道R，以得到第一及第二被處理聲道P1、P2。

在一第二疊代步驟中，疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間與被處理聲道P1、P2之間之聲道內相關值，以在第二疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中，其係假設左環繞聲道Ls與右環繞聲道Rs具有最高值，使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)112而處理左環繞聲道Ls與右環繞聲道Rs，以得到第三及第四被處理聲道P3、P4。

在一第三疊代步驟中，疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間與被處理聲道P1~P4之間之聲道內相關值，以在第三疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中，其係假設第一被處理聲道P1與第三被處理聲道P3具有最高值，使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)114而處理第一被處理聲道P1與第三被處理聲道P3，以得到第五及第六被處理聲道P5、P6。

在一第四疊代步驟中，疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間與被處理聲道P1~P6之間之聲道內相關值，以在第四疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中，其係假設第五被處理聲道P5與中間聲道C具有最高值，使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)115而處理第五被處理聲道P5與第中間聲道C，以得到第七及第八被處理聲道P7、P8。

立體聲盒110~116可為MS立體聲盒，亦即中側立體聲盒(mid/side stereophony boxes)，其係用以提供一中聲道與一側聲道。中聲道可為立體聲盒之輸入聲道之總和，其中側聲道可為立體聲盒之輸入聲道之間之差。此外，立體聲盒110、116可為旋轉盒或立體聲預測盒。

在圖3中，第一被處理聲道P1、第三被處理聲道P3與第五被處理聲道P5可皆為中聲道，其中第二被處理聲道P2、第四被處理聲道P4與第六被處理聲道P6可皆為側聲道。

另外，如圖3所示，疊代處理器102可用以執行在該第二疊代步驟中之該計算、該選擇及該處理，並且假使可行，在任何另外的疊代步驟中使用輸入聲道L、R、Ls、Rs、C及被處理聲道之(僅僅)中聲道P1、P3、P5。換言之，疊代處理器102可被配置為在第二疊代步驟中之該計算、該選擇及該處理中不使用被處理聲道之側聲道P2、P4、P6，並且假使可行的話，這可應用在任何其他疊代步驟中。

圖4係顯示一裝置(解碼器)200之一示意方塊圖，其係為了解碼具有被編碼聲道E1~E3以及至少第一與第二多聲道參數MCH_PAR1、MCH_PAR2之一被編碼多聲道訊號107。裝置200係包含一聲道解碼器202與一多聲道處理器204。

聲道解碼器202係用以解碼該等被編碼聲道E1~E3以得到被解碼聲道D1~D3。

舉例來說，聲道解碼器202可包含至少三單音解碼器(或單音盒、或單音工具)206_1~206_3，其中各單音解碼器206_1~206_3可用以解碼至少三被編碼聲道E1~E3之其中之一，以得到各別的被解碼聲道D1~D3。單音解碼器206_1~206_3可例如為運用轉換之音源解碼器。

多聲道處理器204係用以藉由使用由第二多聲道參數MCH_PAR2所定義之被解碼聲道之一第二對並藉由使用第二多聲道參數MCH_PAR2來執行一多聲道處理，以得到被處理聲道，並用以藉由使用由第一多聲道參數MCH_PAR1所定義之聲道之一第一對並藉由使用第一多聲道參數MCH_PAR1來執行另一多聲道處理，其中聲道之第一對係包含至少一被處理聲道。

如圖4所示之例子，第二多聲道參數MCH_PAR2可指示(或標示)被解碼聲道之第二對係由第一被解碼聲道D1及第二被解碼聲道D2所組成。如此，多聲道處理器204係藉由使用由第一被解碼聲道D1及第二被解碼聲道D2(由第二多聲道參數MCH_PAR2所定義)所組成之被解碼聲道之第二對並藉由使用第二多聲道參數MCH_PAR2來執行一多聲道處理，以得到被處理聲道P1*、P2*。第一多聲道參數MCH_PAR1可指示被解碼聲道之第一對係由第一被處理聲道P1*及第三被解碼聲道D3所組成。如此，多聲道處理器204係藉由使用由第一被處理聲道P1*及第三被解碼聲道D3(由第一多聲道參數MCH_PAR1所定義)所組成之被解碼聲道之第一對並藉由使用第一多聲道參數MCH_PAR1來執行一多聲道處理，以得到被處理聲道P3*、P4*。

此外，多聲道處理器204可提供第三被處理聲道P3*作為第一聲道CH1、第四被處理聲道P4*作為第三聲道CH3、以及第二被處理聲道P2*作為第二聲道CH2。

假設圖4所示之解碼器200係從圖1所示之編碼器100接收被解碼之多聲道訊號107，解碼器200之第一被解碼聲道D1可等效於編碼器100之第三被處理聲道P3，其中解碼器200之第二被解碼聲道D2可等效於編碼器100之第四被處理聲道P4，並且其中該解碼器200之第三被解碼聲道D3可等效於編碼器100之第二被處理聲道P2。另外，解碼器200之第一被處理聲道P1*可等效於編碼器100之第一被處理聲道P1。

另外，被編碼之多聲道訊號107可為一串列訊號(serial signal)，其中第二多聲道參數MCH_PAR2係在解碼器200並在第一多聲道參數MCH_PAR1之前被接收。在此狀況中，多聲道處理器204可用以依序處理被解碼聲道，其中該多聲道參數MCH_PAR1、MCH_PAR2係被解碼器所接收。在圖4所示之例子中，解碼器係在第一多聲道參數MCH_PAR1之前接收第二多聲道參數MCH_PAR2，並且如此藉由使用由第二多聲道參數MCH_PAR2所定義之被解碼聲道之第二對(由第一及第二被解碼聲道D1、D2所組成)來執行多聲道處理，而這是在藉由使用由第一多聲道參數 MCH_PAR1所定義之被解碼聲道之第一對(由第一被處理聲道P1*及第三被解碼聲道D3所組成)來執行多聲道處理之前進行的。

在圖4中，多聲道處理器204係示意地執行兩個多聲道處理作業。為了說明目的，由多聲道處理器204所執行之多聲道處理作業係以圖4及處理盒208、210來說明。處理盒208、210可以硬體或軟體實現。處理盒208、210可例如為立體聲盒，就如前關於編碼器100所述的，例如一般解碼器(或解碼器側之立體聲盒)、運用預測之解碼器(或解碼器側之立體聲盒)、或運用KLT之旋轉解碼器(或解碼器側之立體聲盒)。

舉例來說，編碼器100可使用運用KLT之旋轉編碼器(或編碼器側之立體聲盒)。在此狀況中，編碼器100可得到第一及第二多聲道參數MCH_PAR1、MCH_PAE2，使得第一及第二多聲道參數MCH_PAR1、MCH_PAE2包含旋轉角度。旋轉角度可為差分編碼(differentially encoded)。因此，解碼器200之多聲道處理器204可包含一差分解碼器以為了差分解碼該等被差分編碼之旋轉角度。

裝置200可更包含一輸入介面212，其係用以接收並處理被編碼之多聲道訊號107，以提供被編碼聲道E1~E3給聲道解碼器202並提供第一及第二多聲道參數MCH_PAR1、MCH_PAR2給多聲道處理器204。

就如前述，一保持指示器(或保持樹旗標)可被用來標示沒有新的樹要被傳送，但是最後的立體聲樹應被使用。假使聲道相關性在一段較長時間維持不變，這可用來避免相同的立體聲樹配置之多重傳送。

因此，當被編碼之多聲道訊號107包含針對一第一訊框之第一或第二多聲道參數MCH_PAR1、MCH_PAR2以及針對接在第一訊框之後一第二訊框之保持指示器時，多聲道處理器204可用以對如同在第一訊框所使用之聲道的第二對或第一對來執行在第二訊框之多聲道處理或另外的多聲道處理。

多聲道處理與另外的多聲道處理可包含使用一立體聲參數之一立體聲處理，其中針對各別比例因子頻帶(scale factor bands)或被解碼聲道D1~D3之比例因子頻帶之群組，一第一立體聲參數係被包含在第一多聲道參數MCH_PAR1中並且一第二立體聲參數被包含在第二多聲道參數MCH_PAR2中。藉此，第一立體聲參數與第二立體聲參數可屬於相同類型，例如是旋轉角度或預測係數。自然地，第一立體聲參數與第二立體聲參數可屬於不同類別。舉例來說，第一立體聲參數可為一旋轉角度，第二立體聲參數可為一預測係數，反之亦可。

另外，第一或第二多聲道參數MCH_PAR1、MCH_PAR2可包含一多聲道處理遮罩，其係指示哪些比例因子頻帶經過多聲道處理以及哪些比例因子頻帶未經過多聲道處理。藉此，多聲道處理器204可用以不執行在由多聲道處理遮罩所指示之比例因子頻帶中之多聲道處理。

第一與第二多聲道參數MCH_PAR1、MCH_PAR2可各別包含一聲道對識別(或索引)，其中多聲道處理器204可用以藉由使用一預定義之解碼規則或在被編碼之多聲道訊號中所指示之一解碼規則而解碼該聲道對識別(或索引)。

舉例來說，聲道對可藉由依據聲道之總數量來使用獨一的索引給各對而有效地被標示，就如上面關於編碼器100的敘述。

此外，解碼規則可為一Huffman解碼規則，其中該多聲道處理器204可用以執行聲道對識別之一Huffman解碼。

被編碼之多聲道訊號107可更包含一多聲道處理容許指示器，其係指示可容許多聲道處理之被解碼聲道之僅僅一子群組並且指示不容許多聲道處理之至少一被解碼聲道。藉此，多聲道處理器204可用以針對該至少一被解碼聲道不執行任何多聲道處理。對於該至少一被解碼聲道而言，多聲道處理未被容許，就如多聲道處理容許指示器所指示。

舉例來說，當多聲道訊號為一5.1聲道訊號，多聲道處理容許指示器可指示多聲道處理僅容許給5聲道，亦即右聲道R、左聲道L、右環繞聲道Rs、左環繞聲道Ls及中間聲道C，其中多聲道處理未被容許給LFE聲道。

對於解碼處理(聲道對索引之解碼)，下面的c-code可被使用。藉此，對於所有的聲道對，聲道連同有效KLT處理的數量(nChannels)以及現在訊框之聲道對之數量(numPairs)是需要的。

maxNumPairIdx=nChannels*(nChannels-1)/2-1；

對於解碼非關於頻帶之角度(non-bandwise angles)之預測係數，下列的c-code可被使用。

對於解碼非關於頻帶之KLT角度(non-bandwise KLT angles)之預測係數，下列的c-code可被使用。

為避免不同平台上之三角函數之浮點差異，可使用下面為了將角度索引直接轉成sin/cos之查找表。

為了多聲道編碼之解碼，下面為了運用KLT旋轉之方法之c-code可被使用。

為了關於頻帶之處理，可使用下面的c-code。

為了KLT旋轉之一應用，可使用下面的c-code。

圖5係顯示一方法300之一流程圖，其係為編碼具有至少三聲道之一多聲道訊號。方法300包含一步驟302，其係在一第一疊代步驟中計算該至少三聲道之各對之間之聲道內相關值，在第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對，並且藉由使用一多聲道處理作業而處理該被選擇之對以得到針對被選擇之對之第一多聲道參數並得到第一被處理聲道；一步驟304，其係在一第二疊代步驟中藉由使用被處理聲道之至少一而執行該計算、該選擇及該處理，以得到第二多聲道參數及第二被處理聲道；一步驟306，其係編碼從由疊代處理器執行之一疊代處理所產生之聲道以得到被編碼聲道；以及一步驟308，其係產生具有被編碼聲道及第一與第二多聲道參數之一被編碼多聲道訊號。

圖6係顯示一方法400之一流程圖，其係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。方法400包含一步驟402，其係解碼被編碼聲道以得到被解碼聲道；以及一步驟404，其係藉由使用由第二多聲道參數所識別之被解碼聲道之一第二對並藉由使用第二多聲道參數而執行一多聲道處理，以得到被處理聲道，並且藉由使用由第一多聲道參數所識別之聲道之一第一對並藉由使用第一多聲道參數而執行另一多聲道處理，其中聲道之第一對係包含至少一被處理聲道。

雖然本發明已經藉由方塊示意圖之上下文進行描述，其中該等方塊代表實際或邏輯硬體元件，但是本發明亦可藉由一電腦實現方法而被實現。在後面的例子中，該等方法代表對應的方法步驟，其中這些步驟係支持由對應邏輯或實體硬體方塊所執行之功能性。

雖然一些方法係藉由一裝置之上下文來進行描述，但是清楚地，這些方法亦代表對應方法之一描述，其中一方塊或裝置係對應一方法步驟或一方法步驟之一特徵。類似地，由一方法步驟之上下文所描述的方法亦代表一對應裝置之一對應方塊、項目或特徵之一描述。部皆或全部的方法步驟可藉由(或使用)一硬體裝置而被執行，例如一微處理器、一可編程電腦或一電子電路。在一些實施例中，最重要的方法步驟之某個或多個可藉由這樣的裝置來執行。

本發明之被傳送或被編碼的訊號可被儲存於一數位儲存媒介上或可被傳送在一傳輸媒介上，例如一無線傳輸媒介或一有線傳輸媒介，例如網路。

依據某些實現需求，本發明之實施例可以硬體或軟體實現。該實現可藉由使用一數位儲存媒介而執行，例如一軟碟、一DVD、一藍光、一CD、一唯讀記憶體、一可編程唯讀記憶體、可消除可編程唯讀記憶體、一電子式可消除可編程唯讀記憶體或一快閃記憶體，其具有電子式可讀控制訊號儲存於其上，並可與一可編程電腦系統合作(或能夠合作)，使得各別方法可被執行。如此，數位儲存媒介可為電腦可讀。

本發明之一些實施例係包含具有電子式可讀控制訊號之一資料戴體，其係能夠與一可編程電腦系統合作，使得本發明之該些方法之其中之一可被執行。

一般而言，本發明之實施例可被實現如同一電腦程式產品連同一程式碼，當電腦程式產品執行於一電腦上時，該程式碼係可執行該些方法之一。程式碼可例如被儲存於一機械可讀載體上。

其他實施例係包含電腦程式，其係為了執行本發明之方法之其中之一並儲存於一機械可讀載體。

換言之，本發明之方法之一實施例係因此為具有一程式碼之一電腦程式，以為了當電腦程式執行於一電腦時，其係執行本發明方法之一。

本發明之方法之另一實施例係因此為一資料載體(或一非暫態儲存媒介例如一數位儲存媒介或一電腦可讀媒介)，其係包含，記錄於其上，為執行本發明方法之一之電腦程式。資料載體、數位儲存媒介或被記錄媒介係為典型地具體及/或非暫態。

本發明方法之另一實施例係因此為一資料流或一訊號序列(sequence of signals)，其係代表用以執行本發明方法之一之電腦程式。資料流或訊號序列可例如經由一資料通訊連接而被傳送，例如經由網路。

另一實施例包含一處理手段，例如一電腦或一可編程邏輯裝置，可被配置或被適應於執行本發明方法之其中之一。

另一實施例係包含一電腦，其係具有電腦程式安裝於其上用以執行本發明方法之一。

本發明另一實施例係包含一裝置或一系統，其係可傳移(例如以電子式或光學式)用以執行本發明方法之一之一電腦程式到一接收器。該接收器可例如為一電腦、一行動裝置、一記憶體裝置等等。裝置或系統可例如包含一檔案伺服器用以傳送電腦程式至接收器。

在一些實施例中，一可編程邏輯裝置(例如一現場可編程邏輯閘陣列)可被使用來執行本發明方法之部分或全部的功能性。在一些實施例中，一現場可編程邏輯閘陣列可與一微處理器合作以執行本發明方法之一。一般而言，該些方法較佳係藉由任何硬體裝置來執行。

以上所述僅為舉例性，而非為限制性者。任何未脫離本發明之精神與範疇，而對其進行之等效修改或變更，均應包含於後附之申請專利範圍中。