[go: up one dir, main page]

TR201900906T4 - Multi-channel audio coding using complex prediction and explicit prediction signaling. - Google Patents

Multi-channel audio coding using complex prediction and explicit prediction signaling. Download PDF

Info

Publication number
TR201900906T4
TR201900906T4 TR2019/00906T TR201900906T TR201900906T4 TR 201900906 T4 TR201900906 T4 TR 201900906T4 TR 2019/00906 T TR2019/00906 T TR 2019/00906T TR 201900906 T TR201900906 T TR 201900906T TR 201900906 T4 TR201900906 T4 TR 201900906T4
Authority
TR
Turkey
Prior art keywords
signal
prediction
real
channel
decoder
Prior art date
Application number
TR2019/00906T
Other languages
Turkish (tr)
Inventor
Purnhagen Heiko
Carlsson Pontus
Villemoes Lars
Robilliard Julien
Neusinger Matthias
Helmrich Christian
Hilpert Johannes
Rettelbach Nikolaus
Disch Sascha
Edler Bernd
Original Assignee
Dolby Int Ab
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP10169432A external-priority patent/EP2375409A1/en
Application filed by Dolby Int Ab, Fraunhofer Ges Forschung filed Critical Dolby Int Ab
Publication of TR201900906T4 publication Critical patent/TR201900906T4/en

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Bir orta sinyal olarak bir birinci kombinasyon sinyalini (204) ve orta sinyalden türetilen öngörülmüş bir yan sinyal kullanılarak türetilebilen bir artık sinyali (205) elde etmek için iki ses kanalının (201, 202) birleştirilmesine dayalı olan bir ses kodlayıcı ve bir ses kodu çözücü açıklanmaktadır. Birinci kombinasyon sinyali ve öngörü artık sinyali kodlanır (206) ve bir optimizasyon hedefine (208) dayalı olarak bir iyileştirici (207) vasıtasıyla türetilen öngörü bilgisi (206) ile birlikte bir veri akışına (213) yazılır (212). Bir kod çözücü, kodu çözülmüş birinci kanal sinyalini ve kodu çözülmüş ikinci kanal sinyalini türetmek için öngörü artık sinyalini, birinci kombinasyon sinyalini ve öngörü bilgisini kullanır. Bir kodlayıcı örneğinde veyahut bir kod çözücü örneğinde, birinci kombinasyon sinyalinin spektrumunun sanal parçasını kestirmek için bir gerçekten-sanala dönüşüm uygulanabilir. Öngörü artık sinyalinin türetilmesinde kullanılan öngörü sinyalini hesaplamak için gerçek değerli birinci kombinasyon sinyali, karmaşık öngörü bilgisinin gerçek bir kısmıyla çarpılırken; birinci kombinasyon sinyalinin kestirilen sanal parçası, karmaşık öngörü bilgisinin sanal bir kısmıyla çarpılır.An audio encoder and an audio decoder are disclosed based on combining two audio channels 201, 202 to obtain a residual signal 205 that can be derived using a first combination signal 204 as a middle signal and a predicted side signal derived from the middle signal. . The first combination signal and the prediction residual signal are encoded 206 and written to a data stream 213 with predictive information 206 derived by an optimizer 207 based on an optimization target 208. A decoder uses the prediction residual signal, the first combination signal, and predictive information to derive the decoded first channel signal and the decoded second channel signal. In an encoder sample or a decoder example, a real-virtual transform can be applied to estimate the imaginary part of the spectrum of the first combination signal. While the real valued first combination signal is multiplied by a real part of the complex predictive information to calculate the prediction signal used in the derivation of the prediction residual signal; The predicted imaginary part of the first combination signal is multiplied by an imaginary part of the complex predictive information.

Description

TARIFNAME KARMASIK ÖNGÖRÜ VE AÇIK KESTIRIM SINYALLEME KULLANARAK ÇOK KANALLI SES KODLAMA Mevcut bulus, ses isleme ile, özellikle de iki veya daha fazla kanal sinyali olan Çok kanalli bir sinyalin çok kanalli ses islemesi ile ilgilidir. Çok kanalli veya stereo isleme alaninda, orta/yan (M/S: mid/side) stereo kodlama olarak bilinen yöntemin uygulanmasi bilinmektedir. Bu konseptte, bir orta veya mono sinyali (M) elde etmek üzere sol veya birinci ses kanali sinyali ile sag veya ikinci ses kanali sinyalinin bir kombinasyonu olusturulur. Buna ilave olarak, yan sinyali (S) elde etmek üzere sol veya birinci kanal sinyali ile sag veya ikinci kanal sinyalinin arasinda bir fark olusturulur. Sol sinyal ile sag sinyalin birbirlerine oldukça benzer oldugu durumda yan sinyal oldukça küçük olacagindan, bu orta/yan kodlama yöntemi ciddi bir kodlama kazanci ile sonuçlanir. Genel olarak, nicemlenecek/entropi-kodlanacak degerlerin araligi küçüldügü zaman, nicemleyici/entropi kodlayici asamasindaki kodlama kazanci artacaktir. Dolayisiyla yan sinyal küçüldügü zaman, bir PCM (Pulse Code Modulation: Darbe/vurum kod kiplenimi) veya Huffman-tabanli veya aritmetik entropi- kodlayici için kodlama kazanci artacaktir. Ancak orta/yan kodlamanin kodlama kazanci ile sonuçlanmadigi bazi durumlar da mevcuttur. Bu durum, her iki kanaldaki sinyallerde birbirlerine örnegin 90° faz-kaydirma yapildigi zaman gerçeklesebilir. Ardindan, orta sinyal ile yan sinyal oldukça benzer bir araliktar olabilir, bu sebeple entropi-kodlayici kullanilarak orta sinyal ile yan sinyalin kodlanmasi kodlama kazanci ile sonuçlanmayacak, hatta artan bir bit orani ile sonuçlanacaktir. Dolayisiyla, bantlarda orta/yan kodlamayi etkisiz hale getirmek için, örnegin yan sinyalin orijinal sol sinyale göre bir dereceye kadar küçülmedigi frekans-seçici bir orta/yan kodlama uygulanabilir. Sol ve sag sinyaller özdes oldugunda yan sinyal sifir olmasina, bunun da yan sinyalin elimine edilmesinden kaynakli maksimum kodlama kazanci ile sonuçlanmasina karsin, durum orta sinyal ile yan sinyalin, bu iki sinyal arasindaki tek fark genel genlikleri olmak kaydiyla dalga biçimi bakimindan özdes olmasi halinde farkli bir hal alir. Bu durumda, yan sinyalden orta sinyale faz-kayma olmadigi da varsayildiginda, yan sinyal anlamli ölçüde artarken, orta sinyalde deger araligi bakimindan çok fazla bir düsüs görülmez. Belli bir frekans bandinda bu durum gerçeklestigi zaman, kodlama kazanci olmamasindan ötürü orta/yan kodlama etkisiz hale getirilebilir. Orta/yan kodlama frekans-seçici olarak uygulanabilecegi gibi, alternatif olarak zaman bölgesinde de uygulanabilir. Orta/yan kodlama gibi bir dalga biçimi yaklasimina degil, belli stereofonik ipuçlarina dayali olarak parametrik islemeye dayanan alternatif çok kanalli kodlama teknikler mevcuttur. Bu teknikler "çifte ipucu kodlama", "parametrik stereo kodlama" veya "MPEG çevre kodlama" olarak bilinir. Burada çoklu frekans bantlari için belli ipuçlari hesaplanir. Bu ipuçlari; kanallararasi seviye farklarini, kanallararasi uyum ölçümlerini, kanallararasi zaman farklarini ve/veya kanallararasi faz farklarini içerir. Bu yaklasimlar dinleyici tarafindan hissedilen çok kanalli bir etkinin, kanallarin detayli dalga biçimlerine dayanmasinin zorunlu olmadigi, aksine frekans-seçici olarak saglanmis dogru ipuçlarina veya kanallararasi bilgiye dayandigi varsayimindan gelmektedir. Bu da bir renderlama nakinesinde ipuçlarini dogru bir sekilde yansitan çok kanalli sinyallerin renderlanmasi esnasinda dikkatli olunmasini gerektigi, ancak dalga biçimlerinin belirleyici bir öneme sahip olmadigi anlamina gelmektedir. Bu yaklasim özellikle, bütün bu kanallar bir veya ayni downmix kanalindan türetilmis olsa da, kod. çözücünün birbirlerinden ilintisizlestirilmis stereo sinyallerini yapay olarak. elde etmesi için bir ilintisizlestirme isleme uygulamak zorunda oldugu durumda karmasik olabilir. Uygulamaya bagli olarak, bu amaca yönelik ilintisizlestiriciler karmasiktir ve özellikle geçisli sinyal kisimlarinda yapayliklara neden olabilir. Ayrica parametrik kodlama yaklasimi, dalga biçimi kodlamanin aksine hem tipik nicemlemeden, hem de belirli dalga biçimleri yerine stereofonik ipuçlarina bakilmasindan kaynaklanan kaçinilmaz bir bilgi kaybina neden olan kayipli bir kodlama yaklasimidir. Bu yaklasimi çok düsük. bit oranlarina olanak saglar, ancak kaliteden ödün vermeyi gerektirebilir. Son dönemde, Sekil 7'de görülen tümlesik konusma ve ses kodlamada (USAC; Unified Speech and Audio Coding) gelistirmeler yapilmistir. Bir çekirdek kod çözücü (700), giris 70l'de orta/yan kodlanmis olabilen kodlanmis stereo sinyalde kod çözme islemini gerçeklestirir. Çekirdek kod çözücü, hat 702'de bir orta sinyal, hat 703'te ise bir yan veya artik sinyal çikisi yapar. Her iki sinyal de QMF (Quadrature Mirror Filter; Çeyrek Ayna Süzgeç) süzgeç öbekleriyle (704 ve 705) bir QMF bölgesine dönüstürülür. Ardindan, bir sol kanal sinyalini (707) ve bir sag kanal sinyalini ( uygulanir. Sonrasinda düsük bantli sinyaller bir spektral bant kopyalama (SBR; Spectral Band Replication) kod çözücüye (709) iletilir, bu da hat 7l0 ve 7ll'de genis bantli sol ve sag sinyalleri üretir ve ardindan bunlar genis bantli sol ve sag sinyalleri (L, R) elde etmek, üzere QMF sentez süzgeç öbekleri (712, 713) ile bir zaman bölgesine dönüstürülür. Sekil 7'de MPEG çevre kod çözücünün (706) bir orta/yan kod çözmeyi gerçeklestirdigi durum gösterilmistir. Alternatif olarak, MPEG çevre kod çözücü blogu (706), tek bir mono çekirdek kod. çözücü sinyalinden stereo sinyalleri üretmeye yönelik bir stereofonik ipucu tabanli parametrik kod çözmeyi gerçeklestirir. MPEG çevre kod çözücü (706) ayrica kanallararasi seviye farklari, kanallararasi uyum ölçümleri gibi parametrik bilgileri veya bu türdeki diger kanallararasi bilgi parametrelerini kullanarak, SBR kod çözücü bloguna (709) girilecek olan çoklu düsük bantli çikis sinyallerini de üretebilir. MPEG çevre kod çözücü blogu (706) Sekil 7b'de gösterilen orta/yan kod çözmeyi gerçeklestirdiginde, bir gerçek-kazanç katsayisi (g) uygulanabilir; DMX/RES ve L/R sirasiyla karmasik karma QMF bölgesinde gösterilen downmix/artik ve sol/sag sinyallerdir. Blok 706 ve blok 709'un bir kombinasyonunun kullanilmasi, temel olarak bir stereo kod çözücünün kullanimi ile kiyaslandiginda sayisal karmasiklikta sadece çok az bir artisa neden olur, çünkü sinyale ait karmasik QMF gösterimi SBR kod çözücünün bir parçasi olarak halihazirda mevcuttur. SBR. olmayan bir yapida ise USAC baglaminda açiklanan QMF tabanli stereo kodlama, bu örnekte 64-bant analiz öbekleri ve 64-bant sentez öbeklerini gerektiren gerekli QMF öbeklerinden ötürü sayisal karmasikliktaki anlamli bir artis ile sonuçlanabilir. Bu süzgeç öbekleri sadece stereo kodlama amaçli olarak eklenmelidir. Gelistirilmekte olan MPEG USAC sisteminde ise genellikle SBR'nin kullanilmadigi yüksek bit oranlarindaki kodlama modlari mevcuttur. Asagidaki iki MPEG USAC dokümanlarda bir karmasik degerli öngörü katsayisi vasitasiyla bir downmix/toplam/mono sinyalden farkli bir sinyalin tahmin edildigi çok kanalli ses kodlama/kod çözme semalarina iliskin örnekler mevcuttur: HEIKO PURNHAGEN VE ARK.: "Technical description of proposed Unified Stereo Coding in USAC", 90. MPEG TOPLANTISI; 26-10- MAX NEUENDORF (EDITÖR): "WD5 of USAC", 90. MPEG TOPLANTISI; 12-08), sayfa 1-146; alaninda kompleks öngörü kullanarak stereo kodlama kod çözme için yöntemler ve cihazlar açiklamaktadir. Bir düzenlemede, kompleks öngörü kodlama ile kodlanan ve iki girdi kanalinin birinci frekans alani gösterimlerini içeren bir girdi stereo sinyalinden bir çikti stereo sinyalini elde etmek için bir kod çözme yöntemi su upmiksleme adimlarini içerir: (i) bir birinci girdi kanalinin bir ikinci frekans alani gösterimini hesaplama; ve (ii) birinci girdi kanalinin birinci ve ikinci frekans alani gösterimleri, ikinci girdi kanalinin birinci frekans alani gösterimi ve bir kompleks öngörü katsayisi temelinde bir çikti kanalini hesaplama. Upmiksleme, kontrol verisine duyarli olarak bekletilebilir. downmiks sinyalinden bir sol sinyal Ve bir sag sinyal üreten bir parametrik stereo upmiks cihazini açiklamaktadir. Bahsedilen parametrik stereo upmiksinin özelligi, bir öngörü katsayisi ile ölçeklenen mono downmiks sinyaline dayanan sol sinyal ile sag sinyal arasinda bir fark içeren bir fark sinyalini öngörmek için bir araç içermesidir. Bahsedilen öngörü katsayisi uzamsal parametrelerden derive edilir. Bahsi geçen stereo upmiks cihazi ayrica, sol sinyali ve sag sinyali mono downmiks sinyalinin ve bahsi geçen fark sinyalinin bir toplamina ve bir farkina dayanarak derive etmek için bir aritmetik araç içermektedir. Mevcut bulusun bir amaci bir yandan yüksek kodlama kazanci saglarken, diger yandan da iyi bir ses kalitesi ve/veya azalan sayisal karmasiklik ile sonuçlanan iyilestirilmis bir ses isleme konsepti ortaya koymaktir. Bu amaca Istem l'deki gibi bir ses kodu çözücü, Istem 4'deki gibi bir ses kodlayici, Istem 7'deki gibi bir ses kodu çözme yöntemi, Istem 8'deki gibi bir ses kodlama yöntemi veya Istem 9'daki gibi bir bilgisayar programi ile ulasilmaktadir. Mevcut bulus, yüksek kaliteli dalga biçimi kodlama yaklasimindaki bir kodlama kazancinin bir birinci kombinasyon sinyali kullanilarak bir ikinci kombinasyon sinyalinin anlamli ölçüde arttirilabilecegi bulgusuna dayanmakta olup, buradaki sinyallerin her ikisi de orta/yan kombinasyon kurali gibi bir kombinasyon kurali kullanilarak orijinal kanal sinyallerinden türetilir. Bulus konusu öngörünün parametre tabanli bir çift veya çok kanalli kodlama yaklasimindan ziyade dalga biçimi tabanli bir kodlama olmasindan dolayi, bu öngörü bilgisinin, bir optimizasyon hedefi yerine getirilecek, sadece küçük bir ek yüke neden olacak, fakat ses kalitesinde herhangi bir kayip olmaksizin yan sinyal için gereken bit oraninda anlamli bir azalma ile sonuçlanacak sekilde ses kodlayicidaki bir öngörücü tarafindan hesaplandigi bulunmustur. Sayisal karmasikligi azaltmak adina, öngörü bilgisinin bant-seçici bir sekilde frekans bölgesi girisinden türetildigi bir frekans-bölgesi kodlamanin gerçeklestirilmesi tercih edilir. Zaman bölgesi gösteriminin bir spektral gösterime dönüstürülmesine yönelik dönüsüm algoritmasi tercihen, karmasik dönüsümde bir spektrumun gerçekr ve karmasik degerlerir 2 kat yüksekr hizdar örnekleme (oversampling) ile sonuçlanacak sekilde hesaplanirken, karmasik dönüsümden sadece gerçek degerlerin veya sanal degerlerin hesaplanmasi bakimindan fakli olan, modifiye edilmis kesintili kosinüs dönüsümü (MDCT; Modified Discrete Cosine Transform) veya modifiye edilmis kesintili sinüs dönüsümü (MDST; Modified Discrete Sine Transform) gibi kritik olarak örneklenmis bir islemdir. Tercihen, örtüsen bir sununi ve silmeye dayali bir dönüsüm kullanilir. Özellikle MDCT böyle bir dönüsümdür ve kod çözücü tarafindaki örtüsme-ekleme-isleme sayesinde elde edilen iyi bilinen zaman bölgesi esdes silme (TDAC; Time Domain Aliasing Cancellation) özelliginden ötürü herhangi bir ek yük olmaksizin sonraki bloklar arasinda bir çapraz-sönümlemeye olanak saglar. Tercihen, kodlayicida hesaplanan, kod çözücüye iletilen ve kod çözücüde kullanilan öngörü bilgisi, avantajli olarak O° ve 360° arasindaki miktarlardan rastgele seçilen iki ses kanali arasindaki faz farkliliklarini yansitan bir sanal parçayi içerir. Sayisal karmasiklik, sadece gerçek degerli bir dönüsüm veya genel anlamda sadece gerçek bir spektrum ya da sadece sanal bir spektrum saglayan bir dönüsüm uygulandigi zaman anlamli ölçüde azaltilir. Sol sinyale ait belli bir bant ile sag sinyale ait karsilik gelen bir bant arasindaki faz kaymasini belirten bu sanal öngörü bilgisinden faydalanmak için, orijinal kombinasyon sinyaline göre faz- döndürülmüs olan birinci kombinasyon sinyalinden bir öngörü artik sinyali hesaplamak üzere kod çözücüde bir gerçekten- sanala dönüstürücü ya da dönüsüni uygulamasina. bagli olarak bir sanaldan-gerçege dönüstürücü saglanir. Sonrasinda bu faz- döndürülmüs öngörü artik sinyali, son asamada belli bir banttaki kodu çözülmüs sol kanali ve bu banttaki kodu çözülmüs sag kanali elde etmekr üzere bir orta sinyal ile birlestirilebilen bir yan sinyali yeniden üretmek için bit akisinda iletilen öngörü artik sinyali ile birlestirilebilir. Ses kalitesini arttirmak için, kod çözücü tarafinda uygulanan ayni gerçekten-sanala veya sanaldan-gerçege dönüstürücü, öngörü artik sinyali kodlayicida hesaplanirken kodlayici tarafinda da uygulanir. Mevcut bulus, ayni bit oranina ve ayni ses kalitesine sahip sistemler ile kiyaslandiginda iyilestirilmis bir ses kalitesi ve azaltilmis bir bit orani saglamasi bakimindan avantajlidir. Ayrica, genellikle SBR'nin kullanilmadigi, yüksek bit oranlarinda MPEG USAC sisteminde faydali olan birlestirilmis stereo kodlamanin sayisal verimliligi bakimindan da avantajlar elde edilmistir. Bu yaklasimlarda, sinyalin karmasik karma QMF bölgesinde islenmesinin yerine, alttaki stereo dönüsüm kodlayicinin yerel MDCT bölgesinde artik tabanli öngörücü stereo kodlama uygulanir. Mevcut bulusun bir yönüne uygun olarak, mevcut bulus MDCT bölgesinde karmasik öngörü yoluyla bir stereo sinyalin üretimi için bir cihaz veya yöntem içermekte olup, burada karmasik öngörü bir gerçekten-karmasiga dönüsüm kullanilarak MDCT bölgesinde yapilir; burada sözü edilen stereo sinyal, stereo sinyal üretme cihazi veya yöntem kod çözücü tarafinda uygulandiginda, kodlayici tarafindaki kodlanmis bir stereo sinyal olabilecegi gibi alternatif olarak kodu çözülmüs/iletilmis bir stereo sinyal de olabilir. Asagida mevcut bulusun tercih edilen düzenlemeleri ekli sekillere atifta bulunularak açiklanacak olup, bu sekillerden; Sekil l, bir ses kodu çözücünün bir semasidir; Sekil 2, bir ses kodlayicinin bir blok semasidir; Sekil 3a, Sekil 2'deki kodlayici hesaplayicinin bir uygulamasini göstermektedir; Sekil 3b, Sekil 2'deki kodlayici hesaplayicinin› alternatif bir uygulamasini göstermektedir; Sekil 3c, kodlayici tarafinda uygulanacak bir orta/yan kombinasyon kuralini göstermektedir; Sekil 4a, Sekil 1'deki kod çözücü hesaplayicinin bir uygulamasini göstermektedir; Sekil 4b, bir matris hesaplayici formundaki kod çözücü hesaplayicinin alternatif bir uygulamasini göstermektedir; Sekil 4c, Sekil 3c'de gösterilen kombinasyon kuralina karsilik› gelen bir orta/yan ters kombinasyon kuralini göstermektedir; Sekil 5a, tercihen gerçek degerli bir frekans bölgesi olan frekans bölgesinde isleyen bir ses kodlayici düzenlemesini göstermektedir; Sekil 5b, frekans bölgesinde isleyen bir ses kodu çözücünün bir uygulamasini göstermektedir; Sekil 6a, mevcut bulusun edilen bir düzenlemesine uygun olarak. MDCT bölgesinde isleyen ve bir gerçekten- sanala dönüsümü kullanan bir ses kodlayicinin alternatif bir uygulamasini göstermektedir; Sekil 6b, mevcut bulusun edilen bir düzenlemesine uygun olarak MDCT bölgesinde isleyen ve bir gerçekten- sanala dönüsümü kullanan bir ses kod çözücüyü göstermektedir; Sekil 7a, bir stereo kod çözücüyü ve sonradan baglanan bir SBR. kod çözücüyü kullanan bir ses sonislemcisini göstermektedir; Sekil 7b, bir orta/yan upmix matrisini göstermektedir; Sekil 8a, Sekil 6a'daki MDCT blogunun detayli bir görünümünü göstermektedir; Sekil 8b, Sekil 6b'deki MDCT*l blogunun detayli bir görünümünü göstermektedir; Sekil 9a, MDCT çikisina göre azaltilmis çözünürlükte isleyen bir iyilestiricinin (optimize edici) bir uygulamasini göstermektedir; Sekil 9b, bir MDCT spektrumunun ve öngörü bilgisinin hesaplandigi karsilik gelen düsük çözünürlük bantlarinin bir gösterimini göstermektedir; Sekil lOa, Sekil 6a veya 6b'deki gerçekten-sanala dönüstürücünün bir uygulamasini göstermektedir ve Sekil lOb, Sekil lOa'daki sanal spektrum hesaplayicinin olasi bir uygulamasini göstermektedir. Sekil 1, bir giris hattinda (100) elde edilen kodlanmis çok kanalli bir ses sinyalinin kodunu çözmeye yönelik bir ses kodu çözücüyü göstermektedir. Kodlanmis çok kanalli ses sinyali, çok kanalli ses sinyalini gösteren bir birinci kanal sinyali ile bir ikinci kanal sinyalini birlestirmeye yönelik bir kombinasyon kurali kullanilarak. üretilen› bir kodlanmis birinci kombinasyon sinyalini, kodlanmis bir öngörü artik sinyalini ve bir öngörü bilgisini içerir. Kodlanmis çok kanalli sinyal, çogullamali formdaki üç bilesene sahip olan bir bit akisi gibi bir veri akisi olabilir. Hat lOO'de kodlanmis çok kanalli sinyale ilave yan bilgi dahil edilebilir. Sinyal giris arayüzüne (102) girilir. Giris arayüzü (102) hat 104'te kodlanmis birinci kombinasyon sinyalini, hat 106'da kodlanmis artik sinyali, hat 108'de ise öngörü bilgisini çikaran bir veri akisi çogullama çözücü olarak uygulanabilir. Öngörü bilgisi tercihen sifira esit olmayan. bir gerçek. parça. ve/veya sifirdan farkli olan bir sanal parçaya sahip olan bir faktördür. Kodlanmis kombinasyon sinyali ile kodlanmis artik sinyal, hat 112'de kodu çözülmüs bir birinci kombinasyon sinyali elde etmek üzere birinci kombinasyon sinyalinin kodunu çözmek için bir sinyal kodu çözücüye (110) girilir. Ek olarak, sinyal kodu çözücü (110) hat 114'de kodu çözülmüs bir artik sinyali elde etmek üzere kodlanmis artik sinyalin kodunu çözecek sekilde yapilandirilmistir. Bir ses kodlayici tarafindaki kodlama islemeye bagli olarak, sinyal kodu çözücü› bir Huffman kod çözücü, bir aritmetik kod çözücü veya herhangi bir diger entropi-kod çözücü gibi bir entropi-kod çözücüyü ve iliskili bir ses kodlayicida bir nicemleyici islemiyle eslesen bir nicemleme giderme isleminin gerçeklestirilmesine yönelik sonradan baglamali bir nicemleme giderme (nicemlenmis bir görüntüde kaybolan detayin geri kazanilmasi) adimini içerebilir. Hat 112 ve 114'teki sinyaller hat 117'de birinci kanal sinyalini, hat 118'de ikinci kanal sinyalini çikaran bir kod çözücü hesaplayiciya (115) girilir ki burada sözü edilen iki sinyal bir çok kanalli ses sinyaline ait iki kanal ya da stereo sinyaldir. Örnegin çok kanalli ses sinyali bes kanal içeriyorsa, bu durumda söz konusu iki sinyal, çok kanalli sinyalden gelen iki kanaldir. Bes kanali olan bu tür bir çok kanalli sinyali tamamen kodlamak için, Sekil 1'de gösterildigi gibi iki kod çözücü uygulanabilir ki burada birinci kod çözücü sol kanali ve sag kanali isler, ikinci kod çözücü sol çevre kanalini ve sag çevre kanalini isler, yine burada merkez kanalda mono-kodlama uygulamak için bir üçüncü mono kod çözücü kullanilabilir. Bununla birlikte dalga biçimi kodlayicilar ve parametrik kodlayicilarin baska gruplamalari ve kombinasyonlari da uygulanabilir. Öngörü semasini ikiden fazla kanala genellemenin alternatif bir yolu da üç (veya daha fazla) sinyali ayni anda isleme tabi tutmak, yani MPEG Çevre'de "ikiden üçe (two-to-three)" yaklasimina oldukça benzer sekilde iki öngörü katsayisini kullanarak 1" ve 2. sinyallerden bir 3. kombinasyon sinyalini öngörmektir. Kod çözücü hesaplayici (116); kodu çözülmüs artik sinyal (114), öngörü bilgisi (108) ve kodu çözülmüs birinci kombinasyon sinyalini (112) kullanarak kodu çözülmüs birinci kanal sinyali (117) ve kodu çözülmüs ikinci kanal sinyali (118) bulunan bir kodu çözülmüs çok kanalli sinyali hesaplamak üzere yapilandirilmistir. Kod çözücü hesaplayici (116) özellikle kodu çözülmüs birinci kanal sinyali ve kodu çözülmüs ikinci kanal sinyali, birinci kombinasyon sinyali ve öngörü artik sinyali üretildigi esnada kombinasyon kurali ile birlestirilen, karsilik gelen bir kodlayiciya girilen çok kanalli sinyale ait bir birinci kanal sinyali ve bir ikinci kanal sinyalinin en azindan bir yaklasigi olacak sekilde islemek üzere yapilandirilmistir. Özel olarak belirtmek gerekirse, hat 108'deki öngörü bilgisi sifirdan farkli bir gerçek degerli parça ve/veya sifirdan farkli bir sanal parça Kod çözücü hesaplayici (116) farkli sekillerde uygulanabilir. Bir birinci uygulama Sekil 4a'da gösterilmistir. Bu uygulama bir öngörücüyü (1160), bir kombinasyon sinyali hesaplayiciyi (1161) ve bir birlestiriciyi (1162) içerir. Öngörücü kodu çözülmüs birinci kombinasyon sinyali (112) ile öngörü bilgisini (108) alir ve bir öngörü sinyalini (1163) çikarir. Yine özel olarak, öngörücü (1160) öngörü bilgisini (108) kodu çözülmüs birinci kombinasyon sinyaline (112) veya kodu çözülmüs birinci kombinasyon sinyalinden türetilen bir sinyale uygulamak üzere yapilandirilmistir. Öngörü bilgisinin (108) uygulandigi sinyali türetmeye yönelik türetme kurali, bir gerçekten-sanala dönüsüm ya da esit bir biçimde bir sanaldan-gerçege dönüsüm veya bir agirliklandirma islemi olabilecegi gibi, uygulamaya bagli olarak bir faz kaymasi islemi veya birlestirilmis bir agirliklandirma/faz kaymasi islemi de olabilir. Kodu Çözülmüs ikinci kombinasyon sinyalini (1165) hesaplamak için öngörü sinyali (1163) kodu çözülmüs artik sinyal ile birlikte kombinasyon sinyali hesaplayiciya (1161) girilir. Sirayla hat 1166 ile hat 1167'de kodu çözülmüs birinci kanal sinyali ve kodu çözülmüs ikinci kanal sinyali bulunan kodu çözülmüs çok kanalli ses sinyalini elde etmek üzere, sinyallerin (112 ve 1165) her ikisi de kodu çözülmüs birinci kombinasyon sinyali ve ikinci kombinasyon sinyalini birlestiren birlestiriciye (1162) girilir. Alternatif olarak, kod çözücü hesaplayici giris olarak kodu çözülmüs birinci kombinasyon sinyali veya M sinyalini, kodu çözülmüs artik sinyal veya D sinyalini ve öngörü bilgisini (108) alan bir matris hesaplayici (1168) olarak uygulanir. Matris hesaplayici (1168) L, R çikis sinyallerini elde etmek için M, D sinyallerine 1169 ile gösterilen bir dönüsüm matrisini uygular; burada L kodu çözülmüs birinci kanal sinyali, R ise kodu çözülmüs ikinci kanal sinyalidir. Sekil 4b'deki yazim, bir sol kanalli (L) ve bir sag kanalli (R) bir stereo yazima benzer. Kolay bir anlasilma açisindan bu yazim uygulanmistir, ancak teknik alanda uzman kisilerce anlasilacagi üzere L, R sinyalleri, ikiden fazla kanal sinyali bulunan bir çok kanalli sinyal içerisindeki iki kanal sinyalinin herhangi bir kombinasyonu olabilir. Matris islemi bir tür "tek durumlu (single-shot)" matris hesaplamaya birlestirir; burada Sekil 4a'daki devreye yapilan girisler ve Sekil 4a'daki devreden gelen çikislar, matris hesaplayiciya (1168) yapilan girislere ve matris hesaplayicidan (1168) gelen çikislara özdestir. Sekil 4c, Sekil 4a'daki birlestirici (1162) tarafindan uygulanan bir ters kombinasyon kuralinin bir örnegini göstermektedir. Özellikle, bu kombinasyon kurali iyi bilinen orta/yan kodlamadaki kod çözücü tarafi kombinasyon kuralina benzer olup, burada L = M + S ve R = M - S'dir. Sekil 4c'deki ters kombinasyon kurali tarafindan kullanilan S sinyalinin kombinasyon sinyali hesaplayici tarafindan hesaplanan sinyal, yani hat 1163'teki öngörü sinyali ile hat 114'teki kodu çözülmüs artik sinyalin bir kombinasyonu olduguna dikkat edilmelidir. Yine, bu tarifnamede, hatlar üzerindeki sinyallerin bazi durumlarda hatlar için kullanilan referans numaralari kullanilarak, bazi durumlarda da hatlara istinaden kullanilan referans numaralarinin kendisi kullanilarak isimlendirildigi belirtilmelidir. Dolayisiyla yazim, belli bir sinyale sahip olan bir hattin sinyalin kendisini belirttigi seklindedir. Bir hat, donanimla bütünlesik bir uygulamada fiziksel bir hat olabilir. Bilgisayar donanimli bir uygulamada ise fiziksel bir hat bulunmaz, bunun yerine hattin temsil ettigi sinyal bir hesaplama nwdülünden diger bir hesaplama modülüne iletilir. Sekil 2, iki veya daha fazla kanal sinyaline sahip olan bir çok kanalli ses sinyalinin (200) kodlanmasina yönelik bir ses kodlayiciyi göstermekte olup, burada birinci kanal sinyali 201'de, ikinci kanal ise 202'de gösterilmistir. Öngörü artik sinyali (205), birinci kombinasyon sinyalinden (204) türetilen bir öngörü sinyali ile birlestirildiginde ve öngörü bilgisi (206) bir birinci kombinasyon sinyali (204) ile sonuçlandiginda, birinci kombinasyon sinyali ile ikinci kombinasyon sinyali, bir kombinasyon kurali kullanilarak birinci kanal sinyalinden (201) ve ikinci kanal sinyalinden (202) türetilebilecek sekilde, her iki sinyal de birinci kanal sinyali (201) ile ikinci kanal sinyalini (202) ve öngörü bilgisini (206) kullanarak bir birinci kombinasyon sinyali (204) ile bir öngörü artik sinyalini (205) hesaplamaya yönelik bir kodlayici hesaplayiciya (203) Öngörü bilgisi, öngörü artik sinyali bir optimizasyon hedefini (208) yerine getirecek sekilde öngörü bilgisini (206) hesaplamaya yönelik bir iyilestirici (207) tarafindan üretilir. Birinci kombinasyon sinyali (204) ve artik sinyal (205), bir kodlanmis birinci kombinasyon sinyalini (210) elde etmek için birinci kombinasyon sinyalini kodlamaya ve bir kodlanmis artik sinyali (211) elde etmek için artik sinyali (205) kodlamaya yönelik bir sinyal kodlayiciya (209) girilir. Sekil 1'de gösterilen ses kodu çözücünün giris arayüzüne (102) girilen kodlanmis çok kanalli sinyale (100) benzer bir kodlanmis çok kanalli sinyal (213) elde etmek üzere, kodlanmis sinyallerin (210, 211) her ikisi de kodlanmis birinci kombinasyon sinyalini (201) kodlanmis öngörü artik sinyali (211) ve öngörü bilgisiyle (206) birlestirmeye yönelik bir çikis arayüzüne girilir. Uygulamaya bagli olarak, iyilestirici (207) ya birinci kanal sinyalini (201) ve ikinci kanal sinyalini (202) alir ya da hat 214 ve 215 ile gösterilen, Sekil 3a'daki birlestiriciden (2031) (daha sonra açiklanacaktir) türetilen birinci kombinasyon sinyalini (214) ve ikinci kombinasyon sinyalini (215) alir. Sekil 2'de tercih edilen bir optimizasyon hedefi gösterilmekte olup, burada kodlama kazanci maksimuma çikarilmistir, yani bit orani olabildigince azaltilmistir. Bu optimizasyon hedefinde D artik sinyali, a'ya göre Hanimuma indirilmistir. Baska bir deyisle, öngörü bilgisi a HS dMHZ minimuma indirilecek sekilde seçilmistir. Bu da Sekil 2'de gösterilen d için bir çözümle sonuçlanir. S, M sinyalleri bloksal olarak verilmistir ve tercihen spektral bölge sinyalleridir; burada H..." yazimi bagimsiz degiskenin 2-normudur ve <... her zamanki gibi iç çarpimi gösterir. Birinci kanal sinyali 201 ile ikinci kanal sinyali 202 iyilestiriciye (207) girildiginde, iyilestirici kombinasyon kuralini uygulayabilir (örnek bir kombinasyon kurali Sekil 3c'de gösterilmistir). Ancak birinci kombinasyon sinyali 214 ile ikinci kombinasyon sinyali 215 iyilestiriciye (207) girildiginde ise iyilestiricinin (207) kombinasyon kuralini kendiliginden uygulamasina gerek yoktur. Diger optimizasyon hedefleri algi kalitesi ile iliskili olabilir. Optimizasyon hedefi, maksimum algi kalitesinin elde edilmesi olabilir. Bu durumda, iyilestirici bir algisal modelden ilave bilgi edinilmesini gerektirebilir. Optimizasyon hedefinin diger uygulamalari minimum veya sabit bir bit oraninin elde edilmesi ile ilgili olabilir. Ardindan a, minimum bit orani veya alternatif olarak sabit bit orani gibi gereklilikleri yerine getirmek üzere ayarlanacak sekilde belli a degerleri için gereken bit oranini belirlemek için, nicemleme/entropi-kodlama islemini gerçeklestirmek adina iyilestirici (207) uygulanabilir. Optimizasyon hedefinin diger` uygulamalari kodlayici veya kod çözücü kaynaklarinin minimum düzeyde kullanimi ile ilgili olabilir. Böyle bir optimizasyon hedefinin uygulanmasi halinde, belli bir optimizasyon için gereken kaynaklara iliskin bilgi iyilestiricide (207) mevcut olabilir. Buna ek olarak, öngörü bilgisini (206) hesaplayan iyilestiriciyi (207) kontrol etmek adina bu optimizasyon hedeflerinin veya diger optimizasyon hedeflerinin bir kombinasyonu uygulanabilir. Sekil 2'deki kodlayici hesaplayici çesitli sekillerde uygulanabilmekle birlikte, birlestiricide (2031) açik bir kombinasyon kuralinin gerçeklestirildigi bir birinci uygulama örnegi Sekil 3a'da gösterilmistir. Sekil 3b'de bir matris hesaplayicinin (2039) kullanildigi bir alternatif örnek uygulama gösterilmistir. Sekil 3a'daki birlestirici (2031) Sekil 3c'de gösterilen, tüm dallara 0,5 agirlik faktörünün uygulandigi iyi bilinen bir orta/yan kodlama kurali örnegi olan kombinasyon kuralini gerçeklestirmek için uygulanabilir. Ancak, uygulamaya bagli olarak diger agirlik faktörleri uygulanabilecegi gibi hiçbir agirlik faktörünün uygulanmamasi da mümkündür. Ayrica, kodlayici tarafindan uygulanan kombinasyon kuralina ters olan bir kombinasyon kuralini uygulayan Sekil 4a'da gösterilen kod. çözücü birlestiricide (1162) uygulanabilen karsilik gelen bir ters kombinasyon kurali bulundugu sürece, diger dogrusal kombinasyon kurallari veya dogrusal olmayan kombinasyon kurallari gibi baska kombinasyon kurallarinin da uygulanabilecegi göz önünde bulundurulmalidir. Dalga biçimi üzerindeki etki öngörü ile kombinasyon halinde iyilestirici (207) tarafindan gerçeklestirilen öngörü isleminin bir dalga biçimi-koruma süreci olmasindan ötürü mevcut herhangi bir hata iletilmis artik sinyalde kaldigi için herhangi bir terslenebilir öngörü kullanilabilir. Birlestirici (2031) birinci kombinasyon sinyali (204) ile bir ikinci kombinasyon sinyalini (2032) çikarir. Birinci kombinasyon sinyali bir öngörücüye (2033) girilirken ikinci kombinasyon sinyali (2032) artik hesaplayiciya (2034) girilir. Öngörücü (2033) bir öngörü sinyalini (2035) hesaplar, bu da son asamada bir artik sinyal (205) elde etmek üzere ikinci kombinasyon sinyali (2032) ile birlestirilir. Birlestirici (2031) özellikle, birinci kombinasyon sinyali (204) ve ikinci kombinasyon sinyalini (2032) elde etmek için farkli yollarla çok kanalli ses sinyaline ait iki kanal sinyalini (201 ve 202) birlestirmek üzere yapilandirilmis olup, söz konusu iki farkli yol Sekil 3C'de bir örnekte gösterilmistir. Öngörücü (2033), öngörü sinyalini (2035) elde etmek için öngörü bilgisini birinci kombinasyon sinyaline (204) veya birinci kombinasyon sinyalinden türetilen bir sinyale uygulamak üzere yapilandirilmistir. Kombinasyon sinyalinden türetilen sinyal, herhangi bir dogrusal olan veya olmayan islem ile türetilebilir; burada gerçekten-sanala dönüsüm/sanaldan-gerçege dönüsüm tercih edilir, ki bu belli degerlerin agirliklandirilmis toplama (/ekleme) islemlerini yapan bir FIR (Finite Impulse Response; Sonlu dürtü yaniti) süzgeci gibi dogrusal bir süzgeç kullanilarak uygulanabilir. Sekil 3a'daki artik hesaplayici (2034), öngörü sinyali, ikinci kombinasyon sinyalinden çikarilacak sekilde bir çikarma islemi de uygulayabilir. Bununla birlikte, artik hesaplayicida baska islemlerin gerçeklestirilmesi de mümkündür. Buna paralel olarak, Sekil 4a'daki kombinasyon sinyali hesaplayici (1161), ikinci kombinasyon sinyalini (1165) elde etmek üzere kodu çözülmüs artik sinyal (114) ile öngörü sinyalinin (1163) toplandigi bir toplama islemini gerçeklestirebilir. Sekil 5a, bir ses kodlayicinin bir uygulamasini göstermektedir. Sekil 3a'da gösterilen ses kodlayici ile kiyaslandiginda, birinci kanal sinyali (201), bir zaman bölgesi birinci kanal sinyalinin (55a) bir spektral gösterimidir. Buna uygun olarak, ikinci kanal sinyali (202) bir zaman bölgesi kanal sinyalinin (55b) bir spektral gösterimidir. Zaman bölgesinden spektral gösterime dönüsüm, birinci kanal sinyali için bir zaman/frekans dönüstürücü (50) ile; ikinci kanal sinyali için ise bir baska zaman/frekans sinyali (51) ile gerçeklestirilir. Spektral dönüstürücüler (50, 51) tercihen gerçek degerli dönüstürücüler olarak uygulanir, ama bu zorunlu degildir. Dönüsüm algoritmasi; bir kesintili kosinüs dönüsümü, sadece küi: tek gerçek parçanin kullanildigi bir FFT (Fast Fourier Transform; Hizli Fourier dönüsümü) dönüsümü, bir MDCT dönüsümü veya gerçek. degerli spektral degerleri saglayan herhangi bir diger dönüsüm olabilir. Alternatif olarak, her iki dönüsüm de sadece tek bir sanal parçanin kullanildigi ve gerçek parçanin atildigi DST (Discrete Sine Transform; Kesintili sinüs dönüsümü), MDST, FFT ve benzeri bir sanal dönüsüm olarak uygulanabilir. Sadece sanal degerleri saglayan herhangi bir diger dönüsüm de uygulanabilir. Salt gerçek degerli dönüsümün ya da salt sanal dönüsümün kullanilmasinin bir amaci sayisal karmasikliktir, çünkü her bir spektral deger için örnegin büyüklük gibi tek bir degerin veya gerçek parçanin islenmesi ya da alternatif olarak faz veya sanal parçanin islenmesi gerekir. FFT gibi tamamen karmasik dönüsümün aksine, iki degerin, yani her bir spektral hat için bir gerçek parça ve bir sanal parçanin, en az 2 faktörlük bir sayisal karmasiklik artisi ile islenmesi gerekebilir. Burada gerçek degerli bir dönüsümü kullanmanin diger bir nedeni de bu tür bir dönüsümün kritik olarak örneklenmis olmasi, dolayisiyla da sinyal nicemleme ve entropi kodlama ("MP3", AAC veya benzer ses kodlama sistemlerinde uygulanan standart "algisal ses kodlama" paradigmasi) için uygun (ve ortak olarak kullanilan) bir bölge saglamasidir. Sekil 5a ayrica "arti" girisinde yan sinyali alan, "eksi" girisinde ise öngörücü (2033) tarafindan öngörü sinyali çikisini alan bir toplayici olarak kullanilan bir artik hesaplayiciyi (2034) göstermektedir. Buna ilaveten, Sekil 5a öngörücü kontrol bilgisinin iyilestiriciden kodlanmis çok kanalli ses sinyalini gösteren bir çogullamali bit akisini çikaran çogullayiciya (212) yönlendirildigi durumu göstermektedir. Özellikle, öngörü islemi, Sekil 5a'nin sagindaki Denklemlerle gösterildigi gibi yan sinyal, orta sinyalden öngörülecek sekilde gerçeklestirilir. Tercihen, öngörücü kontrol bilgisi (206) Sekil 3b'nin saginda gösterildigi gibi bir faktördür. Öngörü kontrol bilgisinin karmasik degerli a'nin bir büyüklügü veya karmasik degerli a'nin gerçek parçasi gibi gerçek bir kismi içerdigi ve bu kismin sifirdan farkli bir faktöre karsilik geldigi bir örnekte, orta sinyal ve yan sinyalin dalga biçimi yapilarindan ötürü birbirlerine benzer olup farkli genliklere sahip oldugunda ciddi bir kodlama kazanci elde edilebilir. Buna karsin, öngörü kontrol bilgisinin sadece karmasik degerli bir faktörün sanal parçasi veya karmasik degerli bir faktörün faz bilgisi olabilen bir ikinci kismi içerdigi ve sanal parçanin ya da faz bilgisinin sifirdan farkli oldugu durumda, mevcut bulus, 0° veya 180°'den farkli bir degerle birbirlerine faz kaydirilmis ve faz kaymasinin yani sira benzer dalga biçimi özellikleri ve benzer genlik iliskileri bulunan sinyaller için ciddi bir kodlama kazanci elde eder. Bir öngörü kontrol bilgisi tercihen karmasik degerlidir. Bu sayede genlik bakimindan farkli olan ve faz kaymasina tabi tutulmus sinyaller için ciddi bir kodlama kazanci elde edilebilir. Zaman/frekans dönüsümlerinin karmasik spektrumlar sagladigi bir durumda, islem (2034) öngörücü kontrol bilgisinin gerçek parçasinin karmasik M spektrumunun gerçek parçasina uygulandigi, karmasik öngörü bilgisinin sanal parçasinin karmasik spektrumun sanal parçasina uygulandigi karmasik bir islem olacaktir. Ardindan ekleyicide (2034) bu öngörü isleminin sonucu öngörülmüs gerçek bir spektrum ve öngörülmüs sanal bir spektrum. olur; karmasik bir artik D spektrumu elde etmek üzere öngörülmüs gerçek spektrum, yan S sinyalinin gerçek spektrumundan çikarilir (bantsal olarak) ve öngörülmüs sanal spektruni S spektrumumun sanal parçasindan çikarilir. Zaman bölgesi sinyalleri (L ve R) gerçek degerli sinyallerdir, fakat frekans bölgesi sinyalleri gerçek degerli ya da karmasik degerli olabilir. Frekans bölgesi sinyalleri gerçek. degerli ise dönüsüm de gerçek degerli bir dönüsüm olur. Frekans bölgesi sinyalleri karmasik ise dönüsüm de karmasik degerli bir dönüsüm olur. Bu, zamandan-frekansa girisin ve frekanstan-zamana dönüsümlerin çikisinin gerçek degerli oldugunu göstermekle birlikte, frekans bölgesi sinyalleri örnegin karmasik. degerli QME' bölgesi sinyalleri olabilir. Sekil 5b, Sekil 5a'da gösterilen ses kodlayiciya karsilik gelen bir ses kodu çözücüyü göstermektedir. Sekil l'deki ses kodu çözücüye istinaden benzer ögeler benzer referans numaralarina sahiptir. Sekil 5a'daki bit akisi çogullayici (212) tarafindan yapilan bit akisi çikisi, Sekil 5b'deki bir bit akisi çogullama çözücüye (102) girilir. Bit akisi çogullama çözücü (102) bit akisini M downmix sinyali ve D artik sinyaline çogullar. M downmix sinyali niçemleme gidericiye (llOa) girilir. D artik sinyali ise bir baska niçemleme gidericiye (llOb) girilir. Buna ek olarak, bit akisi çogullama çözücü (102) bit akisindan öngörücü kontrol bilgisini (108) çogullar ve bunu öngörücüye (1160) girer. Öngörücü (1160) bir öngörülmüs yan sinyali (d ' M) çikarir ve birlestirici (1161), son asamada yeniden olusturulmus yan S sinyalini elde etmek üzere niçemleme giderici (llOb) vasitasiyla öngörülmüs yan sinyal ile artik sinyal çikisini birlestirir. Ardindan sinyal, orta/yan kodlamaya istinaden Sekil 4c'de gösterildigi gibi örnegin bir toplam/fark islemeyi gerçeklestiren birlestiriciye (1162) girilir. Blok (1162) özellikle, sol kanalin bir frekans bölgesi gösterimini ve sag kanalin bir frekans bölgesi gösterimini elde etmek için bir (ters) orta/yan kod çözmeyi gerçeklestirir. Sonrasinda frekans bölgesi gösterimi karsilik gelen frekans/zaman dönüstürücüler (52 ve 53) vasitasiyla bir zaman bölgesi gösterimine dönüstürülür. Sistem uygulamasina bagli olarak, frekans bölgesi gösterimi gerçek degerli bir gösterim ise frekans/zaman dönüstürücüler (52, 53) gerçek degerli frekans/zaman dönüstürücülerdir veyahut frekans bölgesi gösterimi karmasik degerli bir gösterim ise karmasik degerli frekans/zaman dönüstürücülerdir. Ancak verimliligin arttirilmasi için, mevcut bulusun bir düzenlemesi ile uyumlu olarak Sekil 6a'da kodlayici, mevcut bulusun bir düzenlemesi ile uyumlu olarak Sekil 6b'de kod çözücü için gösterilen diger bir uygulamada oldugu gibi gerçek degerli bir dönüsümün gerçeklestirilmesi tercih edilir. Gerçek degerli dönüsümler (50 ve 51) bir MDCT ile uygulanir. Ayrica, öngörü bilgisi bir gerçek parça ve bir sanal parçaya sahip olan bir karmasik deger olarak hesaplanir. M, 8 spektrumlarinin her ikisi de gerçek degerli spektrumlar oldugundan ve bu sebeple spektrumun sanal parçasi bulunmadigindan, M sinyalinin gerçek degerli spektrumundan kestirilen bir sanal spektrumu hesaplayan bir gerçekten- sanala dönüstürücü (2070) mevcuttur. Bu gerçekten-sanala dönüstürücü (2070) iyilestiricinin (207) bir parçasidir ve blok (2070) tarafindan kestirilen sanal spektrum (600), artik 2073'te belirtilen gerçek degerli bir faktöre ve 2074'te belirtilen sanal bir faktöre sahip olan öngörü bilgisini (206) hesaplamak için gerçek M spektrumu ile birlikte iyilestirici asamasina (2071) girilir. Bu asamada, söz konusu düzenlemeye uygun olarak, sonradan gerçek degerli yan spektrumdan çikarilacak olan öngörü sinyalini elde etmek üzere birinci M kombinasyon sinyalinin gerçek degerli spektrumu gerçek parça (dR, 2073) ile çarpilir. Ayrica, ilave öngörü sinyalini elde etmek için sanal spektrum (600) 2074'te gösterilen sanal parça (di) ile çarpilir; sonrasinda bu öngörü sinyali 2034b'de belirtilen gerçek degerli yan spektrumdan çikarilir. Daha sonra, D öngörü artik sinyali nicemleyicide (209b), gerçek degerli M spektrumu ise nicemlenmis/kodlanmis blokta (209a) nicemlenir. Ayrica, örnegin Sekil Sa'daki bit akisi çogullayiciya (212) yönlendirilen ve son asamada öngörü bilgisi olarak bit akisina girilen kodlanmis karmasik a degerini elde etmek için öngörü bilgisi a'nin nicemleyici/entropi kodlayicida (2072) nicemlenmesi ve kodlanmasi tercih edilir. a için nicemleme/kodlama (Q/C) modülünün konumuyla ilgili olarak çarpicilarin (2073 ve 2074) tercihen kod çözücüde kullanilacak olanla ayni (nicemlenmis) a'yi kullandigi belirtilmelidir. Dolayisiyla, dogrudan 2071 çikisina hareket edilebilecegi gibi, a'nin nicemlemesinin halihazirda 2071'deki optimizasyon sürecinde göz önünde bulunduruldugu da düsünülebilir. Kodlayici tarafinda karmasik bir spektrumun hesaplanabilmesine karsin, tüm bilgi mevcut oldugundan, kod çözücü bakimindan Sekil 6b'de gösterilene benzer kosullarin üretilmesi için kodlayicida blok 2070'te gerçekten-karmasiga dönüsümün gerçeklestirilmesi tercih edilir. Kod çözücü, birinci kombinasyon sinyaline ait bir gerçek degerli kodlanmis spektrumu ve kodlanmis artik sinyale ait bir gerçek degerli spektral gösterimini alir. Buna ek olarak, 108'de kodlanmis bir karmasik öngörü bilgisi elde edilir; 1160b'de gösterilen gerçek parçayi dR ve 1160c'de gösterilen sanal parçayi di elde etmek için bir entropi-kod çözme ve nicemleme giderme gerçeklestirilir. Agirliklandirma ögeleri (ll60b ve 1160c) tarafindan çikarilan orta sinyaller kodu çözülmüs ve nicemlemesi giderilmis Öngörü artik sinyaline eklenir. Özel olarak belirtmek gerekirse, agirliklandiriciya (1160c) girilen, agirlikr faktörü olarakr karmasik öngörü faktörünün sanal parçasinin kullanildigi spektral degerler, gerçekten- sanala dönüstürücü (ll60a) vasitasiyla gerçek degerli M spektrumundan türetilir, ki bu tercihen Sekil 6a'daki kodlayici tarafiyla ilgili blok 2070'te oldugu gibi uygulanir. Kod çözücü tarafinda, kodlayici tarafinin aksine orta sinyale ve yan sinyale ait karmasik degerli bir gösterim mevcut degildir. Bunun nedeni, bit oranlarindan ve karmasiklik nedenlerinden ötürü kodlayicidan kod çözücüye sadece kodlanmis gerçek degerli spektrumlarin iletilmesidir. Sekil 6a'daki gerçekten-sanala dönüstürücü (1160a) veya patentinde yayinlandigi gibi uygulanabilir. Alternatif olarak, ilgili teknik alandan bilinen herhangi bir diger uygulama da uygulanabilir; bu anlamda tercih edilen bir uygulama Sekil 10a, 10b'ye istinaden açiklanmistir. Yine özel olarak, Sekil 10a'da gösterildigi gibi, gerçekten- sanala dönüstürücü (1160a) bir sanal spektrum hesaplayiciya (1001) baglanan bir spektral çerçeve seçiciyi (1000) içerir. Spektral çerçeve seçici (1000), giris 1002'de geçerli çerçeve i'nin bir göstergesini, uygulamaya bagli olarak da bir kontrol girisi 1003'te kontrol bilgisini alir. Örnegin hat 1002'deki göstergenin geçerli çerçeve i için sanal bir spektrumun hesaplanacagini belirtmesi ve kontrol bilgisinin (1003) söz konusu. hesaplama. için sadece geçerli çerçevenin kullanilacagini belirtmesi halinde, spektral çerçeve seçici (lOOO) sadece geçerli çerçeve i'yi seçer ve bu bilgiyi sanal spektrum hesaplayiciya gönderir. Ardindan sanal spektrum hesaplayici, frekans bakimindan Sekil 10b'de 1004'te gösterildigi gibi sanal bir hattin hesaplanacagi geçerli spektral hat k'ya yakin veya bunun çevresinde olan, geçerli çerçevede (blok 1008) konumlandirilan hatlarin agirliklandirilmis bir kombinasyonunu gerçeklestirmek için sadece geçerli çerçeve i'nin spektral hatlarini kullanir. Ancak spektral çerçeve seçici (1000), sanal spektrumun hesaplanmasi için önceki çerçeve (i-1) ve sonraki çerçevenin (i+1) de kullanilacagini belirten bir kontrol bilgisini aldiginda, sanal spektrum hesaplayici ilaveten çerçeveler i-l ve i+l'den gelen degerleri de alir ve çerçeve i-l için 1005'te, çerçeve i+1 için 1006'da gösterildigi gibi karsilik gelen çerçevelerde agirliklandirilmis bir kombinasyon gerçeklestirir. Agirliklandirma islemlerinin sonuçlari, son asamada çerçeve fi için bir sanal k hatti elde etmek üzere blok 1007'de agirliklandirilmis bir kombinasyon ile birlestirilir; sonrasinda bu, söz konusu hat için öngörü sinyalini elde etmek üzere öge 1160c'de öngörü bilgisinin sanal parçasi ile çarpilir; bu da ardindan kod çözücü için olan toplayicida 1161b orta sinyalin karsilik gelen hattina eklenir. Kodlayicida ayni islem gerçeklestirilir, ancak öge 2034b'de bir çikarma islemi yapilir. Kontrol bilgisinin (1003) ayrica çevreleyen› iki çerçeveden daha fazla çerçeveyi kullanmayi veya örnegin sistematik gecikmeyi azaltmak adina "ilerideki" çerçeveleri kullanmadan, sadece geçerli çerçeveyi ve önceki çerçevelerden tam olarak bir veya daha fazlasini kullanmayi belirtebilecegi göz önünde bulundurulmalidir. Yine, diger sirada, bir birinci islemde bir çerçeveden gelen hatlarin birlestirildigi ve sonrasinda bu çerçevesel kombinasyon islemlerinin sonuçlarinin kendiliginden birlestirildigi Sekil 10b'deki gösterildigi gibi asamali agirliklandirilmis kombinasyonun da gerçeklestirilebilecegi belirtilmelidir. Burada diger sira ile kastedilen, bir birinci adimda kontrol bilgisi (103) ile belirtilen birtakim bitisik çerçeveden gelen geçerli k frekansi hatlarinin agirliklandirilmis bir kombinasyon ile birlestirilmesidir. Sanal hatti tahmin etmek için kullanilacak olan bitisik hat sayisina bagli olarak bu agirliklandirilmis kombinasyon k, k- 1, k-2, k+1, k+2 Vb. için uygulanir. Sonrasinda, bu asamada fi çerçevesi için sanal k hattini elde etmek üzere tutulur. Agirliklar tercihen› -1 ve 1 arasindaki degerlere ayarlanmistir ve spektral hatlarin veya farkli frekanslardan ve farkli çerçevelerden gelen spektral sinyallerin dogrusal kombinasyonunu gerçeklestiren bir dogrudan FIR veya IIR (Infinite Impulse Response; Sonsuz dürtü yaniti) süzgeci kombinasyonda uygulanabilir. Sekil 6a ve 6b'de belirtildigi gibi, tercih edilen dönüsüm algoritmasi, Sekil 6a'daki öge 0054 ve 51'de ileri yönde uygulanan; öge 52, 53'te ise spektral bölgede isleyen birlestiricideki (1162) kombinasyon isleminin ardindan geri yönde uygulanan MDCT dönüsümü algoritmasidir. Sekil 8a, blok 50 veya 51'in daha detayli bir uygulamasini göstermektedir. Özellikle, zaman bölgesi ses örneklerinin bir dizisi, bir analiz penceresini kullanarak bir pencereleme islemini gerçeklestiren ve bu islemi özellikle bir çerçeve içerisinde çerçevesel olarak, fakat %50'lik bir asma veya örtüsme kullanarak gerçeklestiren bir analiz pencereleyiciye (500) girilir. Analiz pencereleyici sonuçlari, yani pencerelenmis örneklerin çerçevelerine ait diziler, gerçek degerli MDCT çerçevelerine ait dizileri çikaran bir MDCT dönüsüm bloguna (501) girilir ve burada söz konusu çerçevelere örtüsme etkisine maruz kalir. Örnek olarak, analiz pencereleyici 2048 örnek uzunlugundaki analiz pencerelerini uygular. Sonra, MDCT dönüsüm blogu (501), 1024 gerçek spektral hatti veya MDCT degeri olan MDCT spektrumlarini çikarir. Tercihen, analiz pencereleyici (500) ve/veya MDCT dönüstürücü (501) bir pencere uzunlugu veya dönüsüm uzunlugu kontrolü (502) vasitasiyla kontrol edilebilir ki bu sayede daha iyi kodlama sonuçlari elde edebilmek için örnegin sinyaldeki geçis kisimlari için pencere uzunlugu/dönüsüm uzunlugu azaltilir. Sekil 8, blok 0056 ve 53'te gerçeklestirilen ters MDCT islemini göstermektedir. Örnegin, blok 52, çerçeve çerçeve (frame-by-frame) ters MDCT dönüsümü gerçeklestirmeye yönelik blok 250'yi içerir. Örnegin MDCT degerlerinin bir çerçevesinin 1024 degere sahip olmasi halinde, bu MDCT ters dönüsümünün çikisinda 2048 örtüsmeye maruz kalmis zaman örnegi bulunur. Bu tür bir çerçeve, 2048 örneklik bu çerçeveye bir sentez penceresi uygulayan bir sentez pencereleyiciye (521) gönderilir. Sonrasinda pencerelenmis çerçeve bir örtüsme/toplama islemciye (522) yönlendirilir, bu da örnegin takip eden iki çerçeve arasinda %50'lik bir örtüsme uygular, sonra da 2048 örneklik blok son durumda 1024 yeni örtüsmesiz çikis sinyali örnegi ile sonuçlanacak sekilde örnek örnek (sample by sample) toplama gerçeklestirir. Yine, 523'te belirtildigi gibi, örnegin kodlanmis çok kanalli sinyalin yan bilgisinde iletilen bir bilgiyi kullanarak pencere/dönüsüm uzunlugu kontrolü uygulamak tercih sebebidir. Öngörü degerleri bir MDCT spektrumundaki her bir bireysel spektral hat için hesaplanabilir. Ancak, bunun gerekli olmadigi ve öngörü bilgisinin bantsal olarak hesaplanmasiyla önemli bir miktarda yan bilginin kurtarilabilecegi bulunmustur. Farkli bir ifadeyle, örnegin Sekil 8a baglaminda açiklandigi gibi bir MDCT islemcisi olan bir spektral dönüstürücü (50), Sekil 9b'de gösterilen belli spektral hatlara sahip olan yüksek frekans çözünürlüklü bir spektrum saglar. Bu yüksek frekans çözünürlüklü spektrum, Bl, B2, B3, çözünürlüklü bir spektrumu saglayan bir spektral hat seçici (90) tarafindan kullanilir. Bu düsük frekans çözünürlüklü spektrum, öngörü bilgisi her spektral hat için degil, sadece her bir bant için hesaplanacak sekilde öngörü bilgisini hesaplamak üzere iyilestiriciye (207) yönlendirilir. Bu amaçla, iyilestirici (207) bant basina spektral hatlari alir Ve banttaki her spektral hat için ayni d degerinin kullanildigi varsayimina dayanarak optimizasyon islemini hesaplar. Tercihen, Sekil 9b'de gösterildigi gibi düsük frekanslardan yüksek frekanslara gidildikçe bantlarin bant genisliginin artmasi için bantlar psikoakustik olarak sekillendirilir. Alternatif olarak, bant genisligi artirma uygulamasi kadar tercih edilmese de, her bir frekans bandinin en az iki veya tipik olarak çok daha fazla, örnegin en az 30 frekans hattina sahip oldugu esit boyutlu frekans bantlarinin kullanimi da mümkündür. Genel olarak, 1024 spektral hatli bir spektrum için, 30'dan az karmasik a degeri, tercihen 5'ten fazla a degeri hesaplanir. 1024'ten az spektral hatli spektrumlar için (örnegin l28 hat), a için tercihen daha az frekans bandi (örnegin 6) kullanilir. a degerlerini hesaplamak için MDCT spektrumu zorunlu degildir. Alternatif olarak, a degerlerini hesaplamak için gereken çözünürlüge benzer bir frekans çözünürlügü olan bir süzgeç öbegi de kullanilabilir. Frekansi artan bantlar uygulanacagi zaman bu süzgeç öbeginin degiskenlik gösteren bant genisligi olmalidir. Ancak, düsükten yüksege frekanslardaki sabit bir bant genisliginin yeterli oldugu durumda, esit genislikli alt-bantlari olan geleneksel bir süzgeç öbegi kullanilabilir. Uygulamaya bagli olarak, Sekil 3b veya 4b'de belirtilen a degerinin imzasi tersine çevrilebilir. Ancak, tutarlilik açisindan bu tersine çevirmenin hem kodlayici tarafinda hem de kod çözücü tarafinda kullanilmasi gereklidir. Sekil 5a, Sekil 6a'ya kiyasla, kodlayicinin genel bir görünümünü göstermekte olup; burada madde 2033, madde 207'de belirlenen ve yan bilgi olarak bit akisina katilan öngörücü kontrol bilgisi (206) vasitasiyla kontrol edilen bir öngörücüdür. Sekil 5a'da, Sekil 6'da blok 50,51'de kullanilan MDCT'nin yerine genellenmis bir zaman/frekans dönüsümü kullanilmistir. Daha önce belirtildigi gibi, Sekil 6a, Sekil 6b'deki kod çözücü sürecine karsilik gelen bir kodlayici süreci olup burada L, sol kanal sinyalini; R, sag kanal sinyalini; M, orta sinyali veya downmix sinyalini; S, yan sinyali; D ise artik sinyali temsil etmektedir. Alternatif olarak L, birinci kanal sinyali (201) olarak; R, ikinci kanal sinyali (202) olarak; M, birinci kombinasyon sinyali (204) olarak; 8 ise ikinci kombinasyon sinyali (2032) olarak da adlandirilabilir. Tercihen, kodlayicidaki 2070, kod çözücüdeki 1160a modülleri, dogru dalga biçimi kodlamayi garantilemek için birbiriyle tam olarak eslesmelidir. Bu, tercihen bu modüllerin kesilmis süzgeçler gibi bir çesit yaklasiklamayi veya üç MDCT çerçevesi yerine sadece bir veya iki MDCT çerçevesinden olustugu durumda (yani hat 60'daki geçerli MDCT çerçevesi) hat 6l'deki önceki MDCT çerçevesi ve hat 62'deki sonraki MDCT çerçevesini kullandigi durum için de geçerlidir. Buna ek olarak, kod çözücüdeki gerçekten-sanala (RZI) modülü llöOa'nin giris olarak sadece nicemlenmis MDCT spektrumuna sahip olmasina karsin, Sekil 6a'daki kodlayicidaki modül 2070'in giris olarak nicemlenmemis M MDCT spektrumunu kullanmasi tercih edilir. Alternatif olarak, kodlayicinin modül 2070'e bir giris olarak nicemlenmis MDCT katsayilarini kullandigi bir uygulamanin kullanilmasi da mümkündür. Ancak algisal açidan bakildiginda, modül 2070'e giris olarak nicemlenmemis MDCT spektrumunun kullanimi tercih edilen bir yaklasimdir. Mevcut bulusun düzenlemelerinin bazi yönleri daha sonra daha detayli bir sekilde açiklanacaktir. Standart parametrik stereo kodlama, yüksek hizda örneklenmis karmasik (karma) QMF bölgesinin, örtüsme yapayliklarina neden olmadan zaman ve frekans bakimindan degiskenlik gösteren algisal olarak yönlendirilmis sinyal islemeye olanak saglama özelligine baglidir. Ancak downmix/artik kodlama (burada dikkate alinan yüksek bit oranlarinda kullanildigi gibi) durumunda, elde edilen birlestirilmis stereo kodlayici bir dalga biçimi kodlayici olarak islev görür. Bu da MDCT bölgesi gibi kritik olarak örneklenmis bir bölgede islem yapilmasina olanak saglar, çünkü dalga biçimi kodlama paradigmasi, MDCT- modifiye edilmis kesintili kosinüs dönüsümü) isleme zincirinin örtüsme silme özelliginin yeterli ölçüde iyi bir sekilde korunmasini saglar. Bununla birlikte, karmasik degerli bir` d öngörü katsayisi vasitasiyla kanallararasi zaman veya faz farkliliklari olan stereo sinyallerle elde edilebilen kodlama verimliliginden faydalanabilmek için karmasik degerli upmix matrisine giris olarak downmix sinyalinin (DMX) karmasik degerli bir frekans bölgesi gösterimi gereklidir. Bu, DMX sinyali için MDCT dönüsümüne ek olarak bir MDST dönüsümünün de kullanilmasi suretiyle olanakli hale getirilebilir. MDST spektrumu, MDCT spektrumundan (tam olarak veya yaklasik olarak) hesaplanabilir. Ayrica, upmix matrisinin parametrelendirilmesi, MPS (MPEG Surround) parametreleri yerine d karmasik öngörü katsayisinin iletilmesi suretiyle basitlestirilebilir. Dolayisiyla üç parametre (ICC (Inter-Channel Coherence; Kanallararasi uyum), CLD (Channel Level Difference; Kanal seviye farki) ve IPD (Inter-Channel Phase Difference; Kanallararasi faz farki)) yerine sadece iki parametre (d'nin gerçek ve sanal parçasi) iletilir. Bu, downmix/artik kodlama durumunda MPS parametrelendirmesindeki artikliktan ötürü mümkündür. MPS parametrelendirmesi kod çözücüye eklenecek olan göreli ilintisizlestirme miktarina iliskin bilgiyi (yani RES (Residual: Artik) ve DMX (Downmix) sinyalleri arasindaki enerji orani) içerir ve bu bilgi fiili DMX ve RES sinyalleri iletildiginde gerekenden fazladir. Ayni nedenden dolayi, yukaridaki upmix matrisinde gösterilen kazanç katsayisi (g), downmiX/artik kodlama durumunda artik kullanilmamaktadir. Dolayisiyla karmasik öngörülü downmix/artik kodlama için upmix matrisi artik asagidaki rL _ 1~a 1 [DMX Sekil 4b'deki Denklem ll69'a kiyasla, bu denklemde alfa isareti ters çevrilmistir; DMX=M ve RES=DT seklindedir. Bu sebeple de bu uygulama, Sekil 4b'ye istinaden alternatif bir uygulama/yazimdir. Kodlayicidaki öngörü artik sinyalini hesaplamak için iki seçenek mevcuttir. Bunlardan biri, downmixe ait nicemlenmis MDCT spektral degerlerini kullanmaktir. Burada kodlayici ve kod çözücü öngörü üretmek için ayni degerleri kullandigindan bu seçenek M/S kodlamadakiyle ayni nicemleme hatasi dagilimi ile sonuçlanir. Seçeneklerden digeri ise nicemlenmemis MDCT spektral degerlerini kullanmaktir. Bu, kodlayici ve kod çözücünün öngörüyü üretmek için ayni veriyi kullanmayacagi anlamina gelmektedir, ki bu kismen azalan bir kodlama kazanci pahasina, sinyalin anlik maskeleme özelliklerine göre kodlama hatasinin uzamsal olarak yeniden dagilmasina olanak saglar. MDST spektrumunun, açiklanan üç bitisik MDCT çerçevesinin iki boyutlu FIR süzgeci vasitasiyla frekans bölgesinde dogrudan hesaplanmasi tercih edilir. Sonraki durum bir "gerçekten- sanala" (R2I) dönüsüm olarak düsünülebilir. MDST'ye ait frekans bölgesi hesaplamadaki karmasiklik çesitli sekillerde azaltilabilir, yani sadece MDST spektrumunun bir yaklasigi hesaplanabilir: - FIR süzgeci tap sayisinin sinirlandirilmasi. - Sadece geçerli MDCT çerçevesinden MDST'nin tahmin edilmesi. edilmesi. Kodlayici ve kod çözücüde ayni yaklasiklama kullanildigi müddetçe dalga biçimi kodlama özellikleri etkilenmez. Ancak, MDST spektrumundaki bu yaklasiklamalar karmasik öngörüyle elde edilen kodlama kazancinda azalmaya neden olabilir. Alttaki MDCT kodlayicinin pencere biçimli geçisi desteklemesi halinde, MDST spektrumunu hesaplamak için kullanilan iki boyutlu FIR süzgecinin katsayilari fiili pencere sekillerine uyarlanmak zorundadir. Geçerli çerçevenin MDCT spektrumuna uygulanan süzgeç katsayilari tam pencereye baglidir, yani her bir pencere türü ve her` bir` pencere geçisi için bir grup katsayi gereklidir. Önceki/sonraki çerçevenin MDCT spektrumuna uygulanan süzgeç katsayilari sadece geçerli çerçevenin yarisiyla örtüsen pencereye baglidir, yani bunlarda sadece her bir pencere türü için bir grup katsayi gereklidir (geçisler için ilave katsayi yok). Alttaki MDCT kodlayicinin dönüsüm uzunlugu geçisini kullanmasi halinde, yaklasiklamadaki önceki ve/veya sonraki MDCT çerçevesi dahil olmak üzere, farkli dönüsüm uzunluklari arasindaki geçislerde daha karmasik bir durum olusur. Geçerli ve önceki/sonraki çerçevedeki farkli sayidaki MDCT katsayilarindan dolayi bu durumda iki boyutlu süzme daha karisiktir. Artan sayisal ve yapisal karmasikligi gidermek için dönüsüm uzunlugu geçislerinde önceki/sonraki çerçeve, özel çerçeveler için yaklasiklama dogrulugunun azalmasi pahasina da olsa, süzme islemine dahil edilmeyebilir. Ayrica, FIR süzme için gerekenden daha az çevreleyen MDCT katsayisinin bulundugu MDST spektrumunun en düsük ve en yüksek parçalarina (DC ve fs/2'ye yakin) özellikle dikkat edilmelidir. Burada, süzme süreci MDST spektrumunu dogru bir sekilde hesaplamak üzere uyarlanmalidir. Bu, atlanmis katsayilar için MDCT spektrumunun simetrik olarak uzatilmasi/genisletilmesi (zaman kesintili sinyallerin spektrumlarinin periyodikligine göre) ya da süzgeç katsayilarinin uygun bir sekilde uyarlanmasi suretiyle yapilabilir. Bu özel durumlar, MDST spektrumunun sinirlarina yakin yerlerde dogrulugun azaltilmasi pahasina daha basitlestirilmis bir sekilde islenebilir. Kod çözücüdeki iletilmis MDCT spektrumlarindan tam MDST spektrumunun hesaplanmasi kod çözücü gecikmesini bir çerçeve kadar azaltir (burada 1024 örnek oldugu varsayilmaktadir). Giris olarak sonraki çerçevenin MDCT spektrumunu gerektirmeyen MDST spektrumunun bir yaklasiklamasi kullanilarak ilave gecikme önlenebilir. Asagida MDCT tabanli birlestirilmis stereo kodlamanin QMF tabanli birlestirilmis stereo kodlamaya göre avantajlari maddeler halinde siralanmistir: - Sayisal karmasiklikta sadece küçük bir artis (SBR kullanilmadiginda). - MDCT spektrumlari nicemlenmediginde kusursuz yeniden olusturmaya varan ölçekler. QMF tabanli birlestirilmis stereo kodlamada bu durum söz konusu degildir. - M/S kodlamanin ve ses siddeti stereo kodlamanin dogal olarak genisletilmesi. . Stereo sinyal isleme ve nicemleme/kodlama siki bir sekilde birlestirilebilecegi için kodlayici uyumlamasini basitlestiren daha temiz bir yapi. Burada, QMF tabanli birlestirilmis stereo kodlamada, MPEG Çevre çerçevelerinin ve MDCT çerçevelerinin hizali olmadigina ve Ölçek katsayisi bantlarinin parametre bantlariyla eslesmedigine dikkat edilmelidir. - MPEG Çevrede (ICC, CLD, IPD) oldugu gibi üç parametre yerine sadece iki parametrenin (karmasik d) iletilmesi gerektigi için stereo parametrelerin verimli bir sekilde kodlanmasi. MDST spektrumunun bir yaklasiklama olarak hesaplanmasi halinde (sonraki çerçeve kullanilmaksizin) herhangi bir ilave kod çözücü gecikmesi söz konusu degil. Bir uygulamanin önemli özellikleri asagidaki gibi özetlenebilir: a)MDST spektrumlari geçerli, önceki ve sonraki MDCT spektrumlarindan iki boyutlu FIR süzgeci vasitasiyla hesaplanir. FIR süzgeci taplarini ve/veya kullanilan MDCT çerçevelerinin sayilarini azaltmak suretiyle MDST hesaplama (yaklasiklama) için farkli karmasiklik/kalite degisimleri mümkündür. Iletini veya dönüsüm uzunlugu geçisi esnasinda gerçeklesen çerçeve kaybindan ötürü bitisik bir çerçevenin mevcut olmamasi halinde, söz konusu çerçeve MDST kestirimine dahil edilmez (dislama). Dönüsüm uzunlugu geçisinde ise bit akisinda dislama sinyali verilir. MICC, CLD ve IPD yerine sadece iki parametre (yani d karmasik öngörü katsayisinin gerçek ve sanal parçasi) iletilir. A'nin gerçek ve sanal parçalari, aralikla sinirli bagimsiz olarak islenir. Verilen bir çerçevede belli bir parametre (d'nin gerçek veya sanal parçasi) kullanilmiyorsa bunun sinyali bit akisinda verilir ve ilgisiz parametre iletilmez. Parametreler zaman ayrimsal veya frekans ayrimsal olarak kodlanir ve son olarak ölçek katsayisi kod çizelgesi kullanilarak Huffman kodlama uygulanir. Öngörü katsayilari her saniye ölçek katsayisi bandinda güncellenir, bu da MPEG Çevresindekine benzer bir frekans çözünürlügü ile sonuçlanir. Bu nicemleme ve kodlama semasi, 96 kb/s hedef bit orani olan tipik bir yapilanmada stereo yan bilgi için yaklasik 2 kb/s'lik bir ortalama bit orani ile sonuçlanir. Tercih edilen ilave veya alternatif uygulama detaylari asagidakileri içerir: karsilik gelen bir bit ile sinyali verilen, çerçeve basina veya akis basina prensibiyle isleyen ayrimsal olmayan (PCM) veya ayrimsal olan (DPCM (Differential Pulse Code Modulation: DPCM kodlama için zaman veya frekans ayrimsal kodlama mümkündür. Bu da bir-bit isareti kullanilarak sinyallenebilir. d)AAC (Advancedr Audio Coding; Gelismis ses kodlama) ölçek katsayi kitabi gibi önceden tanimlanmis bir kod kitabini yeniden kullanmaktansa d parametre degerlerini kodlamak için özel bir degisimsiz ya da sinyal-uyarlanir kod kitabi kullanilabilecegi gibi, sabit uzunluklu (örnegin 4-bit) imzasiz veya ikiye tümleyen kod sözcüklerine geçilebilir. e)d parametre degerlerinin araliginin yani sira parametre nicemleme adim boyu, rastgele seçilip eldeki sinyal özelliklerine optimize edilebilir. ÜAktif d parametre bantlarinin sayisi ve spektral ve/veya zamansal genisligi rastgele seçilip belirli sinyal özelliklerine optimize edilebilir. Özellikle, bant yapilanmasi çerçeve basina veya akis basina prensibine g)Yukaridaki a) maddesinde açiklanan mekanizmalara ilave veya alternatif olarak, bit akisindaki çerçeve basina bit vasitasiyla açik bir sekilde MDST spektrumu yaklasiklamasini hesaplamak için sadece geçerli çerçevenin MDCT spektrumunun kullanildigi, yani bitisik MDCT çerçevelerinin hesaba katilmadigi sinyali verilebilir. Düzenlemeler MDCT bölgesindeki birlestirilmis stereo kodlamaya yönelik bulus konusu sistem ile ilgilidir. Bu, QMF tabanli yaklasimin getirdigi sayisal karmasiklikta anlamli bir artis olmaksizin MPEG USAC sisteminde birlestirilmis stereo kodlamanin avantajlarindan daha yüksek bit oranlarinda dahi faydalanmayi saglar (burada SBR kullanilmaz). Asagidaki iki listede daha önce açiklanan tercih edilen yapilanma yönleri açiklanmis olup, bunlar birbirlerine alternatif olarak veyahut diger yönlere ilave olarak kullanilabilir: la) genel konsept: orta MDCT ve MDST'den yan MDCT'nin karmasik öngörüsü; lb) 1 veya daha fazla çerçeveler (3-çerçeve gecikmeye yol açar) kullanarak frekans bölgesinde MDCT'den MDST'yi hesapla/yaklasikla; lc) sayisal karmasikligi azaltmak için süzgecin kesilmesi (l-çerçeve 2-tap'a kadar düsecek sekilde, yani [-101]); ld) DC ve fs/2'nin düzgün bir sekilde islenmesi; le) pencere sekli geçisinin düzgün bir sekilde islenmesi; lf) farkli bir dönüsüni boyutu varsa önceki/sonraki çerçeveyi kullanma; lg) kodlayicidaki nicemlenmemis veya nicemlenmis MDCT katsayilarina dayali öngörü; Za) karmasik öngörü katsayisinin gerçek ve sanal parçasini dogrudan nicemle ve kodla (yani MPEG Çevresi parametrelendirmesi yok); 2b) bunun için tekdüze nicemleyici kullan (örnegin adim 2c) öngörü katsayilari için uygun frekans çözünürlügü kullan (örnegin 2 Ölçek Katsayi Bandi için 1 katsayi): 2d) tüm öngörü katsayilarinin gerçek olmasi halinde ucuz sinyalleme; 2e) l-çerçeve RZI islemini baslatmak için çerçeve basina açik bit. Bir düzenlemede, kodlayici ayrica iki kanal sinyalinin zaman bölgesi gösterimini, söz konusu iki kanal için altbant sinyallerine sahip olan iki kanal sinyaline ait spektral gösterime dönüstürülmesi için bir spektral dönüstürücüyü (50, 51) içermekte olup; burada birlestirici (2031), öngörücü (2033) ve artik sinyal hesaplayici (2034), çoklu altbantlar için birinci birlestirilmis sinyal ile artik sinyalin elde edilebilmesi için her bir altbant sinyalini ayri ayri isleyecek sekilde yapilandirilmistir; yine burada çikis arayüzü (212) çoklu altbantlar için kodlanmis birinci birlestirilmis sinyal ile kodlanmis artik sinyali birlestirmek üzere yapilandirilmistir. Bazi acilarin, bir cihazin baglaminda tanimlanmasina ragmen, bu acilarin, bir blokun veya cihazin, yöntem basamagina veya yöntem basamaginin bir özelligine karsilik geldigi ilgili yöntemin tanimini temsil ettigi açiktir. Benzer sekilde bir yöntem. adimi baglaminda açiklanan yönler, ilgili bir blok veya ögenin ya da ilgili cihazin bir özelliginin açiklamasini da kapsamaktadir. Bir örnekte, pencere sekli geçisinin düzgün bir islemesi uygulanir. Sekil lOa'ya bakildiginda, sanal spektrum hesaplayiciya (1001) bir pencere sekli bilgisi (109) girilebilir. Spesifik olarak, MDCT spektrumu gibi (Sekil degerli spektrumun gerçekten-sanala dönüsümünü gerçeklestiren sanal spektrum hesaplayici, FIR veya IIR süzgeci olarak uygulanabilir. Bu gerçekten-sanala modülündeki (1001) FIR veya IIR katsayilari, geçerli çerçevenin sol yarisina ve sag yarisina ait pencere sekline baglidir. Bu pencere sekli bir sinüs pencere veya KBD (Kaiser Bessel Derived; Kaiser Bessel Türevli) pencere için farkli olabilir ve ilgili pencere dizisi yapilanmasina tabi olarak bir uzun pencere, bir baslatma penceresi, bir durdurma penceresi, bir durdurma- baslatma penceresi veya bir kisa pencere olabilir. Gerçekten- sanala modülü iki boyutlu bir FIR süzgeci içerebilir; burada birinci boyut iki ardisik MDCT çerçevesinin FIR süzgecine girildigi bir zaman boyutu, ikinci boyut ise bir çerçevenin frekans katsayilarinin girildigi bir frekans boyutudur. Asagidaki tabloda farkli pencere sekilleri ve pencerenin sol yarisinin ve sag yarisinin farkli uygulamalari için geçerli bir pencere dizisine iliskin farkli MDST süzgeci katsayilari verilmistir. Tablo A - Geçerli Pencere için MDST Süzgeci Parametreleri Geçerli Pencere Sol Yari: Sinüs Sekli SagSol Yari: KBD Sekli Sag Dizisi Yari: Sinüs Sekilli Yari: KBD Sekilli Geçerli Pencere Sol Yari: Sinüs Sekli SagSol `Yari: KBD Sekli Sag Dizisi Yari: KBD Sekli Yari: Sinüs Sekilli (devami) Sol Yari: Sinüs Sekli SagSol Yari: KBD Sekli Sag Mevcut Pencere Yari: KBD Sekli Yari: Sinüs Sekilli Buna ek olarak, MDCT spektrumundan MDST spektrumunu hesaplamak için önceki pencere kullanildiginda, bilgisi (109) önceki için pencere pencere sekli sekli bilgisini Önceki pencereye iliskin karsilik gelen MDST Süzgeci katsayilari asagidaki tabloda verilmistir. Tablo B - Önceki Pencere için MDST Süzgeci Parametreleri Geçerli Pencere DiZiSi Geçerli PencereniAGeçerli Pencerenin Sol Yarisi: SinüsSol Yarisi: KBD Sonuç olarak, pencere sekli bilgisine (109) bagli olarak Sekil lOa'daki sanal spektrum hesaplayici (1001) farkli süzgeç katsayilari gruplari uygulanarak uyarlanabilir. Kod çözücü tarafinda kullanilan pencere sekli bilgisi kodlayici tarafinda hesaplanir ve kodlayici çikis sinyaliyle birlikte yan bilgi olarak iletilir. Kod çözücü tarafinda ise pencere sekli bilgisi (109), bit akisi çogullama çözücü (örnegin Sekil Sb'de 102) vasitasiyla bit akisindan ayiklanir ve Sekil 10a'da gösterildigi gibi sanal spektrum Pencere sekli bilgisi (109) önceki çerçevenin farkli bir dönüsüm boyutu oldugu sinyalini verirse, gerçek degerli spektrumdan sanal spektrumu hesaplamak için önceki çerçevenin kullanilmamasi tercih edilir. Ayni durum pencere sekli bilgisi (109) yorumlanarak sonraki çerçevenin farkli bir dönüsüm boyutu oldugu bulundugu zaman da geçerlidir. Bu durumda gerçek degerli spektrumdan sanal spektrumu hesaplamak için sonraki çerçeve kullanilmaz. Böyle bir durumda, örnegin önceki çerçeve geçerli çerçeveden farkli bir dönüsüm boyutuna sahip oldugunda veya sonraki çerçeve geçerli çerçeveden farkli bir dönüsüm boyutuna sahip oldugunda, sanal spektrumu kestirmek için sadece geçerli çerçeve, yani geçerli pencerenin spektral degerleri kullanilir. Kodlayicidaki öngörü MDCT katsayilari gibi nicemlenmemis veya nicemlenmis frekans katsayilarina dayalidir. Sekil 3a'da öge 2033 ile gösterilen öngörü örnegin nicemlenmemis veriye dayali oldugunda, artik hesaplayici (2034) tercihen nicemlenmemis veri üzerinde de islem yapar ve artik hesaplayici çikis sinyali, yani artik sinyal (205) entropi kodlanmadan önce nicemlenir ve bir kod çözücüye iletilir. Alternatif bir düzenlemede öngörünün nicemlenmis MDCT katsayilarina dayali olmasi tercih edilir. Bu durumda, bir birinci nicemlenmis kanal ile bir ikinci nicemlenmis kanalin artik sinyalin hesaplanmasi için temel olmasi için nicemleme Sekil 3a'daki birlestiriciden (2031) önce gerçeklesebilir. Alternatif olarak, birinci kombinasyon sinyali ile ikinci kombinasyon sinyalinin nicemlenmemis bir formda hesaplanmasi ve artik sinyal hesaplanmadan önce nicemlenmesi için, nicemleme islemi birlestiriciden (2031) sonra da gerçeklesebilir. Yine alternatif olarak, öngörücü (2033) nicemlenmemis bölgede isleyebilir* ve öngörü sinyali (2035) artik hesaplayiciya girilmeden önce nicemlenir. Bu durumda, artik hesaplayiciya (2034) girilen diger bir sinyal olan ikinci kombinasyon sinyalinin (2032) de artikr hesaplayici Sekil 3a'daki öngörücü (2033) içerisinde uygulanabilen ve kod çözücü tarafinda mevcut olan ayni nicemlenmis veri ile isleyen Sekil 6a'daki artik sinyali (1070) hesaplamadan önce nicemlenmesi faydalidir. Bu sayede artik sinyalin hesaplamasini gerçeklestirme amaçli olarak kodlayicida kestirilen MDST spektrumunun, ters öngörüyü gerçeklestirmek, yani artik sinyalden yan sinyali hesaplamak için kullanilan kod çözücü tarafindaki MDST spektrumuyla tamamen ayni olmasi garanti altina alinabilir. Bu amaçla Sekil 6a'daki hat 204 üzerindeki M sinyali gibi birinci kombinasyon sinyali, blok 2070'e girilmeden önce nicemlenir. Sonra, geçerli çerçevenin nicemlenmis MDCT spektrumu kullanilarak hesaplanan MDST spektrumu, kontrol bilgisine bagli olarak da önceki veya sonraki çerçevenin nicemlenmis MDCT spektrumu, çarpiciya (2074) girilir; bu durumda Sekil a'daki çarpicinin (2074) çikisi da nicemlenmemis bir spektrum olacaktir. Bu nicemlenmemis spektrum, spektrum girisinden toplayiciya (2034b) çikarilacak ve son olarak nicemleyicide (209b) nicemlenecektir. Bir düzenlemede, öngörü bandi basina karmasik öngörü katsayinin gerçek parçasi ve sanal parçasi dogrudan, yani örnegin MPEG Çevresi parametrelendirmesi olmaksizin nicemlenir ve kodlanir. Nicemleme islmei, örnegin 0,1 adim boyu olan tekdüze bir nicemleyici kullanilarak gerçeklestirilebilir. Bu da herhangi bir logaritmik nicemleme adim boyunun ve benzerinin uygulanmadigi, ancak herhangi bir dogrusal adim boyunun uygulandigi anlamina gelir. Bir uygulamada, karmasik öngörü katsayisinin gerçek parçasi ve sanal parçasinin deger araligi -3 ila 3 arasinda degisir, bu da karmasik öngörü katsayisinin gerçek parçasi ve sanal parçasi için 60 `veya uygulama detaylarina. bagli olarak 61 nicemleme adiminin kullanilmasi demektir. Tercihen, Sekil 6a'daki çarpicida (2073) uygulanan gerçek parça ve Sekil 6a'da uygulanan sanal parça (2074) da uygulanmadan önce nicemlenir, bu sayede kodlayici tarafinda kod çözücü tarafinda mevcut olanla ayni öngörü degeri kullanilir. Bu da öngörü artik sinyalinin, sunulan nicemleme hatasinin yani sira, kod çözücü tarafinda nicemlenmis bir öngörü katsayisi uygulanirken kodlayici tarafinda nicemlenmemis bir öngörü katsayisi uygulandiginda ortaya çikabilecek tüm hatalari kapsamasini garanti eder. Tercihen, nicemleme islemi, hem kodlayici tarafinda hem de kod çözücü tarafinda mümkün oldugunca ayni durum ve ayni sinyaller mevcut olacak sekilde uygulanir. Dolayisiyla, girisin gerçekten-sanala hesaplayiciya (2070) nicemlenmesi isleminin nicemleyicide (209a) uygulananla ayni nicemleme kullanilarak yapilmasi tercih edilir. Ayrica, madde 2073 ve madde 2074'teki çarpmalari yapmak için öngörü katsayisinin gerçek parçasinin ve sanal parçasinin nicemlenmesi tercih edilir. Bu nicemleme islemi, nicemleyicide (2072) uygulanan islemin aynisidir. Buna ek olarak, Sekil 6a'daki blok 2031 tarafindan çikarilan yan sinyal de toplayicilardan (2034a ve 2034b) önce nicemlenebilir. Bununla birlikte, nicemleyici (209b) tarafindan gerçeklestirilen nicemlemenin, söz konusu toplayicilarin yaptigi toplamanin nicemlenmemis bir yan sinyal ile uygulandigi ekleme isleminin ardindan yapilmasi problemli degildir. Diger bir örnekte, tüm öngörü katsayilarinin gerçek olmasi halinde ucuz sinyalleme uygulanir. Belli bir çerçeve için, yani ses sinyalinin ayni zaman kismi için tüm öngörü katsayilarinin gerçek olarak hesaplandigi bir durum söz konusu olabilir. Bu tür bir durum, tam orta sinyal veya tam yan sinyalden bir digerine faz-kaymasi hiç yoksa veya çok az varsa gerçeklesebilir. Kullanilan bit miktarini azaltmak için bu, tek bir gerçek gösterge ile belirtilir. Bu durumda öngörü katsayisinin sanal parçasinin, bir sifir degerini temsil eden bir kod sözcügü ile bit akisinda sinyallenmesine gerek kalmaz. Kod Çözücü tarafinda, bit akisi kod çözücü arayüzü, örnegin bit akisi çogullama çözücü, bu yeni göstergeyi yorumlayacak ve sanal parça için kod sözcüklerini aramayacak, bunun yerine tüm bitlerin gerçek degerli öngörü katsayilari için bit akisinin karsilik gelen bölümünde oldugunu varsayacaktir. Bunun yani sira, öngörücü (2033) çerçevedeki öngörü katsayilarinin tüm sanal parçalarinin sifir oldugunu belirten bir gösterge aldiginda bunun gerçek. degerli MDCT spektrumundan bir MDST spektrumunu veya genel olarak sanal bir spektrumu hesaplamasina gerek kalmayacaktir. Bu sebeple, Sekil 6b'deki kod çözücüdeki öge ll60a deaktif hale getirilecek ve ters öngörü sadece Sekil 6b'deki çarpicida (ll60b) uygulanan gerçek degerli öngörü katsayisi kullanilarak gerçeklestirilecektir. Ayni durum, öge 2070'in deaktif hale getirilecegi ve öngörünün sadece çarpici (2073) kullanilarak gerçeklestirilecegi kodlayici tarafi için de geçerlidir. Bu yan bilgi tercihen çerçeve basina ilave bit olarak kullanilir, bu durumda kod çözücü gerçekten-sanala dönüstürücünün (1160a) bir çerçeve için aktif olup olmayacagina karar vermek için bu biti çerçeve çerçeve okuyacaktir. Dolayisiyla, bu bilginin saglanmasi öngörü katsayisinin bir çerçeve için sifir olan tüm sanal parçalarinin daha verimli sinyallenmesinden ötürü bit akisi boyutunun azalmasi ile sonuçlanir ve buna ek olarak, böyle bir çerçeve için kod çözücüde daha az karmasiklik saglar, bu da hizli bir sekilde örnegin batarya ile çalisan mobil bir cihazda uygulanan bu tür bir islemcinin pil tüketiminin azalmasina yol açar. Mevcut bulusun tercih edilen düzenlemelerine uygun karmasik stereo öngörü, kanallar arasinda seviye ve/veya faz farkliliklari ile kanal çiftlerinin verimli bir sekilde kodlanmasinar yönelikr bir araçtir. Karmasik degerli a parametresi kullanilarak sol ve sag kanallar asagidaki matrisle yeniden olusturulur. Burada, dmxm" downmix kanallarinin (dmxmg MDCT'sine karsilik gelen MDST'yi belirtir. l' 1+aRe alin _i i Yukaridaki denklem, a'nin gerçek parçasi ve sanal parçasi bakimindan ayrilan ve birlestirilmis bir öngörü/kombinasyon islemi için olan bir denklemi temsil eden bir baska gösterim olup, burada öngörülmüs S sinyalinin hesaplanmasi zorunlu degildir. Bu araç için tercihen asagidaki veri ögeleri kullanilir: cplx_pred_all 0: Bazi bantlar L/R kodlamayi kullanir, bunun sinyali cplx_pred_used[] ile verilir 1: Tüm bantlar karmasik stereo öngörüyü kullanir (devami) cplat_pred;used[g][sfb] (öngörü bantlarindan eslestirildikten sonra) pencere grubu (g) ve ölçek katsayisi bandi (sfb) basina bir- bit isareti sunu gösterir O: karmasik öngörü kullanilmiyor, L/R kodlama kullanilir 1: karmasik öngörü kullaniliyor complex_coef 0: tüm öngörü bantlari için QH1= O 1: tüm öngörü bantlari için ahiiletilir use_prev_frame O: MDST kestirimi için sadece geçerli çerçeveyi kullan 1: MDST kestirimi için geçerli ve önceki çerçeveyi kullan delta_code_time O: Öngörü katsayilarinin frekans ayrimsal kodlamasi l: Öngörü katsayilarinin zaman ayrimsal kodlamasi hcod;alpha_g_re d Re Huffman kodu hcod;alpha_g_im d Im Huffman kodu Bu veri ögeleri bir kodlayicida hesaplanir bir çok kanalli ses sinyalin yan bilgisine yerlestirilir. Ögeler bir yan bilgi ayiklayici vasitasiyla kod çözücü tarafinda yan bilgiden ayiklanir ve karsilik gelen bir islem gerçeklestirmek üzere kod çözücü hesaplayiciyi kontrol etmek için kullanilir. Karmasik stereo öngörü, geçerli kanal çiftinin downmix MDCT spektrumunu; complex_coef == 1. durumunda ise geçerli kanal çiftinin downmix MDST spektrumuun, yani MDCT spektrumunun sanal karsiligini gerektirir. Downmix MDST kestirimi geçerli çerçevenin MDCT downmixinden; use_prev_frame == ]. durumunda ise önceki çerçevenin MDCT downmixinden hesaplanir. Pencere grubu (g) ve grup pencereye (b) ait önceki çerçevenin MDCT downmixi, söz konusu çerçevenin yeniden olusturulmus sol ve sag spektrumlarindan elde edilir. Downmix MDST kestiriminin hesaplanmasinda, window_sequence ve bunun yani sira filter_coefs ve filter_coefs_prev'e bagli çift sayi degerli MDCT dönüsümü uzunlugu kullanilir, ki bunlar süzgeç çekirdeklerini içeren ve önceki tablolara göre türetilen dizilimlerdir. Tüm, öngörü katsayilari için (zaman veya frekansta) önceki deger bir Huffman kod kitabi kullanilarak kodlanir. cplx_pred_used = 0 durumunda öngörü katsayilari öngörü bantlari için iletilmez. Öngörü katsayilari, cplx_pred_used = 0 oldugu öngörü bantlari için iletilmez. Ters nicemlenmis öngörü katsayilari alpha_re ve alpha_im asagidaki sekilde verilir; alpha_re = alpha___q_re*0.1 alpha_im = alpha_q`im*0.1 Mevcut bulusun sadece stereo sinyallere, yani sadece iki kanali olan çok kanalli sinyallere degil; 5,1 veya 7,1 sinyal gibi üç veya daha fazla kanali bulunan birçok kanalli sinyalin iki kanalina da uygulanabilir oldugu belirtilmelidir. Belirli uygulama gerekliliklerine dayanilarak bulusun düzenlemeleri bir donanimda ya da yazilimda uygulanabilmektedir. Uygulama, ilgili yöntemin gerçeklestirilmesine olanak saglayacak sekilde, üzerinde programlanabilir bir bilgisayar sistemi ile birlikte çalisan (veya birlikte çalisma kabiliyetine sahip olan) elektronik olarak okunabilir kontrol sinyallerini depolayan disket, DVD, CD, ROM, PROM, EPROM, EEPROM veya FLASH bellek gibi bir sayisal depolama ortaminda gerçeklestirilebilir. Bulusa göre bazi düzenlemeler, burada açiklanan yöntemlerden birinin gerçeklestirmesine olanak saglayacak sekilde programlanabilir bir bilgisayar sistemiyle birlikte çalisma kabiliyetine sahip olan elektronik olarak okunabilir kontrol sinyalleri bulunan kalici veya somut bir veriyi tasiyan bir tasiyiciyi içermektedir. Genel olarak mevcut bulusun düzenlemeleri, bilgisayar programi ürünü bir bilgisayar üzerinde çalisirken, yöntemlerden birini gerçeklestirmek üzere çalisan bir program kodu ile birlikte bir bilgisayar programi olarak uygulanabilmektedir. Program kodu örnegin makine tarafindan okunabilir bir tasiyicida depolanabilir. Diger düzenlemeler, makine tarafinca okunabilir tasiyici üzerine depolanmis, burada tarif edilen yöntemlerin birinin gerçeklestirilmesine iliskin bilgisayar programina sahiptir. Baska bir deyisle, bulus basamaginin bir düzenlemesi bu yüzden, bilgisayar programi bir bilgisayarda çalisirken burada açiklanan yöntemlerden birini gerçeklestirmek için bir program koduna sahip olan bir bilgisayar programidir. Bulusa dair yöntemlerin bir diger düzenlemesi bu nedenle, burada tarif edilen yöntemlerden birini gerçeklestirmeye yönelik, üzerine kaydedilmis, bilgisayar programi içeren bir veri tasiyicisidir (ya da bir dijital depolama araci, ya da bir bilgisayarda okunabilir araç). Bulus yönteminin ayrica bir düzenlemesi bu yüzden, burada tarif edilen yöntemlerden birini gerçeklestirmek için bilgisayar programini temsil eden bir veri akisi ya da bir sinyaller dizilimidir. Veri akisi ya da sinyaller dizisi örnegin Internet gibi bir veri iletisim baglantisi yoluyla aktarilacak sekilde yapilandirilabilir. Diger bir düzenleme, burada tarif edilen yöntemlerden birini gerçeklestirmek için yapilandirilmis ya da uyumlastirilmis örnegin bir bilgisayar ya da bir programlanabilir mantik cihazi gibi bir isleme araci içermektedir. Bir diger düzenleme, burada tarif edilen yöntemlerden birini gerçeklestirmek için bilgisayar programi yüklenmis olan bir bilgisayar içermektedir. Bazi düzenlemelerde, programlanabilir bir mantik cihazi (örnegin bir alanda programlanabilir geçit dizisi), burada tarif edilen yöntemlerin bazi ya da tüm. islevselliklerini gerçeklestirmek için kullanilabilir. Bazi düzenlemelerde, burada açiklanan yöntemlerden birini gerçeklestirmek için alanda programlanabilir geçit dizilimi bir mikroislemci ile birlikte çalisabilir. Yöntemler genel olarak tercihen herhangi bir donanim cihazi ile gerçeklestirilebilir. Yukarida tarif edilen düzenlemeler yalnizca. mevcut bulusun prensipleri için örnekleyicidir. Burada açiklanan düzenlemeler ve detaylarda çesitli modifikasyonlarin ve varyasyonlarin yapilabilecegi teknik alanda uzman kisiler için asikardir. Bu nedenle amaç, buradaki düzenlemelerin açiklamasi ve anlatimi yoluyla sunulan spesifik detaylar ile degil, yalnizca ekli patent istemlerinin kapsami ile sinirli olmaktir. TR TR TR TR TR DESCRIPTION MULTI-CHANNEL AUDIO CODING USING COMPLEX PREDICTION AND OPEN PREDICTION SIGNALING The present invention relates to audio processing, particularly to multi-channel audio processing of a multi-channel signal having two or more channel signals. In the field of multi-channel or stereo processing, the application of a method known as mid/side (M/S) stereo coding is known. In this concept, a combination of the left or first audio channel signal and the right or second audio channel signal is created to obtain a middle or mono signal (M). In addition, a difference is created between the left or first channel signal and the right or second channel signal to obtain the side signal (S). Since the side signal will be quite small when the left and right signals are very similar, this mid/side coding method results in a significant coding gain. In general, as the range of values to be quantized/entropy-coded decreases, the coding gain at the quantizer/entropy encoder stage increases. Consequently, as the side signal decreases, the coding gain for a PCM (Pulse Code Modulation) or Huffman-based or arithmetic entropy encoder increases. However, there are some cases where center/side coding does not result in coding gain. This may occur when the signals in both channels are phase-shifted, for example, by 90°. Then, the center and side signals may have very similar ranges, so encoding the center and side signals using an entropy encoder will not result in coding gain but will instead result in an increased bit rate. Therefore, to disable mid/side coding across bands, frequency-selective mid/side coding can be applied, for example, where the side signal is not significantly reduced relative to the original left signal. While the side signal is zero when the left and right signals are identical, resulting in maximum coding gain due to the elimination of the side signal, the situation is different when the mid and side signals are waveform-identical, with the only difference between them being their overall amplitude. In this case, assuming no phase shift from the side signal to the mid, the side signal increases significantly, while the mid signal does not experience a significant decrease in value across the range. When this occurs in a particular frequency band, mid/side coding can be disabled due to the lack of coding gain. Mid/side coding can be implemented frequency-selectively or, alternatively, in the time domain. Alternative multichannel coding techniques exist that rely not on a waveform approach like center/side coding, but rather on parametric processing based on specific stereophonic cues. These techniques are known as "double-cue coding," "parametric stereo coding," or "MPEG surround coding." In this technique, specific cues are calculated for multiple frequency bands. These cues include inter-channel level differences, inter-channel coherence measurements, inter-channel time differences, and/or inter-channel phase differences. These approaches assume that a multichannel effect experienced by the listener does not necessarily depend on the detailed waveforms of the channels, but rather on accurate frequency-selective cues or inter-channel information. This means that a rendering machine must be careful when rendering multi-channel signals that accurately reflect the cues, but the waveforms are not of decisive importance. This approach can be particularly complex when the decoder must apply decorrelation processing to artificially obtain decorrelated stereo signals from each other, even though all these channels are derived from one or the same downmix channel. Depending on the application, decorrelators for this purpose are complex and can cause artifacts, especially in the interlaced signal portions. Furthermore, the parametric coding approach, unlike waveform coding, is lossy, resulting in unavoidable information loss due to both typical quantization and the consideration of stereophonic cues rather than specific waveforms. This approach is very low. This allows for higher bit rates, but may require compromises in quality. Recent improvements have been made to Unified Speech and Audio Coding (USAC), as shown in Figure 7. A core decoder 700 decodes the encoded stereo signal, which may be center/side encoded on input 701. The core decoder outputs a center signal on line 702 and a side or residual signal on line 703. Both signals are converted to the QMF domain by QMF (Quadrature Mirror Filter) filter banks 704 and 705. Next, a left channel signal 707 and a right channel signal 708 are applied. The low-band signals are then passed to a spectral band replication (SBR) decoder 709, which produces wide-band left and right signals on lines 710 and 711, which are then converted to a time domain by QMF synthesis filter banks 712, 713 to obtain wide-band left and right signals L, R. Figure 7 shows the situation where the MPEG surround decoder 706 performs a center/side decoding. Alternatively, the MPEG surround decoder block 706 performs a stereophonic cue-based parametric decoding to produce stereo signals from a single mono core decoder signal. The MPEG surround decoder 706 also performs inter-channel level differences, Using parametric information such as inter-channel coherence measurements or other such inter-channel information parameters, it can also generate multiple low-band output signals to be input to the SBR decoder block 709. When the MPEG surround decoder block 706 performs the mid/side decoding shown in Figure 7b, a real-gain coefficient g can be applied; DMX/RES and L/R are the downmix/residual and left/right signals, respectively, represented in the complex mixed QMF region. Using a combination of block 706 and block 709 results in only a slight increase in numerical complexity compared to using a basic stereo decoder, because the complex QMF representation of the signal is already available as part of the SBR decoder. In a non-SBR structure, QMF-based stereo coding, as described in the USAC context, in this example, is used for 64-band analysis. This can result in a significant increase in computational complexity due to the required QMF blocks, which require blocks and 64-band synthesis blocks. These filter banks should only be added for stereo coding purposes. The MPEG USAC system under development generally has high bitrate coding modes where SBR is not used. The following two MPEG USAC documents provide examples of multichannel audio coding/decoding schemes in which a signal other than a downmix/sum/mono signal is predicted by means of a complex-valued prediction coefficient: HEIKO PURNHAGEN ET AL.: "Technical description of proposed Unified Stereo Coding in USAC", 90th MPEG MEETING; 26-10- MAX NEUENDORF (EDITOR): "WD5 of USAC", 90th MPEG MEETING; 12-08), page 1-146; The disclosure discloses methods and apparatus for decoding stereo coding using complex prediction in the field. In one embodiment, a decoding method for obtaining an output stereo signal from an input stereo signal encoded with complex prediction coding and comprising first frequency domain representations of two input channels comprises the following upmixing steps: (i) computing a second frequency domain representation of a first input channel; and (ii) computing an output channel based on the first and second frequency domain representations of the first input channel, the first frequency domain representation of the second input channel, and a complex prediction coefficient. The upmixing may be delayed responsively to control data. The disclosure discloses a parametric stereo upmix apparatus that generates a left signal and a right signal from the downmix signal. Said parametric stereo upmix is characterized by comprising means for predicting a difference signal comprising a difference between the left signal and the right signal based on the mono downmix signal scaled by a prediction coefficient. Said prediction coefficient is derived from spatial parameters. Said stereo upmixer further comprises an arithmetic means for deriving the left signal and the right signal based on a sum and a difference of the mono downmix signal and said difference signal. An object of the present invention is to provide an improved audio processing concept that results in good audio quality and/or reduced digital complexity while providing high coding gain. This object is achieved by an audio decoder as in claim 1, an audio coder as in claim 4, an audio decoding method as in claim 7, an audio coding method as in claim 8, or a computer program as in claim 9. The present invention is based on the finding that the coding gain in a high-quality waveform coding approach can be significantly increased for a second combination signal using a first combination signal, where both signals are derived from the original channel signals using a combination rule such as the mid/side combination rule. Because the inventive prediction is a waveform-based coding approach rather than a parameter-based dual or multi-channel coding approach, it has been found that this prediction information is calculated by a predictor in the audio encoder such that an optimization objective is achieved, incurring only a small overhead, but resulting in a significant reduction in the bit rate required for the side signal without any loss of audio quality. To reduce computational complexity, it is preferable to implement frequency-domain coding in which the prediction information is derived band-selectively from the frequency-domain input. The transformation algorithm for converting a time domain representation to a spectral representation is preferably a critically oversampled operation such as the modified discrete cosine transform (MDCT) or the modified discrete sine transform (MDST). This differs from the complex transform in that only real and imaginary values are computed, while in the complex transform, the real and complex values of a spectrum are oversampled by a factor of 2, resulting in oversampling. Preferably, a transform based on overlapping presentation and deletion is used. MDCT, in particular, is such a transform, and it allows cross-fading between subsequent blocks without any overhead due to the well-known Time Domain Aliasing Cancellation (TDAC) property achieved through decoder-side overlap-add processing. Preferably, the prediction information computed in the encoder, transmitted to the decoder, and used in the decoder includes an imaginary part that reflects the phase differences between two audio channels, advantageously chosen from an order between 0° and 360°. The computational complexity is significantly reduced when a purely real-valued transform, or in general, a transform that provides only a real spectrum or only an imaginary spectrum, is applied. To utilize this virtual prediction information, which indicates the phase shift between a specific band of the left signal and a corresponding band of the right signal, a real-to-virtual converter, or a virtual-to-real converter depending on the implementation of the conversion, is provided in the decoder to calculate a predictive residual signal from the first combination signal that has been phase-rotated with respect to the original combination signal. This phase-rotated predictive residual signal can then be combined with the predictive residual signal transmitted in the bitstream to reproduce a side signal, which can then be combined with a middle signal to obtain the decoded left channel in a specific band and the decoded right channel in that band. To improve audio quality, the same real-to-virtual or virtual-to-real converter applied at the decoder is also applied at the encoder when the predictive residual signal is calculated in the encoder. The present invention is advantageous in that it provides improved audio quality and a reduced bit rate when compared to systems having the same bit rate and the same audio quality. Advantages are also gained in terms of the computational efficiency of combined stereo coding, which is useful in the MPEG USAC system at high bit rates, where SBR is generally not used. In these approaches, instead of processing the signal in the complex mixed QMF domain, residue-based predictive stereo coding is applied in the local MDCT domain of the underlying stereo transform encoder. In accordance with one aspect of the present invention, the present invention includes an apparatus or method for generating a stereo signal by complex prediction in the MDCT domain, wherein the complex prediction is performed in the MDCT domain using a real-to-complex transform; wherein said stereo signal may be an encoded stereo signal at the encoder side when the stereo signal generating device or method is implemented at the decoder side, or alternatively, a decoded/transmitted stereo signal. In the following, preferred embodiments of the present invention will be described with reference to the attached drawings, of which: Figure 1 is a schematic of an audio decoder; Figure 2 is a block diagram of an audio encoder; Figure 3a shows an implementation of the encoder calculator of Figure 2; Figure 3b shows an alternative implementation of the encoder calculator of Figure 2; Figure 3c shows a mid/side combination rule to be implemented at the encoder side; Figure 4a shows an implementation of the decoder calculator of Figure 1; Figure 4b shows an alternative implementation of the decoder calculator in the form of a matrix calculator; Figure 4c shows a mid/side reverse combination rule corresponding to the combination rule shown in Figure 3c; Figure 5a shows an embodiment of a voice encoder operating in the frequency domain, preferably a real-valued frequency domain; Figure 5b shows an embodiment of a voice decoder operating in the frequency domain; Figure 6a, in accordance with an embodiment of the present invention. Figure 6b shows an alternative implementation of an audio encoder operating in the MDCT domain and using a real-to-virtual transform; Figure 6b shows an audio decoder operating in the MDCT domain and using a real-to-virtual transform in accordance with an embodiment of the present invention; Figure 7a shows an audio postprocessor using a stereo decoder and a downstream SBR decoder; Figure 7b shows a mid/side upmix matrix; Figure 8a shows a detailed view of the MDCT block of Figure 6a; Figure 8b shows a detailed view of the MDCT*1 block of Figure 6b; Figure 9a shows an implementation of an optimizer operating at reduced resolution with respect to the MDCT output; Figure 9b shows a representation of an MDCT spectrum and the corresponding low resolution bands for which predictive information is calculated; Figure 10a shows an implementation of the real-to-virtual converter of Figure 6a or 6b, and Figure 10b shows a possible implementation of the virtual spectrum calculator of Figure 10a. Figure 1 shows an audio decoder for decoding an encoded multi-channel audio signal obtained on an input line 100. The encoded multi-channel audio signal includes an encoded first combination signal, an encoded predictive residual signal, and predictive information generated using a combination rule for combining a first channel signal representing the multi-channel audio signal and a second channel signal. The encoded multi-channel signal may be a data stream, such as a bit stream having three components in multiplexed form. Additional side information may be included in the encoded multi-channel signal on line 100. The signal is input to the input interface 102. The input interface 102 may be implemented as a data stream demultiplexer that extracts the encoded first combination signal on line 104, the encoded residual signal on line 106, and the prediction information on line 108. The prediction information is preferably a factor having a real part that is not equal to zero and/or an imaginary part that is different from zero. The encoded combination signal and the encoded residual signal are input to a signal decoder 110 to decode the first combination signal to obtain a decoded first combination signal on line 112. Additionally, the signal decoder 110 is configured to decode the encoded residual signal to obtain a decoded residual signal on line 114. Depending on the encoding process on the side of an audio encoder, the signal decoder may include an entropy decoder such as a Huffman decoder, an arithmetic decoder, or any other entropy decoder, and a post-coupled dequantization (recovery of lost detail in a quantized image) step to perform a dequantization operation that maps to a quantizer operation in an associated audio encoder. The signals on lines 112 and 114 are input to a decoding calculator 115, which outputs the first channel signal on line 117 and the second channel signal on line 118, where the two signals are two channels of a multi-channel audio signal or stereo signals. For example, if the multi-channel audio signal contains five channels, then the two signals are two channels from the multi-channel signal. To fully encode such a five-channel multichannel signal, two decoders can be implemented, as shown in Figure 1, where the first decoder processes the left channel and right channel, the second decoder processes the left surround channel and right surround channel, and a third mono decoder can be used to apply mono-coding to the center channel. However, other groupings and combinations of waveform and parametric encoders can also be implemented. An alternative way to generalize the prediction scheme to more than two channels is to process three (or more) signals simultaneously, i.e., to predict a 3rd combination signal from signals 1 and 2 using two prediction coefficients, much like the "two-to-three" approach in MPEG Environment. The decoder calculator 116 is configured to calculate a decoded multi-channel signal having a decoded first channel signal 117 and a decoded second channel signal 118 using the decoded residual signal 114, the prediction information 108, and the decoded first combination signal 112. Specifically, the decoded first channel signal and the decoded second channel signal are combined by the combination rule when generating the first combination signal and the prediction residual signal. The encoder is configured to process the multi-channel signal input to the encoder such that it has at least an approximation of a first channel signal and a second channel signal. Specifically, the prediction information in line 108 can be a non-zero real-valued part and/or a non-zero imaginary part. The decoder calculator 116 can be implemented in different ways. A first implementation is shown in Figure 4a. This implementation includes a predictor 1160, a combination signal calculator 1161, and a combiner 1162. The predictor receives the decoded first combination signal 112 and the prediction information 108 and outputs a prediction signal 1163. Also specifically, the predictor 1160 combines the prediction information 108 into the decoded first combination signal 112 or a signal derived from the decoded first combination signal. The derivation rule for deriving the signal to which the prediction information 108 is applied may be a real-to-virtual transformation or equivalently a virtual-to-real transformation or a weighting operation, or may also be a phase shift operation or a combined weighting/phase shift operation, depending on the application. The prediction signal 1163 is input to the combination signal calculator 1161 together with the decoded residual signal to calculate the decoded second combination signal 1165. Both signals 112 and 1165 are combined to obtain the decoded multi-channel audio signal having the decoded first channel signal and the decoded second channel signal on lines 1166 and 1167, respectively. The decoder calculator is implemented as a matrix calculator 1168, which takes as input the decoded first combination signal or M signal, the decoded residual signal or D signal, and the prediction information 108. The matrix calculator 1168 applies a transformation matrix, denoted 1169, to the M, D signals to obtain output signals L, R, where L is the decoded first channel signal and R is the decoded second channel signal. The notation in Figure 4b resembles a stereo notation with one left channel (L) and one right channel (R). This notation is implemented for clarity, but those skilled in the art will understand that the L, R signals can be any combination of two channel signals within a multi-channel signal having more than two channel signals. The matrix operation is a kind of "monostable" 4a" to the matrix calculation, where the inputs to the circuit in Figure 4a and the outputs from the circuit in Figure 4a are identical to the inputs to the matrix calculator 1168 and the outputs from the matrix calculator 1168. Figure 4c shows an example of an inverse combination rule implemented by the combiner 1162 in Figure 4a. Specifically, this combination rule is similar to the decoder-side combination rule in well-known middle/side coding, where L = M + S and R = M - S. It should be noted that the signal S used by the inverse combination rule in Figure 4c is the signal calculated by the combination signal calculator, i.e., a combination of the prediction signal on line 1163 and the decoded residual signal on line 114. Again, in this description, the signals on lines It should be noted that in some cases, the lines are named using the reference numbers used for them, and in some cases, the reference numbers used for the lines themselves. Therefore, the notation is that a line having a certain signal represents the signal itself. A line may be a physical line in a hardware-integrated implementation. In a computer-aided implementation, there is no physical line; instead, the signal represented by the line is transmitted from one computational module to another. Figure 2 shows an audio coder for encoding a multi-channel audio signal 200 having two or more channel signals, where the first channel signal is shown at 201 and the second channel at 202. When the prediction residual signal 205 is combined with a prediction signal derived from the first combination signal 204, and the prediction information 206 is combined with a first combination signal 204, When the first combination signal and the second combination signal are input to an encoder calculator 203 for calculating a first combination signal 204 and a prediction residual signal 205 using the first channel signal 201 and the second channel signal 202 and the prediction information 206, so that the first combination signal and the second combination signal can be derived from the first channel signal 201 and the second channel signal 202 using a combination rule. The prediction information is generated by an optimizer 207 for calculating the prediction information 206 such that the prediction residual signal satisfies an optimization goal 208. The first combination signal 204 and the residual signal 205 are input to a signal encoder 209 for coding the first combination signal to obtain an encoded first combination signal 210 and encoding the residual signal 205 to obtain an encoded residual signal 211. Both encoded signals 210, 211 are input to an output interface for combining the encoded first combination signal 201 with the encoded prediction residual signal 211 and the prediction information 206 to obtain an encoded multi-channel signal 213 similar to the encoded multi-channel signal 100 input to the input interface 102 of the audio decoder shown in Fig. 1. Depending on the application, the optimizer 207 either receives the first channel signal 201 and the second channel signal 202, or receives the first combination signal 214 and the second combination signal 215 derived from the combiner 2031 (described later) in Fig. 3a, indicated by lines 214 and 215. A preferred optimization target is shown in Fig. 2, wherein the coding gain is maximized. is removed, i.e., the bit rate is reduced as much as possible. In this optimization objective, the residual signal D is reduced to Hanimum with respect to a. In other words, the predictive information a HS dMHZ is chosen to be minimized. This results in a solution for d shown in Figure 2. The signals S, M are given blockwise and preferably spectral domain signals; where "H..." is the 2-norm of the argument and <... denotes the inner product as usual. When the first channel signal 201 and the second channel signal 202 are input to the optimizer 207, the optimizer can apply the combination rule (an example combination rule is shown in Figure 3c). However, when the first combination signal 214 and the second combination signal 215 are input to the optimizer 207, the optimizer 207 need not automatically apply the combination rule. Other optimization goals may relate to perception quality. The optimization goal may be to achieve maximum perception quality. In this case, the optimizer may require additional information from a perceptual model. Other applications of the optimization goal may relate to achieving a minimum or constant bit rate. The optimizer 207 may then be applied to perform quantization/entropy-coding to determine the required bit rate for particular values of a, such that a is adjusted to meet requirements such as a minimum bit rate or, alternatively, a constant bit rate. Other applications of the optimization goal may relate to minimizing the use of encoder or decoder resources. If such an optimization objective is implemented, information regarding the resources required for a particular optimization may be available at optimizer 207. Additionally, a combination of these optimization objectives or other optimization objectives may be implemented to control optimizer 207, which computes the predictive information 206. While the encoder calculator in Figure 2 can be implemented in various ways, a first example implementation in which an explicit combination rule is implemented in combiner 2031 is shown in Figure 3a. An alternative example implementation using a matrix calculator 2039 is shown in Figure 3b. Combiner 2031 in Figure 3a can be implemented to implement the combination rule shown in Figure 3c, which is a well-known example of a mid/side encoding rule where a weighting factor of 0.5 is applied to all branches. However, depending on the application, other weighting factors may be applied, or it is possible to apply no weighting factor at all. It should also be noted that other combination rules, such as other linear combination rules or nonlinear combination rules, can be applied, as long as a corresponding inverse combination rule is available that can be applied in the decoder combiner 1162 shown in Figure 4a, which implements a combination rule that is opposite to the combination rule implemented by the encoder. Any reversible prediction can be used, as any existing error remains in the transmitted residual signal, since the prediction process performed by the optimizer 207 in combination with the effect on the waveform is a waveform-protecting process. The combiner 2031 outputs the first combination signal 204 and a second combination signal 2032. The first combination signal is input to a predictor 2033, while the second combination signal 2032 is input to the residual calculator 2034. The predictor 2033 calculates a prediction signal 2035, which is finally combined with the second combination signal 2032 to obtain a residual signal 205. The combiner 2031 is specifically configured to combine two channel signals 201 and 202 of the multi-channel audio signal in different ways to obtain the first combination signal 204 and the second combination signal 2032, the two different ways being shown in an example in Figure 3C. The predictor 2033 is configured to apply the prediction information to the first combination signal 204 or a signal derived from the first combination signal to obtain the prediction signal 2035. The signal derived from the combination signal can be derived by any linear or nonlinear operation; in this case, real-to-virtual/virtual-to-real transformation is preferred, which can be implemented using a linear filter such as a FIR (Finite Impulse Response) filter that performs weighted addition of certain values. The residual calculator 2034 in Figure 3a can also perform a subtraction operation such that the prediction signal is subtracted from the second combination signal. However, other operations can also be performed in the residual calculator. In parallel, the combination signal calculator 1161 in Fig. 4a may perform a summation operation in which the decoded residual signal 114 and the prediction signal 1163 are summed to obtain the second combination signal 1165. Fig. 5a shows an implementation of a vocoder. Compared to the vocoder shown in Fig. 3a, the first channel signal 201 is a spectral representation of a time domain first channel signal 55a. Correspondingly, the second channel signal 202 is a spectral representation of a time domain channel signal 55b. The conversion from the time domain to the spectral representation is performed by a time/frequency converter 50 for the first channel signal and another time/frequency signal 51 for the second channel signal. Spectral transformers (50, 51) are preferably implemented as real-valued transformers, but this is not mandatory. The transformation algorithm can be a discrete cosine transform, an FFT (Fast Fourier Transform) transform using only one real part, an MDCT transform, or any other transform that provides real-valued spectral values. Alternatively, both transforms can be implemented as a virtual transform, such as a DST (Discrete Sine Transform), MDST, FFT, or similar transform using only one imaginary part and discarding the real part. Any other transform that provides only imaginary values can also be implemented. One purpose of using a pure real-valued transform or a pure imaginary transform is to increase computational complexity, since for each spectral value, a single value, such as magnitude, must be processed, or alternatively, a phase or imaginary part. Unlike a purely complex transform such as an FFT, two values, one real part and one imaginary part for each spectral line, may need to be processed, with a computational complexity increase of at least a factor of 2. Another reason for using a real-valued transform here is that this type of transform is critically sampled, thus providing a convenient (and commonly used) domain for signal quantization and entropy coding (the standard "perceptual audio coding" paradigm implemented in "MP3," "AAC," or similar audio coding systems). Figure 5a also shows a residual calculator 2034 used as an adder that receives the side signal on its "plus" input and receives the prediction signal output by the predictor 2033 on its "minus" input. In addition, Figure 5a shows the case where the predictive control information is routed from the optimizer to the multiplexer 212, which outputs a multiplexed bit stream representing the encoded multi-channel audio signal. Specifically, the prediction process is performed such that the side signal is predicted from the center signal, as shown by the Equations on the right of Figure 5a. Preferably, the predictive control information 206 is a factor, as shown on the right of Figure 3b. In an example where the predictive control information includes a real part, such as a magnitude of a complex value a or a real part of a complex value a, and this part corresponds to a non-zero factor, a significant coding gain can be achieved when the center signal and the side signal are similar to each other due to their waveform structures but have different amplitudes. In the case where the predictive control information includes only a second part, which can be the imaginary part of a complex value factor or the phase information of a complex value factor, and where the imaginary part or the phase information is non-zero, the present invention achieves a significant coding gain for signals that are phase shifted to each other by a value other than 0° or 180° and have similar waveform characteristics and similar amplitude relationships, as well as phase shift. A predictive control information is preferably complex-valued. This allows significant coding gains to be achieved for signals that differ in amplitude and are phase-shifted. In a case where time/frequency transforms yield complex spectra, the process 2034 will be a complex process in which the real part of the predictive control information is applied to the real part of the complex spectrum M, and the imaginary part of the complex prediction information is applied to the imaginary part of the complex spectrum. Then, in the adder 2034, the results of this prediction process are a predicted real spectrum and a predicted imaginary spectrum. The predicted real spectrum is subtracted (bandwise) from the real spectrum of the side signal S, and the predicted imaginary spectrum is subtracted from the imaginary part of the S spectrum to obtain a complex residual spectrum D. Time domain signals (L and R) are real-valued signals, but frequency domain signals can be real-valued or complex-valued. Frequency domain signals are real-valued. If the frequency domain signals are complex, the transform is also a real-valued transform. This shows that the input time-to-frequency and output frequency-to-time transforms are real-valued, but frequency domain signals can be, for example, complex-valued QME' domain signals. Figure 5b shows an audio decoder corresponding to the audio coder shown in Figure 5a. Similar elements have similar reference numbers with respect to the audio decoder in Figure 1. The bitstream output by the bitstream multiplexer 212 in Figure 5a is input to a bitstream demultiplexer 102 in Figure 5b. The bitstream demultiplexer 102 multiplexes the bitstream into a downmix signal M and a residual signal D. The downmix signal M is input to dequantizer 110a. The residual signal D is input to another dequantizer 110b. In addition, the bitstream demultiplexer 102 multiplexes the predictive control information 108 from the bitstream and inputs it to predictor 1160. Predictor 1160 extracts a predicted side signal d' M, and combiner 1161 combines the predicted side signal and the residual signal output via dequantizer 110b to obtain the reconstructed side signal S in the final stage. The signal is then input to combiner 1162, which performs, for example, a sum/difference processing, as shown in Figure 4c, with respect to mid/side coding. Block 1162 specifically performs a (reverse) mid/side decoding to obtain a frequency domain representation of the left channel and a frequency domain representation of the right channel. The frequency domain representation is then converted to a time domain representation by means of corresponding frequency/time converters 52 and 53. Depending on the system implementation, the frequency/time converters 52, 53 are real-valued frequency/time converters if the frequency domain representation is a real-valued representation, or complex-valued frequency/time converters if the frequency domain representation is a complex-valued representation. However, for increased efficiency, it is preferred to perform a real-valued conversion, as in another embodiment shown for the encoder in Figure 6a in accordance with an embodiment of the present invention and for the decoder in Figure 6b in accordance with an embodiment of the present invention. The real-valued transforms 50 and 51 are implemented with an MDCT. Furthermore, the predictive information is calculated as a complex value having a real part and an imaginary part. Since both the M, 8 spectra are real-valued spectra and therefore the spectrum has no imaginary part, there is a real-to-virtual converter 2070 that calculates a virtual spectrum estimated from the real-valued spectrum of the M signal. This real-to-virtual converter 2070 is part of optimizer 207, and the virtual spectrum 600 estimated by block 2070 is input to optimizer stage 2071 along with the real M spectrum to calculate the predictive information 206, which now has a real-valued factor specified in 2073 and an imaginary factor specified in 2074. In this step, in accordance with the embodiment in question, the real-valued spectrum of the first M combination signal is multiplied by the real part (dR, 2073) to obtain the prediction signal, which is then subtracted from the real-valued side spectrum. Furthermore, the virtual spectrum 600 is multiplied by the virtual part (di) shown at 2074 to obtain the additional prediction signal; this prediction signal is then subtracted from the real-valued side spectrum shown at 2034b. Next, the D prediction residual signal is quantized in the quantizer 209b, and the real-valued M spectrum is quantized in the quantized/coded block 209a. Furthermore, it is preferable to quantize and encode the prediction information a in the quantizer/entropy encoder 2072 to obtain the encoded complex value a, which is routed to the bitstream multiplexer 212 in Figure 5 and input into the bitstream as prediction information in the final stage. Regarding the location of the quantization/coding (Q/C) module for a, it should be noted that the multipliers 2073 and 2074 preferably use the same (quantized) a as that which will be used in the decoder. Therefore, one could proceed directly to output 2071, or one could even consider that the quantization of a is already considered in the optimization process at 2071. Although a complex spectrum can be calculated at the encoder, since all the information is available, it is preferable for the decoder to perform the real-to-complex transformation at block 2070 to produce conditions similar to those shown in Figure 6b. The decoder receives a real-valued coded spectrum of the first combination signal and a real-valued spectral representation of the encoded residual signal. In addition, a complex prediction information encoded at 108 is obtained; entropy decoding and dequantization are performed to obtain the real part dR, shown at 1160b, and the imaginary part dI, shown at 1160c. The intermediate signals extracted by the weighting elements 1160b and 1160c are added to the decoded and dequantized prediction residual signal. Specifically, the spectral values input to weighter 1160c, using the imaginary part of the complex prediction factor as weighting factor, are derived from the real-valued spectrum M by means of the real-to-virtual converter 1160a, which is preferably implemented as in block 2070 for the encoder side of Figure 6a. On the decoder side, unlike the encoder side, there is no complex-valued representation of the mid-signal and side-signal. This is because, due to bit rate and complexity reasons, only the encoded real-valued spectra are transmitted from the encoder to the decoder. The real-to-virtual converter 1160a of Figure 6a may be implemented as published in or patent. Alternatively, any other implementation known from the relevant art may be implemented; A preferred embodiment in this regard is described with reference to Figures 10a, 10b. Specifically, as shown in Figure 10a, the virtual-to-virtual converter 1160a includes a spectral frame selector 1000 connected to a virtual spectrum calculator 1001. The spectral frame selector 1000 receives an indication of the current frame i at input 1002 and, depending on the implementation, control information at a control input 1003. For example, if the indication on line 1002 indicates that a virtual spectrum is to be calculated for the current frame i and the control information 1003 indicates that only the current frame is to be used for that calculation, the spectral frame selector 1000 selects only the current frame i and sends this information to the virtual spectrum calculator. The virtual spectrum calculator then uses only the spectral lines of the current frame i to perform a weighted combination of the lines located in the current frame (block 1008) that are close in frequency to or around the current spectral line k for which a virtual line is to be calculated, as shown at 1004 in Figure 10b. However, when the spectral frame selector 1000 receives control information indicating that the previous frame i-1 and the next frame i+1 are also to be used for computing the virtual spectrum, the virtual spectrum calculator additionally receives the values from frames i-l and i+l and performs a weighted combination in the corresponding frames, as shown at 1005 for frame i-l and at 1006 for frame i+1. The results of the weighting operations are combined with a weighted combination in block 1007 to obtain a virtual line k for frame f in the final stage; this is then multiplied by the imaginary part of the prediction information in element 1160c to obtain the prediction signal for that line, which is then added to the corresponding line of the middle signal in the adder 1161b for the decoder. The same operation is performed in the encoder, but a subtraction operation is performed in element 2034b. It should be noted that the control information 1003 may also specify using more than two surrounding frames, or using only the current frame and exactly one or more of the previous frames, for example, without using "ahead" frames to reduce systematic delay. It should also be noted that a stepwise weighted combination can also be implemented, as shown in Figure 10b, where, in a first step, the lines from a frame are combined, and then the results of these frame-by-frame combination operations are automatically combined. What is meant by "other order" here is that, in a first step, the valid k-frequency lines from a number of adjacent frames, specified by control information 103, are combined with a weighted combination. Depending on the number of adjacent lines to be used to estimate the virtual line, this weighted combination is applied for k, k-1, k-2, k+1, k+2, etc. Then, this step is held to obtain the virtual k line for frame fi. The weights are preferably set to values between -1 and 1, and a direct FIR or IIR (Infinite Impulse Response) filter can be applied in combination, performing linear combination of spectral lines or spectral signals from different frequencies and different frames. As indicated in Figures 6a and 6b, the preferred transform algorithm is the MDCT transform algorithm, which is applied forward in elements 0054 and 51 of Figure 6a, and backward in elements 52 and 53, following the combination operation in combiner 1162 operating in the spectral domain. Figure 8a shows a more detailed implementation of block 50 or 51. Specifically, a sequence of time domain audio samples is input to an analysis windower 500, which performs a windowing operation using an analysis window, specifically performing this operation frame by frame within a frame, but using a 50% overlap or overlap. The analysis windower results, i.e., sequences of frames of windowed samples, are input to an MDCT transform block 501, which extracts sequences of real-valued MDCT frames, where they are subjected to aliasing. For example, the analysis windower applies analysis windows of 2048 samples in length. Next, the MDCT transform block 501 extracts MDCT spectra with 1024 real spectral lines or MDCT values. Preferably, the analysis windower 500 and/or the MDCT converter 501 may be controlled by a window length or transform length control 502, such that the window length/transform length is reduced for transition portions in the signal to achieve better coding results. Figure 8 shows the inverse MDCT operation performed in blocks 0056 and 53. For example, block 52 includes block 250 for performing a frame-by-frame inverse MDCT transformation. For example, if one frame of MDCT values has 1024 values, the output of this MDCT inverse transform would contain 2048 aliased time samples. Such a frame is sent to a synthesis windower 521, which applies a synthesis window to that frame of 2048 samples. The windowed frame is then routed to an overlap/summing processor 522, which applies, for example, a 50% overlap between the two subsequent frames, and then performs sample-by-sample addition of the 2048-sample block, resulting in a final sample of 1024 new non-aliased output signal samples. Again, as noted in 523, it is preferable to implement window/transform length control, for example, using information conveyed in the side information of the encoded multi-channel signal. Prediction values can be calculated for each individual spectral line in an MDCT spectrum. However, it has been found that this is not necessary and that a significant amount of side information can be recovered by computing the prediction information band-wise. In other words, a spectral converter 50, which is an MDCT processor as described in Figure 8a, provides a high-frequency resolution spectrum having certain spectral lines as shown in Figure 9b. This high-frequency resolution spectrum is used by a spectral line selector 90, which provides a spectrum with resolutions B1, B2, B3. This low-frequency resolution spectrum is routed to the optimizer 207 to calculate the predictive information, such that the predictive information is calculated only for each band, not for each spectral line. To this end, the optimizer 207 takes the spectral lines per band and calculates the optimization process based on the assumption that the same d value is used for each spectral line in the band. Preferably, the bands are psychoacoustically shaped so that their bandwidth increases from low to high frequencies, as shown in Figure 9b. Alternatively, although not as desirable as bandwidth expansion, it is also possible to use equally sized frequency bands, where each frequency band has at least two or typically many more frequency lines, for example, at least 30. Generally, for a spectrum with 1024 spectral lines, fewer than 30 complex a values are calculated, and preferably more than 5. For spectra with fewer than 1024 spectral lines (e.g., 128 lines), fewer frequency bands (e.g., 6) are preferably used for a. MDCT spectra are not required for calculating a values. Alternatively, a filter bank with a frequency resolution similar to the resolution required to calculate the a values can be used. When increasing frequency bands are to be applied, this filter bank must have a variable bandwidth. However, if a constant bandwidth from low to high frequencies is sufficient, a conventional filter bank with equal-width subbands can be used. Depending on the application, the signature of the a value indicated in Figure 3b or 4b can be inverted. However, for consistency, this inversion should be used both at the encoder and the decoder. Figure 5a shows a general view of the encoder, compared to Figure 6a; where item 2033 is a predictor controlled by means of predictive control information 206, specified in item 207, which is incorporated into the bit stream as side information. In Figure 5a, a generalized time/frequency transform is used in place of the MDCT used in blocks 50, 51 in Figure 6. As previously mentioned, Figure 6a is an encoder process corresponding to the decoder process in Figure 6b, where L represents the left channel signal; R represents the right channel signal; M represents the middle signal or downmix signal; S represents the side signal; and D represents the residual signal. Alternatively, L may be referred to as the first channel signal 201; R represents the second channel signal 202; M represents the first combination signal 204; and δ may be referred to as the second combination signal 2032. Preferably, modules 2070 in the encoder and 1160a in the decoder should be precisely matched to ensure correct waveform encoding. This also applies preferably to the case where these modules use some approach such as cut-off filters, or where the output consists of only one or two MDCT frames (i.e., the current MDCT frame on line 60), the previous MDCT frame on line 61, and the next MDCT frame on line 62, rather than three MDCT frames. In addition, it is preferred that module 2070 in the encoder of Figure 6a use the non-quantized MDCT spectrum M as input, while module 1160a in the decoder has only the quantized MDCT spectrum as input. Alternatively, it is possible to use an implementation in which the encoder uses quantized MDCT coefficients as input to module 2070. However, from a perceptual perspective, using the unquantized MDCT spectrum as input to module 2070 is a preferred approach. Some aspects of the embodiments of the present invention will be described in more detail later. Standard parametric stereo coding relies on the ability of the oversampled complex (mixed) QMF domain to allow perceptually oriented signal processing that varies in time and frequency without introducing aliasing artifacts. However, in the case of downmix/backmix coding (as used at the high bit rates considered here), the resulting combined stereo encoder functions as a waveform encoder. This allows processing in a critically sampled region, such as the MDCT region, because the waveform coding paradigm (MDCT - modified discrete cosine transform) ensures that the aliasing removal property of the processing chain is sufficiently well preserved. However, to benefit from the coding efficiency achievable with stereo signals with inter-channel time or phase differences via a complex-valued prediction coefficient d, a complex-valued frequency domain representation of the downmix signal (DMX) is required as input to the complex-valued upmix matrix. This can be achieved by using an MDST transform in addition to the MDCT transform for the DMX signal. The MDST spectrum can be calculated (exactly or approximately) from the MDCT spectrum. Furthermore, the parameterization of the upmix matrix can be simplified by passing the complex prediction coefficient d instead of the MPS (MPEG Surround) parameters. Therefore, instead of three parameters (ICC (Inter-Channel Coherence), CLD (Channel Level Difference), and IPD (Inter-Channel Phase Difference)), only two parameters (the real and imaginary parts of d) are transmitted. This is possible due to the redundancy of the MPS parameterization in the case of downmix/residual coding. The MPS parameterization includes information on the relative decorrelation amount to be added to the decoder (i.e., the energy ratio between the RES (Residual) and DMX (Downmix) signals), and this information is more than necessary when actual DMX and RES signals are transmitted. For the same reason, the gain coefficient (g), shown in the upmix matrix above, is no longer used in the case of downmix/residual coding. Therefore, for complex predictive downmix/residual coding, the upmix matrix is now given by rL _ 1 ~ a 1 [DMX] Compared to Equation 1169 in Figure 4b, in this equation the alpha sign is inverted; DMX = M and RES = DT. Therefore, this implementation is an alternative implementation/writing based on Figure 4b. There are two options for calculating the predictive residual signal in the encoder. One is to use the quantized MDCT spectral values of the downmix. Since the encoder and decoder use the same values to generate the prediction, this option results in the same quantization error distribution as in M/S coding. The other option is to use the non-quantized MDCT spectral values. This means that the encoder and decoder do not use the same data to generate the prediction, which allows the coding error to be spatially redistributed according to the instantaneous masking properties of the signal, at the expense of a somewhat reduced coding gain. It is preferable to directly calculate the MDST spectrum in the frequency domain using a two-dimensional FIR filter for three adjacent MDCT frames described. The latter can be thought of as a "real-to-virtual" (R2I) transformation. The complexity of the frequency domain calculation of the MDST can be reduced in several ways, i.e., only an approximation of the MDST spectrum can be calculated: - Limiting the number of FIR filter taps - Estimating the MDST from only the current MDCT frame. Waveform coding properties are not affected as long as the same approximation is used in the encoder and decoder. However, these approximations to the MDST spectrum may result in a reduction in the coding gain achieved with complex prediction. If the underlying MDCT encoder supports window-shaped transitions, the coefficients of the two-dimensional FIR filter used to calculate the MDST spectrum must be adapted to the actual window shapes. The filter coefficients applied to the MDCT spectrum of the current frame depend on the full window, meaning a set of coefficients is required for each window type and each window transition. The filter coefficients applied to the MDCT spectrum of the previous/next frame depend only on the window that overlaps half of the current frame, meaning they only require a set of coefficients for each window type (no additional coefficients for each transition). If the underlying MDCT encoder uses transform-length transitions, a more complex situation arises for transitions between different transform lengths, including the previous and/or next MDCT frame in the approximation. Two-dimensional filtering is more complex in this case due to the different numbers of MDCT coefficients in the current and previous/next frames. To address the increased numerical and structural complexity, the previous/next frame can be omitted from the filtering process during transform length transitions, at the expense of decreasing approximation accuracy for specific frames. Furthermore, special attention should be paid to the lowest and highest parts of the MDST spectrum (near DC and fs/2), where the surrounding MDCT coefficients are less than those required for FIR filtering. Here, the filtering process must be adapted to accurately calculate the MDST spectrum. This can be achieved by symmetrically stretching/expanding the MDCT spectrum for omitted coefficients (according to the periodicity of the spectra of time-discontinuous signals) or by appropriately adapting the filter coefficients. These special cases can be handled in a simplified manner, at the expense of reduced accuracy near the boundaries of the MDST spectrum. Computing the full MDST spectrum from the transmitted MDCT spectra at the decoder reduces decoder latency by one frame (assuming 1024 samples here). Additional latency can be avoided by using an approximation of the MDST spectrum that does not require the MDCT spectrum of the next frame as input. The advantages of MDCT-based combined stereo coding over QMF-based combined stereo coding are listed below: - Only a small increase in computational complexity (when SBR is not used). - Scales up to perfect reconstruction when the MDCT spectra are not quantized, which is not the case with QMF-based combined stereo coding. - Natural expansion of M/S coding and loudness stereo coding. A cleaner architecture that simplifies encoder matching, as stereo signal processing and quantization/coding can be tightly coupled. It should be noted here that in QMF-based combined stereo coding, MPEG Surround frames and MDCT frames are not aligned, and the scale factor bands do not map to the parameter bands. - Efficient encoding of stereo parameters, as only two parameters (complex d) need to be transmitted, instead of three as in MPEG Surround (ICC, CLD, IPD). If the MDST spectrum is calculated as an approximation (without using the next frame), no additional decoder delay is introduced. The important features of an implementation can be summarized as follows: a) MDST spectra are calculated from the current, previous, and next MDCT spectra through a two-dimensional FIR filter. Various complexity/quality trade-offs are possible for the MDST calculation (approximation) by reducing the number of FIR filter taps and/or the number of MDCT frames used. If a contiguous frame is not available due to a frame loss during the transmission or transform length traversal, that frame is excluded from the MDST estimation (exclusion). In the transform length traversal, an exclusion signal is signaled in the bitstream. Instead of MICC, CLD, and IPD, only two parameters (i.e., the real and imaginary parts of the complex prediction coefficient d) are transmitted. The real and imaginary parts of A are processed independently, with a limited range. If a particular parameter (real or imaginary part of d) is not used in a given frame, its signal is signaled in the bitstream, and the irrelevant parameter is not transmitted. The parameters are encoded either time- or frequency-differentially, and finally, Huffman coding is applied using the scale factor codebook. The prediction coefficients are updated in the scale factor band every second, resulting in a frequency resolution similar to that of MPEG Environment. This quantization and coding scheme results in an average bit rate of approximately 2 kb/s for stereo side information in a typical configuration with a target bit rate of 96 kb/s. Preferred additional or alternative implementation details include the following: non-differential (PCM) or differential (DPCM) coding, which operates on a per-frame or per-stream basis, signaled by a corresponding bit; time or frequency differential coding is possible for DPCM coding. This can also be signaled using a one-bit signal. d) instead of reusing a predefined codebook such as the AAC (Advanced Audio Coding) scale factor book, a dedicated invariant or signal-adaptive codebook can be used to encode the d parameter values, or a fixed-length (e.g. 4-bit) unsigned or two's complement codeword can be switched. e) the range of d parameter values, as well as the parameter quantization step size, can be arbitrarily selected and optimized for the signal properties at hand. üThe number and spectral and/or temporal width of the active parameter bands can be arbitrarily selected and optimized for specific signal characteristics. In particular, band structuring can be done on a per-frame or per-stream basis. g) In addition to or as an alternative to the mechanisms described in a) above, it can be explicitly signaled that only the MDCT spectrum of the current frame is used to calculate the MDST spectrum approximation via bits per frame in the bitstream, i.e., adjacent MDCT frames are not taken into account. The embodiments relate to the inventive system for combined stereo coding in the MDCT domain. This allows to utilize the advantages of combined stereo coding in the MPEG USAC system even at higher bit rates without a significant increase in the computational complexity introduced by the QMF-based approach (SBR is not used here). The following two lists describe the preferred construction aspects described previously, which can be used alternatively or in addition to other aspects: 1a) general concept: complex prediction of side MDCT from middle MDCT and MDST; 1b) calculate/approximate MDST from MDCT in the frequency domain using 1 or more frames (leading to a 3-frame delay); 1c) filter truncation to reduce computational complexity (with the l-frame reduced to 2-tap, i.e. [-101]); ld) proper handling of DC and fs/2; le) proper handling of window shape transition; lf) use previous/next frame if it has a different transform size; lg) prediction based on unquantized or quantized MDCT coefficients in the encoder; Za) directly quantize and encode the real and imaginary part of the complex prediction coefficient (i.e. no MPEG Environment parameterization); 2b) use uniform quantizer for this (e.g. step 2c) use appropriate frequency resolution for the prediction coefficients (e.g. 1 coefficient for 2 Scale Factor Bands): 2d) cheap signaling if all prediction coefficients are real; 2e) clear bit per frame to start the l-frame RZI process. In one embodiment, the encoder further comprises a spectral converter (50, 51) for converting the time domain representation of the two channel signals into a spectral representation of the two channel signals having subband signals for said two channels, wherein the combiner (2031), predictor (2033) and residual signal calculator (2034) are configured to process each subband signal separately to obtain the first combined signal and the residual signal for multiple subbands; wherein the output interface (212) is configured to combine the first combined signal encoded for multiple subbands and the encoded residual signal. While some aspects are defined in the context of a device, it is clear that these aspects represent the definition of the corresponding method, where a block or device corresponds to a method step or a feature of the method step. Similarly, aspects described in the context of a method step also include the description of a corresponding block or element or a feature of the corresponding device. In one example, a smooth processing of window shape transition is implemented. Referring to Figure 10a, window shape information 109 can be entered into the virtual spectrum calculator 1001. Specifically, the virtual spectrum calculator, which performs the real-to-virtual transformation of the MDCT spectrum (Figure 1001), can be implemented as a FIR or IIR filter. The FIR or IIR coefficients in this real-to-virtual module depend on the window shape of the left half and the right half of the current frame. This window shape can be different for a sine window or a Kaiser Bessel Derived (KBD) window and can be a long window, a start window, a stop window, a stop-start window or a short window, depending on the respective window sequence configuration. The real-to-virtual module can include a two-dimensional FIR filter; where the first dimension is a time dimension in which two consecutive MDCT frames are input into the FIR filter, and the second dimension is a frequency dimension in which the frequency coefficients of a frame are input. The table below shows the different window shapes and the left half of the window. Different MDST filter coefficients for a valid window sequence are given for different implementations of the right and left halves. Table A - MDST Filter Parameters for the Current Window Current Window Left Half: Sine Shape RightLeft Half: KBD Shape Right Sequence Half: Sine Shape Half: KBD Shape Current Window Left Half: Sine Shape RightLeft Half: KBD Shape Right Sequence Half: KBD Shape Half: Sine Shape (continued) Left Half: Sine Shape RightLeft Half: KBD Shape Right Current Window Half: KBD Shape Half: Sine Shape In addition, when the previous window is used to calculate the MDST spectrum from the MDCT spectrum, the information (109) for the previous window is used to calculate the MDST spectrum from the corresponding MDST Filter for the previous window. The coefficients are given in the table below. Table B - MDST Filter Parameters for the Previous Window Current Window Sequence Current WindowLeft Half of the Current Window: SineLeft Half: KBD Consequently, depending on the window shape information (109), the virtual spectrum calculator (1001) in Figure 10a can be adapted by applying different groups of filter coefficients. The window shape information used on the decoder side is calculated on the encoder side and transmitted as side information with the encoder output signal. On the decoder side, the window shape information (109) is extracted from the bit stream by means of a bitstream demultiplexer (e.g., 102 in Figure 5b) and the virtual spectrum is extracted from the bit stream by means of a bitstream demultiplexer (e.g., 102 in Figure 5b) as shown in Figure 10a. The window shape information (109) signals that the previous frame has a different transform size. If it does, it is preferred not to use the previous frame to calculate the virtual spectrum from the real-valued spectrum. The same applies when the window shape information 109 is interpreted and it is found that the next frame has a different transform size. In this case, the next frame is not used to calculate the virtual spectrum from the real-valued spectrum. In such a case, for example, when the previous frame has a different transform size than the current frame or when the next frame has a different transform size than the current frame, only the spectral values of the current frame, i.e., the current window, are used to estimate the virtual spectrum. The prediction in the encoder is based on unquantized or quantized frequency coefficients, such as the MDCT coefficients. When the prediction, shown by element 2033 in Figure 3a, is based on unquantized data, for example, the calculator 2034 preferentially operates on the unquantized data as well, and the calculator output signal is, i.e., the residual signal 205 is quantized before entropy coding and transmitted to a decoder. In an alternative embodiment, it is preferred that the prediction be based on quantized MDCT coefficients. In this case, quantization can occur before the combiner 2031 in Figure 3a, so that a first quantized channel and a second quantized channel are the basis for calculating the residual signal. Alternatively, the quantization process can occur after the combiner 2031, so that the first combination signal and the second combination signal are calculated in a non-quantized form and quantized before calculating the residual signal. Alternatively, the predictor 2033 can operate in the non-quantized region*, and the prediction signal 2035 is quantized before being input to the residual calculator. In this case, the second combination signal 2032, another signal input to the residual calculator 2034, is also input to the residual calculator. It is beneficial to quantize the residual signal 1070 in Figure 6a before calculating it, which can be implemented within the predictor 2033 in Figure 3a and operates with the same quantized data available at the decoder. This ensures that the MDST spectrum estimated at the encoder for the purpose of performing the calculation of the residual signal is exactly the same as the MDST spectrum at the decoder side used to perform the inverse prediction, i.e., to calculate the side signal from the residual signal. For this purpose, the first combination signal, such as the M signal on line 204 in Figure 6a, is quantized before being input to block 2070. Then, the MDST spectrum calculated using the quantized MDCT spectrum of the current frame and, depending on the control information, the quantized MDCT spectrum of the previous or next frame are input to the multiplier 2074; in this case, the output of the multiplier 2074 in Figure a is also will be an unquantized spectrum. This unquantized spectrum will be extracted from the spectrum input to the adder 2034b and finally quantized in the quantizer 209b. In one embodiment, the real part and the imaginary part of the complex prediction coefficient per prediction band are quantized and encoded directly, i.e., without, for example, MPEG Environment parameterization. The quantization process can be performed using a uniform quantizer with, for example, a 0.1 step size. This means that no logarithmic quantization step size and the like are applied, but any linear step size is applied. In one embodiment, the value range of the real part and the imaginary part of the complex prediction coefficient varies from -3 to 3, which means that 60 or 61 quantization steps for the real part and the imaginary part of the complex prediction coefficient, depending on the implementation details. Preferably, the real part applied in the multiplier 2073 in Figure 6a and the imaginary part 2074 applied in Figure 6a are also quantized before being applied, so that the same prediction value is used at the encoder side as at the decoder side. This ensures that the prediction residual signal covers not only the introduced quantization error but also all errors that may occur when a non-quantized prediction coefficient is applied at the encoder side while a quantized prediction coefficient is applied at the decoder side. Preferably, the quantization process is applied in such a way that the same state and the same signals are present at both the encoder side and the decoder side as much as possible. Therefore, it is preferred that the quantization of the input from the real to the virtual calculator 2070 is performed using the same quantization as that applied at the quantizer 209a. Also, To perform the multiplications in items 2073 and 2074, it is preferable to quantize the real part and the imaginary part of the prediction coefficient. This quantization operation is the same as that implemented in quantizer 2072. In addition, the side signal extracted by block 2031 in Figure 6a can also be quantized before the adders 2034a and 2034b. However, it is not problematic to perform the quantization performed by quantizer 209b after the addition operation, where the addition performed by the adders in question is performed with an unquantized side signal. In another example, cheap signaling is applied if all prediction coefficients are real. There may be a situation where all prediction coefficients are calculated as real for a particular frame, i.e., for the same time portion of the audio signal. Such a situation can be the case for the full mid-signal or full This can happen when there is no or very little phase shift from one side signal to the other. To reduce the amount of bits used, this is indicated by a single real indicator. In this case, the imaginary part of the prediction coefficient does not need to be signaled in the bitstream with a codeword representing a zero value. On the decoder side, the bitstream decoder interface, for example, the bitstream demultiplexer, will interpret this new indicator and will not search for codewords for the imaginary part, but instead will assume that all bits are in the corresponding part of the bitstream for the real-valued prediction coefficients. Furthermore, when the predictor 2033 receives an indication that all imaginary parts of the prediction coefficients in the frame are zero, it will not need to calculate an MDST spectrum, or an imaginary spectrum in general, from the real-valued MDCT spectrum. Therefore, element 1160a in the decoder in Figure 6b will be deactivated. and inverse prediction will be performed using only the real-valued prediction coefficient implemented in multiplier 1160b in Figure 6b. The same applies to the encoder side, where element 2070 will be deactivated and prediction will be performed using only multiplier 2073. This side information is preferably used as an additional bit per frame, in which case the decoder will read this bit frame by frame to decide whether the real-to-virtual converter 1160a will be active for a frame. Therefore, providing this information results in a reduction of the bit stream size due to more efficient signaling of all virtual parts of the prediction coefficient that are zero for a frame, and additionally, it provides less complexity in the decoder for such a frame, which will quickly lead to a reduction in the battery consumption of such a processor implemented in, for example, a battery-powered mobile device. The complex stereo prediction according to preferred embodiments of the present invention is a tool for efficient coding of channel pairs with level and/or phase differences between channels. Using the complex valued parameter a, the left and right channels are reconstructed with the following matrix. Here, dmxm" denotes the MDST corresponding to the MDCT of the downmix channels (dmxmg). l' 1+aRe alin _i i The above equation is another representation of an equation for a prediction/combination process separated and combined in terms of the real part and the imaginary part of a, where the calculation of the predicted signal S is not required. The following data items are preferably used for this tool: cplx_pred_all 0: Some bands use L/R coding, the signal for which is given by cplx_pred_used[] 1: All bands use complex stereo prediction (continued) cplat_pred;used[g][sfb] (after matching from prediction bands) one-bit sign per window group (g) and scale factor band (sfb) indicates O: complex prediction is not used, L/R coding is used 1: complex prediction is used complex_coef 0: for all prediction bands QH1= O 1: for all prediction bands ahi is transmitted use_prev_frame O: use only current frame for MDST estimation 1: use current and previous frame for MDST estimation delta_code_time O: Frequency differential coding of prediction coefficients l: Time differential coding of prediction coefficients hcod;alpha_g_re d Re Huffman code hcod;alpha_g_im d Im Huffman code These data items are calculated in an encoder for a multichannel audio signal The elements are extracted from the side information at the decoder side using a side information extractor and are used to control the decoder calculator to perform a corresponding operation. Complex stereo prediction requires the downmix MDCT spectrum of the current channel pair; in the case complex_coef == 1, the downmix MDST spectrum of the current channel pair, i.e., the virtual counterpart of the MDCT spectrum. The downmix MDST estimation is calculated from the MDCT downmix of the current frame; in the case use_prev_frame == ]., the MDCT downmix of the previous frame belonging to window group (g) and group window (b) is obtained from the reconstructed left and right spectra of that frame. In the calculation of the downmix MDST estimation, the double-valued MDCT transform based on window_sequence, as well as filter_coefs and filter_coefs_prev is used. is used, which are arrays containing the filter kernels and derived according to the previous tables. For all prediction coefficients (in time or frequency), the previous value is encoded using a Huffman codebook. When cplx_pred_used = 0, the prediction coefficients are not transmitted for the prediction bands. The prediction coefficients are not transmitted for the prediction bands for which cplx_pred_used = 0. The inverse quantized prediction coefficients alpha_re and alpha_im are given by: alpha_re = alpha___q_re*0.1 alpha_im = alpha_q`im*0.1 It should be noted that the present invention is applicable not only to stereo signals, i.e. multi-channel signals with only two channels, but also to two channels of multi-channel signals with three or more channels, such as 5.1 or 7.1 signals. Depending on particular application requirements, embodiments of the invention may be implemented in hardware or software. The implementation may be implemented in a digital storage medium such as a floppy disk, DVD, CD, ROM, PROM, EPROM, EEPROM, or FLASH memory, which stores electronically readable control signals that are interoperable (or capable of interoperating) with a programmable computer system to enable the method to be performed. Some embodiments of the invention include a carrier carrying permanent or tangible data with electronically readable control signals that are interoperable with a programmable computer system to enable one of the methods described herein. In general, embodiments of the present invention may be implemented as a computer program product with program code that executes to perform one of the methods when the computer program product is running on a computer. The program code may be stored, for example, on a machine-readable carrier. Other embodiments have the computer program for performing one of the methods described herein stored on the machine-readable carrier. In other words, one embodiment of the inventive step is therefore a computer program having program code for performing one of the methods described herein when the computer program is running on a computer. Another embodiment of the inventive methods is therefore a data carrier (or a digital storage medium, or a computer-readable medium) having the computer program recorded thereon for performing one of the methods described herein. A further embodiment of the inventive method is therefore a data stream or a sequence of signals representing the computer program for performing one of the methods described herein. The data stream or sequence of signals may be configured to be transmitted via a data communications connection, such as the Internet, for example. Another embodiment includes a processing means, such as a computer or a programmable logic device, configured or adapted to perform one of the methods described herein. Another embodiment includes a computer loaded with a computer program to perform one of the methods described herein. In some embodiments, a programmable logic device (e.g., a field programmable gate array) may be used to perform some or all of the functionality of the methods described herein. In some embodiments, the field programmable gate array may cooperate with a microprocessor to perform one of the methods described herein. The methods may generally be implemented by any hardware device, preferably any hardware device. The embodiments described above are merely illustrative of the principles of the present invention. It will be apparent to those skilled in the art that various modifications and variations can be made to the embodiments and details described herein. Therefore, the intention is to be limited only by the scope of the attached patent claims and not by the specific details presented by way of description and explanation of the embodiments herein.TR TR TR TR TR

Claims (1)

1.1.
TR2019/00906T 2010-04-09 2011-03-23 Multi-channel audio coding using complex prediction and explicit prediction signaling. TR201900906T4 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32268810P 2010-04-09 2010-04-09
US36390610P 2010-07-13 2010-07-13
EP10169432A EP2375409A1 (en) 2010-04-09 2010-07-13 Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction

Publications (1)

Publication Number Publication Date
TR201900906T4 true TR201900906T4 (en) 2019-02-21

Family

ID=65681314

Family Applications (5)

Application Number Title Priority Date Filing Date
TR2019/00830T TR201900830T4 (en) 2010-04-09 2011-03-23 Multichannel audio coding using complex prediction and real display.
TR2019/01427T TR201901427T4 (en) 2010-04-09 2011-03-23 Multichannel audio coding using complex predictive and window shape information.
TR2019/00414T TR201900414T4 (en) 2010-04-09 2011-03-23 Decoding a stereo sound signal using complex prediction.
TR2018/20422T TR201820422T4 (en) 2010-04-09 2011-03-23 Multi-channel audio coding with the help of complex estimation and a conversion length indicator.
TR2019/00906T TR201900906T4 (en) 2010-04-09 2011-03-23 Multi-channel audio coding using complex prediction and explicit prediction signaling.

Family Applications Before (4)

Application Number Title Priority Date Filing Date
TR2019/00830T TR201900830T4 (en) 2010-04-09 2011-03-23 Multichannel audio coding using complex prediction and real display.
TR2019/01427T TR201901427T4 (en) 2010-04-09 2011-03-23 Multichannel audio coding using complex predictive and window shape information.
TR2019/00414T TR201900414T4 (en) 2010-04-09 2011-03-23 Decoding a stereo sound signal using complex prediction.
TR2018/20422T TR201820422T4 (en) 2010-04-09 2011-03-23 Multi-channel audio coding with the help of complex estimation and a conversion length indicator.

Country Status (2)

Country Link
ES (4) ES2708581T3 (en)
TR (5) TR201900830T4 (en)

Also Published As

Publication number Publication date
ES2704261T3 (en) 2019-03-15
TR201900830T4 (en) 2019-02-21
ES2708581T3 (en) 2019-04-10
TR201820422T4 (en) 2019-01-21
ES2704891T3 (en) 2019-03-20
TR201900414T4 (en) 2019-02-21
TR201901427T4 (en) 2019-02-21
ES2707473T3 (en) 2019-04-03

Similar Documents

Publication Publication Date Title
CA2804907C (en) Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
CA2796292C (en) Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
TR201900906T4 (en) Multi-channel audio coding using complex prediction and explicit prediction signaling.
HK40046871A (en) Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction
HK40046869A (en) Audio decoder for processing stereo audio using a variable prediction direction
HK40046871B (en) Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction
HK40046869B (en) Audio decoder for processing stereo audio using a variable prediction direction
HK40046866B (en) Audio decoding method for processing stereo audio signals using a variable prediction direction