TARIFNAME FREKANSI GELISTIRILMIS BIR SES SINYALININ ÜRETILMESI IÇIN DEKODER, DEKODE ISLEMINE ILISKIN YÖNTEM, ENKODE EDILMIS BIR SINYALIN ÜRETILMESI IÇIN ENKODER VE KOMPAKT SEÇIMI YAN BILGISININ ENKODE EDILMESINE ILISKIN YÖNTEM Spesifikasyon Mevcut bulus, ses kodlama ve özellikle frekans gelistirimi baglaminda ses kodlama ile, yani bir dekoder çikti sinyalinin bir enkode sinyaline kiyasla daha yüksek sayida frekans bantlarina sahip olmasi ile ilgilidir. Bu tür prosedürler bant genisligi genisletimi, spektral replikasyon veya akilli bosluk doldurma içermektedir. Modern konusma kodlama sistemleri, genis bant (WB) dijital ses içeriklerini yani 6 kbps kadar düsük bit hizlarinda 7-8 kHz'e kadar olan frekanslara sahip sinyalleri sifreleyebilmektedir. Büyük çogunlukla tartisilan örnekler, ITU-T tavsiyeleri G.722.2 Birlesik Konusma ve Ses Kodlama (USAC) [8]'dir. Hem g.722.2, AMR_WB olarak da bilinir, beni de G.7l8, altta yatan ACELP çekirdek-kodlayicinin, algisal olarak daha baglantili düsük frekanslara (özellikle insanin isitme sisteminin faz duyarli olduklari) "odaklanma"sini ve böylece özellikle çok düsük bit hizlarinda yeterli kaliteyi elde etmesini saglamak için 6.4 ila 7 kHz arasinda bant genisligi uzantisi (BWE) tekniklerini uygular. USAC Genisletilmis Yüksek Etkinlikli Gelistirilmis Ses Kodlamasi (xHE-AAC) profilinde, gelismis spektral bant replikasyonu (eSBR) tipik olarak 16 kbit/s'de 6 kHz'nin altinda olan Çekirdek kodlayici bant genisligi üzerinde ses bant genisliginin genisletilmesi için kullanilmaktadir. Teknigin bilinen durumundan BWE islemleri genel olarak iki algisal yaklasimlara bölünebilmektedir: frekansli (LF) çekirdek-kodlayici sinyalinden yalniz olarak yani sifreleyiciden iletilen yan bilgiye gerek o1maksizin yeniden olusturuldugu "kör" ya da "yapay" BWE. Bu sema, AMR-WB ve 16 kbit/s'de ve altinda G.718' tarafindan ve geleneksel bir dar bantli telefonik konusma üzerinde çalisan bazi geriye dogru uyumlu BWE post-islemcileri [5, 9, 12] (Örnek: Sekil 15) tarafindan kullanilmaktadir. olusturma için kullanilan parametrelerin bazilarinin, çözülmüs çekirdek sinyalinden hesaplanma yerine yan bilgi olarak sifre çözücüye iletilmesi yönünden kör bant genisligi uzantisindan farklilik gösterir. AMR-WB, G.718, xHE-AAC ve ayrica bazi diger kodekler [2, 7, 11] bu yaklasimi, fakat oldukça düsük bit oranlarinda (sekil 16) kullanmaktadir. Sekil 15, Bernd Geiser, Peter Jax ve Peter Vary yayinin tarif edildigi üzere kör veya yapay bir bant genisligi genisletimini göstermektedir: "ROBUST WIDEBAND ENHANCEMENT OF SPEECH BY COMBINED CODING AND ARTIFICIAL BANDWIDTH EXTENSION", Akustik Eko ve Gürültü Kontrolüne iliskin Uluslararasi Çalistay Islemleri (IWAENC), 2005. Sekil 15'te gösterilen bagimsiz bant genisligi genisletimi algoritmasi bir interpolasyon prosedürü bir sentez filtresi 1800, bir özellik çikartim prosedürü 1510, bir zarf kestirini prosedürü 1520 ve bir statik model 1530 içermektedir. Dar bant sinyalin bir genis bant örnek oranina interpolasyonundan sonra, bir özellikle vektörü hesaplanmaktadir. Daha sonra, ön-çalisilmis statik sakli Markov modeli (HMM) vasitasiyla, bant genisligi spektral zarfin kestirimi dogrusal öngörü (LP) katsayilari açisindan belirlenmektedir. Bu bant genisligi katsayilari, interpole edilen dar bant sinyalin analiz filtrelemesi için kullanilmaktadir. Ortaya çikan uyarimin genisletiminden sonra, bir ters sentez filtresi uygulanmaktadir. Dar bandi degistirmeyen bir uyarim genisletimi seçimi dar bant bilesenlerine nispeten seffaftir. Sekil 16 yukarida bahsi geçen yayinda tarif edildigi üzere yan bilgiye sahip bir bant genisligi genisletimini göstermekte olup, burada söz konusu bant genisligi genisletimi bir telefon bant geçisi 1620, bir yan bilgi çikartimi blogu 1610, bir (ortak) enkoder 1630, bir dekoder 1640 ve bir bant genisligi genisletimi blogu 1650 içermektedir. Kombine kodlama ve bant genisligi genisletimi ile bir hata bandi konusma sinyalin bant genisligi gelistirimi için bu sistem sekil 16'da gösterilmektedir. Iletim terminalinde, bant genisligi girdi sinyalin yüksek bant spektral zarfi analiz edilmekte ve yan bilgi belirlenmektedir. Ortaya çikan mesaj m ya ayri olarak ya da dar bant konusma sinyali ile ortak olarak enkode edilmektedir. Alicida, dekoder yan bilgisi bant genisligi genisletini algoritmasi içinde genis bant zarfin› kestirimini desteklemek üzere kullanilmaktadir. Bu mesaj m çesitli prosedürler vasitasiyla elde edilmektedir. 3,4 kHz'den 7 kHz'ye frekanslarin spektral bir gösterimi sadece gönderim tarafinda mevcut olan genis bant sinyalinden çikartilmaktadir. Bu alt bant zarfi selektif dogrusal öngörü tarafindan, yani üst bant bilesenlerine ait ve düzenin 8 sonraki Levinson-Durbin yinelemesine ait bir IDFT tarafindan takip edilen genis bant kuvvet spektrumun hesaplanmasidir. Ortaya çikan alt bant LPC katsayilari spektral alana dönüstürülmekte ve sonunda M = 2N boyutunda bir kod kitabi ile bir vektör kuantizeri tarafindan kuantize edilmektedir. 20 ms çerçeve uzunlugu için, bu durum 300 bit/s yan bilgi veri oraniyla sonuçlanmaktadir. Kombine kestirim yaklasimi a posteriyori olasiliklarin hesaplamasini genisletmekte ve dar bant özelligine iliskin bagimliliklari yeniden ortaya koymaktadir. Böylece, hata gizlemenin gelismis formu elde edilmektedir, ki kendi parametre kestirimi için bilginin bir veya daha fazla kaynagini kullanmaktadir. WB'ye iliskin belirli bir kalite sorunu düsük bit oranlarinda, tipik olarak 10 kbit/s altinda görülebilmektedir. Bir yandan, bu tür oranlar ilimli miktarda BWE verisinin iletimini hakli çikarmak için zaten çok düsüktür, bu da 1 kbit/s tipik olarak kilavuzlu BWE sistemlerin veya yan bilginin daha fazlasinin ortaya çikmasini saglamaktadir. Diger taraftan, bir uygulanabilir kör BWE, çekirdek sinyalinden dogru parametre öngörüsü yetersizliginden ötürü en azindan bazi türdeki konusma ve müzik materyalinde oldukça kötü ses verdigi ortaya çikmistir. Bu durunu HE' ve LF arasindaki düsük korelasyon içeren frikatifler gibi bazi vokal ses için özellikle dogru olabilmektedir. Bu nedenle, kilavuzlu bir BWE semasinin yan bilgisini l kbit's'nin altinda bir düzeye azaltmak arzu edilebilmektedir, ki bu durum oldukça düsük bit oranli kodlamada bile kabulüne imkân vermektedir. Manifold BWE yaklasimlari geçtigimiz yillarda [l-lO] belgelenmistir. Genelde, bunlari hepsi giris sinyalinin anlik karakteristiklerine bakilmaksizin belirli bir çalisma noktasinda ya tamamen kör ya da tamamen yönlendirilmistir. Ek olarak, birçok kör BWE sistemleri [1, 3, 4, 5, 9, 10] müzik için oldugundan konusma sinyalleri için özellikle optimize edilmekte ve bu nedenle müzik için tatmin edici sonuçlar saglamayabilmektedir. Bu durum ayrica, [13]'te tarif edilen söz konusu sistem için de aynidir. Son olarak, BWE gerçeklestirmelerinin çogu nispeten hesap olarak komplekstir, Fourier dönüsümleri, LPC filtre hesaplamalari veya yan bilginin vektör kuantizasyonunu (MPEG-d USAC'da [8] Öngörüsel Vektör Kodlama) kullanilmaktadir. Bu, mobil telekomünikasyon piyasalarinda yeni kodlama teknolojisinin uygulanmasinda bir dezavantaja neden olur, mobil cihazlarin çogunlugun çok sinirli hesaplama gücü ve batarya kapasitesi sagladigini düsünecek olursak. Kör BWE'yi küçük yan bilgi ile genisleten bir yaklasim, [12]'de sunulmakta ve sekil 16'da gösterilmektedir. Yan bilgi "m" yine de bant genisligi genisletilmis frekans araliginin spektral zarfinin tasinmasiyla sinirlidir. Sekil 16'da gösterilen prosedürün diger bir sorunu ise bir yanda düsük bant özelligi ve diger yanda ek zarf yan bilgisi kullanan zarf kestirimine ait oldukça komplike yoludur. Her iki girdi, yani düsük bant Özelligi ve ek yüksek bant zarfi statik modeli etkilemektedir. Bu durum, yüksek güç tüketiminden dolayi mobil cihazlar için özellikle sorun teskil eden karmasik bir dekoder tarafi uygulamasi ile sonuçlanmaktadir. Ek olarak, statik model, sadece ek yüksek bant zarf verisi tarafindan etkilenmemesinden dolayi güncellemek içim oldukça da zordur. Mevcut bulusun amaci, ses enkode/dekodenin gelismis bir konseptini saglamaktir. Bu amaç, istem l'e göre bir dekoder, istem 12'ye göre bir enkoderi istem 14'e göre bir frekansi gelismis ses sinyalinin üretilmesi için bir yöntem, istem 15'e göre enkode bir sinyalin üretilmesi için bir yöntem, istem 16'ya göre bir bilgisayar programi vasitasiyla yerine getirilmektedir. Mevcut bulus, yan bilgi miktarini daha da azaltmak için ve ek olarak bütün bir enkoder/dekoderi asiri olarak kompleks yapmamak için, bir yüksek bant kisminin önceki teknikte kullanilan parametrik enkode etme isleminin, bir frekans gelistirim dekoderi üzerinde bir özellik çikartici ile birlikte kullanilan aslinda statik modele iliskin seçim yan bilgisiyle degistirilmesi gerektigi veya en azindan gelistirilmesi gerektigi bulgusuna dayanmaktadir. Bir statik model ile kombinasyonlu bir sekilde özellik çikartiminin spesifik olarak bazi konusma kisimlari için çift anlamliliga sahip olan parametrik gösterim alternatifleri sunmasindan dolayi, saglanan alternatifleri en iyisi olabilen dekoderin tarafinda bir parametre üreticisi içinde statik modelin aslinda kontrol edilmesi Özellikle oldukça düsük bot orani uygulamalarinda sinyalin belirli karakteristiginin aslinda parametrik olarak kodlamasindan daha üstün oldugu ortaya çikarilmistir` burada bant genisligi uzantisi için yan bilgi sinirlidir. Böylece, özellikle sinyalin kendisi kabul edilebilir algisal kalite düzeyinde HF içeriginin yeniden yapilandirilmasi için izin vermezse, küçük ek yan bilgiye sahip uzanti ile kodlu sinyal için bir kaynak modelinden yararlanan bir kör BWE gelistirilmektedir. Bu prosedür bu nedenle ekstra bilgi ile kodlu çekirdek-kodlayici içeriginden üretilen kaynak modelin parametrelerini kombine etmektedir. Bu durum, bu tür bir kaynak model içinde kodlama yagmanin zor oldugu algisal ses kalitesini gelistirmek için özellikle avantajlidir. Bu tür sesler tipik olarak HF ve LF içerigi arasinda düsük bir korelasyon ortaya koymaktadir. Mevcut bulus, oldukça düsük bit orani ses kodlamasinda geleneksek BWE'nin sorunlarina ve mevcut olan teknigin bilinen durumundaki tekniklere iliskin eksiklere hitap etmektedir. Yukarida tarif edilen kalite sorununa iliskin bir çözüm, bir kör ve bir kilavuzlu BWE'nin sinyal adaptif bir kombinasyonu olarak minimal olarak kilavuzlu BWE önerilerek saglanmaktadir. Bulusa konu BWE, diger sekilde sorun teskil eden kodlu seslerin ayrica ayrilmasina izin veren sinyale bazi küçük yan bilgi eklemektedir. Konusma kodlamada, bu durum özellikle sibilanlar ve frikatifler için geçerlidir. WB kodeklerinde, çekirdek kodlayici bölgesi üzerindeki HF bölgesinin spektral zarfinin kabul edilebilir algisal kalite ile BWE'nin uygulanmasi için gerekli olan en kritik veriyi gösterimledigi bulunmustur. Spektral ince yapi ve zamansal zarf gibi tüm diger parametreler genellikle çözülmüs çekirdek sinyalinden oldukça hassas bir sekilde türetilebilir ya da düsük algisal öneme sahiptir. Frikatifler yine de genellikle BWE sinyalinde uygun bir yeniden üretimden yoksundur. Yan bilgi bu nedenle farkli sibilanlar veya "f", "s", "ch" ve "sh" gibi frikatifler arasinda ayrim yapan ek bilgi içerebilmektedir. meydana geldiginde bant genisligi uzantisina iliskin diger sorun teskil eden akustik bilgi söz konusudur. Mevcut bulus, sadece bu yan bilginin kullanimina ve gerekli oldugunda bu yan bilginin aktarilmasina izin vermekte ve istatistiksel modelde beklenmeyen hiçbir çift anlamlilik söz konusu olmadiginda bu yan bilginin tasinmamasini saglamaktadir. Ek olarak, mevcut bulusun tercih edilen düzenlemeleri, her çerçeve için üç veya daha az bitler, bir sinyal kestiricinin kontrol edilmesi için kombine bir ses aktivitesi tespit/konusma/konusma olmayan tespit, hem bir zarf kestirimine hem de diger bant genisligi uzantisi araçlarina veya bant genisligi parametrelerinin gelistirimine atfeden bir sinyal siniflayici veya parametrik gösterim alternatifleri tarafindan belirlenen istatistiksel farkli modeller veya yeni parametrelerin zaten mevcut olan ve aslinda iletilen bant genisligi uzantisi parametrelerine eklenmesi gibi oldukça küçük miktarda yan bilgi kullanmaktadir. Mevcut bulusun tercih edilen düzenlemeleri daha sonra ekli çizimler ile baglantili olarak açiklanacaktir, burada: bir frekansi gelismis ses sinyalin üretilmesi için bir dekoderi göstermektedir; sekil l'e ait yan bilgi çikarticinin baglaminda tercih edilen bir uygulamayi göstermektedir; parametrik gösterim alternatiflerin sayisina seçim yan bilgisinin bit sayilarini iliskilendiren bir tabloyu göstermektedir; parametre üreticisinde yapilan tercihli bir prosedürü göstermektedir; bir ses aktivitesi detektörü veya bir konusma/konusma olmayan detektör tarafindan kontrol edilen sinyal kestiricinin tercih edilen bir uygulamasini göstermektedir; bir sinyal siniflandirici tarafindan kontrol edilen parametre üreticisine ait tercih edilen bir uygulamayi göstermektedir; bir istatistiksel modelin ve iliskilendirilen seçim yan bilgisinin bir sonucuna iliskin örnegi göstermektedir; enkode bir çekirdek› sinyal ve iliskilendirilen› yan bilgi içeren örnek enkode sinyali göstermektedir; bir zarf kestirim gelisimi için bir bant genisligi uzantisi sinyalini göstermektedir; spektral bant replikasyon prosedürü baglaminda bir dekodere ait diger bir uygulamayi göstermektedir; ek olarak iletilen yan bilginin baglaminda bir dekoderin diger bir düzenlemesini göstermektedir; enkode bir sinyalin üretilmesi için bir enkodere ait bir düzenlemeyi göstermektedir; Sekil 13 sekil lZ'ye ait seçim yan bilgisinin bir uygulamasini göstermektedir; Sekil 14 sekil 12'ye ait seçim yan bilgisinin diger bir uygulamasini göstermektedir; Sekil 15 önceki teknikteki bagimsiz bir bant genisligi uzantisi algoritmasini göstermektedir; ve Sekil 16 ek bir mesaja sahip olan bir iletim sisteminin üstten görünüsünü göstermektedir. Sekil 1 bir frekansi gelismis ses sinyalin 120 üretilmesi için bir dekoderi göstermektedir; Dekoder, bir çekirdek sinyalden 100 (en az) bir özelligin çikartilmasi için bir özellikle çikartici 104 içermektedir. Genel olarak özellik çikartici tek bir özellik veya birçok özellik, ani iki veya daha fazla özellik çikartabilmektedir ve birçok özelligin özellik çikartici tarafindan çikartilmasi tercih de edilmektedir. Bu durum, sadece dekoderdeki özellikle çikartici için degil, ayni zamanda enkoderdeki özellik çikartici için de geçerlidir. Ek olarak, çekirdek sinyal 100 ile iliskilendirilen bir seçim yan sinyalin 114 çikartilmasi için bir yan bili çikartici 110 saglanmaktadir. Ek olarak, bir parametre üreticisi 108 özellik iletim hatti 112 vasitasiyla özellikle çikarticisina 104 ve seçim yan bilgisi 114 vasitasiyla yan bilgi çikarticisina 110 irtibatlandirilmaktadir. Parametre üreticisi 108, çekirdek sinyali tarafindan tanimlanmayan frekansi gelismis ses sinyaline ait spektral bir araligini kestirilmesi içini bir parametrik gösterimin üretilmesi için konfigüre edilmektedir. Parametre üreticisi 108, özelliklere 112 yanit olarak birçok parametrik gösterim alternatifleri saglamak ve seçim yan bilgisine 114 yanit olarak parametrik gösterim olarak parametrik gösterim alternatiflerinden birisini seçmek üzere konfigüre edilmektedir. Dekoder ayrica, selektör tarafindan seçilen parametrik gösterimi, yani parametrik gösterimi 116 kullanarak frekansi gelismis bir ses sinyalin kestirilmesi için bir sinyal kestirici 118 içermektedir. Özellikle, özellikle çikartici 104, sekil 2'de gösterildigi üzere dekode edilmis çekirdekr sinyalden çikartilmakr üzere uygulanabilmektedir. Daha sonra, bir girdi arayüzü 110 enkode bir girdi sinyalin 200 alinmasi için konfigüre edilmektedir. Bu enkode girdi sinyali 200, arayüze 110 girdilenmekte ve daha sonra girdi arayüzü 110 enkode çekirdek sinyalde seçim yan bilgisini ayirmaktadir. Böylece, girdi arayüzü 110, sekil 1'de an bilgi çikartici 110 olarak islev görmektedir. Girdi arayüzü 110 tarafindan çiktilanan enkode çekirdek sinyali 201, çekirdek sinyal 100 olabilen dekode bir çekirdek sinyali saglamak üzere daha sonra bir çekirdek dekodere 124 girdilenmektedir. Alternatifli olarak, yine de özellik çikartici da enkode çekirdek sinyalden bir özelligi çalistirabilmekte veya çikartabilmektedir. Tipik olarak, enkode çekirdek sinyali frekans bantlari için ölçek çarpanlarinin bir gösterimini veya ses bilgisinin diger herhangi gösterimini içermektedir. Özellikle çikartimi türüne bagli olarak ses sinyalin enkode gösterimi dekode çekirdek sinyalin göstergesidir ve bu nedenle özellikle çikartilabilmektedir. Alternatifli veya ek olarak, bir özellikle sadece tamamen dekode bir çekirdek sinyalden degil, ayni zamanda kismi olarak dekode bir çekirdek sinyalden çikartilabilmektedir. Frekans alan kodlamada, enkode sinyal bir spektral çerçeveler sekansi içeren bir frekans alan gösterimini gösterimlemektedir. Enkode çekirdek sinyali bu nedenle, aslinda spektrum zaman dönüsümünü gerçeklestirmeden önce spektral çerçeveler sekansinin dekode bir gösterimini elde etmek için sadece kismi olarak dekode edilebilmektedir. Böylece, özellik çikartici 104 ya enkode çekirdek sinyalinden ya da kismi olarak dekode çekirdek sinyalinden ya da tamamen dekode çekirdek sinyalinden özellikler çikartabilmektedir. Özellik çikartici 104, teknikte bilindigi üzere çikartilan özellikleri uyarinca uygulanabilmektedir ve Özellik çikartici örnek olarak ses parmak izi veya ses ID teknolojilerinde oldugu gibi uygulanabilmektedir. Tercihli olarak, seçim tarafi bilgi 114 çekirdek sinyalin her çerçevesi için bitlerin sayisi N içermektedir. Sekil 3 farkli alternatifler için bir tabloyu göstermektedir. Seçim yan bilgisi için bitlerin sayisi ya sabit olur ya da çikartilan bir özellige yanit olarak istatistiksel model tarafindan saglanan parametrik gösterim alternatiflerinin sayisina dayanarak seçilmektedir. Seçim yan bilgisinin bir biti, sadece iki parametrik gösterim alternatifleri bir özellige yanit olarak istatistiksel model tarafindan saglandiginda yeterli olmaktadir. Dört gösterim alternatiflerinin maksimum bir sayisi istatistiksel model tarafindan saglandiginda, seçim yan bilgisi için iki bit gerekli olmaktadir. Seçim yan bilgisinin 3 biti maksimum sekiz eszamanli parametrik gösterim alternatiflerine izin vermektedir. Seçim yan bilginin dört biti aslinda 16 parametrik gösterim alternatiflerine izin vermekte ve seçim yan bilgisinin bes biti 32 eszamanli parametrik gösterim alternatiflerine izin vermektedir. Bir saniyenin 50 çerçeveye bölündügü zaman, her saniye için 150 bit yan bilgi oraniyla sonuçlanan her çerçevenin seçim yan bilgisinin sadece üçünü veya daha azini kullanmak tercih edilmektedir. Bu yan bilgi orani, seçim yan bilgisi, istatistiksel model aslinda gösterim alternatifleri saglarken gerekli olmasindan dolayi azaltilabilmektedir. Böylece, istatistiksel model sadece tek bir alternatifi bir özellikle için saglarsa, bir seçim yan bilgisi biti hiç de gerekli degildir. Diger yandan, istatistiksel model sadece dört parametrik gösterim alternatifleri saglarsa, o zaman seçim yan bilginin üç biti yerine sadece iki biti gerekli olmaktadir. Bu nedenle, tipik durumlarda, ek yan bilgi orani, her saniye için 150 bitin altina azaltilabilmektedir. Ek olarak, parametre üreticisi 2N'ye esit olan parametrik gösterim alternatifleri miktarini en Çok saglamak üzere konfigüre edilmektedir. Diger yandan, parametre üreticisi 108, örnek olarak, sadece bes parametrik gösterim alternatifi saglarsa, o zaman seçim yan bilgisinin üç biti yine de gerekli olmaktadir. Sekil 4, parametre üreticisinin 108 tercih edilen bir uygulamasini göstermektedir. Özellikle parametre üreticisi 108, sekil 1'e ait özelligin 112 adimda 400 belirtildigi üzere istatistiksel bir modele girdilenmesi için konfigüre edilmektedir. Daha sonra, adimda 402 belirtildigi üzere, birçok parametrik gösterim alternatifleri model tarafindan saglanmaktadir. Ek olarak, parametre üreticisi 108, adimda 404 belirtildigi üzere yan bilgi çikartisindan seçim yan bilgisini 114 geri almak için konfigüre edilmektedir. Daha sonra, adimda 406, spesifik bir parametrik gösterim alternatifi seçim yan bilgisi 114 kullanarak seçilmektedir. Son olarak, adimda 408, seçili parametrik gösterim alternatifi sinyali kestiriciye 118 çiktilanmaktadir. Tercihli olarak, parametre üreticisi 108, parametrik gösterim alternatiflerinden birisini seçerken, parametrik gösterim alternatiflerinden daha önceden belirlenen bir düzeni veya alternatifli olarak gösterim alternatiflerin bir enkoder sinyal düzenini kullanmak üzere konfigüre edilmektedir. Bu dogrultuda, sekil 7'ye referans yapilmaktadir. Sekil 7, dört parametrik istatistiksel modelin bir sonucunu göstermektedir. Ilgili seçim yan bilgisi de gösterilmektedir. Alternatif 702, bit sablonuna 712 karsilik gelmektedir. Alternatif 704, bit sablonuna 714 karsilik gelmektedir. Alternatif 706 bit sablonuna 716 karsilik gelmekte ve alternatif 708 bit sablonuna 718 karsilik gelmektedir. Böylece, parametre üreticisi 108 veya örnek olarak adim 402 sekil 7'de gösterilen düzende dört alternatifi 702 ila 708 geri aldiginda, bit sablonuna 716 sahip bir seçim yan bilgisi benzersiz bir sekilde parametrik gösterim alternatifini 3 (referans numarasi 706) tanimlayacaktir ve parametre üreticisi 108 bu üçüncü alternatifi seçecektir. Yine de seçim yan bilgisi bit sablonu, bit sablonu 712 oldugunda, birinci alternatif 702 seçilebilmektedir. Parametrik gösterim alternatiflerin önceden tanimlanan düzeni, bu nedenle, istatistiksel modelin aslinda çikartilan bir özellige yanit olarak alternatifleri ilettigi düzen olabilmektedir. Alternatifli olarak, münferit alternatif, yine de birbirine oldukça yakin olan farkli olasiliklari iliskilendirmisse, daha önceden belirlenen düzen, en yüksek olasilik. parametrik gösterimin birinci ve o sekilde devam etmesi olabilmektedir. Alternatifli olarak, Düzen örnek olarak tek bir bit tarafindan sinyal edilebilmektedir, fakat bu biti korumak için, daha önceden belirlenen bir düzen tercih edilmektedir. Bunun ardindan, sekiller 9 ila 11'e atifta bulunulmaktadir. Sekil 9'da göre bir düzenlemede, söz konusu bulus özellikle konusma sinyalleri için uygundur, çünkü adanmis bir konusma kaynagi modeli parametre çikartimi için kullanilmaktadir. Bulus, yine de konusma kodlamayla sinirli degildir. Farkli düzenlemeler diger kaynak modellerini de kullanabilmektedir. Özellikle, seçim yan bilgisi 114 de "frikatif bilgi" olarak terimlenebilmektedir, çünkü bu seçim yan bilisi "f", "s" veya ayirim yapmaktadir. Böylece, seçim yan bilgisi, parametre üretici 108 içinde yapilan zarf kestirimi 902 isleminde istatistiksel model 904 tarafindan Örnek olarak saglanan üç problem teskil eden alternatiften birisinin açik bir tanimini saglamaktadir. Zarf kestirimi, çekirdek sinyale dahil olmayan spektral kisimlarin spektral zarfinin parametrik bir gösterimiyle sonuçlanmaktadir. Blok 104 bu nedenle sekil 15'in bloguna 1510 karsilik gelmektedir. Ek. olarak, sekil 15'in blogu 1530 sekil 9'un istatistiksel modeline 904 karsilik gelebilmektedir. Ek olarak, sinyal kestiricinin 118 bir analiz filtresi 910, bir uyarim, uzantisi blogu 112 ve bir sentez filtresi 940 içermesi tercih edilmektedir. Böylece, bloklar 910, 912, 914 gelebilmektedir. Özellikle, analiz filtresi 910 bir LPC analiz filtresidir. Zarf tahmin blogu 902 analiz filtresinin 910 filtre katsayilarini kontrol etmektedir, böylece blogun 910 sonucu filtre uyarim sinyalidir. Bu filtre uyarim sinyali, hem bir çikti sinyali için dekoderin 120 frekans araligina sahip hem de çekirdek sinyalin çekirdek kodlayici ve/veya asiri spektral araligi tarafindan tanimlanmayan frekans veya spektral aralik içeren blogun 912 çiktisinda bir uyarim sinyalini elde etmek için frekans uyarinca uzantilanmaktadir. Böylece, dekoderin çiktisinda bulunan ses sinyali 909 bir interpolatör 900 tarafindan yukari örneklenip interpole edilmektedir ve daha sonra interpole edilmis sinyal, sinyal tahmincisinde 118 isleme tabi tutulmaktadir. Ayrica, sekil 9'da bulunan interpolatör 900 sekil 15'de bulunan interpolatöre 1500 karsilik gelebilmektedir. Tercihli olarak, yine de sekil 15'in aksine, özellik çikartimi 104, sekil 15'de gösterildigi üzere interpole sinyal üzerinde yapilmasi yerine interpole olmayan sinyali kullanarak yapilmaktadir. Bu durum avantaj saglamaktadir, çünkü özellik çikartici 104, interpole olmayan ses sinyalin 909 blogun 900 çiktisinda alt örnekli ve interpole sinyaline kiyasla ses sinyalin belirli bir zaman kismina kiyaslanan örneklerin daha küçük sayisina sahip olmasindan dolayi daha etkin bir sekilde çalismaktadir. Sekil 10, mevcut bulusun bir diger düzenlemesini gösterir. Sekil 9'un aksine, sekil 10 sekil 9'da oldugu üzere bir zarf kestirimi saglayan ve ayni zamanda kayip tonlarin 1080 üretimi için bilgiyi veya ters filtreleme 1040 için bilgiyi veya eklenecek olan gürültü tabanina 1020 iliskin bilgiyi içeren ek parametrik gösterimler saglayan istatistiksel bir model 904 kayip tonlar 1080 prosedürleri HEAAC (Yüksek Etkinlikte Gelismis Ses Kodlama) baglaminda. MPEG-4 standardinda tarif edilmektedir. Böylece, konusmadan farkli diger sinyaller de sekil lO'da gösterildigi üzere kodlanabilmektedir. Bu durumda, yalniz spektral zarfin 1060 kodlanmasi yeterli olmayabilmekte, ayni zamanda [6]'da gösterilen spektral bant replikasyonda (SBR) gösterildigi üzere tonalite (1040), bir gürültü düzeyi (1020) veya kayip sinusaoidler gibi ayrica yan bilgileri de kodlamak gerekebilmektedir. Sekil ll'de diger bir düzenleme gösterilmektedir, burada yan bilgi 114 yani seçim yan bilgisi 1100'da gösterildigi üzere SBR yan bilgisine ek olarak kullanilmaktadir. Böylece, örnek olarak tespit edilen konusma seslerine iliskin bilgiyi içeren seçim yan bilgisi eski SBR yan bilgisine eklenmektedir. Frikatifler, patlamalilar veya ünlüler gibi konusma sesleri için yüksek frekans içerigini daha dogru› bir sekilde üretmeye yardimci olmaktadir. Böylece, sekil ll'de gösterilen prosedür, ek olarak iletilen seçim yan bilgisinin 114, SBR veya BWE (bant genisligi uzantisi) parametrelerinin bir dekoder tarafi uyumunu saglamak için bir dekoder tarafi (fonem) siniflandirmasini desteklemesine iliskin avantaja sahiptir. Böylece, sekil 10'nun aksine, sekil 11 yan seçim bilgisine ek olarak eski SBR yan bilgisini saglamaktadir. Sekil 8, enkode girdi sinyalin örnek bir gösterimini göstermektedir. Enkode girdi sinyali sonraki çerçevelerden 800, 806, 812 meydana gelmektedir. Her bir çerçeve enkode çekirdek sinyali içermektedir. Örnek olarak, çerçeve 800 enkode çekirdek sinyali olarak konusma içermektedir. Çerçeve 806, enkode çekirdek sinyal olarak müzik içermekte ve çerçeve 812 enkode çekirdek sinyali olarak konusma içermektedir. Çerçeve 800 örnegin, yan bilgi olarak SBR yan bilgisi degil yalnizca seçim yan bilgisi içermektedir. Böylece, çerçeve 800 sekil 9 veya sekil 10'a karsilik gelmektedir. Örnek olarak, çerçeve 806 SBR bilgisi içermekte, fakat herhangi seçim yan bilgisi içermemektedir. Ek olarak, çerçeve 812 enkode konusma sinyali içermekte ve çerçevenin 800 aksine, çerçeve 812 herhangi seçim yan bilgisi içermemektedir. Bu durum, seçim yan bilgisinin gerekli olmamasindan kaynaklanmaktadir, çünkü özellik çikartimi/istatistiksel model islemindeki herhangi iki anlamlilik enkoder tarafinda bulunmamistir. Daha sonra, sekil 5 tarif edilmektedir. Çekirdek sinyal üzerinde çalisan bir ses aktivitesi detektörü veya bir konusma/konusma olmayan detektör 500, bulus konusu bant genisligi veya frekans gelistirme teknolojisinin veya farkli bir bant genisligi uzantisi teknolojisinin kullanip kullanilmadigina karar vermek için kullanilmaktadir. Böylece, ses aktivitesi detektörü veya konusma/konusma olmayan detektör ses veya konusma tespit ederse, örnek olarak sekiller 1, 9, 10, 11'de gösterildigi üzere çalisan daha sonra 511'de gösterilen birinci bir bant genisligi uzantisi teknolojisi BWEXT.1 kullanilmaktadir. Böylece, anahtarlar 502, 504, girdiden 512 parametre üreticisinden gelen parametreler alinacak ve anahtar 504 bu parametreleri bloga 511 baglayacak sekilde ayarlanmaktadir. Fakat, herhangi konusma sinyali göstermeyen, yine de örnek olarak müzik sinyali gösteren detektör 500 tarafindan bir durum tespit edildiginde, o zaman bit akisindan gelen bant genisligi uzantisi parametreleri 514 tercihli olarak diger bant genisligi uzantisini teknoloji prosedürüne 513 girdilenmektedir. Böylece, detektör 500, bulus konusu bant genisligi uzantisi teknolojisinin 511 kullanilmasi gerekip gerekmedigini tespit etmektedir. Konusma olmayan sinyaller için, kodlayici [6, 8]'da bahsi geçtigi gibi blok 513 tarafindan gösterilen diger bant genisligi uzantisi tekniklerine anahtarlanabilmektedir. Bundan dolayi, sekil 5'e ait sinyal kestiricisi 11, detektör 500 ses olmayan aktivite veya konusma olmayan aktivite sinyali tespit ettiginde, farkli bir bant genisligi uzantisi prosedürüne geri dönmesi ve/Veya enkode sinyalden çikartilan farkli parametreleri kullanmak üzere konfigüre edilmektedir. Bu farkli bant genisligi uzantisi teknolojisi 513 için, seçim yan bilgisi tercihli olarak bit akisinda mevcut olmayip, ayni zamanda kullanilmamaktadir, ki bu anahtari 502 girdiye 514 ayarlayarak sekil 5'te sembolize edilmektedir. Sekil 6, parametre üreticisinin 108 diger bir uygulamasini göstermektedir. Parametre üretici 108 tercihli olarak birinci bir istatistiksel model 600 ve ikinci bir istatistiksel model 602 gibi birçok istatistiksel model içermektedir. Ek olarak, dogru parametrik gösterim alternatifinin saglanmasi için seçim yan bilgisi tarafindan kontrol edilen bir selektör 604 saglanmaktadir. Istatistiksel model aktif oldugunda, özellik çikarticiya 104 girdi olarak girisinde çekirdek sinyali yani ayni sinyali alan ek bir sinyal siniflandirici 606 tarafindan kontrol edilmektedir. Böylece, sekil lO'da bulunan veya diger herhangi sekillerde bulunan istatistiksel model kodlu içerik ile degiskenlik gösterebilmektedir. Sinyal siniflandirici 606 tarafindan örnek olarak siniflandirildigi üzere müzik sinyaller gibi diger sinyaller için, büyük bir müzikal veri setinde çalistirilan farkli bir model kullanilirken, konusma için bir konusma üretim kaynagi modelini gösterimleyen istatistiksel bir model kullanilmaktadir. Diger istatistiksel modeller ek olarak farkli diller için kullanisli olabilmektedir. Daha önce anlatildigi üzere, sekil 7, istatistiksel modeli 600 gibi istatistiksel model tarafindan elde edildigi üzere birçok alternatif göstermektedir. Bu nedenle, blogun 600 çiktisi örnek olarak, paralel çizgide 605 gösterildigi üzere farkli alternatifler içindir. Ayni sekilde, ikinci istatistiksel model 602 ayrica satirda 606 gösterildigi üzere alternatifler için olanlar gibi birçok alternatifler çiktilayabilmektedir. Spesifik istatistiksel modele dayanarak, özellik çikartici 104 uyarinca oldukça yüksek bir olasiliga sahip olan alternatiflerin çiktilanmasi tercih edilmektedir. Böylece, istatistiksel bir model, bir özellige yanit olarak, birçok alternatif parametrik gösterimleri saglamakta olup, burada her bir alternatif parametrik gösterim diger farkli alternatif parametrik gösterimlerin olasiligina özdes olan veya %10 daha az diger alternatif parametrik gösterimlerin olasiligindan farkli olan bir olasilik içermektedir. Böylece, bir düzenlemede en yüksek olasiliga ve en iyi eslesme alternatifinin olasiligindan sadece %10 daha küçük olan bir olasiliga sahip olan diger birçok alternatif parametrik gösterimler içeren parametrik gösterim çiktilanmaktadir. Sekil 12, enkode bir sinyalin 1212 üretilmesi için bir enkoderi göstermektedir. Enkoder, orijinal sinyale 1206 kiyasla daha az sayida frekans bantlara iliskin bilgiye sahip enkode bir çekirdek ses sinyalini 1208 elde etmek için bir orijinal sinyali 1206 enkode etmek için bir çekirdek enkoder 1200 içermektedir. Ek olarak, seçim yan bilgisinin 1210 (881 seçim yan bilgisi) üretilmesi üzere bir seçim yan bilgisi üreticisi 1202 saglanmaktadir. Seçim yan bilgisi 1210, orijinal sinyalden 1206 veya enkode ses sinyalinden 1208 veya enkode ses sinyalinin dekode versiyonundan çikartilan özellige yanit olarak istatistiksel model tarafindan saglanan tanimli bir parametrik gösterim alternatifini göstermektedir. Ek olarak, enkoder, enkode sinyalin 1212 çiktilanmasi için bir çikti arayüzü 1204 içermektedir. Enkode sinyal 1212 enkode ses sinyali 1208 ve seçim yan bilgisi 1210 içermektedir. Tercihli olarak, seçim yan bilgisi üretici 1202 sekil 13'de gösterildigi üzere uygulanmaktadir. Bu dogrultuda, seçim. yan bilgisi üreticisi tarafindan çiktilanan dekode çekirdek sinyali üzerinde çalisan özellik çikartici 1302 saglanmaktadir. Özellik, blok 1300 tarafindan çiktilanan dekode çekirdek sinyali tarafindan tanimlanmayan bir frekansi gelismis sinyalin spektral araliginin kestirilmesi için birçok parametrik gösterim alternatiflerinin üretilmesi için bir istatistiksel model islemciye 1304 girdilenmektedir. Bu parametrik gösterim alternatiflerinin 1305 hepsi frekansi gelismis bir ses sinyalinin 1307 kestirimi için bir sinyal kestiriciye 1306 girdilenmektedir. Bu kestirilen frekans gelismis ses sinyaller gelismis ses sinyallerini 1307 kiyaslamak için bir kiyaslayiciya 1308 girdilenmektedir. Seçim yan bilgisi üretici 1202 ek olarak seçim yan bilgisini 1210 ayarlamak üzere konfigüre edilmektedir, böylece seçim yan bilgisi essiz olarak bir optimizasyon kriterine göre orijinal sinyal ile en iyi eslesen bir frekansi gelismis ses sinyaliyle sonuçlanan parametrik gösterim alternatifini tanimlamaktadir. Optimizasyon kriteri bir MMSE (minimum ortalama kareli hata) tabanli kriter olabilmekte, olup, burada örneksel farki minimize eden bir kriter veya tercihli olarak algilanan bozulmayi minimize eden psiko-akustik bir kriter veya teknikte uzman kisi tarafindan bilinen diger herhangi optimizasyon kriteri olabilmektedir. Sekil 13 bir kapali döngü veya sentez yoluyla analiz prosedürünü gösterirken, sekil 14, bir açik döngü prosedürüne daha çok benzeyen seçim yan bilgisinin 1202 alternatif bir uygulamasini göstermektedir. Sekil 14'te bulunan düzenlemede, orijinal sinyal 1206, orijinal ses sinyalin örneklerinin bir sekansi için akustik bilginin (ör. ek açiklama) bir sekansini tarif eden seçim yan bilgisi üreticisi 1202 için iliskilendirilmis meta bilgi içermektedir. Seçim yan bilgisi üreticisi 1202 bu düzenlemede, meta bilgisinin sekansinin çikartilmasi bir meta veri çikartici 1400 ve ek olarak orijinal ses sinyali ile iliskilendirilen seçim yan bilgisinin 1210 bir sekansina meta bilginin sekansinin çevrilmesi için dekoder tarafi üzerinde çalistirilan istatistiksel modele iliskin tipik olarak bilgiye sahip bir meta veri çevirici içermektedir. Meta veri çikartici 1400 tarafindan çikartilan meta veri enkode sinyale 1212 tasinmamakta ve enkodere iskarta edilmektedir. Bunun yerine, seçim yan bilgisi 1210, farkli bir frekans içerigi ve tipik olarak sonunda üretilen dekode sinyale kiyasla veya orijinal sinyale 1206 kiyasla daha küçük bir frekans içerigine sahip olan çekirdek enkoder tarafindan üretilen enkode ses sinyali 1208 ile birlikte enkode sinyale tasinmaktadir. Seçim yan bilgisi üreticisi 1202 tarafindan üretilen seçim yan bilgisi 1210 önceki Sekillerin baglaminda tartisildigi üzere karakteristiklerinin herhangi birisine sahip olabilmektedir. Mevcut bulus, bloklarin asil ya da mantikli donanim bilesimlerini temsil ettigi blok diyagramlarinin kontekstinde tarif edilmis olmasina ragmen, mevcut bulus bir bilgisayar uygulamali yöntem vasitasiyla da uygulanabilmektedir. Ikinci durumda, bloklar bu adimlarin ilgili mantikli ya da fiziksel donanim bloklari tarafindan uygulanan islevsellikleri temsil ettigi ilgili yöntem adimlarini gösterimlemektedir. Bazi yönlerin bir ekipmanin baglaminda tarif edilmesine ragmen, söz konusu yönlerin ayrica ilgili yöntemin bir tarifini de gösterimledigi açikça ortadadir, ki bir blok ya da aygit bir yöntem adimina ya da bir yöntem adiminin bir özelligini karsilamaktadir. Benzer olarak, bir yöntem basamaginin baglaminda tarif edilen yönler, ilgili bir cihazin ilgili bir blokuna ya da parçasina ya da özelligine ait bir açiklamayi da temsil etmektedir. Yöntem adimlarinin bazilari ya da hepsi, örnek olarak bir mikroislemci, programlanabilir bir bilgisayar ya da elektronik bir devre gibi bir donanim ekipmani (ya da kullanarak) ile isleme sokulabilmektedir. Bazi düzenlemelerde en önemli yöntem adimlarinin bazilari, biri ya da daha fazlasi bu tür bir ekipman ile isleme sokulabilmektedir. Bulussal iletilen veya sifrelenen sinyal bir sayisal depolama ortaminda depolanabilecegi gibi, internet gibi kablosuz veya kablolu bir iletim ortamina benzer bir iletim ortami üzerinden de aktarilabilir. Belirli uygulama gerekliliklerine dayanilarak bulusun düzenlemeleri bir donanimda ya da yazilimda uygulanabilmektedir. Söz konusu uygulama, üzerine yazilan elektronik olarak okunabilir kontrol sinyallerine sahip, ilgili yöntemin çalismasi için programlanabilir bir bilgisayar sistemi ile (çalisma yetisine sahip) çalisan bir dijital saklama ortami, örnek olarak bir flopi disk, bir DVD, bir Blu-Ray, bir CD, bir ROM, bir PROM, bir EPROM ve EEPROM ya da bir TASINABILIR bellek kullanilarak gerçeklestirilebilmektedir, böylece ilgili yöntem uygulanmaktadir. Bu neden dijital saklama ortami bilgisayarca okunulabilir olabilmektedir. Bulusa göre bazi düzenlemeler, burada açiklanan yöntemlerden birinin gerçeklesmesi için, programlanabilir bilgisayar sistemiyle birlikte çalisabilen, elektronik olarak okunabilir kontrol sinyallerine sahip bir veri tasiyici içermektedir. Genellikle mevcut bulusun düzenlemeleri, bir program kodlu bir bilgisayar programi ürünü olarak uygulanabilmektedir, söz konusu program kodu, bilgisayar program ürünü bir bilgisayar üzerinde çalistigi zaman, yöntemlerinden birisinin gerçeklestirilmesi için çalismaktadir. Program kodu örnegin, makinede okunabilir bir tasiyici üzerinde depolanabilir. Diger düzenlemeler, makine tarafinca okunabilir tasiyici üzerine depolanmis, burada tarif edileni yöntemlerin› birinin gerçeklestirilmesine iliskin bilgisayar programina sahiptir. Baska bir deyisle bulussal yöntemin bir düzenlemesi bu nedenle, bilgisayar programi bir bilgisayar üzerinde çalistigi zaman, burada tarif edilen yöntemlerden birisinin gerçeklestirilmesine iliskin bir program koduna sahip bir bilgisayar programidir. Bulussal yöntemin diger bir düzenlemesi bu nedenle, üzerine kaydedilmis, burada tarif edilen yöntemlerden birisinin gerçeklestirilmesine iliskin bilgisayar programina sahip bir veri tasiyicisidir (ya da dijital saklama ortami ya da bilgisayarca okunabilir bir ortam). Veri tasiyicisi, dijital depolama ortami veya kaydedilmis ortam, genelde somuttur ve/veya geçici-degildir. Bulussal yöntemin diger bir düzenlemesi bu nedenle, burada tarif edilen yöntemlerin birisinin gerçeklestirilmesine iliskin bilgisayar programini gösterimleyen sinyallerin bir dizisi ya da bir veri akisidir. Veri akisi ya da sinyaller dizisi örnegin internet gibi bir veri iletisim baglantisi vasitasiyla aktarilmak üzere örnegin yapilandirilabilir. Bir diger düzenleme, burada açiklanan yöntemlerden birini gerçeklestirmek üzere yapilandirilmis, bir bilgisayar veya programlanabilir bir mantik cihazi gibi, bir proses araci içermektedir. Diger bir düzenleme, üzerine monte edilmis, burada tarif edilen yöntemlerden birisinin gerçeklestirilmesine iliskin bilgisayar programina sahip bir bilgisayari kapsamaktadir. Bulusa göre diger bir örnek, burada tarif edilen yöntemlerden birini uygulamak için bilgisayar programini (ör. elektronik olarak veya optik olarak) bir aliciya aktarmak üzere konfigüre edilmis bir cihaz veya bir sistem içermektedir. Alici, örnegin bir bilgisayar, bir mobil cihaz, bir bellek cihazi veya benzeri olabilir. Cihaz veya sistem, örnegin, bilgisayar programini aliciya aktarmak için bir dosya sunucu içerebilir. Bazi düzenlemelerde programlanabilir bir mantik araci (örnek olarak, alanda programlanabilir bir kapi dizisi) burada tarif edilen yöntemlerin islevselliklerinin bazilarinin ya da hepsinin uygulanmasi için kullanilabilmektedir. Bazi örneklerde, alanda programlanabilir bir geçit dizilimi, burada tarif edilen yöntemlerden birini uygulamak için bir mikro- islemci ile is birligi yapabilir. Genel olarak. yöntemler, tercihen herhangi bir donanim cihazi ile gerçeklestirilir. Yukarida tarif edilen düzenlemeler yalnizca. mevcut bulusun prensipleri için gösterim saglamaktadir. Düzenlemelerin ve burada tarif edilen detaylarin modifikasyonlari ve varyasyonlari teknikte uzman kisilere açik oldugu anlasilmaktadir. Dolayisiyla, amaç buradaki örneklerin tarif ve açiklama yoluyla sunulan spesifik detaylariyla degil, ekteki patent istemlerinin kapsami ile sinirli olmaktir. TR TR TR