Derleyici
Programın yürütülmesi |
---|
Genel kavramlar |
Kod çeşitleri |
Derleme stratejileri |
Kaydadeğer çalışmazamanları (runtime) |
|
Kaydedeğer derleyiciler & araç setleri |
|
Derleyici, kaynak kodu makine koduna dönüştüren yazılımdır. Bir programlama dilinin derleyicisi, o programlama dili kullanılarak yazılmış olan kodu hedef işlemci mimarisine göre uygun şekilde makine koduna derler ve genellikle çıktı olarak yürütülebilir dosyanın (executable file) oluşturulmasını sağlar. Bu eyleme derleme denir. Bir başka ifadeyle derleyici, bir tür yazı işleyicidir; girdi olarak yazı alır ve çıktı olarak yazı verir.
Bilgi işlemde, yürütülebilir dosya doğrudan işlemci tarafından çalıştırılabilecek bir dosyayı ifade eder. Dosya makine kodu ile yazılmış komut seti talimatları bütününden oluşur.
Derleyiciler çalışma prensiplerine göre ayrılır. Bir derleyici, yorumlayıcı ve assembler'de olduğu gibi sözcüksel analiz (lexical analysis) ve ayrıştırma (parsing) aşamalarını gerçekleştirir.
Derleyicilerin ürettiği yürütülebilir dosyalar her zaman platforma özel olarak derlenmiş makine kodlarından oluşmaz, bazen kaynak kod bir ara temsil diline (intermediate representation) derlenir ve bu dil genellikle bytecode'lardan oluşur ve sanal bir makinede çalıştırılır. Ara dillerin bilinen örnekleri Microsoft .NET, Java Sanal Makinesi ve BEAM (Erlang Virtual Machine) şeklindedir. Bu platformlar kendilerine özgü bir ara dil kullanır. Örneğin JVM, Java Bytecode olarak adlandırılan bir ara dil kullanmaktadır. Bu şekilde derlenen diller tam zamanında derleme (Just in Time – JIT) tekniğini kullanır.
İki ana derleyici türü vardır, bunlar: yerel (native) ve çapraz (cross) derleyicilerdir. Yerel derleyiciler üzerinde çalıştığı platforma özgü derleme gerçekleştirir. Yerel bir derleyiciden elde edilecek çıktı yalnızca derleyicinin derleme zamanında yürütüldüğü sisteme yönelik olacaktır (Örn. Yerel bir derleyici ile C kodunun AMD64 mimarisini kullanan Linux çekirdeğinde çalışan bir makinede derlenmesi sonucu AMD64 ve Linux çekirdeğiyle uyumlu makine kodu elde edilmesi). Yerel derleyicilerin platform bağımsız düşünmeleri gerekmediğinden AOT derleme tekniği ile direkt olarak makine koduna derlenirler. Çapraz derleyiciler üzerinde çalıştıkları platformdan bağımsız bir şekilde destekledikleri tüm platformlara özel olarak makine kodu derlemeleri üretebilirler. Buna örnek olarak ARM64 üzerinde çalışan bir derleyicinin I386 için uyumlu makine kodu derlemesi gösterilebilir. Derleyici yalnızca kodu derlemekle ilgilenmez, aynı zamanda derleme zamanında gerekli gördüğü yerlerde kodu optimize edebilir ve daha optimum bir makine kodu üretmek için çabalayabilir. Buna derleyici optimizasyonu denir.
Makine üzerinde bulunan işlemcinin komut setine uygun şekilde derlenen saf makine kodlarının işlemci tarafından doğrudan yürütülebilir olduğundan en saf çalışma performansı bu şekilde derlenen dillerden elde edilebilir. Bu diller zamanından önce (Ahead of Time - AOT) derleme tekniğini kullanır.
Genellikle yürütülebilir dosya elde edilmesi şeklinde tanımlanmasının nedeni ise bir derleyicinin her zaman tam anlamıyla yürütülebilir dosya oluşturmamasından kaynaklanmaktadır.
Derleyicinin kullanılmasındaki amaç genellikle çalışabilir bir yazılım elde etmektir. Kullanıcıların programları kullanırken kolaylık sağlamak amaçlı geliştirilmiştir. Örneğin, şu satırı bir programın kaynak kodunda (programın okunabilir hali) düşünelim:
Alttaki assembly'de yazılmış satırlar, aynı programın derlenmiş halidir:
LOAD A [0] ;; belleğin 0 adresindeki veriyi A yazmacına yükle
ADD A BX ;; A yazmacına BX yazmacının adresinde bulunan veriyi ekle
STOR A [100] ;; sonucu 100 adresine yaz
Bu örnekte assembly'nin hedefi, programcının anladığı kaynak kodundan işlemcinin anladığı 0 ile 1 den oluşan makine dili kodunu üretmek (LOAD, ADD ve STOR komutları 0001, 0011 ve 0010 olarak yorumlanır)
0001 01 00 00000000
0011 01 10 00000010
0010 01 00 00000100
---- -- -- ---------
| | | |_________bellek adresi
| | |____________işaret
| |______________yazmaç
|_________________komut
Bir programlama dili genellikle insan tarafından okunabilir yapılardır. Bilgisayarlar komut seti içerisinde yer alan talimatlar dışında herhangi bir komut yorumlama yeteneğine sahip değillerdir. İşlemcilerin mimarisine göre komut seti de farklılık gösterir, bu nedenle derleyicilerin desteklenen her farklı işlemci mimarisi için farklı derleme aşamalarını izlemesi ve farklı makine kodu sonuçları üretmesi gerekir.
Derleyici yapısı
[değiştir | kaynağı değiştir]Bir derleyicinin yapısı hedef programlama diline göre değişiklik gösterse de genel olarak bir derleyicinin uygulanması (implementation) yaygın şekilde benzer aşamaları takip eder.
Ön Uç (Front end)
[değiştir | kaynağı değiştir]Bir derleyicinin ön ucu, kaynak kodun analiz edilerek daha kolay bir şekilde anlamlandırılması ve anlamlandırılmadan önce bir takım sözdizimi gibi hataların kontrol edildiği yerdir.
- Sözcüksel analiz: kaynak kodun incelenerek jeton (token) olarak temsil edilecek şekilde ayrıştırılmasıdır. Tanımlayıcılar, anahtar kelimeler, operatorler ve diğer kaynak kod ögeleri jetonlar haline getirilerek temsil edilir ve program içerisinde ögelerin anlamlandırılmasında kullanılır.
Arka Uç (Back end)
[değiştir | kaynağı değiştir]Bir derleyicinin arka ucu işlenmiş olan ara temsilden yararlanarak hedef derleme platformuna uygun bir şekilde makine kodu oluşturulduğu yerdir. Birden fazla işlemci mimarisini destekleyen derleyiciler her bir mimari için farklı sonuçlar üreten farklı arka uçlara sahip olabilirler.
- Kod oluşturma: platforma uygun şekilde makine kodunun oluşturulmasıdır. Makine kodu içerisinde programın algoritmasının gerçekleşmesi gerekli olan talimatların yanı sıra hata ayıklama ve çalışma zamanı için özel olarak ek kodlar bulunabilir.
- Platforma bağlı optimizasyonlar: derleyici kod ürettiği platforma özel olarak üretilen makine kodu üstünde optimizasyonlar uygulayabilir ve girdi olarak alınan kaynak kodun teorik olarak daha iyi çalışan bir sürümünü elde edebilir.
Ayrıca bakınız
[değiştir | kaynağı değiştir]- Bağlayıcı
- Yorumlayıcı
- Sözcüksel analiz
- Bilgisayar
- İşlemci
- Programlama dili
- Kaynak kod
- Makine kodu
- Komut seti
Dış bağlantılar
[değiştir | kaynağı değiştir]Daha fazla bilgi için:
- ISBN 0-201-10088-6
- Introduction and overview of compilation (9-2 and 9-7, 2004) 4 Aralık 2004 tarihinde Wayback Machine sitesinde arşivlendi.