Z.ai'dan 1 milyon token bağlam penceresine sahip açık ağırlıklı kodlama modeli: GLM-5.2

Wait 5 sec.

Çin merkezli Z.ai, uzun soluklu kodlama ve ajan tabanlı yazılım geliştirme görevlerine odaklanan yeni amiral gemisi modeli GLM-5.2’yi kullanıma sundu. Model, özellikle büyük kod tabanlarını tek seferde anlayabilme, çok adımlı refactoring süreçlerini sürdürebilme ve yazılım geliştirme akışını uçtan uca yönetebilme yetenekleriyle öne çıkıyor. GLM-5.2’nin en dikkat çeken özellikleri arasında 1 milyon token bağlam penceresi, 128 bin token maksimum çıktı kapasitesi, farklı düşünme eforu seviyeleri ve MIT lisanslı açık ağırlık yapısı yer alıyor. Hugging Face’te yer alan bilgilere göre model, 753 milyar parametreye sahip. Modelin proje ölçeğinde mühendislik bağlamını işleyebildiğini belirten Z.ai, gereksinimlerden uygulanabilir ürüne kadar uzanan geliştirme akışlarında daha kararlı sonuçlar verdiğini ifade ediyor. Bu anlamda GLM-5.2’nin yalnızca kısa kod parçaları yazan bir yardımcı olmaktan çıkarak büyük kod tabanlarında uzun süreli görevler yürütebilen bir yazılım ajanı alternatifi haline geldiğini söyleyebiliriz. Modelin 1 milyon tokenlık bağlam penceresine sahip olması, özellikle büyük ölçekli yazılım projeleri yürütenler için önemli. Z.ai dokümanlarında GLM-5.2'nin, modül sınırları, API kontratları, dizin yapıları, mimari kararlar ve geçmiş konuşma bağlamını daha uzun süre koruyacak şekilde tasarlandığını vurguluyor. Bu sayede modelin, bir kod tabanının yalnızca belirli dosyalarını değil, daha geniş proje bağlamını aynı iş akışı içinde değerlendirmesi hedefleniyor.GLM-5.2, “High” ve “Max” olmak üzere iki farklı düşünme eforu seviyesine sahip. Bu yaklaşım sayesinde geliştiriciler, hız, maliyet ve yanıt kalitesi arasında seçim yapabiliyor. Z.ai, karmaşık ve çok adımlı kodlama görevleri için Max seviyesini öneriyor. Z.ai’nin paylaştığı benchmark (ölçüt) tablosuna göre model, SWE-bench Pro’da 62,1 puan alarak GLM-5.1’in 58,4’lük skorunu geride bırakıyor. Aynı tabloda GPT-5.5’in SWE-bench Pro skoru 58,6, Gemini 3.1 Pro’nun skoru ise 54,2 olarak yer alıyor. Terminal Bench 2.1’de ise GLM-5.2’nin 81,0 puanla GLM-5.1’e kıyasla ciddi bir sıçrama yaptığı görülüyor.Ayrıca Z.ai GLM-5.2’nin FrontierSWE, PostTrainBench ve SWE-Marathon gibi uzun soluklu yazılım mühendisliği ölçütlerinde açık ağırlıklı modeller arasında en üst sırada yer aldığını belirtiyor. Şirketin dokümanlarına göre model, FrontierSWE’de Claude Opus 4.8’in yalnızca yaklaşık 1 puan gerisinde kalırken, bazıölçütlerde GPT-5.5 ve Opus 4.7’yi geride bırakıyor. Bu noktada sonuçların Z.ai tarafından paylaşıldığını ve bağımsız testlerin modelin gerçek dünya performansını daha net göstereceğini belirtmekte fayda var.Z.ai’ın resmi fiyatlandırma sayfasına göre GLM-5.2 API kullanımı 1 milyon girdi token'ı için 1,40 dolar, 1 milyon cached girdi token'ı için 0,26 dolar, 1 milyon çıktı token'ı için ise 4,40 dolar olarak fiyatlandırılıyor. Modelin GPT-5.5’e kıyasla yaklaşık altıda bir maliyetle rekabetçi uzun soluklu kodlama performansı sunduğu aktarılıyor. Z.ai, GLM-5.2’de uzun bağlam kullanımını daha verimli hale getiren IndexShare adlı bir yönteme yer veriyor. Bu yöntem sayesinde model, 1 milyon tokenlık bağlam penceresinde çalışırken işlem maliyetini önemli ölçüde düşürebiliyor. Hugging Face’teki model kartına göre IndexShare, token başına işlem maliyetini 2,9 kat azaltıyor. Hugging Face üzerinde MIT lisansıyla yayınlanan model, Transformers, vLLM, SGLang ve Docker Model Runner gibi araçlarla kullanılabiliyor. Bu sayede geliştiriciler, modeli yerel olarak çalıştırabiliyor, kendi altyapılarına entegre edebiliyor veya farklı çıkarım (inference) sağlayıcıları üzerinden deneyebiliyor.Görsel kaynak: ChatGPT