Gemma 4 yapay zeka ailesinin yeni sürümleri, bellek gereksinimlerini azaltmak ve cihaz içi performansı artırmak amacıyla Quantization-Aware Training (QAT) yöntemiyle optimize edildi. İki ay önce kullanıma sunulan Gemma 4, o günden bu yana yeni özelliklerle geliştirilmeye devam ediyor. Çıkarım süreçlerini hızlandırmak için eklenen Çoklu Token Tahmini (MTP) özelliğinin ardından, geçtiğimiz günlerde de E4B ve 26B MOE modelleri arasındaki boşluğu kapatmak için 12 milyar parametreli (12B) yeni bir model yayınlanmıştı. QAT optimizasyonu sayesinde bu modeller artık mobil cihazlarda ve dizüstü bilgisayarlarda çok daha verimli çalışacak.



