Google I/O 2025 etkinliğinde doğrudan kişisel cihazlarda çalışmak üzere tasarlanmış Gemma 3n modeli duyuruldu. Peki, Google Gemma 3n neler sunuyor?
Google Gemma 3n Özellikleri
Gemma 3n’deki en büyük yeni gelişme, Google DeepMind tarafından geliştirilen Per-Layer Embeddings (PLE) adlı bir yeniliği kullanması. Bu, model için gereken bellek gereksinimlerini azaltmasıyla dikkat çekiyor. Gemma 3n için ham parametre sayısı 5B ve 8B ancak 2B ve 4B modelleriyle karşılaştırılabilir bellek ek yüklerine sahip. Google, bu modellerin sırasıyla yalnızca 2GB ve 3GB bellek ayak iziyle çalışabileceğini iddia ediyor.
Daha küçük bir bellek ayak izine sahip olmasının yanı sıra, PLE, KVC paylaşımı ve gelişmiş aktivasyon nicelemesi gibi teknikler, Gemma 3n’nin Gemma 3 4B ile karşılaştırıldığında mobilde çok daha iyi kalitede 1,5 kat daha hızlı yanıt vermeye başlamasını sağlıyor. Gemma 3n ayrıca, belirli kullanım durumlarınıza daha iyi uyan alt modelleri dinamik olarak oluşturmasına olanak tanıyan mix’n’match yeteneğini de kullanıyor.
Gemma 3n’nin bir diğer avantajı ise yerel yürütmeyi kullanması. Yani model tamamen cihazınız tarafından destekleniyor ve hiçbir veri istemlerinizin incelenebileceği bir sunucuya gitmiyor. Ek olarak bu, internet bağlantısı olmadan kullanılabileceği anlamına geliyor.

Gemma 3n’in ses, metin ve görüntüleri anlayabildiği ve video anlayışını önemli ölçüde geliştirdiği için çok modlu girdilerde çok daha iyi olduğu ifade ediliyor. Bu, karmaşık çok modlu etkileşimlerin anlaşılmasını sağlayarak modlar arasında transkripsiyonlar, çeviriler ve iç içe geçmiş girdiler gerçekleştirmesini sağlıyor.
Model, İngilizce dışındaki diller söz konusu olduğunda da daha iyi olmayı vaat ediyor. Kullanıcılar özellikle Japonca, Almanca, Korece, İspanyolca ve Fransızca’da gelişmiş performans görecekler. Model, WMT24++’da %50,1 gibi çok dilli karşılaştırmalarında da güçlü performans gösteriyor.
Gemma 3n’i artık hiçbir kuruluma gerek kalmadan doğrudan Google AI Studio’daki tarayıcınızda kullanmaya başlayabilirsiniz. Gemma 3n’i yerel olarak entegre etmek isteyen geliştiriciler bunu araçlar ve kütüphaneler sağlayan Google AI Edge aracılığıyla yapabilir.



