Google geçtiğimiz haftaki Cloud Next etkinliğinde, Gemini 2.5 Flash modelinin önemli iyileştirmelerle yakında geleceğini duyurmuştu ve şimdi şirket Gemini API’sinde Gemini 2.5 Flash ön izlemesinin Google AI Studio ve Vertex AI aracılığıyla kullanıma sunulacağını açıkladı. Yeni model, Gemini kullanıcıları için model seçici aracılığıyla da kullanılabiliyor ve belgeleri ile kodları kolayca iyileştirmek için Canvas ile birlikte kullanılabiliyor.
İlk Tam Hibrit Akıl Yürütme Modeli: Google Gemini 2.5 Flash
Gemini 2.0 Flash modelinin izinden giden Gemini 2.5 Flash, yüksek maliyetler veya gecikmeler olmadan akıl yürütme yeteneklerinde önemli iyileştirmeler sunuyor. Google, bu yeni modelin mükemmel bir performans-maliyet oranına sahip olduğunu iddia ediyor. Fiyatlandırmalar ise şu şekilde:
- 1 milyon giriş token’ı başına 0,15 dolar
- Akıl yürütme olmadan 1 milyon çıktı token’ı başına 0,60 dolar
- Akıl yürütme ile 1 milyon çıktı token’ı başına 3,50 dolar
Gemini 2.5 Flash, geliştiricilerin akıl yürütmeyi açmasına veya kapatmasına olanak tanıyan Google’ın ilk tamamen hibrit akıl yürütme modeli. Bunun geliştiricilerin hedeflenen kalite, maliyet ve gecikmeye bağlı olarak yanıtlarını optimize etmelerine yardımcı olduğu söyleniyor.
Düşük maliyetine rağmen Gemini 2.5 Flash, Anthropic ve Grok’un sınır modelleriyle karşılaştırıldığında kendi yerini koruyor gibi görünüyor. Ek olarak, OpenAI’nin yakın zamanda piyasaya sürdüğü o4-mini, Gemini 2.5 Flash ön izlemesinden daha iyi performans gösteriyor gibi görünse de önemli ölçüde daha pahalı.