OpenAI tarafından Eylül ayında yanıt vermeden önce daha fazla düşünmek için tasarlanmış yeni o1 büyük dil modeli (LLM) serisi duyuruldu. Bu modeller karmaşık muhakeme görevleri için uygunken bilim, kodlama ve matematikte daha iyi performans gösteriyorlar. Şimd ise Google, Gemini 2.0 Flash Thinking adlı ilk muhakeme odaklı LLM’sini duyurdu. Bu yeni deneysel model, Google AI Studio’daki geliştiriciler için gemini-2.0-flash-thinking-exp-1219 adı altında mevcut. Google, bu son modelin çok modlu anlama, muhakeme ve kodlama için en uygun olduğunu iddia ediyor.
Google, çıkarım süresi hesaplamasını artırdığında umut verici sonuçlar gördüğünü belirtti. Ne yazık ki Google, iddiasını desteklemek için kendi başına herhangi bir kıyaslama paylaşmadı ancak Chatbot Arena‘ya göre Gemini-2.0-Flash-Thinking artık tüm kategorilerde 1 numarada yer alıyor.
Breaking news from Chatbot Arena⚡🤔@GoogleDeepMind's Gemini-2.0-Flash-Thinking debuts as #1 across ALL categories!
The leap from Gemini-2.0-Flash:
– Overall: #3 → #1
– Overall (Style Control): #4 → #1
– Math: #2 → #1
– Creative Writing: #2 → #1
– Hard Prompts: #1 → #1… https://t.co/lO1DiTiOOj pic.twitter.com/cq2MRMbWZ1— lmarena.ai (formerly lmsys.org) (@lmarena_ai) December 19, 2024
Google, modeli denemek için geliştirici portalında şu kullanım durumlarını listeledi:
- En karmaşık problemler üzerinde akıl yürütme
- Modelin düşünme sürecini gösterme
- Zor kod ve matematik problemlerini ele alma
Bu yeni model 128k’dan büyük bir bağlam uzunluğunu destekleyecek ve Ağustos 2024’te bilgi kesintisi ile birlikte geliyor. Geliştiriciler, bu yeni Gemini akıl yürütme modeline Google AI Studio ve Vertex AI’daki Gemini API’si aracılığıyla erişebilir.
Want to see Gemini 2.0 Flash Thinking in action? Check out this demo where the model solves a physics problem and explains its reasoning. pic.twitter.com/Nl0hYj7ZFS
— Jeff Dean (@JeffDean) December 19, 2024