OpenAI’nin o3 yapay zeka modeli, xAI’ın Grok 4 modelini satrançta 4-0’lık net bir skorla yendi. Kaggle’ın Game Arena platformunda düzenlenen turnuva, sekiz büyük dil modelini karşı karşıya getirdi. Finalde OpenAI’nin o3 modeli ile xAI’ın Grok 4’ü mücadele etti ancak karşılaşma Grok için zorlu geçti.
OpenAI’ın o3 modeli, satranç finalinde Grok 4’ü 4-0 mağlup etti
Turnuvada yer alan modeller arasında OpenAI’nin o3 ve o4-mini’si, Google’ın Gemini 2.5 Pro ve Flash’ı, Anthropic’in Claude Opus’u, Moonshot’ın DeepSeek ve Kimi modelleri ile xAI’ın Grok 4’ü bulunuyordu. Finalde Grok 4, yaptığı hatalarla dikkat çekerken o3 dengeli bir oyun sergiledi.
Karşılaşmaları eski dünya satranç şampiyonu Magnus Carlsen ve büyükusta David Howell yorumladı. Carlsen, Grok’un hamlelerini “teoriyi öğrenmiş ama devamını bilmeyen bir kulüp oyuncusu” şeklinde tanımladı.
İlk oyunda filini erken kaybeden Grok devamında taş değişimlerini hızla yaparak pozisyon üstünlüğünü kaybetti. Carlsen, Grok’un seviyesini yaklaşık 800 ELO olarak değerlendirirken o3’ü 1200 ELO civarında konumlandırdı.
Carlsen, o3’ün oyunu avantajını kaybetmeden tamamladığını ve taş kaybı yaşamadan klasik satranç taktiklerini uyguladığını belirtti. Grok için ise doğru zamanda doğru hamleyi yapamadığını, hamlelerin satrançla ilgili olsa da yanlış sıralama ve zamanlama ile geldiğini ifade etti.
Turnuvanın amacı yalnızca satranç rekabeti değil, yapay zeka modellerinin katı kurallar içeren görevlerdeki performansını gözlemlemekti. Satranç da yapay zekanın planlama, seçenekleri değerlendirme, ciddi hatalardan kaçınma ve mantıksal tutarlılık gibi yeteneklerini açık şekilde gösteren bir alan.
Finalin OpenAI ile xAI arasında olması ise Sam Altman ve Elon Musk arasındaki rekabeti gündeme getirdi. Sonuç olarak şirketler arasındaki genel çekişmeyi bitirmese de OpenAI için kamuoyunda önemli bir prestij kazanımı sağladı.
https://www.youtube.com/watch?v=5q3u3lwsPi4&t=130s