Elon Musk’ın sahibi oldupu yapay zeka şirketi xAI, Grok 2 adlı son nesil yapay zeka modelini beta olarak kullanıma sundu. Duyuru, Musk’ın bu yılın başlarında model için yakında bir güncelleme sunulacağı sözü veren yorumlarının ardından geldi.
Grok ile birlikte xAI; Amazon’un desteklediği Anthropic’in Claude’u, Microsoft’un desteklediği OpenAI’nin ChatGPT’si, Facebook’un sahibi Meta’nın Llama’sı ve Google’ın Gemini’si dünyadaki önde gelen yapay zeka yazılım ürünleri arasında yer alıyor. Bunların hepsi genel tüketici ve kurumsal kullanım durumları için yapay zeka özellikleri sunuyor ve Grok 2’nin sürümü bu iki yönü de kapsıyor.
Grok 2 erken bir önizleme aşamasında ve X sosyal medya platformunda kullanıcılara sunulacak bir mini Grok 2 modelini içeriyor. Grok 2, UC Berkley’nin Büyük Model Sistemleri Örgütü’nün (LMSYS) yapay zeka karşılaştırmalarında test edildi ve OpenAI’nin GPT-4o’suna neredeyse eşit olduğu ortaya çıktı.
LMSYS’ye göre Grok 2, matematik ve kodlamada 2. en iyi, zor komutlara yanıt verme becerisinde ise 3. en iyi olarak derecelendirildi. Bu da genel liderlik tablosunda üçüncü sıraya yerleşmesini sağladı. Grok 2’nin önünde ChatGPT 4.0 ve Gemini 1.5 Pro yer alıyor.
xAI’nin kendi verileri, Grok 2’nin GPT 4 Turbo’dan daha iyi performans gösterdiğini ve GPT 4o’nun küçük bir farkla gerisinde kaldığını gösteriyor. Öte yandan, OpenAI’nin ChatGPT 4o, 1.314’lük genel LMSYS ELO derecesi sayesinde xAI’ın verilerinde bile yapay zeka performansının kralı durumunda. Öte yandan xAI’nin Grok 2’nin erken sürümü 1.281 puana sahipken, Gemini 1.5 Pro’nun medyan puanı 1.297.
Sohbet robotu performansı tarafında, Grok 2, daha iyi puan alan yanıtların yüzdesini ölçen “kazanma oranı”nda Gemini 1.5 Pro’nun gerisinde kalıyor. Google’ın ürününe karşı oranı %48 ve xAI’ın verileri, kullanıcıların resim yüklemelerine ve yapay zekadan bunlara dayalı yanıtlar üretmesini istemelerine olanak tanıyan bir model olan OpenAI’nin ChatGPT 4o için karşılaştırılabilir rakamlar göstermiyor.
xAI, Grok 2’nin “hem metin hem de görsel anlayışta gelişmiş yeteneklerle” geldiğini ve modelin X’te bulunan verileri kullandığını söylüyor. Diğer yapay zeka ürünleri gibi, Grok 2 mini de yazma, kodlama veya metinsel istem yanıtları oluşturma gibi özellikleri destekleyen genel tüketici kullanımına yönelik olacak.
xAI, Grok 2 ve Grok 2 mini’nin ürünlerinin kurumsal kullanım durumları için bu ayın sonuna kadar geliştiricilere sunulacağını paylaşıyor.