Fransız girişim Mistral AI kod oluşturma, matematik ve muhakeme konusunda önemli ölçüde daha yetenekli olan Large 2 adlı yeni amiral gemisi modelini duyurdu. Mistral ayrıca Large 2’ye gelişmiş çoklu dil desteği ve gelişmiş işlev çağırma yetenekleri de eklendiğini ifade ediyor.
Mistral Large 2 modelinin 123 milyar parametresi bulunuyor. Bu da onun tek bir H100 düğümünde yüksek verimde çalışmasına olanak tanıyor. Model; Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Arapça, Hintçe, Rusça, Çince, Japonca ve Korece dillerini destekliyor. Kodlama açısından ise Python, Java, C, C++, JavaScript ve Bash dahil 80’den fazla kodlama dili destekleniyor.
Mistral Large 2 sadece araştırma ve ticari olmayan kullanım için ücretsiz olarak sunulurken ticari kullanım için model lisansı gerekiyor.
Mistral Large 2’nin performansı, kodlama kriterlerinde OpenAI GPT-4o, Anthropic Claude Opus 3 ve Meta Llama 3.1 405B ile karşılaştırılabilir. Wild Bench, Arena Hard ve MT Bench kıyaslamalarında Large 2, Llama 3.1 405B ve Claude 3 Opus’tan daha iyi performans gösteriyor. Popüler MMLU kıyaslamasında bu yeni model, Llama 3.1 70B’yi geride bırakıyor ve Llama 3.1 405B ile kıyaslanabilir.
Geliştiriciler için Mistral Large 2 artık geliştirilmiş işlev çağırma ve alma becerileriyle birlikte geliyor. Artık hem paralel hem de sıralı işlev çağrılarını yürüterek geliştiricilerin karmaşık iş yapay zeka uygulamaları oluşturmasına da olanak tanıyor.
Mistral, model portföyünü güçlendiriyor. Mistral Nemo ile Mistral Large olmak üzere iki genel amaçlı model ve Codestral ile Embed olmak üzere iki özel model sunuluyor. Mistral gelecekte Apache modellerini (Mistral 7B, Mistral 8x7B ve 8x22B, Codestral Mamba, Mathstral) ise kullanımdan kaldıracak.
Microsoft ve Mistral’ın zaten Mistral modellerini Azure’da kullanıma sunmak için bir ortaklığı vardı. Artık Mistral modellerinin Google Cloud’da kullanılabilmesini sağlamak için Google ile de ortaklık sağlanmış durumda.