Meta tarafından Llama 3 halefi Llama 3.1 yapay zeka model ailesi resmen duyuruldu. Llama 3.1 ailesi Llama 3.1 8B, Llama 3.1 70B ve Llama 3.1 405B olmak üzere üç model içeriyor. Her üç model de artık geliştirilmiş 128K bağlam uzunluğuyla geliyor. Ek olarak Meta, artık geliştiricilerin diğer modelleri geliştirmek için Llama modellerinden elde edilen çıktıları kullanmasına olanak tanıyor.
Meta Llama 3.1 8B, Llama 3.1 70B ve Llama 3.1 405B Yenilikleri
Meta, Llama 3.1 model ailesinin performansını 150’den fazla kıyaslama veri kümesinde değerlendirdi. Meta ayrıca bu modelleri gerçek dünya senaryolarındaki diğer rakip modellerle karşılaştırmak için çeşitli insan değerlendirmeleri de gerçekleştirmiş durumda.
Sonuçlara göre Llama 3.1 405B, GPT-4, GPT-4o ve Claude 3.5 Sonnet dahil önde gelen temel modellerle rekabet edebiliyor. Bu nedenle Meta artık Llama 3.1 405B’nin dünyanın en büyük ve en yetenekli, açık olarak bulunabilen temel modeli olduğunu iddia ediyor. Ayrıca daha küçük olan Llama 3.1 modelleri, boyut olarak benzer olan hem kapalı hem de açık modellerle rekabet halinde.
Llama 3.1 405B’nin diğer önde gelen modellerle karşılaştırması:
Llama 3.1 8B ve Llama 3.1 70B’nin diğer önde gelen modellerle karşılaştırması:
Llama 3.1 ailesi modelleri artık geliştiriciler tarafından AWS, NVIDIA, Databricks, Groq, Dell, Azure ve Google Cloud aracılığıyla kullanılabiliyor. Llama 3.1 405B, sunucusuz bir API uç noktası olarak Azure AI’nin Hizmet Olarak Modeller aracılığıyla edinilebiliyor. Ayrıca Llama 3.1 8B ve Llama 3.1 70B’nin en son ince ayarlı sürümleri artık Azure AI Model Kataloğu’nda kullanıma sunuldu.