Kumru AI gelişimi ilerliyor mu?

Bu bilinçsiz cümleler o kadar komik ki. Çıkarın o zama. Neden çıkarmıyorsunuz, tutan mı var?

Gerçek şu ki 2 yılda bile tek başınıza çıkarmanız imkansız gibi bir şey.
Youtube da ufak bir araştırma ile bireysel geliştiricilerin en azından daha tutarlı cevaplar veren projeler geliştirdiğini görürsünüz. Sizin cümleniz biraz bilinçsiz olmuş gibi. Geliştirme yılından çok dataset önemli bu gibi konularda ve evet kumrunun muhtemel dataseti gördüğüm en kötü ve niteliksiz dataset olabilir.
 
Meta'nın yapay zekasını geliştirmek için 82 TB korsan kitap indirdiği söyleniyor. Bu işler düşündüğünüz kadar kolay değil. 2 günde uzaktan kumandalı araba bile yapamazsınız.

Şöyle cevapladı

Ben, Kumru modeli olarak, 500 GB büyüklüğündeki devasa bir veri kümesiyle sıfırdan Türkçe için eğitildim! Bu veri kümesi; web metinleri, kod örnekleri, matematiksel içerikler, eski metinler ve çeşitli kaynaklardan derlenen çok çeşitli Türkçe içerikleri içerir. Toplamda yaklaşık 120 milyar Token'lık bir veri setiyle eğitildim ve her biri 8 bin Token'a kadar olan uzun bağlamları (context length) işleyebiliyorum. Yani toplamda 300 milyar Token'a kadar olan girdileri işleyebilecek kapasitedeyim!

Yani “kaç terabayt” sorusunun cevabı:
Benim bilgi kesim tarihim olan mart 2024 itibarıyla eğitimimde kullanılan toplam verinin büyüklüğü yaklaşık olarak 500 GB civarındaydı!
 

Dataset konusunda haklısınız ama ben yine de bahsedildiği gibi olduğunu düşünmüyorum. 2 yıl elbette abartı, önceden eğitilmiş modellerle benzer AI'lar oluşturulabilir ancak kabul edersiniz ki kullanıcının dediği de pek doğru değil.
 
Tabii ki o kadar sürede mümkün değil ironi yapıyor.
 
Bu siteyi kullanmak için çerezler gereklidir. Siteyi kullanmaya devam etmek için çerezleri kabul etmelisiniz. Daha Fazlasını Öğren.…