OpenAI(ChatGPT) açık kaynaklı modelini tanıttı!

Shinoa

Hectopat
Katılım
18 Temmuz 2022
Mesajlar
3.090
Makaleler
5
Çözümler
25
Yer
İstanbul
Ollama için kullanıma sunulmuş. 3o-Mini modelini geride bıraktığı belirtiliyor.

Model, İngilizce yazımda geliştirilmiş(Türkçe de kullanılabilir ama İngilizce temel) ayrıca GPT-4o gibi modellerin oluşturulmasında kullanılan token üst kümesi kullanılmış.

Kod yazma:
1754432735868.png


İnsancıl cevap verme:
1754432775697.png


120b modeli 80 GB GPU üzerinde sorunsuz çalıştığı gibi, 20B parametreli model ise 16 GB GPU için önerilmiş. Sanırım bu modeller Gemma 3, Qwen 2.5 Coder ve DeepSeep R1 gibi modelleri geride bırakacak ve onların yerini alacak.

Kişisel fikrim, OpenAI açık kaynaklı olmaya başladıysa, eski modellerini yani 4o gibi gelişmiş insancıl konuşma yeteneklerine sahip modellerini veya onlara çok yakınları sunabilir ve bu bayağı bir ilerleme demektir. Modeli henüz indirme şansım olmadı ancak en kısa zamanda deneyeceğim ve kod yazma becerileri, Türkçe anlama becerisi ve insancıl konuşma özelliklerini test ettiğim bir konu açacağım.

Kaynaklar:
 
Modeli denedim, 16 GB VRAM'de bile performanslı çalışacağını düşünmüyorum bence en az 20 GB gerekiyor. Model çok kaliteli ama sistem gereksinimleri de ona paralel.
Colab ve kaggle’ın verdiği T4 gpu ile ne kadar optimizd çalışır acaba? İlk fırsatta deneyeceğim.
 
RTX 4090 ile denedim hızlı bir şekilde cevap verdi, onda problem yok fakat kodlama konusunda kesinlikle berbat olduğunu düşünüyorum. Tool kullanımı konusunda berbat, bir türlü istediğim şekilde dönüt sağlamadı.
 
RTX 4090 ile denedim hızlı bir şekilde cevap verdi, onda problem yok fakat kodlama konusunda kesinlikle berbat olduğunu düşünüyorum. Tool kullanımı konusunda berbat, bir türlü istediğim şekilde dönüt sağlamadı.
Hangi dil yazıyorsunuz hocam? PHP de güzel sonuçlar aldım ben aslında ama System Prompt'um bütün projeyi kapsayacak şekilde yazmıştım, onun etkisi olabilir.
 
Hangi dil yazıyorsunuz hocam? PHP de güzel sonuçlar aldım ben aslında ama System Prompt'um bütün projeyi kapsayacak şekilde yazmıştım, onun etkisi olabilir.
C# için denedim, Roo Code ile beraber denedim ondan kaynaklı da olabileceğini düşünüyorum. Model bir süre sonra sürekli aynı şeyleri tekrarlamaya başladı, durumu daha ilginç kılan ise 128k bağlama kadar açmıştım. Ek olarak 20b modelini denedim. 120b durumu farklı olabilir.
 
C# için denedim, Roo Code ile beraber denedim ondan kaynaklı da olabileceğini düşünüyorum. Model bir süre sonra sürekli aynı şeyleri tekrarlamaya başladı, durumu daha ilginç kılan ise 128k bağlama kadar açmıştım. Ek olarak 20b modelini denedim. 120b durumu farklı olabilir.
Hocam tabii ChatGPT 4o kadar başarılı değil bu alanda ancak local modellerle kıyaslarsak Qwen 2.5 Coder(14b), Qwen 3(12b) gibi modellerden bayağı iyi, özellikle türkçe okuyup anlama konusunda çağ atlamış hissettim. Tabii karşılaştırma yaptığım modeller parametre olarak bu modelden küçükler ancak gereksinimleri hemen hemen aynı.
 
Hocam tabii ChatGPT 4o kadar başarılı değil bu alanda ancak local modellerle kıyaslarsak Qwen 2.5 Coder(14b), Qwen 3(12b) gibi modellerden bayağı iyi, özellikle türkçe okuyup anlama konusunda çağ atlamış hissettim. Tabii karşılaştırma yaptığım modeller parametre olarak bu modelden küçükler ancak gereksinimleri hemen hemen aynı.
Qwen3 Coder'ı denemenizi tavsiye ederim onun yanında en çok beğendiğim modelelrden birisi olan Devstral24B'de güzel. Qwen3 Coder'dan çok verim alamadım fakat Devstral gerçekten çok iyiydi, gerek tool kullanımında gerekse görevi anlamlandırma ve akabinde işleme konusunda kod yazımı da fena değil. Lokal modellerde kod anlamında kesinlikle Devstral benim için 1.'dir.

GPT4o konusuna hiç girmek istemiyorum, çok sıkıntı çıkartıyor, MCP sunucu toolunu yanlış çağırması mı dersin, genel görevin bir parçasını yapıp ben yaptım demesi mi, sonra taslak bırakması mı çok baş ağrıttı. En sonunda kafayı kırıp Cladue aboneliği satın alacağım.
 

Technopat Haberler

Yeni konular

Geri
Yukarı