Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Haber - Alibaba Qwen2.5-Max Karşılaştırmalarda DeepSeek-V3 Modelini Geride Bıraktı

Alibaba Qwen2.5-Max Karşılaştırmalarda DeepSeek-V3 Modelini Geride Bıraktı

30 Ocak 2025 - 09:00
- Haber, Yapay Zeka
Qwen2.5-Max DeepSeek-V3

Son dönemde DeepSeek adını sorgulara verilen yanıtları iyileştiren yeni akıl yürütme modeli R1 sayesinde sıkça duyar olduk. DeepSeek’in ana akıl yürütme dışı modeli DeepSeek-V3 ise Aralık ayında kendi etkileyici karşılaştırma puanlarıyla geldi. Öte yandan, bir diğer Çinli şirket olan Alibaba, DeepSeek-V3’ü ve bazı testlerde GPT-4o-0806 ile Claude-3.5-Sonnet-1022’yi geride bırakan Qwen2.5-Max modelini yayınladı.

Qwen2.5-Max mi DeepSeek-V3 mü?

DeepSeek gibi Qwen2.5-Max de Çin siyasi sorunları konusunda hassas, bu soruları bile yanıtlamıyor, Qwen Chat’te bu sorguları denediğinizde sadece kota sınırınızı aştığınızı söylüyor ancak konuyu değiştirdiğinizde iyi yanıtlıyor.

Alibaba’nın modelini rekabete karşı test etmek için kullandığı bazı ölçütler arasında üniversite düzeyindeki problemler aracılığıyla bilgiyi test eden MMLU-Pro, kodlama yeteneklerini değerlendiren LiveCodeBench, genel yetenekleri kapsamlı bir şekilde test eden LiveBench ve insan tercihlerini tahmin eden Arena-Hard yer alıyor.

Qwen2.5-Max, Arena-Hard’da 89,4 puanla birinci oldu ve en yakın rakibi 85,5 puanla DeepSeek-V3 oldu. MMLU-Pro’da Claude Sonnet, Qwen2.5-Max’in 76,1 puanına kıyasla 78,0 puanla kazandı. GPQA-Diamond ölçütünde Claude’un 65,0 puanına kıyasla 60,1 puanla Claude Sonnet’in ardından ikinci oldu.

LiveCodeBench’te Claude’un 38,9 puanına kıyasla 38,7 puan aldı. Son olarak, LiveBench’te Qwen, DeepSeek’in 60.5 puanına kıyasla 62.2 puanla kazandı.

Şirketin yaptığı diğer bazı karşılaştırmalar ise şunlar:

Yeni Qwen2.5-Max, geliştiricilerin platformlarına entegre etmeleri için bir API aracılığıyla ve son kullanıcılar için Qwen Chat aracılığıyla erişilebilir. İkinci seçenek, Artifacts’ı kullanmanıza ve görüntü veya video oluşturmanıza olanak tanıyor. Ek olarak, web aramasını etkinleştirmek için bir düğme de var ancak bunun yakında geleceğini belirtiliyor.

Etiketler: aialibabaDeepSeekDeepSeek-V3karşılaştırmaQwen2.5-Maxyapay zekaYZ
PaylaşPaylaşTweetYollaPaylaş
İlker Şekercioğlu

İlker Şekercioğlu

Tam bir teknoloji bağımlısı olan İlker, teknolojideki son gelişmeleri meraklıları ile paylaşmaktan keyif alıyor.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • 6-7 bin TL 27 inç 4K monitör önerisi
  • Yurt dışı iPhone süresi uzatma
  • CS2 kasaları nasıl nakite çevirilir?
  • Exvega kötü müşteri hizmeti
  • Aile paylaşımı ile oyun çalınabilir mi?
  • Hz. Aişe'nin evlilik yaşı tarihsel gerçekler ve modern yorumlar arasında bir tartışma
  • Gemini'yi Siri gibi telefonda kapsamlı kullanmak mümkün mü?
  • RAM fiyatları neden 1 haftada 3 katına çıktı?
  • Tuvalet tıkandığı için kat malikleri dava açabilir mi?
  • Kadının zorunlu askerlik hakkında dedikleri konusunda düşünceleriniz nedir?

Technopat Video

Şu an oynayan

4K 160Hz ve FHD 320Hz arası geçiş yapabilen monitör: Philips Evnia 27M2N3800A inceleme

Philips Evnia 27M2N3800A inceleme

4K 160Hz ve FHD 320Hz arası geçiş yapabilen monitör: Philips Evnia 27M2N3800A inceleme

Haber
En iyisi olabilir! ASUS ROG Ally X inceleme

En iyisi olabilir! ASUS ROG Ally X inceleme

Haber
AOC GAMING CU34G4Z inceleme

Oyunculara özel 34 inç kavisli monitör: AOC GAMING CU34G4Z inceleme

Haber

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.


01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.
Netse
Çerez Onayı
Web sitemizi ziyaret ettiğinizde, kullanıcı deneyiminizi daha iyi hale getirmek, hizmetlerimizi size daha etkin bir şekilde sunabilmek için çerezler (cookies) ve benzeri araçlar kullanıyoruz. Çerezler, internet sitesinin düzgün çalışmasını sağlamak, içeriği kişiselleştirmek, sosyal medya özellikleri sağlamak ve trafik analizi yapmak için kullanılan küçük metin dosyalarıdır. Çerezleri nasıl kullandığımız ve kişisel verilerinizi nasıl işlediğimiz hakkında daha fazla bilgi almak için çerez politikamızı ve kişisel veri politikamızı inceleyebilirsiniz.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, sadece kullanıcının açıkça talep ettiği belirli bir hizmetin kullanılmasını sağlama amacıyla veya iletişimin elektronik iletişim ağı üzerinden iletilmesinin tek amacıyla yasal olarak kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından istenmeyen tercihlerin depolanması yasal amacıyla gereklidir.
İstatistikler
Sadece istatistiksel amaçlarla kullanılan teknik depolama veya erişim. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Pazarlama
Teknik depolama veya erişim, reklam gönderimi için kullanıcı profilleri oluşturmak veya kullanıcıyı bir web sitesinde veya birden fazla web sitesinde benzer pazarlama amaçları için takip etmek amacıyla gereklidir.
  • Seçenekleri yönet
  • Hizmetleri yönetin
  • {vendor_count} satıcılarını yönetin
  • Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri yönet
  • {title}
  • {title}
  • {title}
Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal