GLM-4.7 AI rakiplerini geride bıraktı - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Yapay Zeka - Açık kaynak yapay zeka dengeleri değişirdi! GLM-4.7 rakiplerini geride bıraktı

Açık kaynak yapay zeka dengeleri değişirdi! GLM-4.7 rakiplerini geride bıraktı

24 Aralık 2025 - 17:08
- Haber, Teknoloji, Yapay Zeka

Açık kaynak büyük dil modelleri ile kapalı sistemler arasındaki performans farkı uzun süredir tartışma konusuydu. Paylaşılan son benchmark sonuçlarıyla birlikte bu tablo önemli ölçüde değişti. GLM-4.7 çok sayıda akademik ve pratik testte hem önceki sürümlerini hem de Claude Sonnet, Gemini ve GPT-5 sınıfındaki modelleri geride bırakarak açık kaynak cephesinde yeni bir eşiğe ulaştı.

GLM-4.7 benchmark sonuçları ne gösteriyor?

Paylaşılan veriler GLM-4.7’nin özellikle muhakeme, matematik, kod üretimi ve ajan tabanlı görevlerde istikrarlı biçimde üst sıralarda yer aldığını ortaya koyuyor. MMLU-Pro testinde 84,3 puan alan model önceki sürüm GLM-4.6’nın üzerine çıkarken birçok modelle aynı seviyede konumlandı. GPQA-Diamond ve IMOAnswerBench gibi bilgi ve akıl yürütme ağırlıklı testlerde de benzer bir tablo ortaya çıktı.

Matematik odaklı AIME 2025 ve HMMT testlerinde GLM-4.7’nin 95 puan bandını aşması dikkat çekiyor. Bu skorlar modelin yalnızca dil üretiminde değil ileri seviye problem çözme tarafında da güçlü bir yapı sunduğunu gösteriyor. Özellikle HMMT Şubat 2025 testinde elde edilen 97,1 puan açık kaynak bir model için bugüne kadar görülen en yüksek sonuçlardan.

Kod ve yazılım ajanı tarafında da benzer bir tablo söz konusu. SWE-bench Verified ve SWE-bench Multilingual testlerinde GLM-4.7 hem çok dilli kod üretiminde hem de gerçek hata çözüm senaryolarında önceki açık kaynak modelleri geride bıraktı. LiveCodeBench-v6 sonuçları modelin canlı kod üretimi ve hata ayıklama performansının tüm rakip sistemlerle aynı ligde yer aldığını ortaya koyuyor.

Terminal Bench ve BrowseComp testleri ise GLM-4.7’nin yalnızca metin üretmekle sınırlı kalmadığını, araç kullanımı, komut satırı görevleri ve bağlam yönetimi gibi ajan yeteneklerinde de ciddi bir ilerleme kaydettiğini gösteriyor. BrowseComp bağlam yönetimi testinde elde edilen 67,5 puanla model çok adımlı görevlerde de tutarlı bir performans sunuyor.

Açık kaynak modeller ilk kez bu kadar geniş bir benchmark setinde rakipleriyle yakın, hatta bazı başlıklarda daha iyi performans sergiliyor. GLM-4.7’nin Hugging Face üzerinde açık şekilde erişilebilir olması ve geliştiriciler tarafından doğrudan kullanılabilmesi de bu başarıyı daha da kritik hale getiriyor.

BenchmarkGLM-4.7GLM-4.6Kimi K2 ThinkingDeepSeek-V3.2Gemini 3.0 ProClaude Sonnet 4.5GPT-5-HighGPT-5.1-High
MMLU-Pro84.383.284.685.090.188.287.587.0
GPQA-Diamond85.781.084.582.491.983.485.788.1
HLE24.817.223.925.137.513.726.325.7
HLE (w/ Tools)42.830.444.940.845.832.035.242.7
AIME 202595.793.994.593.195.087.094.694.0
HMMT Feb. 202597.189.289.492.597.579.288.396.3
HMMT Nov. 202593.587.789.290.293.381.789.2–
IMOAnswerBench82.073.578.678.383.365.876.0–
LiveCodeBench-v684.982.883.183.390.764.087.087.0
SWE-bench Verified73.868.071.373.176.277.274.976.3
SWE-bench Multilingual66.753.861.170.2–68.055.3–
Terminal Bench Hard33.323.630.635.439.033.330.543.0
Terminal Bench 2.041.024.535.746.454.242.835.247.6
BrowseComp52.045.1–51.4–24.154.950.8
BrowseComp (w/ Context Manage)67.557.560.267.659.2–––
BrowseComp-Zh66.649.562.365.0–42.463.0–
τ²-Bench87.475.274.385.390.787.282.482.7
Etiketler: Claude SonnetgeminiGLM-4.7GPT-5
PaylaşPaylaşTweetYollaPaylaş
Mert Can Aka

Mert Can Aka

1996 yılında Üsküdar'da doğdu. Sinema, bilim, teknoloji ve tarih meraklısı. Öğrenmeyi ve paylaşmayı seven teknoloji editörü. -Technopat Yazı İşleri Müdürü-

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • RX 6700 XT sistem için Lian Li A3 alınır mı?
  • Rocky 7 2026'da çıkacak mı?
  • Soundpeats Air5 1.425TL
  • Linux dağıtımı önerisi
  • 20.000 TL bütçeye oyun ve gündelik kullanım için telefon önerisi
  • R5 7500F - RX 9060 XT sistemde Stutter ve %1 FPS düşüşleri meydana geliyor
  • The Last of Us Part 1 vs Resident Evil 4 remake
  • Tedarikçi nasıl bulunur?
  • BMW 3.18i̇ alınır mı?
  • DAC adaptör önerisi

Technopat Video

Şu an oynayan

Haftanın teknoloji gündemi: T Raporu 2. bölüm sizlerle

Haftanın teknoloji gündemi: T Raporu 2. bölüm sizlerle

Haftanın teknoloji gündemi: T Raporu 2. bölüm sizlerle

Haber
Yeni kasa, RTX 5070 Ti ve gerçek performans! Acer Predator Helios Neo 16 AI inceleme

Yeni kasa, RTX 5070 Ti ve gerçek performans! Acer Predator Helios Neo 16 AI inceleme

Haber
Uzun ömürlü olsun ama cebimi yakmasın diyenlere: İtopya RTX 5060 Ti OEM paket inceleme

Uzun ömürlü olsun ama cebimi yakmasın diyenlere: İtopya RTX 5060 Ti OEM paket inceleme

Haber

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.

01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.

Hosting :

Çerez Onayı
Web sitemizi ziyaret ettiğinizde, kullanıcı deneyiminizi daha iyi hale getirmek, hizmetlerimizi size daha etkin bir şekilde sunabilmek için çerezler (cookies) ve benzeri araçlar kullanıyoruz. Çerezler, internet sitesinin düzgün çalışmasını sağlamak, içeriği kişiselleştirmek, sosyal medya özellikleri sağlamak ve trafik analizi yapmak için kullanılan küçük metin dosyalarıdır. Çerezleri nasıl kullandığımız ve kişisel verilerinizi nasıl işlediğimiz hakkında daha fazla bilgi almak için çerez politikamızı ve kişisel veri politikamızı inceleyebilirsiniz.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, sadece kullanıcının açıkça talep ettiği belirli bir hizmetin kullanılmasını sağlama amacıyla veya iletişimin elektronik iletişim ağı üzerinden iletilmesinin tek amacıyla yasal olarak kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından istenmeyen tercihlerin depolanması yasal amacıyla gereklidir.
İstatistikler
Sadece istatistiksel amaçlarla kullanılan teknik depolama veya erişim. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Pazarlama
Teknik depolama veya erişim, reklam gönderimi için kullanıcı profilleri oluşturmak veya kullanıcıyı bir web sitesinde veya birden fazla web sitesinde benzer pazarlama amaçları için takip etmek amacıyla gereklidir.
  • Seçenekleri yönet
  • Hizmetleri yönetin
  • {vendor_count} satıcılarını yönetin
  • Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri yönet
  • {title}
  • {title}
  • {title}
Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Nasıl Yapılır
  • Yapay Zeka
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal