GLM-4.7 AI rakiplerini geride bıraktı - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Yapay Zeka - Açık kaynak yapay zeka dengeleri değişirdi! GLM-4.7 rakiplerini geride bıraktı

Açık kaynak yapay zeka dengeleri değişirdi! GLM-4.7 rakiplerini geride bıraktı

24 Aralık 2025 - 17:08
- Haber, Teknoloji, Yapay Zeka
Google Haberler'de Takip Et

Açık kaynak büyük dil modelleri ile kapalı sistemler arasındaki performans farkı uzun süredir tartışma konusuydu. Paylaşılan son benchmark sonuçlarıyla birlikte bu tablo önemli ölçüde değişti. GLM-4.7 çok sayıda akademik ve pratik testte hem önceki sürümlerini hem de Claude Sonnet, Gemini ve GPT-5 sınıfındaki modelleri geride bırakarak açık kaynak cephesinde yeni bir eşiğe ulaştı.

GLM-4.7 benchmark sonuçları ne gösteriyor?

Paylaşılan veriler GLM-4.7’nin özellikle muhakeme, matematik, kod üretimi ve ajan tabanlı görevlerde istikrarlı biçimde üst sıralarda yer aldığını ortaya koyuyor. MMLU-Pro testinde 84,3 puan alan model önceki sürüm GLM-4.6’nın üzerine çıkarken birçok modelle aynı seviyede konumlandı. GPQA-Diamond ve IMOAnswerBench gibi bilgi ve akıl yürütme ağırlıklı testlerde de benzer bir tablo ortaya çıktı.

Matematik odaklı AIME 2025 ve HMMT testlerinde GLM-4.7’nin 95 puan bandını aşması dikkat çekiyor. Bu skorlar modelin yalnızca dil üretiminde değil ileri seviye problem çözme tarafında da güçlü bir yapı sunduğunu gösteriyor. Özellikle HMMT Şubat 2025 testinde elde edilen 97,1 puan açık kaynak bir model için bugüne kadar görülen en yüksek sonuçlardan.

Kod ve yazılım ajanı tarafında da benzer bir tablo söz konusu. SWE-bench Verified ve SWE-bench Multilingual testlerinde GLM-4.7 hem çok dilli kod üretiminde hem de gerçek hata çözüm senaryolarında önceki açık kaynak modelleri geride bıraktı. LiveCodeBench-v6 sonuçları modelin canlı kod üretimi ve hata ayıklama performansının tüm rakip sistemlerle aynı ligde yer aldığını ortaya koyuyor.

Terminal Bench ve BrowseComp testleri ise GLM-4.7’nin yalnızca metin üretmekle sınırlı kalmadığını, araç kullanımı, komut satırı görevleri ve bağlam yönetimi gibi ajan yeteneklerinde de ciddi bir ilerleme kaydettiğini gösteriyor. BrowseComp bağlam yönetimi testinde elde edilen 67,5 puanla model çok adımlı görevlerde de tutarlı bir performans sunuyor.

Açık kaynak modeller ilk kez bu kadar geniş bir benchmark setinde rakipleriyle yakın, hatta bazı başlıklarda daha iyi performans sergiliyor. GLM-4.7’nin Hugging Face üzerinde açık şekilde erişilebilir olması ve geliştiriciler tarafından doğrudan kullanılabilmesi de bu başarıyı daha da kritik hale getiriyor.

BenchmarkGLM-4.7GLM-4.6Kimi K2 ThinkingDeepSeek-V3.2Gemini 3.0 ProClaude Sonnet 4.5GPT-5-HighGPT-5.1-High
MMLU-Pro84.383.284.685.090.188.287.587.0
GPQA-Diamond85.781.084.582.491.983.485.788.1
HLE24.817.223.925.137.513.726.325.7
HLE (w/ Tools)42.830.444.940.845.832.035.242.7
AIME 202595.793.994.593.195.087.094.694.0
HMMT Feb. 202597.189.289.492.597.579.288.396.3
HMMT Nov. 202593.587.789.290.293.381.789.2–
IMOAnswerBench82.073.578.678.383.365.876.0–
LiveCodeBench-v684.982.883.183.390.764.087.087.0
SWE-bench Verified73.868.071.373.176.277.274.976.3
SWE-bench Multilingual66.753.861.170.2–68.055.3–
Terminal Bench Hard33.323.630.635.439.033.330.543.0
Terminal Bench 2.041.024.535.746.454.242.835.247.6
BrowseComp52.045.1–51.4–24.154.950.8
BrowseComp (w/ Context Manage)67.557.560.267.659.2–––
BrowseComp-Zh66.649.562.365.0–42.463.0–
τ²-Bench87.475.274.385.390.787.282.482.7
Etiketler: Claude SonnetgeminiGLM-4.7GPT-5
PaylaşPaylaşTweetYollaPaylaş
Mert Can Aka

Mert Can Aka

1996 yılında Üsküdar’da doğan Mert Can Aka, sinema, bilim, teknoloji ve tarih alanlarına duyduğu ilgiyle şekillenen kariyerinde teknoloji editörlüğüne odaklandı. Öğrenmeyi ve bilgiyi aktarmayı merkeze alan Aka, farklı kurumlarda çeşitli görevler üstlendi. Bu süreçte MediaMarkt’ın MediaTrend Teknolojik Yaşam dergisini son sayısına kadar yöneterek dergicilik tarafında da deneyim kazandı. Bilgisayar Mühendisliği, Bilgisayar Programcılığı, Web Tasarım ve Kodlama ile birlikte Adalet ve İktisat alanlarında akademik geçmişe sahip olan Aka, bugün Technopat’ta Yazı İşleri Müdürü olarak görev yapıyor. Otomotivden yapay zekaya, donanımdan ev teknolojilerine uzanan geniş bir yelpazede ürettiği on bini aşkın içerik yüz milyonlarca okura ulaştı.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • Wraith sorumsuz teknik servis süreci
  • Askerlik celp ve sevk dönemi ne zaman?
  • Ford Mondeo 2.0 şanzıman tamiri nasıl olur?
  • Stage 1 yazılım için Ankara'da güvenilir ECU remapçı önerisi
  • Size göre en korkunç şey nedir?
  • Shopier'den iade edilen kargonun parası gelmiyor
  • İnsan ve insan çatışması
  • iPhone 17 vs S25 Ultra
  • CS2 için 4.000 TL'ye kadar %60 klavye önerisi
  • Belirli ASUS ROG Ürünü Alanlara Yanında Resident Evil Requiem Hediye!

Technopat Video

Şu an oynayan

SanDisk WD_BLACK SN7100 inceleme: PCIe Gen4 hızları, düşük sıcaklık ve 2 TB kapasite

SanDisk WD_BLACK SN7100 inceleme: PCIe Gen4 hızları, düşük sıcaklık ve 2 TB kapasite

SanDisk WD_BLACK SN7100 inceleme: PCIe Gen4 hızları, düşük sıcaklık ve 2 TB kapasite

Haber
ZEISS kameralar, 6500 mAh pil ve Snapdragon 7 Gen 4: vivo V70 inceleme

ZEISS kameralar, 6500 mAh pil ve Snapdragon 7 Gen 4: vivo V70 inceleme

Akıllı Telefon
MWC 2026, Galaxy S26, iPhone 17e ve dahası: T Raporu 12. bölüm yayında

MWC 2026, Galaxy S26, iPhone 17e ve dahası: T Raporu 12. bölüm yayında

Akıllı Telefon

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.

01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.

Hosting :

Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Nasıl Yapılır
  • Yapay Zeka
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal