Windows Agent Arena Üretken Yapay Zekaları Test Edecek - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Haber - Windows Agent Arena Üretken Yapay Zekaları Test Edecek

Windows Agent Arena Üretken Yapay Zekaları Test Edecek

16 Eylül 2024 - 11:00
- Haber, Yapay Zeka
Windows Agent Arena

Microsoft Research tarafından özellikle Windows PC platformunda yapay zeka çözümlerini test etmek için bir kıyaslama (benchmark) geliştirdiğini duyurdu. Microsoft’un GitHub sayfasında açıklanan kıyaslama, Windows Agent Arena olarak adlandırılıyor.

Windows Agent Arena, yapay zeka ajanlarının insanların genellikle kullandığı Windows uygulamalarıyla ne kadar iyi ve ne kadar hızlı etkileşim kurabileceğini test etmek için tasarlandı. Windows Agent Arena’da yapay zeka ajanlarıyla test edilen uygulamalar listesi arasında Microsoft Edge ve Google Chrome gibi web tarayıcıları, Dosya Gezgini Ayarları gibi işletim sistemi işlevleri, Visual Studio Code gibi kodlama uygulamaları, Not Defteri, Saat ve Paint gibi basit önceden yüklenmiş Windows uygulamaları ve VLC Player ile video izleme yer alıyor.

Microsoft’un açıklaması şu şekilde: “OSWorld çerçevesini, planlama, ekran anlama ve araç kullanımında ajan yetenekleri gerektiren temsili etki alanlarında 150’den fazla farklı Windows görevi oluşturmak için uyarlıyoruz. Kıyaslama ölçütümüz de ölçeklenebilir ve 20 dakika gibi kısa bir sürede tam bir kıyaslama değerlendirmesi için Azure’da sorunsuz bir şekilde paralelleştirilebilir.”

Microsoft Research ayrıca Windows Agent Arena karşılaştırma ölçütünde test etmek için Navi adlı kendi çok modlu ajanını oluşturdu. “Baktığım web sitesini bir PDF dosyasına dönüştürebilir ve ana ekranıma, yani Masaüstüne koyabilir misin?” gibi belirli metin istemleriyle görevler gerçekleştirmesi istendi. Şirket, Navi’nin ortalama %19,5’lik bir performans başarı oranına sahip olduğunu buldu. Öte yandan bu, %74,5’lik insan performans oranına kıyasla hala oldukça düşük.

Windows Agent Arena gibi bir karşılaştırma ölçütüne sahip olmak, yapay zeka ajanlarının oluşturulması için büyük bir gelişme olabilir. Böylece ajanlar iyileştirilebilir ve insan performansına daha yakın performans gösterebilirler.

Kıyaslama ölçütünün koduyla birlikte tam makaleyi GitHub üzerinden inceleyebilirsiniz.

Etiketler: aiMicrosoftmicrosoft researchWindows Agent Arenayapay zekayapay zeka ajanlarıYZ
PaylaşPaylaşTweetYollaPaylaş
İlker Şekercioğlu

İlker Şekercioğlu

Tam bir teknoloji bağımlısı olan İlker, teknolojideki son gelişmeleri meraklıları ile paylaşmaktan keyif alıyor.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • Samsung Odyssey Neo G8 4K monitör kalitesi
  • Instagram'da ban yedikten sonra yeni hesapta oturum açılmıyor
  • PC için uygun fiyatlı gamepad önerisi
  • GTA Vice City trainer önerisi
  • Redmi Note 13 Pro 5G HyperOS güncellemesi gelmiyor
  • 3500 TL Türkçe tuşlu, kablosuz, mekanik %100 klavye önerisi
  • Galaxy S25 yerine S26 beklenir mi?
  • Nothing Headphone (1) 8.499 TL
  • PlayStation Black Friday indirimlerinden oyun önerisi
  • Next YE-58GFSG8-QLED 58" alınır mı?

Technopat Video

Şu an oynayan

RAM overclock rehberi – Hız aşırtma nasıl yapılır?

RAM Overclock Rehberi - Hız aşırtma nasıl yapılır?

RAM overclock rehberi – Hız aşırtma nasıl yapılır?

Haber
İnsanlar ve yapay zeka ajanları yan yana çalışacak

İnsanlar ve yapay zeka ajanları yan yana çalışacak

Haber
Fiyat/performans kralı geldi! Sinerji RTX 5070 sistem inceleme

Fiyat/performans kralı geldi! Sinerji RTX 5070 sistem inceleme

Haber

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.


01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.
Netse
Çerez Onayı
Web sitemizi ziyaret ettiğinizde, kullanıcı deneyiminizi daha iyi hale getirmek, hizmetlerimizi size daha etkin bir şekilde sunabilmek için çerezler (cookies) ve benzeri araçlar kullanıyoruz. Çerezler, internet sitesinin düzgün çalışmasını sağlamak, içeriği kişiselleştirmek, sosyal medya özellikleri sağlamak ve trafik analizi yapmak için kullanılan küçük metin dosyalarıdır. Çerezleri nasıl kullandığımız ve kişisel verilerinizi nasıl işlediğimiz hakkında daha fazla bilgi almak için çerez politikamızı ve kişisel veri politikamızı inceleyebilirsiniz.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, sadece kullanıcının açıkça talep ettiği belirli bir hizmetin kullanılmasını sağlama amacıyla veya iletişimin elektronik iletişim ağı üzerinden iletilmesinin tek amacıyla yasal olarak kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından istenmeyen tercihlerin depolanması yasal amacıyla gereklidir.
İstatistikler
Sadece istatistiksel amaçlarla kullanılan teknik depolama veya erişim. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Pazarlama
Teknik depolama veya erişim, reklam gönderimi için kullanıcı profilleri oluşturmak veya kullanıcıyı bir web sitesinde veya birden fazla web sitesinde benzer pazarlama amaçları için takip etmek amacıyla gereklidir.
  • Seçenekleri yönet
  • Hizmetleri yönetin
  • {vendor_count} satıcılarını yönetin
  • Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri yönet
  • {title}
  • {title}
  • {title}
Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Nasıl Yapılır
  • Yapay Zeka
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal