Anthropic, güncellenen Claude 3.5 Sonnet modeli ve yeni Claude 3.5 Haiku modelinin lansmanının yanı sıra, Claude AI’ın bilgisayar ekranlarını kontrol etmesine ve bir kullanıcı adına işlem yapmasına olanak tanıyan “bilgisayar kullanımı” adlı deneysel bir genel beta API’sini duyurdu. Geliştiriciler bu API aracılığıyla Claude’un bir ekrana bakmasını, imleci hareket ettirmesini, düğmelere tıklamasını ve metin yazmasını yönlendirebilir. Anthropic, geri bildirim toplamak ve zamanla hızla iyileştirmek için bugün bu API’yi yayınlıyor.
Anthropic ekibi duyuru blog yazısında bu yeni yetenek hakkında şunları yazdı: “Bilgisayar kullanımıyla temelde yeni bir şey deniyoruz. Claude’un bireysel görevleri tamamlamasına yardımcı olacak belirli araçlar yapmak yerine, ona genel bilgisayar becerileri öğretiyoruz; böylece insanlar için tasarlanmış çok çeşitli standart araçlar ve yazılım programları kullanabiliyor.”
Geliştiriciler, tekrarlayan süreçleri otomatikleştirmek, uygulamaları test etmek ve hatta araştırma gibi görevleri yürütmek için Claude bilgisayar API’sini kullanabilecek. Şirket bunu şöyle açıklıyor: “Geliştiriciler, Claude’un talimatları (örneğin, “bu formu doldurmak için bilgisayarımdaki ve çevrimiçi verileri kullan”) bilgisayar komutlarına (örneğin, bir elektronik tabloyu kontrol etme; bir web tarayıcısını açmak için imleci hareket ettirme; ilgili web sayfalarına gitme; bu sayfalardaki verilerle bir formu doldurma vb.) çevirmesini sağlamak için bu API’yi entegre edebilirler.”
Anthropic ekibi, Claude’un bilgisayarları kullanma konusundaki mevcut yeteneğinin henüz tamamlanmadığını, çünkü kaydırma, sürükleme ve yakınlaştırma gibi bazı yaygın kullanıcı eylemlerini gerçekleştiremediğini açıkça belirtti. Bu yeni API spam, yanlış bilgilendirme veya dolandırıcılık için kullanılabileceğinden, Anthropic bilgisayar kullanımının ne zaman kullanıldığını ve zararın meydana gelip gelmediğini belirlemek için yeni sınıflandırıcılar da geliştirdi.
Anthropic, Asana, Canva, Cognition, DoorDash, Replit ve The Browser Company gibi birçok girişimin tamamlanması yüzlerce adım gerektiren görevleri gerçekleştirmek için bilgisayar kullanım API’sini halihazırda araştırdığını vurguladı.