Gemini 3 Flash için Agentic Vision duyuruldu! Ne işe yarıyor? - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Haber - Gemini 3 Flash için Agentic Vision duyuruldu! Ne işe yarıyor?

Gemini 3 Flash için Agentic Vision duyuruldu! Ne işe yarıyor?

30 Ocak 2026 - 11:55
- Haber, Teknoloji, Yapay Zeka

Google, Gemini 3 Flash modeli için Agentic Vision adını verdiği yeni görsel anlama yeteneğini duyurdu. Bu sistem, görsel akıl yürütmeyi doğrudan kod çalıştırma ile birleştiriyor ve verilen yanıtları görsel kanıta dayandırıyor.

Yeni yapı tek bakışta yorum yapan klasik görsel model yaklaşımı yerine görüntüyü adım adım inceleyen aktif bir araştırma süreci kullanıyor. Böylece seri numarası, uzak tabelalar ya da mikro detaylar gibi küçük unsurlar atlanmadan analiz ediliyor.

Agentic Vision ile görsel analiz süreci değişti

Agentic Vision, Gemini 3 Flash içinde görsel anlama sürecini statik değerlendirme yerine etken bir inceleme döngüsüne çeviriyor. Model, görsel ve kullanıcı sorgusunu birlikte değerlendiriyor, çok adımlı bir inceleme planı çıkarıyor ve ardından Python kodu üreterek görüntü üzerinde doğrudan işlem yapıyor.

Bar graph showing code execution with Gemini 3 Flash delivering a consistent 5-10% quality boost across most vision benchmarks.

Kırpma, döndürme, işaretleme, alan sayma ve hesaplama gibi işlemler kod yoluyla yürütülüyor. Ortaya çıkan yeni görseller modelin bağlam penceresine ekleniyor ve nihai yanıt bu genişletilmiş görsel kanıt üzerinden veriliyor.

Kod çalıştırma özelliği aktif kullanıldığında, görsel kıyaslama testlerinin büyük bölümünde kalite skorunun yüzde 5 ile 10 arası arttığı bildiriliyor. Sistem Think, Act, Observe döngüsü ile ilerliyor.

İlk aşamada model sorguyu ve görseli analiz edip plan kuruyor. İkinci aşamada ürettiği Python kodunu çalıştırarak görüntüyü dönüştürüyor ya da ölçüyor. Son aşamada oluşan yeni çıktıyı tekrar inceleyip yanıtını netleştiriyor.

Agentic Vision diagram introduces an agentic Think, Act, Observe loop into image understanding tasks

Agentic Vision, yüksek çözünürlüklü görsellerde küçük detaylara otomatik yakınlaşma davranışı da gösteriyor. Yapı planı doğrulama alanında kullanılan PlanCheckSolver platformunda bu yöntemle doğruluk oranının yüzde 5 yükseldiği paylaşıldı.

Model, çatı kenarları ve yapı bölümleri gibi alanları parça parça kırpıp yeniden bağlama ekliyor ve kurallara uygunluğu bu görsel kanıt üzerinden kontrol ediyor.

Görsel açıklama tarafında da farklı bir yaklaşım kullanılıyor. Model yalnızca gördüğünü tarif etmiyor, görüntü üzerine doğrudan çizim yapabiliyor. Örnek senaryoda bir eldeki parmak sayısı istenirken, model her parmak için kutu ve numara etiketleri çiziyor. Bu görsel taslak üzerinden sayım yapıyor ve sonucu buna göre veriyor. Böylece tahmin yerine piksel düzeyinde doğrulama kullanılıyor.

Yoğun veri içeren tablolar ve grafikler üzerinde de aynı yöntem geçerli. Model ham veriyi görselden çıkarıyor, Python ortamında normalize ediyor ve grafik üretiyor.

Matplotlib ile oluşturulan grafik çıktısı doğrudan yanıtın parçası oluyor. Çok adımlı görsel matematik işlemlerinde görülen tahmin hataları bu şekilde azaltılıyor.

Agentic Vision şu anda API üzerinden kullanıma açıldı. Geliştiriciler özelliği Google AI Studio ve Vertex AI üzerinden etkinleştiriyor. Gemini uygulamasında da kademeli dağıtım başladı ve model seçim alanında Thinking modu seçilerek erişiliyor. AI Studio Playground ortamında Tools bölümünde Code Execution anahtarı açılarak doğrudan test yapılabiliyor.

Google, sonraki güncellemelerde yakınlaştırma dışındaki davranışların da otomatik hale geleceğini, döndürme ve görsel matematik gibi işlemlerin açık komut gerektirmeden tetikleneceğini bildiriyor.

Ayrıca web araması ve ters görsel arama gibi yeni araçların da modele eklenmesi planlanıyor. Agentic Vision yeteneğinin ilerleyen dönemde Flash dışındaki model boyutlarına da genişletilmesi yer alıyor.

Etiketler: Agentic Visiongoogle
PaylaşPaylaşTweetYollaPaylaş
Berkan Aslan

Berkan Aslan

Berkan Aslan, yazılım odaklı kariyerini bilişim ve bilgisayar teknolojileri alanındaki derin tecrübesiyle şekillendiren bir teknoloji editörüdür. Uzman yazılımcı kimliğiyle yazılım geliştirme, yapay zeka sistemleri ve bilgisayar teknolojileri üzerine uzun yıllara dayanan bir bilgi birikimine sahiptir. Aynı zamanda teknoloji haberciliği alanında da aktif olarak görev alan Aslan, geçmişte farklı ve önemli yayınlarda editoryal çalışmalarda bulundu. Technopat’ta Haber Editörü olarak görev yapan Aslan, yazılım, yapay zeka, bilgisayar, donanım ve otomobil teknolojileri başta olmak üzere geniş bir yelpazede hazırladığı içeriklerde, teknik bilgiyi güncel gelişmelerle birleştirerek okurlara aktarıyor. Dünyadan teknoloji gündemini yakından takip ederek uzmanlık alanlarına giren konularda analitik ve bilgi odaklı içerikler üretiyor.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • Aternos için yazılım önerisi
  • Nays girişte "teknik sorun hatası" verip açılmıyor
  • 5000 TL'ye Fare, klavye ve kulaklık önerisi
  • Türkiye nereye gidiyor?
  • RX 6500 XT, PCIe 3.0 ile nasıl performans verir?
  • 30 bin TL'ye 2K OLED monitör tavsiyesi
  • Dijital oyun mağazalarına Türkiye'de temsilci bulundurma zorunluluğu geliyor!
  • iPhone 13'ten Galaxy S24'e geçilir mi?
  • ASUS TUF Gaming VG279Q5A vs Gigabyte GS32QCA vs ASUS TUF VG279Q5A
  • Buds 2'den Buds 3 Pro'ya geçilir mi?

Technopat Video

Şu an oynayan

Adım adım sistem toplama rehberi [2026]

Sistem toplama rehberi: 2026 güncel donanımlarla sistem nasıl toplanır? Adım adım anlattık.

Adım adım sistem toplama rehberi [2026]

Ekran Kartı
T Raporu 7. bölüm yayınlandı: Yapay zekadan siber güvenliğe, otomotivden mobil dünyaya!

T Raporu 7. bölüm yayınlandı: Yapay zekadan siber güvenliğe, otomotivden mobil dünyaya!

Android
Yale Linus L2 Lite İnceleme: Daha Kompakt, Daha Hesaplı Akıllı Kilit Deneyimi

Yale Linus® L2 Lite İnceleme: Daha Kompakt, Daha Hesaplı Akıllı Kilit Deneyimi

Ev Teknolojileri

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.

01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.

Hosting :

Çerez Onayı
Web sitemizi ziyaret ettiğinizde, kullanıcı deneyiminizi daha iyi hale getirmek, hizmetlerimizi size daha etkin bir şekilde sunabilmek için çerezler (cookies) ve benzeri araçlar kullanıyoruz. Çerezler, internet sitesinin düzgün çalışmasını sağlamak, içeriği kişiselleştirmek, sosyal medya özellikleri sağlamak ve trafik analizi yapmak için kullanılan küçük metin dosyalarıdır. Çerezleri nasıl kullandığımız ve kişisel verilerinizi nasıl işlediğimiz hakkında daha fazla bilgi almak için çerez politikamızı ve kişisel veri politikamızı inceleyebilirsiniz.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, sadece kullanıcının açıkça talep ettiği belirli bir hizmetin kullanılmasını sağlama amacıyla veya iletişimin elektronik iletişim ağı üzerinden iletilmesinin tek amacıyla yasal olarak kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından istenmeyen tercihlerin depolanması yasal amacıyla gereklidir.
İstatistikler
Sadece istatistiksel amaçlarla kullanılan teknik depolama veya erişim. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Pazarlama
Teknik depolama veya erişim, reklam gönderimi için kullanıcı profilleri oluşturmak veya kullanıcıyı bir web sitesinde veya birden fazla web sitesinde benzer pazarlama amaçları için takip etmek amacıyla gereklidir.
  • Seçenekleri yönet
  • Hizmetleri yönetin
  • {vendor_count} satıcılarını yönetin
  • Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri yönet
  • {title}
  • {title}
  • {title}
Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Nasıl Yapılır
  • Yapay Zeka
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal