Gemini 3 Flash için Agentic Vision duyuruldu! Ne işe yarıyor? - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Haber - Gemini 3 Flash için Agentic Vision duyuruldu! Ne işe yarıyor?

Gemini 3 Flash için Agentic Vision duyuruldu! Ne işe yarıyor?

30 Ocak 2026 - 11:55
- Haber, Teknoloji, Yapay Zeka
Google Haberler'de Takip Et

Google, Gemini 3 Flash modeli için Agentic Vision adını verdiği yeni görsel anlama yeteneğini duyurdu. Bu sistem, görsel akıl yürütmeyi doğrudan kod çalıştırma ile birleştiriyor ve verilen yanıtları görsel kanıta dayandırıyor.

Yeni yapı tek bakışta yorum yapan klasik görsel model yaklaşımı yerine görüntüyü adım adım inceleyen aktif bir araştırma süreci kullanıyor. Böylece seri numarası, uzak tabelalar ya da mikro detaylar gibi küçük unsurlar atlanmadan analiz ediliyor.

Agentic Vision ile görsel analiz süreci değişti

Agentic Vision, Gemini 3 Flash içinde görsel anlama sürecini statik değerlendirme yerine etken bir inceleme döngüsüne çeviriyor. Model, görsel ve kullanıcı sorgusunu birlikte değerlendiriyor, çok adımlı bir inceleme planı çıkarıyor ve ardından Python kodu üreterek görüntü üzerinde doğrudan işlem yapıyor.

Bar graph showing code execution with Gemini 3 Flash delivering a consistent 5-10% quality boost across most vision benchmarks.

Kırpma, döndürme, işaretleme, alan sayma ve hesaplama gibi işlemler kod yoluyla yürütülüyor. Ortaya çıkan yeni görseller modelin bağlam penceresine ekleniyor ve nihai yanıt bu genişletilmiş görsel kanıt üzerinden veriliyor.

Kod çalıştırma özelliği aktif kullanıldığında, görsel kıyaslama testlerinin büyük bölümünde kalite skorunun yüzde 5 ile 10 arası arttığı bildiriliyor. Sistem Think, Act, Observe döngüsü ile ilerliyor.

İlk aşamada model sorguyu ve görseli analiz edip plan kuruyor. İkinci aşamada ürettiği Python kodunu çalıştırarak görüntüyü dönüştürüyor ya da ölçüyor. Son aşamada oluşan yeni çıktıyı tekrar inceleyip yanıtını netleştiriyor.

Agentic Vision diagram introduces an agentic Think, Act, Observe loop into image understanding tasks

Agentic Vision, yüksek çözünürlüklü görsellerde küçük detaylara otomatik yakınlaşma davranışı da gösteriyor. Yapı planı doğrulama alanında kullanılan PlanCheckSolver platformunda bu yöntemle doğruluk oranının yüzde 5 yükseldiği paylaşıldı.

Model, çatı kenarları ve yapı bölümleri gibi alanları parça parça kırpıp yeniden bağlama ekliyor ve kurallara uygunluğu bu görsel kanıt üzerinden kontrol ediyor.

Görsel açıklama tarafında da farklı bir yaklaşım kullanılıyor. Model yalnızca gördüğünü tarif etmiyor, görüntü üzerine doğrudan çizim yapabiliyor. Örnek senaryoda bir eldeki parmak sayısı istenirken, model her parmak için kutu ve numara etiketleri çiziyor. Bu görsel taslak üzerinden sayım yapıyor ve sonucu buna göre veriyor. Böylece tahmin yerine piksel düzeyinde doğrulama kullanılıyor.

Yoğun veri içeren tablolar ve grafikler üzerinde de aynı yöntem geçerli. Model ham veriyi görselden çıkarıyor, Python ortamında normalize ediyor ve grafik üretiyor.

Matplotlib ile oluşturulan grafik çıktısı doğrudan yanıtın parçası oluyor. Çok adımlı görsel matematik işlemlerinde görülen tahmin hataları bu şekilde azaltılıyor.

Agentic Vision şu anda API üzerinden kullanıma açıldı. Geliştiriciler özelliği Google AI Studio ve Vertex AI üzerinden etkinleştiriyor. Gemini uygulamasında da kademeli dağıtım başladı ve model seçim alanında Thinking modu seçilerek erişiliyor. AI Studio Playground ortamında Tools bölümünde Code Execution anahtarı açılarak doğrudan test yapılabiliyor.

Google, sonraki güncellemelerde yakınlaştırma dışındaki davranışların da otomatik hale geleceğini, döndürme ve görsel matematik gibi işlemlerin açık komut gerektirmeden tetikleneceğini bildiriyor.

Ayrıca web araması ve ters görsel arama gibi yeni araçların da modele eklenmesi planlanıyor. Agentic Vision yeteneğinin ilerleyen dönemde Flash dışındaki model boyutlarına da genişletilmesi yer alıyor.

Etiketler: Agentic Visiongoogle
PaylaşPaylaşTweetYollaPaylaş
Berkan

Berkan

Berkan Aslan, yazılım odaklı kariyerini bilişim ve bilgisayar teknolojileri alanındaki derin tecrübesiyle şekillendiren bir teknoloji editörüdür. Uzman yazılımcı kimliğiyle yazılım geliştirme, yapay zeka sistemleri ve bilgisayar teknolojileri üzerine uzun yıllara dayanan bir bilgi birikimine sahiptir. Aynı zamanda teknoloji haberciliği alanında da aktif olarak görev alan Aslan, geçmişte farklı ve önemli yayınlarda editoryal çalışmalarda bulundu.Technopat’ta Haber Editörü olarak görev yapan Aslan, yazılım, yapay zeka, bilgisayar, donanım ve otomobil teknolojileri başta olmak üzere geniş bir yelpazede hazırladığı içeriklerde, teknik bilgiyi güncel gelişmelerle birleştirerek okurlara aktarıyor. Dünyadan teknoloji gündemini yakından takip ederek uzmanlık alanlarına giren konularda analitik ve bilgi odaklı içerikler üretiyor.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • WD Black SN8100 Gen5 vs Kingston NV3 Gen4 SSD
  • Perde betona barfiks demiri takmak binaya zarar verir mi?
  • CS2 seçkin alınmalı mı?
  • Salon için ikinci bir modem önerisi
  • 96.000 TL'ye alınan Sapphire 9060XT sistem iyi midir?
  • HTML nasıl öğrenilir?
  • 5500 TL monitör önerisi
  • Battlefield 1 oynarken laptop kendini yeniden başlatıyor
  • Ikinci el S23 vs sıfır POCO X7 Pro
  • Crimson Desert'daki envanter sistemi nasıl boşaltılır?

Technopat Video

Şu an oynayan

Yapay zekadan otomotive: T Raporu 14 bölüm yayında

Yapay zekadan otomotive: T Raporu 14 bölüm yayında

Yapay zekadan otomotive: T Raporu 14 bölüm yayında

Ekran Kartı
240 Hz OLED monitör ROG Strix OLED XG27AQDMGR inceleme

ASUS’tan 240 Hz OLED monitör: ROG Strix XG27AQDMGR inceleme

Haber
Gamer.Gen.TR RTX 5070 OEM paketi inceleme

Gamer.Gen.TR RTX 5070 OEM paketi inceleme

Ekran Kartı

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.

01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.

Hosting :

Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Nasıl Yapılır
  • Yapay Zeka
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal