Google, deneysel dünya modeli teknolojisini temel alan Project Genie prototipini erişime açtı. Sistem, kullanıcıların metin ve görsellerle kendi etkileşimli dünyalarını oluşturmasına, bu dünyalarda gerçek zamanlı hareket etmesine ve içerikleri yeniden düzenlemesine imkan veriyor. Erişim ilk aşamada ABD’de 18 yaş üstü Google AI Ultra abonelerine sunuluyor. Project Genie, araştırma prototipi olarak Google DeepMind altyapısıyla geliştirildi ve web tabanlı etkileşimli bir uygulama olarak çalışıyor.
Project Genie ve Genie 3 dünya modeli nasıl çalışıyor?
Project Genie’nin temelinde, Google’ın daha önce ön gösterimini yaptığı Genie 3 adlı genel amaçlı dünya modeli yer alıyor. Dünya modeli, bir ortamın dinamiklerini simüle eden ve kullanıcı eylemlerinin ortamı nasıl değiştirdiğini hesaplayan yapay zeka sistemi olarak tanımlanıyor.

Daha önce satranç ve Go gibi belirli kurallı ortamlar için geliştirilen ajan sistemlerinin aksine Genie 3, farklı türde ve açık uçlu çevreleri gerçek zamanlı üretiyor.
Genie 3, sabit 3D sahneler yerine kullanıcı hareket ettikçe önündeki yolu anlık olarak oluşturuyor. Sistem, fizik kurallarını ve nesne etkileşimlerini simüle ediyor.
Aynı zamanda robotik simülasyonlar, animasyon modelleme, kurgu senaryoları, gerçek mekan benzetimleri ve tarihi ortam kurguları gibi çok farklı senaryoları üretebiliyor.
Google, bu modelin erken sürümünün güvenilir test kullanıcıları tarafından farklı sektörlerde aktif biçimde denendiğini ve çok çeşitli kullanım biçimleri ortaya çıktığını aktarıyor.
Project Genie, bu model araştırmasının devamı olarak geliştirilen etkileşimli bir prototip uygulama. Altyapıda Genie 3’e ek olarak Gemini ve Nano Banana Pro sistemleri de yer alıyor. Kullanıcı arayüzü doğrudan tarayıcı üzerinden çalışıyor ve dünya üretimi adım adım yönlendiriliyor.
Kullanıcılar metin komutları ve yükledikleri ya da sistem tarafından üretilen görsellerle bir dünya taslağı oluşturuyor. Karakter yapısı, ortam türü ve dolaşım biçimi bu aşamada belirleniyor. Yürüme, sürüş, uçuş gibi hareket türleri seçilebiliyor.
Nano Banana Pro entegrasyonu sayesinde oluşturulacak dünyanın ön izlemesi görülüyor ve sahne girişinden önce görsel düzenleme yapılabiliyor. Kamera bakış açısı birinci şahıs veya üçüncü şahıs olarak ayarlanabiliyor.
Oluşturulan dünya gezilebilir bir ortama dönüşüyor. Kullanıcı ilerledikçe sistem sahneyi gerçek zamanlı üretiyor. Kamera konumu hareket sırasında değiştirilebiliyor. Var olan dünyalar, orijinal komutları temel alınarak yeniden düzenlenebiliyor.
Galeride yer alan seçili dünyalar veya rastgele dünya üretim aracı üzerinden yeni varyasyonlar oluşturulabiliyor. Oturum sonunda oluşturulan dünya ve keşif süreci video olarak dışa aktarılabiliyor.
Google, Project Genie’nin deneysel bir araştırma prototipi olduğunu ve mevcut sürümde bilinen sınırlamalar bulunduğunu açıkça belirtiyor. Üretilen dünyalar her zaman gerçeğe birebir uymayabiliyor, komutlara veya referans görsellere tam bağlı kalmayabiliyor ve fizik simülasyonunda hatalar görülebiliyor.
Karakter kontrolünde gecikme ve hassasiyet sorunları oluşabiliyor. Tekil üretimler 60 saniye ile sınırlı çalışıyor. Ağustos ayında duyurulan ve keşif sırasında dünyayı dinamik biçimde değiştiren olay komutları gibi bazı model yetenekleri bu prototipte henüz yer almıyor.
Project Genie erişimi ABD’deki Google AI Ultra aboneleri için dağıtıma çıktı. Sistem ilerleyen dönemde farklı ülkelere de açılacak. Google, dünya modeli tabanlı üretken ortamların hem yapay zeka araştırmalarında hem de üretken medya alanında nasıl kullanıldığını bu prototip üzerinden doğrudan kullanıcı verileriyle izleyeceğini bildiriyor.



