Google I/O 2025 etkinliğinde en son medya oluşturma modellerini açıkladı. Bunlar arasında en dikkat çekicisi ise Veo 3 modeli kullanılarak sesli videolar üretilebilmesi oldu.
Veo 3 Artık Sesli Videolar ile Fark Yaratıyor
Veo 3 bundan böyle kuşların şarkılarının seslendirildiği bir video veya arka planda trafik seslerinin olduğu bir şehir sokağı oluşturabiliyor. Google, Veo 3’ün gerçek dünya fiziği ve dudak senkronizasyonunda da mükemmel olduğunu söylüyor. Şu anda, model yalnızca ABD’deki Gemini Ultra aboneleri için Gemini uygulamasında ve kurumsal kullanıcılar için Vertex AI’da kullanılabiliyor. Ayrıca Google’ın yeni yapay zeka film yapım aracı Flow’da da bu model mevcut.
Flow, sinematik klipler ve sahneler oluşturmak için Veo, Imagen ve Gemini’yi bir araya getiriyor. Kullanıcılar istedikleri nihai çıktıyı doğal dilde tanımlayabiliyor ve Flow bunu onlar için yapmak için çalışmaya başlıyor. Yeni araç şimdilik yalnızca ABD’deki Google AI Pro ve Ultra aboneleri için kullanılabilir olacak ancak Google yakında daha fazla ülkede kullanıma sunulacağını söylüyor.
Google henüz Veo 2 modelinden de vezgeçmiş değil. Kullanıcılar, Flow’da istedikleri çıktı için referans olarak kullanmak üzere Veo 2’ye insanların, sahnelerin, stillerin ve nesnelerin görüntülerini verebilecekler. Ayrıca, sahneleri döndürmelerine ve Flow için belirli nesnelere yakınlaştırmalarına olanak tanıyan kamera kontrollerine erişilebilecek. Ayrıca, kullanıcılar çerçevelerini portreden manzaraya genişletebilecek ve videolarına nesne ekleyip çıkarabilecek.
Imagen 4 Görsel Oluşturma Modeli de Tanıtıldı
Google ayrıca en son görüntü oluşturma modeli Imagen 4’ü tanıttı. Şirket, Imagen 4’ün karmaşık kumaşlar ve hayvan kürkü gibi ince ayrıntıları “dikkat çekici bir netlikle” işlediğini ve hem fotogerçekçi hem de soyut görüntüler oluşturmada mükemmel olduğunu söyledi.

Ayrıca, tipografiyi seleflerinden önemli ölçüde daha iyi işliyor ve 2K’ya kadar çözünürlüklerde çeşitli en boy oranlarında görüntüler oluşturabiliyor. Imagen 4 artık Gemini uygulaması, Vertex AI ve Docs ve Slides dahil Workspace uygulamalarında kullanılabilir durumda. Google ayrıca Imagen 3’ten 10 kat daha hızlı olan Imagen 4’ün bir versiyonunu “yakında” yayınlayacağını söyledi.



