Google, yapay zeka destekli üretkenlik araçlarına bir yenisini daha ekledi. Google DeepMind tarafından geliştirilen yeni nesil müzik modeli Lyria 3, Gemini ile entegre şekilde dünya genelinde erişime açıldı. Sistem metinleri ve görselleri doğrudan müzik parçalarına dönüştürüyor ve kullanıcıların saniyeler içinde sözlü, besteli ve paylaşılabilir içerikler üretmesine izin veriyor.
İşte Lyria 3 ile üretilmiş bir Technopat şarkısı :)
Lyria 3, metin ve fotoğraflardan saniyeler içinde şarkı oluşturuluyor
Lyria 3, Google DeepMind’ın bugüne kadarki en gelişmiş müzik üretim modeli olarak tanıtıldı ve bugün itibarıyla Gemini üzerinden denenebiliyor. Çok modlu yapıya sahip sistem aynı anda hem metin hem görsel veri işliyor.
Kullanıcılar yalnızca yazdıkları komutlarla değil, yükledikleri fotoğraflarla da özgün müzik parçaları oluşturabiliyor. Gemini’ın görsel analiz yeteneği fotoğrafın atmosferini, renklerini ve sahnesini yorumlayarak buna uygun bir beste hazırlıyor.
Özellik şu anda gemini.google.com üzerinden masaüstünde çalışıyor. Mobil Gemini uygulamasına ise önümüzdeki günlerde eklenmesi planlanıyor. Sistem günlük kullanıma doğrudan hitap ediyor, herhangi bir teknik bilgi gerektirmeden sadece bir prompt yazarak müzik üretmek mümkün.
Model, yazılan komuta uygun şarkı sözlerini otomatik oluşturuyor. Kullanıcıların ayrıca söz yazmasına gerek kalmıyor. Tempo (BPM) müzik tarzı ve vokal karakteri üzerinde manuel kontrol seçenekleri de bulunuyor.
Oluşturulan parçalar saniyeler içinde tamamlanıyor ve her yaklaşık 30 saniyelik müzik için otomatik olarak bir kapak görseli hazırlanıyor. Kapak tasarımları Nano Banana tarafından üretiliyor. Ortaya çıkan müzik klipleri indirilebiliyor veya bağlantı ile anında paylaşılabiliyor.

Günlük konuşmalar da müzik haline gelebiliyor. Basit bir alışveriş listesi, örneğin cips, soda, çikolata, ekmek ve yoğurt içeren bir mesaj, model tarafından rap parçasına dönüştürülebiliyor. Aynı şekilde kullanıcılar bir fotoğraf yükleyip sahnenin hissine uygun soundtrack oluşturmasını isteyebiliyor.
Google, sistemin yalnızca üretim yapmadığını, doğrulama da gerçekleştirdiğini açıkladı. Gemini ile üretilen tüm ses dosyalarına insan kulağıyla duyulmayan SynthID dijital filigranı yerleştiriliyor.
Ayrıca kullanıcılar herhangi bir ses dosyasını Gemini’ye yükleyerek yapay zeka üretimi olup olmadığını kontrol edebiliyor. Sistem hem filigranı analiz ediyor hem de kendi model değerlendirmesini kullanarak kaynağa dair sonuç veriyor.
Lyria 3 şu anda İngilizce, Almanca, İspanyolca, Fransızca, Hintçe, Japonca, Korece ve Portekizce dillerinde 18 yaş üzerindeki kullanıcılara sunuldu. Özellik masaüstünde aktif durumda ve mobil uygulamaya birkaç gün içinde geliyor. Google AI Plus, Pro ve Ultra aboneleri daha yüksek kullanım limitleriyle erişim sağlıyor. Dil kapsamının ve üretim kalitesinin ilerleyen dönemde genişletileceği de doğrulandı.



