Anasayfa Haber NVIDIA’dan Yapay Zeka Destekli Konuşma Algoritması: RAD-TTS

NVIDIA’dan Yapay Zeka Destekli Konuşma Algoritması: RAD-TTS

NVIDIA’nın geliştirmiş olduğu yapay zeka destekli konuşma projesi etkileyici özelliklere sahip ve birçok alanda hizmet verebilir.

Sentezlenmiş sesler yıllar içinde çok yol katetti. Alexa ve Siri gibi modern yapay zeka asistanları ise çok gerçekçi insan sesleri çıkarabiliyor, aynı zamanda oldukça akıcı konuşuyorlar. NVIDIA ise RAD-TTS adlı bir yapay zeka modeli geliştirdi.

Böylelikle geliştiriciler, modeli kendi sesleriyle eğitebiliyor ve öğrenilen tonlamalar kullanılarak metinler doğal konuşmaya dönüştürülebiliyor. Ayrıca bir konuşmacının ve hatta şarkıların sesi, bir diğer insanın sesine dönüştürülebiliyor. NVIDIA yeni çözümünü şöyle tanımlıyor:

Bir müzik enstrümanı olarak insan sesinden ilham alan RAD-TTS arayüzü, kullanıcılara sentezlenen sesin perdesi, süresi ve enerjisi üzerinde ince kontroller sağlıyor.

NVIDIA ayrıca “I AM AI” video serisinde kullanılan teknolojinin örneklerini sergiliyor. Aşağıdaki videoda ise yapay zeka destekli modelin bazı becerilerinden bahsedilmiş.

Bu teknoloji, otomatik müşteri hizmetleri, dil çevirisi, engelliler için destek ve hatta oyunlar dahil olmak üzere birçok alanda kullanılabilir. Özetleyecek olursak, doğal insan sesi gerektiren hemen hemen her uygulamada RAD-TTS’den yararlanmak mümkün olabilir.

Blog yazısında yapay zeka destekli teknolojiyle ilgili ayrıca şu bilgiler veriliyor:

Modellerin birçoğu NVIDIA DGX sistemlerinde on binlerce saatlik ses verileriyle eğitiliyor. Geliştiriciler, kullanım durumuna göre herhangi bir modele ince ayar yapabilir ve NVIDIA Tensor Core GPU’larda karma hassas bilgi işlem kullanarak eğitimi hızlandırabilir.

Araçlar NVIDIA ekran kartlarına sahip bilgisayarlarda kullanım için optimize edildi. Ancak çalışmalar açık kaynak kodlu ve ilgilenen tüm geliştiriciler için ücretsiz olarak sunuluyor.