Tam olarak ne ile kıyaslıyorsun arkadaşım? ElevenLabs 10 saniye süren verilen örneği istenilen ses modeline dönüştüren bir ses teknolojisi. Burada ise senin isteklerini dinleyip onlara göre hareket eden, duygu ve tonlamalar yapan (ki bunu kendi isteği ile yapıyor elevenlabs'in böyle bir durumu yok sen ses verir isen o tonlamaları taklit eder) bir anlık konuşma aracı. Bu zaten en üst seviye yapay zekada ve daha da gelişecek.
@İsimsizMan09 aslında seni dinleyip istediğini vermesi tamamen GPT'ye ait. Burada GPT-4 ile 4o arasındaki fark gibi bir fark olabilir. Bu konuda emin olmadığım için bir şey diyemedim zaten.
Çünkü arada sadece devasa bir veri setiyle eğitilmiş GPT'ye küçük bir ses entegresi olabilir, yahut daha farklı bir şey de olabilir.
Karadeniz ağzı, Ege ağzı vs. yapması da kafa karıştırmıyor değil, bu konu da var. ElevenLabs bunu yapabilir mi?
@İsimsizMan09 aslında seni dinleyip istediğini vermesi tamamen GPT'ye ait. Burada GPT-4 ile 4o arasındaki fark gibi bir fark olabilir. Bu konuda emin olmadığım için bir şey diyemedim zaten.
Çünkü arada sadece devasa bir veri setiyle eğitilmiş GPT'ye küçük bir ses entegresi olabilir, yahut daha farklı bir şey de olabilir.
Karadeniz ağzı, Ege ağzı vs. yapması da kafa karıştırmıyor değil, bu konu da var. ElevenLabs bunu yapabilir mi?
Bu güncelleme zaten bir model güncellemesinden ziyade konuşma modu geliştirmesi içeriyor. Eskiden her bir aşama ayrı ayrı işlemlerden geçerken artık tek bir şekilde geçiriliyor ve daha kaliteli bir ses teknolojisi oluyor. Yapay zekanın bu şive, gülme, üzülme, ses tonlaması ayarlama gibi şeyleri nasıl yaptığını bilmiyoruz ama insan sesi ile eğitilmiş olabilir.