Yapay zekanın artık yapamadığı şey kalmadı. Dil modelleri görüntü oluşturma, video oluşturma, metin hazırlama, notları yönetme derken birçok şeyi hızlıca yapabiliyor. Hatta farklı amaçlara yönelik olarak seslendirme yapmak da mümkün.
Seslendirme kaydı yapmak yeterince zordur. İstediğinizi elde etmek için çok fazla kayıt yapmanız gerekebilir. Prova yapmak ve istediğiniz sesi elde etmek için yeterli zamanınız yok mu? Zamanınız olsa bile kaliteli sesler oluşturmak için yeterli donanıma sahip değil misiniz? O anda yapay zeka yardımınıza koşabilir.
Birçok farklı nedenden dolayı seslendirmeye ihtiyacınız olabilir. AI ses oluşturucularını bir deneyip şans verebilirsiniz. Etkileyici sonuçlar ortaya çıkabiliyor. Metinden ses üreten araçlar kalite, gerçekçilik ve kontroller konusunda uzmanlaşarak bilgisayarınıza mikrofon takmanıza bile gerek kalmadan metnin doğal bir yorumunu oluşturmanıza yardımcı oluyor.
Yapay Zeka ile Ses Oluşturma Nasıl Bir Şey?
Tıpkı diğer yapay zeka modelleri gibi, biz isteklerimizi metin şeklinde giriyoruz, mümkünse farklı materyaller de sağlıyoruz ve yapay zeka bizim için seslendirmeler üretiyor. Üretilen konuşmalar oldukça doğal ve gerçekçi, hatta gerçek bir kişi kelimeleri söylüyormuş gibi.
Bu sezgisel kontrolün ötesinde, her platform telaffuz, perde, ses seviyesi veya hız gibi üretimi yönlendirmenize yardımcı olacak bir dizi ayar sunmakta. Tam yapay zeka sesi kullanmayı planlıyorsanız, Konuşma Sentezi Biçimlendirme Dilini (Speech Synthesis Markup Language, SSML) kullanmayı öğrenebilir ve her bir kelimenin en üst düzeyde kontrolle nasıl gerçekleştirilmesi gerektiğini seçebilirsiniz.
En İyi Seslendirme Araçları
İnternet üzerinde birçok yapay zeka ses üretme platformu olabilir, ancak bunların hepsi kaliteli değil. Aşağıda bulabileceğiniz araçlar gerçekçilik, kontroller, ses kalitesi, tonlama ve ses kütüphanesi gibi çeşitli konularda başarılı.
ElevenLabs (Web)
Daha önce özel olarak değindiğimiz ElevenLabs sunduklarıyla başı çekiyor. Burada birçok gerçek kişinin sesi lisanslanabiliyor, yapay zeka destekli versiyonları da dahil olmak üzere 300’den fazla ses içeren bir ses kütüphanesi mevcut.
Farklı seslerin yanı sıra arama ve filtreleme araçları da yer alıyor. Sol taraftaki menüden Voices’a (Sesler) ve ardından ekranın üst kısmındaki Voice Library (Ses Kitaplığı) sekmesine tıklayın. Özel bir sesi arayabilir ya da sesleri stil veya amaca göre filtrelemek için kategorileri kullanabilirsiniz.
Kütüphanede konuşma seslerinden reklam odaklı seslere kadar, her türlü projeye uyacak seslendirmeler mevcut. Kategorilerin sağ tarafında, trend seslerden yüksek sayıda çıktı üretenlere kadar dört özelliğe göre sıralama yapmak için bir alan göreceksiniz. Hemen yanında, sesleri kategori, cinsiyet, yaş, dil ve aksana göre ayırmak için gelişmiş filtreler var.
Beğendiğiniz sesleri Voice Lab’e (Ses Laboratuvar) ekleyebilirsiniz. Sonrasında Speech’e (Konuşma) tıkladığınızda özel sesleri seçebileceksiniz. Tek yapmanız gereken metni yapıştırmak veya bir ses yüklemek.
Temel Yapay Zeka Diyaloğu
ElevenLabs’ı kullanmanın en basit yolu ücretsiz konuşma yapay zekası aracı. Bunu kullanmak için elevenlabs.io adresine gidin ve bir hesap oluşturun. Kendi e-postanızı ve Google hesabınızı kullanabilirsiniz.
- Sonrasında Speech Synthesis’e (Konuşma Sentezi) tıklayın.
- Ayarlar’da önceden hazırlanmış kadın veya erkek seslerinden birini seçin.
- Kararlılık ve Netlik + Benzerlik Geliştirme (yüksek kararlılık monotonal, yüksek netlik amaçlanan sese daha yakın) kaydırıcılarını ayarlamak için Ses Ayarlarını (Voice Settings) genişletin.
- Eleven English v1 veya Eleven Multilingual v1 modellerinden birini seçin.
- Eleven English v1 ile standart İngilizce dil modeliyle çeşitli sesler, stiller ve ruh hallerinde konuşmalar oluşturabilirsiniz.
- Eleven Multilingual v1 ile İngilizce, Almanca, Lehçe, İspanyolca, İtalyanca, Fransızca, Portekizce ve Hintçe dillerde sesler üretebilirsiniz.
- Test kısmına dönüştürmek istediğiniz metni girin.
- Devamında “Generate (Oluştur) butonuna tıklayın.
İşlem tamamlandığında üretilen ses otomatik olarak oynatılacak. Eğer oynatılmazsa Play tuşuna basarak dinleyebilirsiniz, ayrıca indirme yapabilirsiniz.
Yapay Zeka ile Ses Üretin
Yeni bir ses oluşturmayı tercih ederseniz VoiceLab sayfasını ziyaret edin ve “Add Generative or Cloned Voice” seçeneğine tıklayın.
- Add Voice > Voice Design’e tıklayın.
- Şimdi Generate voice kısmından gerekli ayarlamaları yapabilirsiniz.
Cinsiyet (Gender), Yaş (Age) ve Aksan (Accent) alanlarını ayarlayın.
Vurgu Gücü (Accent Strength) kaydırıcısını gerektiği gibi ayarlayın. - Dönüştürmek istediğiniz metni boş alana yazın.
- Son olarak Generate’e tıklayın. Bittiğinde elde edilen sesi dinleyebilirsiniz.
ElevenLabs her ay 10 dakikalık ses kesiti için ücretsiz deneme sunuyor. Ücretli planlar 30 dakikalık ses ve ses klonlama gibi ekstra özelliklerle birlikte ayda 5 dolardan (veya yılda 50 dolardan) başlıyor.
Speechify (Web, iOS, Android)
Speechify, tek seferde yaratıcı ve deneyimli bir seslendirme sanatçısı gibi kulağa hoş gelen bir çıktı üreterek rakiplerinin önüne geçiyor. Sakin, iyi tempolu, çeşitlilik ve tutarlılık arasında iyi bir denge var.
Speechify isimli şirket kendisini çoğunlukla üretkenlik kullanım durumları için yüksek sesle metin okumaya yönelik bir platform olarak markalaştırdığı için web sitesinin ana sayfası kafa karıştırıcı olabilir. Araba kullanırken veya dışarıda yürüyüş yaparken kullanabilirsiniz.
Diğer yandan projeleriniz için sesler oluşturmak ve indirmek istiyorsanız, Speechify Studio’ya ulaşmak için ekranın üst kısmındaki düğmeye tıklayın. Ünlü sesleri kullanamasanız da mevcut seçenekler oldukça kaliteli. Metni yapıştırdıktan sonra hızı artırıp azaltabilir, ses perdesini kontrol edebilir, ses seviyesini değiştirebilir, özel telaffuz ekleyebilir ve metnin farklı bölümlerinde duraklamalar ayarlayabilirsiniz.
Slayt tabanlı videolar oluşturuyorsanız, Speechify basit sunumları bir araya getirebilecek işleve sahip. Sadece sesi oluşturun, bir arka plan müzik parçası ekleyin ve kaydedin, bu kadar. Bir başka özellik olarak sesinizi platforma ekleyebiliyorsunuz. Böylece kendi sesinizi kullanarak seslendirmeler oluşturabilirsiniz.
Ücretsiz kullanılabilen platformun ücretli planı aylık 24 dolar veya yıllık 69 dolar.
WellSaid (Web)
WellSaid Labs senaryonuzun bölümleri üzerinde, gerekirse kelimesi kelimesine tam kontrol sunmakta. Peki nasıl çalışıyor?
Editörü açın ve senaryonuzu yapıştırın. Sağ taraftaki sekmede, kontrolleri açmak için Cues’a tıklayın. Ekrandaki kelimeler ana hatlarıyla gösterilmekte. Seçmek için kelimeye veya kelime kombinasyonuna tıklayın ve ardından ses yüksekliğini veya hızını ayarlayın. Bunun yerine bir virgül veya nokta seçerseniz, duraklamanın ne kadar uzun olması gerektiğini ayarlayabilirsiniz.
Bir bölümü düzenlemeyi bitirdiğinizde, seçimi kaldırmak için ekranın orta kısmında herhangi bir yere tıklayın. Sonrasında düzenlemiş olduğunuz kısmın renkli olarak vurgulandığını fark edeceksiniz; hızı değiştirdiyseniz yeşil, ses yüksekliğini düzenlediyseniz mavi, noktalama duraklamaları için mor renk tonları. Bu sayede geri dönüp ayarlama yapmak istediğinizde kolaylıkla aradığınızı bulabilirsiniz.
Telaffuz kontrolleri editörde yer almıyor. Sol taraftaki menüden Pronunciation’a (Telaffuz) tıklayın. Orijinal kelimeyi ekleyerek başlayın ve ardından yazılışını bozsa bile bunun yerine nasıl ses çıkarması gerektiğini yazın.
Araçlardan en iyi şekilde yararlanmak için, belgelerdeki en önemli konulara giriş noktaları içeren bir Resources (Kaynaklar) bölümü bulunmakta. Başlamanıza, ses oluşturma iş akışınızı geliştirmenize veya telaffuzlarla çalışmanıza yardımcı olacak adım adım kılavuzlar var. Son olarak, başkalarıyla işbirliği yapıyorsanız geri bildirim toplamak için bir projenin bağlantısını hızlı bir şekilde paylaşabilirsiniz.
Aynı şekilde ücretsiz deneme sürümü mevcut, ücretli planlar aylık 44 dolardan başlıyor.
Respeecher (Web)
Seslendirmelerin çoğu uzun, aynı tonlarda ve sıkıcı gelebilir. Respeecher, her sesin doğallığını ve gerçekçiliğini artırarak anlatımı farklı bir noktaya getiren varyasyonlar sunmakta. İşin en iyi yanı, tek tek ayar yapmak zorunda değilsiniz. Metninizi girdiğinizde, farklı sesler veya anlatım stilleri ile seslendirme oluşturabilirsiniz. Üretilen her ses dosyası, doğal ses varyasyonları ile senaryonun uygun kısmı altında gruplandırılacak.
Kullanıcı arayüzü pek düzenli değil, farklı sekmelerde kontroller bulmak mümkün. Sol taraftaki Settings (Ayarlar) sekmesinden perde kalibrasyonu, duygusal aralık ve genel ses özellikleri ayarlanabiliyor. Bunları değiştirdiğinizde gelecekte oluşturacağınız tüm sesler etkileniyor, yani farklı bir şeye ihtiyacınız olursa ayarları geri almayı unutmayın.
Metninizi yapıştırmanın veya bir ses dosyası yüklemenin yanı sıra, canlı olarak kaydetmek için mikrofonunuzu da kullanabilirsiniz. Yazılım sesinizi şablonunkiyle eşleşecek şekilde değiştirecek ve metnin performansı üzerinde tam kontrol sahibi olmanızı sağlayacak. Eğer oyunculuk deneyiminiz varsa ya da doğal yetenekleriniz varsa mutlaka deneyin.
Bir yapay zeka modelini kendi sesinizle veya başkalarının sesleriyle eğitebilirsiniz, böylece klavyenizi kullanarak tüm bir karakter kadrosunu oynayabilirsiniz. Bu durum deepfake’lerin üretilmesini kolaylaştırabileceğinden, Respeecher kim olduğunuzu anlamak için bir güvenlik kontrolü yapıyor ve aylık abonelik fiyatını da keskin bir şekilde yükseltiyor.
Maalesef Respeecher’ın ücretsiz denemesi yok, fiyatlar alık 4 dolardan başlamakta.
Altered (Web, Masaüstü)
Anlatım stili, oluşturulan metne benzersiz bir his vermek için genel bir perde ve ritim değişikliği görevi görür. Burada en geniş seçenek yelpazesine sahip olan uygulama Altered. Stilin de ötesinde, platform bu listedeki diğer seçeneklerden daha fazla potansiyele sahip.
Gerçek zamanlı dönüşüm, Değiştirilmiş Sanal Mikrofonu etkinleştirerek orijinal sesinizi gerçek zamanlı olarak bir AI avatarınınkiyle değiştirebiliyor. Bu oyuncu arkadaşlarınızla çevrimiçi sohbet ederken yapılabilecek eğlenceli bir şey. Diğer yandan, iş odaklı kişiler bu sesi doğrudan başka bir ses düzenleme uygulamasına kaydetmek için kullanabilir ve iş akışını kolaylaştırabilir.
Post-prodüksiyon morphing, sesten sese içerik oluşturmaya verilen isim. Bir metin kaydı ekleyebilir, hedef sesi seçebilir ve yeni bir seslendirme oluşturabilirsiniz. Sonrasında sonuçları indirerek projenize ekleyebilirsiniz.
Hızlı ses oluşturma, platforma bir sesin 4 ila 8 saniyelik temiz kliplerini eklemenizi sağlıyor. Böylece klonlayama yapabilir ve üretim için kullanabilirsiniz.
Metinden sese oluşturma ile metni giriyorsunuz ve istediğiniz sesi seçebiliyorsunuz. Anlatım şekilleri seçtiğiniz stile bağlı, bu nedenle temel farklılıkları görmek için çok sayıda seçeneği test edebilirsiniz. Senaryoya ve seçtiğiniz tona bağlı olarak sonuçlar tutarsız, tuhaf veya komik olabilir.
Son olarak, Altered aynı zamanda çok sayıda kontrol içeren bir Ses Düzenleyiciye de (Audio Editor) sahip. Sesinizi (her türlü ses) yükleyebilir ve diğer birçok olasılığın yanı sıra transkripsiyon, konuşma oluşturma veya gürültü gidermeye erişebilirsiniz.
Altered için sınırlı ücretsiz plan mevcut, ücretli planlar ise ayda 6 dolardan başlıyor.
Murf (Web)
Çeşitli, gerçekçi AI sesleri ve birden fazla dil desteği sunan Murf, yaratıcı projeleriniz için profesyonel seslendirmeler oluşturma sürecini basitleştirmek için var. Bu platformla içeriğinizi hedef kitlenize hitap eden gerçekçi seslerle zenginleştirebilirsiniz.
Herhangi bir cümleyi yüksek sesle okuyun, sonra her seferinde farklı bir kelimeyi vurgulayarak tekrarlayın. Yaparken tüm cümlenin anlamının ve hissinin nasıl değiştiğine dikkat edin. Murf bunu yapay zeka tarafından üretilen sesleriniz için yapmanıza olanak tanıyor.
Vurgu kontrol butonunu unutmayın. Bir proje üzerinde çalışırken, ilk bloğa metin eklemeye başlayın. Metin eklerken oynat düğmesinin solundaki simgeye (yorum simgesine benzer) tıklayın. Bloktaki tüm kelimelerin yüksek-orta-düşük ölçeğinde sıralandığı bir açılır pencere açılacak, bir nokta eklemek için herhangi bir yere tıklayın. Nereye tıkladığınız önemli, bu nedenle sol/sağ ve üst/alt eksenlerine nokta eklemeyi deneyin.
Ayrıca genel hızı ve perdeyi ayarlayabilir, duraklamalar ekleyebilir veya özel telaffuz ekleyebilirsiniz. Ken sesini seçerseniz, Storytelling (Hikaye Anlatımı) ve Hüzünlü’ye (Sad) kadar toplam dokuz adet olmak üzere geniş anlatım tarzı yelpazesine de erişebileceksiniz.
Ekranın alt kısmında daha fazla özellik sağlayan zaman çizelgesini genişletebilirsiniz. İçerik üretmek için doğrudan platforma video ve müzik ekleyebilir, bunları paylaşmaya hazır olarak doğrudan Murf AI’dan dışa aktarabilirsiniz. İçerik stratejinizi ilerletirken,- ekip arkadaşlarınızı davet edebilir ve ses oluşturma projeleri üzerinde işbirliği yapabilirsiniz. Herkes her senaryo bloğuna yorum bırakabiliyor, böylece mümkün olan en iyi sonuca ulaşana kadar ince ayar yapmaya devam edebilirsiniz.
Bir not olarak, ücretli plandaki sesler ücretsiz plandakilerden çok daha iyi duyuluyor. Eğer sürekli olarak kullanmayı planlıyorsanız, bu işten para kazanıyorsanız veya içerik üretiyorsanız ücretli plana geçebilirsiniz. 10 dakikalık ses üretimi ve proje tamamen ücretsiz. Ücretli planlar ise 23 dolardan başlayan fiyatlarla kullanılabiliyor.
OpenAI Yapay Zeka Ses Üretim Modeli
ChatGPT’nin geliştiricisi OpenAI da bir yapay zeka ses üretim modeli sunuyor. OpenAI metinden sese özelliğine erişmenin tek yolu API kullanmak ve bunun için biraz teknoloji bilgisi gerekiyor.
Ayrıca genel kullanım için mevcut olmadığı bildirilen çok güçlü bir AI ses klonlama modelinin olduğunu belirtelim. Ticari sürümün ne zaman ortaya çıkacağı ise belirsiz.
Yapay Zeka Tarafından Üretilen Sesler Yasal mı?
Listedeki tüm platformlar, eğitim verilerine ince ayar yaparak veya gerçek bir kişinin sesini kendi rızasıyla modelleyerek oluşturulan bir ses koleksiyonu sunmakta. Kullandığınız platformun hizmet ve lisans koşulları dahilinde kaldığınız sürece bu sesleri kullanmak yasal.
Asıl sorun yapay zeka ses klonlamasında yatmakta. Gerçek bir kişinin sesinden sadece birkaç örnekle, herhangi biri bir yapay zeka modelini herhangi biri gibi konuşacak şekilde ayarlayabilir. Ünlü insanlar da dahil olmak üzere. Bu taklitlerin oluşturulması ve kullanılması kimlik hırsızlığına, manipülasyona, yanlış bilgilendirmeye, şantaja veya telif hakkı yasalarının ihlaline (sanatçılar ve eserleri söz konusu olduğunda) yol açabilir.
Bulunduğunuz ülkeye bağlı olarak, böyle durumlar bazı yasal sonuçlar doğurabilir. Yani rıza alınmazsa veya ses suç işleme niyetiyle veya bu şekilde yorumlanabilecek bir şekilde kullanılırsa olumsuz sonuçlar yaşanabilir. Başka birinin sesini klonluyor ve yapay zeka ile üretmek için kullanıyorsanız, çıktıları kullanmadan önce her zaman (tercihen yazılı) onayını alın.
Yapay Zeka Destekli Ses Oluşturma Araçları
Bir yapay zeka ses oluşturucu ile çok sayıda deneme yapmadan ve bir prodüksiyon ekibiyle çalışmadan harikalar yaratabilirsiniz. Senaryoları bir videoya seslendirme olarak eklemeye hazır, akıcı bir anlatıma dönüştürebilirsiniz.
Yukarıdaki listedeki tüm platformlar çeşitli özelliklere ve ses detaylarına sahip. Bazıları ücretsiz deneme sunuyor, istediğinizi alana kadar deneme yapabilirsiniz. Bir kelime dahi etmeden, klavye ve farenizi kullanarak çok farklı seslendirmeler yaratabilirsiniz.