Microsoft, Yapay Zeka Destekli Ses Simüle Çözümünü Duyurdu - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Nasıl Yapılır
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Haber - Microsoft, Yapay Zeka Destekli Ses Simüle Çözümünü Duyurdu

Microsoft, Yapay Zeka Destekli Ses Simüle Çözümünü Duyurdu

10 Ocak 2023 - 13:00
- Haber, Teknoloji, Yapay Zeka

Microsoft araştırmacıları, üç saniyelik bir ses örneği verildiğinde bir kişinin sesini simüle edebilen VALL-E adlı yeni bir yapay zeka modeli geliştirdi. Geliştirilen yapay zeka yalnızca üç saniyelik bir ses alıntısı ile harikalar yaratabiliyor, uzun soluklu metinler aynı kişiye aitmiş gibi seslendirilebiliyor.

VALL-E, kişiden alınan sesi sentezleyebiliyor ve bunu duygusal tonu koruyacak şekilde yapabiliyor. Yazılım şirketi VALL-E’yi bir “nöral kodek dil modeli” olarak adlandırmış. Bu zamana kadar geliştirilen metinden-konuşmaya yapay zeka çözümleri, dalga biçimlerini işleyerek konuşmayı standart bir şekilde sentezliyordu. VALL-E ise metin ve akustik ile ayrı ses kodek kodları üretebiliyor. Temel olarak bir kişinin nasıl ses çıkardığını analiz ediyor, EnCodec sayesinde tüm verileri ayrıştırıyor ve yapay zeka eğitim modeli sayesinde verilen örnek dışındaki söylem şeklini tahmin edebiliyor. Microsoft’un tanımlaması ise şu şekilde:

“VALL-E, kişiselleştirilmiş konuşma sentezleme için konuşmacı ve içerik bilgilerini kısıtlayan 3 saniyelik kayıtla bile akustik verileri ve ses bilgilerine bağlık olarak akustik örnekler üretir. Son olarak, üretilen akustik örnekler ilgili nöral kod çözücü ile nihai dalga biçimini sentezlemek için kullanılır.”

Microsoft, VALL-E’nin konuşma sentezi yeteneklerini Meta tarafından bir araya getirilen LibriLight adlı bir ses kütüphanesi üzerinde eğitti. Bu kütüphane, çoğunluğu halka açık LibriVox sesli kitaplardan alınan, 7.000’den fazla konuşmacının 60.000 saatlik İngilizce konuşmasını içeriyor. VALL-E’nin iyi bir sonuç üretebilmesi için üç saniyelik örnekteki sesin eğitim verilerindeki bir sesle yakından eşleşmesi gerekiyor.

Bir konuşmacının vokal tınısını ve duygusal tonunu korumanın yanı sıra, Microsoft’un çözümü örnek sesin “akustik ortamını” da taklit edebiliyor. Örneğin mevcut ses bir telefon görüşmesinden alındı diyelim. Ses çıkışı, bir telefon görüşmesinin akustik ve frekans özellikleri sentezlenmiş çıktısında simüle ediliyor.

Etiketler: konuşmametinMicrosoftsessimülasyonVALL-Eyapay zeka
PaylaşPaylaşTweetYollaPaylaş
Fatih Işık

Fatih Işık

Küçük yaşından itibaren teknoloji ve oyunlar ile iç içe olan Fatih, araştırma yapmaktan ve deneyimlerini insanlara aktarmaktan mutluluk duyuyor.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • 68.000 TL'ye kadar laptop önerisi
  • Play Store veya App Store 50 TL kod hediyesi
  • 15.000 TL bandı telefon önerisi
  • Teknosa bozuk kulaklığın değişimi için para istiyor
  • ASUS ROG azoth mu yoksa ASUS ROG falchion Low mu?
  • 3D Yazıcı Baskı Hizmeti
  • NZXT C750 Sıfır - Kutu, Fatura, Garanti Tam
  • 35 GB internet yarım saatte bitip 278 TL aşım maliyeti eklenmiş
  • Ailenin okçuluğa destek olmaması
  • Kingdom Come Deliverance oyununa devam edilir mi?

Technopat Video

Şu an oynayan

vivo’nun en iddialı telefonu vivo X300 Pro’ya ilk bakış!

vivo'nun en iddialı telefonu X300 Pro'ya ilk bakış!

vivo’nun en iddialı telefonu vivo X300 Pro’ya ilk bakış!

Akıllı Telefon
Bu fiyata kesintisiz oyun! Sinerji RTX 5050 sistem inceleme

Bu fiyata kesintisiz oyun! Sinerji RTX 5050 sistem inceleme

Ekran Kartı
HyperX Cloud IIIS Wireless İncelemesi – 6000 TL’ye En Rahat Oyuncu Kulaklığı!

Efsane geri döndü! HyperX Cloud IIIS Wireless inceleme

Giyilebilir Teknoloji

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.


01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.
Netse
Çerez Onayı
Web sitemizi ziyaret ettiğinizde, kullanıcı deneyiminizi daha iyi hale getirmek, hizmetlerimizi size daha etkin bir şekilde sunabilmek için çerezler (cookies) ve benzeri araçlar kullanıyoruz. Çerezler, internet sitesinin düzgün çalışmasını sağlamak, içeriği kişiselleştirmek, sosyal medya özellikleri sağlamak ve trafik analizi yapmak için kullanılan küçük metin dosyalarıdır. Çerezleri nasıl kullandığımız ve kişisel verilerinizi nasıl işlediğimiz hakkında daha fazla bilgi almak için çerez politikamızı ve kişisel veri politikamızı inceleyebilirsiniz.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, sadece kullanıcının açıkça talep ettiği belirli bir hizmetin kullanılmasını sağlama amacıyla veya iletişimin elektronik iletişim ağı üzerinden iletilmesinin tek amacıyla yasal olarak kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından istenmeyen tercihlerin depolanması yasal amacıyla gereklidir.
İstatistikler
Sadece istatistiksel amaçlarla kullanılan teknik depolama veya erişim. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Pazarlama
Teknik depolama veya erişim, reklam gönderimi için kullanıcı profilleri oluşturmak veya kullanıcıyı bir web sitesinde veya birden fazla web sitesinde benzer pazarlama amaçları için takip etmek amacıyla gereklidir.
  • Seçenekleri yönet
  • Hizmetleri yönetin
  • {vendor_count} satıcılarını yönetin
  • Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri yönet
  • {title}
  • {title}
  • {title}
Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Nasıl Yapılır
  • Yapay Zeka
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal