IBM Yapay Zeka

IBM, Yapay Zeka Eğitim Sürecini 11 Saate Düşürdü

In Haber by İlker ŞekercioğluLeave a Comment

IBM yapay zeka çalışmalarını aralıksız olarak sürdürürken, şimdi de otomatik konuşma tanıma alanında önemli bir başarıya imza attı.

Makine öğrenimi için güvenilir, sağlam ve genelleştirilebilir konuşma tanıma hala önemli bir süreç. Doğal dil anlama modellerini eğitmek için on binlerce saat ve milyonlarca kelimenin öğretilmesi ve güçlü donanımlara ihtiyaç duyuluyor.

IBM tarafından yeni yayınlanan “Otomatik Konuşma Tanıma için Dağıtılmış Derin Öğrenme Stratejileri” adlı makale, Switchboard adlı popüler bir açık kaynak benchmark yazılımında doğruluk kaybı olmadan 15 kat hızlı bir eğitim sağlayan işlem mimarisi ortaya konulduğunu paylaşıyor. Birden fazla grafik kartı içeren bir sistem ile beraber, sürecin 1 haftadan sadece 11 saate indirildiğinin altı çiziliyor.

Apple Siri, Google Asistan ve Amazon Alexa gibi otomatik konuşma tanıma (ASR) sistemlerinin eğitimi için, sesleri derin öğrenme sistemleri tarafından anlaşılan özelliklere ve çıktıyı insan tarafından okunabilir metne dönüştürmek için karmaşık kodlama sistemlerine ihtiyaç duyuluyor.

IBM ekibi ise paralel bir çözüm için yığın boyutunun büyüklüğünün artırılmasına veya bir kerede işlenecek örnek sayısına odaklanıyor. Eşzamanlı olmayan merkezileşmiş paralel stokastik gradyan inişi (ADPSGD) adlı bir dağıtılmış derin öğrenme tekniği uygularken yığın boyutunu 2.560’a çıkarmak için ilkeli yaklaşım kullanıyor. Bu sayede doğruluk ve hız konusunda önemli bir ilerleme kaydedilebiliyor.

Makalede, eşzamanlı olmayan merkezileşmiş paralel stokastik gradyan inişi ile otomatik konuşma tanıma görevinin tek bir V100 GPU’da, 1 haftadan 32-GPU sisteminde 11.5 saate kısaldığı ifade ediliyor. Ekip bundan böyle gelecekteki daha güçlü donanımlar için optimize edilmiş daha büyük yığın boyutlarını ve sistemlerini işleyebilecek çalışma algoritmalarına odaklanmış durumda. Geliştiricilerin özel kullanımlar için yeni algoritmaların oluşturulması da şart olacak. Ayrıca, elde edilen ilerleme ile mevcut modellerin uygulamalara adaptasyonu için hızlı bir geri dönüş süresi de sağlanıyor.

İlginizi çekebilir: İlk Kara Delik Fotoğrafı Paylaşıldı