İşlemciler Yeni Algoritma İle Yapay Zeka İşlerinde GPU’ları Yeniyor - Technopat
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net
  • Haber
  • Yapay Zeka
  • Tavsiyeler
  • Oyun
  • Video
  • Teknoloji
    • Mobil
    • Yazılım
    • Elektronik Alışveriş Fırsatları
    • Pratik
    • Ev Teknolojileri
    • Makale
    • Güvenlik
    • Ekonomi
    • İnternet
    • Giyilebilir Teknoloji
    • Sağlık
    • Yazıcı
    • Sosyal Medya
    • Otomobil
      • Elektrikli Otomobil
  • Sosyal
Sonuç bulunamadı
Bütün Sonuçları Göster
Teknoloji tutkunu Technopatların ortak adresi: Technopat.net

Anasayfa - Haber - İşlemciler Yeni Algoritma İle Yapay Zeka İşlerinde GPU’ları Yeniyor

İşlemciler Yeni Algoritma İle Yapay Zeka İşlerinde GPU’ları Yeniyor

12 Nisan 2021 - 13:00
- Haber, Yapay Zeka
algoritma yapay zeka

Yeni bir algoritma, işlemcilerin yapay zeka işlerinde GPU’lardan daha iyi performans ortaya koymasını sağlıyor.

Yapay zeka derin sinir ağları (DNN) eğitimi söz konusu olduğunda, grafik işleme birimlerinin (GPU) çoğu işlemciden (CPU) önemli ölçüde daha iyi olduğu biliniyor. Bunda daha fazla yürütme birimine veya çekirdeğe sahip olmaları önemli bir etken. Rice Üniversitesi bilgisayar bilimcileri ise sundukları yeni bir algoritma ile işlemcileri yapay zeka işlerinde bazı öncü GPU’lardan 15 kat daha hızlı hale getirdiklerini iddia etti.

En karmaşık hesaplama zorlukları genellikle daha fazla donanım veya görevi çözebilecek özel amaçlı donanım icatları ile çözülüyor. DNN eğitimi de günümüzde en yoğun bilgi işlem gerektiren iş yükleri arasında yer alıyor. Bundan dolayı programcılar, maksimum eğitim performansı istiyorlarsa, bu iş yükleri için GPU’ları kullanıyor. Çoğu algoritma matris çarpımlarına dayandığından, hesaplama GPU’larını kullanarak yüksek performans elde etmek daha kolay.

Rice Üniversitesi Brown Mühendislik Okulu’nda bilgisayar bilimi profesörü olan Yardımcı Doçent Anshumali Shrivastava ve meslektaşları ise modern AVX512 ve AVX512_BF16 etkin işlemcilerde DNN eğitimini büyük ölçüde hızlandırabilecek bir algoritma sunmuş durumda. Bilim insanları bunun için SLIDE (Sub-LInear Deep Learning Engine) adlı akıllı hash rasgele algoritmalarını işlemci üzerinde mütevazı çok çekirdekli paralellik ile birleştiren ve Intel AVX512 ile AVX512-bfloat16 destekleyen işlemciler için yoğun bir şekilde optimize eden C ++ OpenMP tabanlı bir motoru kullanıyor.

Motor, her güncelleme sırasında uyarlamalı olarak nöronları tanımlamak için LSH /Cocality Sensitive Hashhing) kullanıyor ve bu hesaplama performansı gereksinimlerini optimize ediyor. Araştırmaya göre değişiklik yapılmasa dahi, duvar saati süresi açısından 200 milyon parametreli bir sinir ağını eğitmenin bir NVIDIA V100 GPU’da optimize edilmiş TensorFlow uygulamasından daha hızlı olabileceği ifade ediliyor.

Hashing’i daha hızlı hale getirmek için, bilim insanları algoritmayı vektörleştirip nicelleştiriyor. Böylece Hashing, AVX512 ve AVX512_BF16 motorları tarafından daha iyi işlenebiliyor. Ek olarak, bazı bellek optimizasyonları da uygulanmış. Ekip, matris çarpımlarına takılıp kalınmaması durumunda modern işlemcilerin gücünden yararlanılabileceğini ve yapay zeka modellerini en iyi özel donanımlardan 4 ila 15 kat daha hızlı eğitebileceklerini gösterdiklerinin altını çizmiş.

Amazon-670K, WikiLSHTC-325K ve Text8 veri kümeleriyle elde ettikleri sonuçlar, optimize edilmiş SLIDE motoruyla gerçekten oldukça umut verici gözüküyor. Intel Cooper Lake (CPX) işlemcisi, NVIDIA Tesla V100’ü Amazon-670K ile yaklaşık 7.8 kat, WikiLSHTC-325K ile yaklaşık 5.2 kat ve Text8 ile yaklaşık 15.5 kat geride bırakabiliyor. Hatta optimize edilmiş bir Cascade Lake (CLX) işlemci bile NVIDIA Tesla V100’ünden 2.55–11.6 kat daha hızlı olabiliyor.

IBM’in yapay zeka sistemiyle antibiyotik üretilmesini sağladığını da hatırlatalım.

Etiketler: aiCPUDNNGPUgrafik işlem birimiİşlemcirice üniversitesiyapay zeka
PaylaşPaylaşTweetYollaPaylaş
İlker Şekercioğlu

İlker Şekercioğlu

Tam bir teknoloji bağımlısı olan İlker, teknolojideki son gelişmeleri meraklıları ile paylaşmaktan keyif alıyor.

Yorum Yap Yanıtı iptal et

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

RSS Technopat Sosyal

  • 2.5 bin TL klavye önerisi
  • VLOG için kamera önerisi
  • 14X Boost basınca etiket alınmıyor
  • T300RSGT Vs. T248X Vs. T150 Vs. T128X Vs. G29
  • Kasa fanlarinin yeri nasıl degistirilir?
  • EFootball'da Game Center nasıl kaldırılır?
  • 2000 TL grafik tableti önerisi
  • Tick hosting AdBlock detected hatası
  • Ryzen 7 5700x3D için sıvı soğutma önerisi
  • 3000 TL'ye kadar klavye önerisi

Technopat Video

Şu an oynayan

Hangi MatePad tableti satın almalıyım? İşte yanıtı!

Hangi MatePad tableti satın almalı

Hangi MatePad tableti satın almalıyım? İşte yanıtı!

Haber
Anker Nebula P1, P1i ve Soundcore Boom 3i inceleme

Anker Nebula P1, P1i ve Soundcore Boom 3i inceleme

Haber
SanDisk Extreme PRO Portable SSD inceleme

Tır geçse dayanır! SanDisk Extreme PRO Portable SSD inceleme

Haber

Teknoloji tutkunu Technopatların ortak adresi: Technopat.net!

Güncel teknoloji, internet, donanım, yazılım, oyun ve daha fazlası haber, makale ve videolar ile Technopat’ta sizlerle.


01010100 01100101 01100011 01101000 01101110 01101111 01110000 01100001 01110100

Kategoriler

  • Yapay Zeka
  • Ev Teknolojileri
  • Makale
  • Video

Sosyal Medya

Bağlantılar

  • Hakkında
  • Haber
  • Video
  • Sosyal
  • Çerez Politikası
© 2011-2025 Technopat. Tüm Hakları Saklıdır.
Netse
Çerez Onayı
Web sitemizi ziyaret ettiğinizde, kullanıcı deneyiminizi daha iyi hale getirmek, hizmetlerimizi size daha etkin bir şekilde sunabilmek için çerezler (cookies) ve benzeri araçlar kullanıyoruz. Çerezler, internet sitesinin düzgün çalışmasını sağlamak, içeriği kişiselleştirmek, sosyal medya özellikleri sağlamak ve trafik analizi yapmak için kullanılan küçük metin dosyalarıdır. Çerezleri nasıl kullandığımız ve kişisel verilerinizi nasıl işlediğimiz hakkında daha fazla bilgi almak için çerez politikamızı ve kişisel veri politikamızı inceleyebilirsiniz.
Fonksiyonel Her zaman aktif
Teknik depolama veya erişim, sadece kullanıcının açıkça talep ettiği belirli bir hizmetin kullanılmasını sağlama amacıyla veya iletişimin elektronik iletişim ağı üzerinden iletilmesinin tek amacıyla yasal olarak kesinlikle gereklidir.
Tercihler
Teknik depolama veya erişim, abone veya kullanıcı tarafından istenmeyen tercihlerin depolanması yasal amacıyla gereklidir.
İstatistikler
Sadece istatistiksel amaçlarla kullanılan teknik depolama veya erişim. The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Pazarlama
Teknik depolama veya erişim, reklam gönderimi için kullanıcı profilleri oluşturmak veya kullanıcıyı bir web sitesinde veya birden fazla web sitesinde benzer pazarlama amaçları için takip etmek amacıyla gereklidir.
  • Seçenekleri yönet
  • Hizmetleri yönetin
  • {vendor_count} satıcılarını yönetin
  • Bu amaçlar hakkında daha fazla bilgi edinin
Tercihleri yönet
  • {title}
  • {title}
  • {title}
Sonuç bulunamadı
Bütün Sonuçları Göster
  • Giriş
  • Teknoloji Haberleri
  • Sosyal
  • Video
  • Tavsiyeler
  • İncelemeler
    • Video İncelemeler
  • Güvenlik
  • Oyun
  • Makale
    • Pratik
    • Yazar Köşeleri

© 2025 Technopat
Sorularınız için Technopat Sosyal