Anasayfa Haber NVIDIA, HPC Sınıfı İlk 7nm Ampere GPU’sunu Tanıttı

NVIDIA, HPC Sınıfı İlk 7nm Ampere GPU’sunu Tanıttı

Yüksek performanslı bilgi işlem alanında hizmet verecek NVIDIA A100 GPU, 7nm üretimine dayanan ilk GPU oldu.

NVIDIA, 7nm üretim teknolojisine ve Ampere mimarisine dayanan en güçlü GPU’sunun üzerindeki perdeleri kaldırdı. GA100 olarak isimlendirilen yonga, yeni Ampere mimarisini kullanan ve şimdiye kadar tasarlanmış en büyük 7nm GPU oldu. Bu ürün bilimsel araştırmalar, yapay zeka, derin öğrenme gibi uygulamalarda kullanılmak üzere tamamen HPC pazarı için üretildi.

7nm Ampere GPU

Her şeyden önce NVIDIA Ampere GA100 GPU çeşitli form faktörlerinde bulunacak. Temel teknik özelliklere geldiğimizde GA100’ün tam bir canavar olduğunu söyleyebiliriz. 826mm² kalıp boyutuna sahip olan bu yongaya 54.2 milyar transistör sığdırılmış. Selefinde ise bu miktar 21.1 milyardı.

8192 CUDA çekirdeği ve 128 SM’ye sahip NVIDIA Ampere GA100, şimdiye kadar gördüğümüz en büyük tek GPU çekirdek sayısına ev sahipliği yapıyor. Sonuç olarak 8192 FP32 çekirdeği, 4096 FP64 çekirdeği ve 512 tensör çekirdeği ile birlikte geldiğini görüyoruz. GPU’da her biri 16 SM birimi ve 8 TPC barındıran 8 Grafik İşleme Kümesi bulunuyor. Devasa özelliklere sahip GA100 400W TDP değerine sahip.

A100 çipinde 128’e kadar SM ve 8192 FP32 CUDA çekirdeği bulunuyor ancak ilk sürümde sadece 108 SM etkinleştirilecek.

 

Devasa GPU’nun etrafında ise 48 GB toplam bellek kapasitesinin sağlandığı altı HBM2 bellek yığını (bellek başına 8 GB) konumlanıyor. Ancak ilk etapta 5 adet bellek yığınına sahip (40 GB) ürünlerin gönderileceği söyleniyor. Ayrıca belleğin 2.0 Gbps hızlarında çalıştığı ve yaklaşık 1.6 Tbps bant genişliğine ulaşacağı belirtiliyor.

GA100 Özellikleri ve Karşılaştırması

GPU NVIDIA Tesla P100 NVIDIA Tesla V100 NVIDIA A100
GPU Kod adı GP100 GV100 GA100
GPU Mimarisi NVIDIA Pascal NVIDIA Volta NVIDIA Ampere
GPU Form Faktör SXM SXM2 SXM4
SM 56 80 108 (128)
TPC 28 40 54 (64)
FP32 Çekirdeği 3584 5120 6912 (8192)
FP64 Çekirdeği 1792 2560 3456 (4096)
INT32 Çekirdeği 5120 6912 (8192)
Tensor Çekirdeği 640 432 (512)
GPU Boost Saati 1480 MHz 1530 MHz 1410 MHz
Doku Birimleri 224 320 432
Bellek Arayüzü 4096-bit HBM2 4096-bit HBM2 5120-bit HBM2
Bellek Boyutu 16 GB 32 GB / 16 GB 40 GB (48 GB)
Bellek Veri hızı 703 MHz DDR 877.5 MHz DDR 1215 MHz DDR
Bellek Bant Genişliği 720 GB/saniye 900 GB/saniye 1.6 TB/saniye
L2 Önbellek 4096 KB 6144 KB 40960 KB
Paylaşılan Bellek Boyutu / SM 64 KB 96 KB’a kadar 164 KB’a kadar
Transistör Sayısı 15.3 milyar 21.1 milyar 54.2 milyar
GPU Kalıp Boyutu 610 mm² 815 mm² 826 mm²
TSMC Üretim Teknolojisi 16 nm FinFET+ 12 nm FFN 7 nm N7
TDP 300W 300W 400W

İlginizi çekebilir: 10. Nesil Intel Core vPro İşlemciler Tanıtıldı

Bir yorum

Bir yanıt bırak

Please enter your comment!
Please enter your name here

Bu site, istenmeyenleri azaltmak için Akismet kullanıyor. Yorum verilerinizin nasıl işlendiği hakkında daha fazla bilgi edinin.

Exit mobile version