Yüksek performanslı bilgi işlem alanında hizmet verecek NVIDIA A100 GPU, 7nm üretimine dayanan ilk GPU oldu.
NVIDIA, 7nm üretim teknolojisine ve Ampere mimarisine dayanan en güçlü GPU’sunun üzerindeki perdeleri kaldırdı. GA100 olarak isimlendirilen yonga, yeni Ampere mimarisini kullanan ve şimdiye kadar tasarlanmış en büyük 7nm GPU oldu. Bu ürün bilimsel araştırmalar, yapay zeka, derin öğrenme gibi uygulamalarda kullanılmak üzere tamamen HPC pazarı için üretildi.
Her şeyden önce NVIDIA Ampere GA100 GPU çeşitli form faktörlerinde bulunacak. Temel teknik özelliklere geldiğimizde GA100’ün tam bir canavar olduğunu söyleyebiliriz. 826mm² kalıp boyutuna sahip olan bu yongaya 54.2 milyar transistör sığdırılmış. Selefinde ise bu miktar 21.1 milyardı.
8192 CUDA çekirdeği ve 128 SM’ye sahip NVIDIA Ampere GA100, şimdiye kadar gördüğümüz en büyük tek GPU çekirdek sayısına ev sahipliği yapıyor. Sonuç olarak 8192 FP32 çekirdeği, 4096 FP64 çekirdeği ve 512 tensör çekirdeği ile birlikte geldiğini görüyoruz. GPU’da her biri 16 SM birimi ve 8 TPC barındıran 8 Grafik İşleme Kümesi bulunuyor. Devasa özelliklere sahip GA100 400W TDP değerine sahip.
A100 çipinde 128’e kadar SM ve 8192 FP32 CUDA çekirdeği bulunuyor ancak ilk sürümde sadece 108 SM etkinleştirilecek.
Devasa GPU’nun etrafında ise 48 GB toplam bellek kapasitesinin sağlandığı altı HBM2 bellek yığını (bellek başına 8 GB) konumlanıyor. Ancak ilk etapta 5 adet bellek yığınına sahip (40 GB) ürünlerin gönderileceği söyleniyor. Ayrıca belleğin 2.0 Gbps hızlarında çalıştığı ve yaklaşık 1.6 Tbps bant genişliğine ulaşacağı belirtiliyor.
GA100 Özellikleri ve Karşılaştırması
GPU | NVIDIA Tesla P100 | NVIDIA Tesla V100 | NVIDIA A100 |
GPU Kod adı | GP100 | GV100 | GA100 |
GPU Mimarisi | NVIDIA Pascal | NVIDIA Volta | NVIDIA Ampere |
GPU Form Faktör | SXM | SXM2 | SXM4 |
SM | 56 | 80 | 108 (128) |
TPC | 28 | 40 | 54 (64) |
FP32 Çekirdeği | 3584 | 5120 | 6912 (8192) |
FP64 Çekirdeği | 1792 | 2560 | 3456 (4096) |
INT32 Çekirdeği | – | 5120 | 6912 (8192) |
Tensor Çekirdeği | – | 640 | 432 (512) |
GPU Boost Saati | 1480 MHz | 1530 MHz | 1410 MHz |
Doku Birimleri | 224 | 320 | 432 |
Bellek Arayüzü | 4096-bit HBM2 | 4096-bit HBM2 | 5120-bit HBM2 |
Bellek Boyutu | 16 GB | 32 GB / 16 GB | 40 GB (48 GB) |
Bellek Veri hızı | 703 MHz DDR | 877.5 MHz DDR | 1215 MHz DDR |
Bellek Bant Genişliği | 720 GB/saniye | 900 GB/saniye | 1.6 TB/saniye |
L2 Önbellek | 4096 KB | 6144 KB | 40960 KB |
Paylaşılan Bellek Boyutu / SM | 64 KB | 96 KB’a kadar | 164 KB’a kadar |
Transistör Sayısı | 15.3 milyar | 21.1 milyar | 54.2 milyar |
GPU Kalıp Boyutu | 610 mm² | 815 mm² | 826 mm² |
TSMC Üretim Teknolojisi | 16 nm FinFET+ | 12 nm FFN | 7 nm N7 |
TDP | 300W | 300W | 400W |
İlginizi çekebilir: 10. Nesil Intel Core vPro İşlemciler Tanıtıldı