Büyük iş yükleri için hazırlanan Instinct MI100 GPU hızlandırıcı, yeni mimari ile yüksek performans kazançları sağlıyor.
RDNA 2 grafik mimarisine dayanan RX 6000 serisi ekran kartları kullanılmaya başladı. Şimdi RX 6700 ve RX 6500 serisi gibi daha hesaplı kartlar beklerken AMD’den yüksek performanslı bilgi işlem alanında yeni bir hamle geldi. Kırmızı takım, “bilimsel iş yükleri için dünyanın en hızlı HPC GPU hızlandırıcısı” olarak tanımladığı AMD Instinct MI100 Accelerator’ı tanıttı.
AMD, Instinct MI100’ün “hesaplama ve ara bağlantı performansında dev bir sıçrama” sağlamak için sıfırdan inşa edilen yeni CDNA mimarisini kullandığını belirtti. Geçmiş HPC hızlandırıcılar ile kıyaslandığında ise yaklaşık 3,5 kat (FP32) performans artışı ve yapay zeka işlem hacmi için yaklaşık 7 kat (FP16) performans artışı sunuluyor.
MI100 GPU’nun ardındaki temel teknolojiler arasında şunlar yer alıyor:
- Makine öğrenimi için üstün performansa sahip yepyeni bir Matrix Core Teknolojisi.
- 64 GB/sn CPU – GPU bant genişliği ve 276 GB/sn’ye kadar eşler arası (P2P) bant genişliği performansı için AMD Infinity Fabric Link Teknolojisi.
- 11,5 TFLOPS’a kadar FP64 performansı (veya 23,1 TFLOPS en yüksek FP32 performansı) için PCIe Gen 4.0 bağlantısı.
- Ultra hızlı HBM2 bellek teknolojisi.
Yeni Instinct MI100 hızlandırıcı kartlar Oak Ridge Leadership Computing Facility tarafından bir süre test edildi. Tesis direktörü Bronson Messer, MI100’ün test platformlarında “diğer GPU’lara kıyasla 2-3 kata kadar performans artışı” sağladığını söyledi. Son olarak enerji verimliliği tarafında iyileştirmeler yapıldığı da belirtiliyor.
AMD Radeon Instinct Hızlandırıcı Özellikleri
Accelerator Name | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 |
---|---|---|---|---|---|---|
Mimari | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus |
Üretim | 14nm FinFET | 28nm | 14nm FinFET | 7nm FinFET | 7nm FinFET | 7nm FinFET |
Çekirdek | 2304 | 4096 | 4096 | 3840 | 4096 | 7680 |
Frekans Hızı | 1237 MHz | 1000 MHz | 1500 MHz | 1725 MHz | 1800 MHz | ~1500 MHz |
FP16 Hesaplama | 5.7 TFLOPs | 8.2 TFLOPs | 24.6 TFLOPs | 26.5 TFLOPs | 29.5 TFLOPs | 185 TFLOPs |
FP32 Hesaplama | 5.7 TFLOPs | 8.2 TFLOPs | 12.3 TFLOPs | 13.3 TFLOPs | 14.7 TFLOPs | 23.1 TFLOPs |
FP64 Hesaplama | 384 GFLOPs | 512 GFLOPs | 768 GFLOPs | 6.6 TFLOPs | 7.4 TFLOPs | 11.5 TFLOPs |
VRAM | 16 GB GDDR5 | 4 GB HBM1 | 16 GB HBM2 | 16 GB HBM2 | 32 GB HBM2 | 32 GB HBM2 |
Bellek Frekansı | 1750 MHz | 500 MHz | 945 MHz | 1000 MHz | 1000 MHz | 1200 MHz |
Veri Yolu | 256-bit | 4096-bit | 2048-bit | 4096-bit | 4096-bit | 4096-bit |
Bant Genişliği | 224 GB/s | 512 GB/s | 484 GB/s | 1 TB/s | 1 TB/s | 1.23 TB/s |
Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma | Pasif Soğutma |
TDP | 150W | 175W | 300W | 300W | 300W | 300W |