Yeni NVIDIA ve AMD Ekran Kartlarından Neler Bekleniyor?

AMD ve Intel rekabeti yeni nesil ekran kartlarıyla birlikte farklı bir boyuta taşınabilir.

Yeni RDNA 3 mimarili Radeon RX 7900 XT ve Ada Lovelace destekli GeForce RTX 4090 ekran kartlarıyla ilgili yeni detaylar gelmeye devam ediyor. Bu GPU’ların büyük performans iyileştirmeleri getirmesi bekleniyor ve aynı zamanda şimdiye kadar üretilmiş en çok güç tüketen çipler olacak.

NVIDIA Ada Lovelace mimarisiyle monolitik bir yaklaşımı hedeflerken, AMD’nin CDNA 2 mimarisinde olduğu gibi çok yongalı bir tasarım (MCM) kullanması bekleniyor. AMD, artık tüketici ve oyun GPU’ları için aynı MCM teknolojisini kullanacak.

AMD Radeon RX 7900 XT: RDNA 3 Mimarisi ve Navi 21

Amiral gemisi RDNA 3 yongası olan AMD Navi 31 GPU, yeni nesil Radeon RX 7900 XT grafik kartına güç sağlayacak. AMD’nin yeni nesil RDNA 3 yongalarında CU (Bilgi İşlem Birimi) yerine WGP’ler (Çalışma Grubu İşlemcileri) kullanılacak. Ekran kartının TSMC’nin 5nm işlemine dayalı bir GCD (Graphics Core Die) ve TSMC 6nm işlemine dayalı bir MCD (Multi-Cache Die) olmak üzere iki temel IP’ye sahip olacağı söyleniyor.

Görünen Navi 31 GPU yapılandırmasında iki GCD (Graphics Core Die) ve tek bir MCD (Multi-Cache Die) bulunuyor. Her GCD’de 3 Shader Motoru (toplam 6) ve her Shader Motorunda 2 Shader Dizisi (SE başına 2 / GCD başına 6 / toplamda 12) yer alıyor.

Ayrıca Her Shader Dizisi 5 WGP’den (SE başına 10 / GCD başına 30 / toplamda 60) oluşuyor ve her WGP, 32 ALU’ya sahip 8 SIMD32 ünitesine (SA başına 40 SIMD32 / SE başına 80 / GCD başına 240 / toplamda 480) sahip. Bu SIMD32 birimleri, GCD başına 7.680 çekirdek ve toplamda 15.360 çekirdek oluşturmak üzere bir araya geliyor.

Navi 31 MCD, yeni nesil Infinity Fabric ara bağlantısı aracılığıyla ikili GCD’lere bağlanacak ve 256-512 MB kapasitede Infinity Cache önbellek taşıyacak. Her GPU ayrıca 4 bellek bağlantısına (32 bit) sahip olmalı. Bu da 256 bit veri yolu arabirimi için toplam 8 32 bit bellek kontrolcüsü olacağı anlamına gelmekte.

Yakın zamanda ortaya çıkan bir başka söylenti, AMD’nin RDNA 3 ailesinde 3D Infinity Cache bellek teknolojisini kullanacağını ortaya koydu. Tıpkı Milan-X yongalarının L3 önbelleğinde olduğu gibi, GPU’da bulunan mevcut önbelleğe ek olarak dikey olarak istiflenmiş ek bir önbellek birimi yer alacak.

AMD RDNA GPU Karşılaştırması

GPU Adı Navi 10 Navi 21 Navi 31
GPU Üretim Teknolojisi 7nm 7nm 5nm (6nm?)
GPU Paketlemesi Monolitik Monolitik MCD (Multi-Chiplet Die)
Shader Motorları 2 4 6
GPU WGP 20 40 30 (Per MCD)
60 (In Total)
WGP başına SP 128 128 256
Hesaplama Birimi 40 80 120 (MCD başına)
240 (toplam)
Çekirdek (Kalıp Başına) 2560 5120 7680
Çekirdek (Toplam) 2560 5120 15360 (2 x MCD)
Bellek Veriyolu 256-bit 256-bit 256-bit
Bellek Tipi GDDR6 GDDR6 GDDR6
Bellek Kapasitesi 8 GB 16 GB 32 GB
Infinity Cache 128 MB 256-512 MB
Amiral Gemisi SKU Radeon RX 5700 XT Radeon RX 6900 XTX Radeon RX 7900 XT
TBP 225W 330W 350-550W
Çıkış Tarihi 2019 3. Çeyrek 2020 4. Çeyrek 2022 4. Çeyrek

NVIDIA GeForce RTX 4090: Ada Lovelace Mimarisi ve AD102 GPU

Mevcut bilgilere göre NVIDIA’nın Ada Lovelace GPU’ları için TSMC’nin N5 (5nm) üretim teknolojisi kullanılacak. AMD’nin aksine, yeşil takım yeni ekran kartlarında monolitik bir tasarım benimseyecek. Amiral gemisi RTX 4090 modelinde AD102 GPU’nun yer alacağını ekleyelim.

AD102 GPU’nun 2.5 GHz (2.3 GHz ortalama artış) kadar yüksek bir saat hızına sahip olduğu söyleniyor. NVIDIA AD102, 144 SM birimi içinde yer alan (değişebilen) ön özelliklere göre 18432 CUDA Çekirdeğine sahip görünüyor. Bu da Turing mimarisine kıyasla çekirdek sayısında neredeyse iki katlık bir artış demek. 2.3-2.5 GHz saat hızı bize 85 ila 92 TFLOP’a kadar işlem performansı (FP32) veriyor. Bu 36 TFLOP FP32 hesaplama gücü içeren mevcut RTX 3090’ın FP32 performansının iki katından fazla.

%150 performans artışı çok büyük görünüyor ancak NVIDIA’nın Ampere ile bu nesil FP32 değerlerinde zaten büyük bir sıçrama yaptığını unutmamak gerekiyor. Ampere GA102 GPU (RTX 3090) 36 TFLOP sunarken Turing TU102 GPU (RTX 2080 Ti) 13 TFLOP ham güç sunacak. Yani FP değerleri açısından %150’nin üzerinde bir artış yaşandı. Ancak RTX 3090, gerçek dünya oyun performansı açısından RTX 2080 Ti’iye göre %50-60 civarında daha güçlüydü.

Bunun yanı sıra NVIDIA GeForce RTX 40 amiral gemisinin RTX 3090’a benzer bir 384-bit veri yolu arayüzüne sahip olacağı da gelen bilgiler arasında. Yenik artlar yine GDDR6X belleklerden yararlanacak, ancak mevcut modellere kıyasla daha yüksek bant genişliği göreceğiz. RTX 4090 24 GB belleğe sahip olacak, bu nedenle tek taraflı 16 GB DRAM veya çift taraflı 8 GB DRAM modülleri bekleyebiliriz.

NVIDIA GPU Kıyaslaması

GPU Adı TU102 GA102 AD102
GPU Mimarisi Turing Ampere Ada Lovelace
GPU Üretim Teknolojisi TSMC 12nm NFF Samsung 8nm 5nm
Grafik İşleme Kümeleri (GPC) 6 7 12
Doku İşleme Kümeleri (TPC) 36 42 72
Akış İşlemcileri (SM) 72 84 144
CUDA Çekirdeği 4608 10752 18432
Teorik TFLOP 16.1 37.6 ~90 TFLOPs?
Bellek Tipi GDDR6 GDDR6X GDDR6X
Bellek Veriyolu 384-bit 384-bit 384-bit
Bellek Kapasitesi 11 GB (2080 Ti) 24 GB (3090) 24 GB (4090?)
Amiral Gemisi SKU RTX 2080 Ti RTX 3090 RTX 4090?
TGP 250W 350W 450-650W?
Çıkış Tarihi Eylül 2018 Eylül 2020 2022?
Exit mobile version