NVIDIA, nihayet yeni nesil RTX 4000 ekran kartlarını piyasaya sundu. Gücünü Ada Lovelace mimarisinden alan seride üç ayrı ekran kartı yer alıyor: RTX 4090, RTX 4080 16 GB ve RTX 4080 12 GB. Daha önce amiral gemisi GeForce RTX 4090’ın detaylarına bakmıştık. Şimdi ise kardeşlerine göz atalım.
NVIDIA, geçmişte sızıntılarda bahsettiğimiz RTX 4070 modelini henüz duyurmadı. RTX 4070 ve RTX 4060 gibi daha alt seviye modellerin ne zaman geleceğini bilmiyoruz. Ancak RTX 4080 12 GB, özellikleriyle RTX 4070’in yerini almış görünüyor.
16 GB ve 12 GB’lık modellerin teknik özelliklerine baktığımızda büyük farklılıklar var. RTX 3080 ile kıyaslandığında ise önemli performans artışları sağlanmış.
Ada Lovelace Mimarisi
Yeşil ekibin mühendisleri, 5nm (N5) üretim teknolojisinin optimize edilmiş bir versiyonu olan TSMC 4nm (N4) üretim teknolojisinden faydalandı. Şirket böylelikle GPU’larına 76 milyar transistör ve 18.000’den fazla gölgelendirici dahil etmeyi başardı. RTX 4000 serisi GPU’ların hiçbirinde NVLink bulunmuyor. Kartlar ayrıca aynı şekilde PCIe Gen4 x16 arabirimini kullanmaya devam edecek.
Hatırlarsanız Ampere mimarisiyle birlikte birlikte Tensor ve Ray Tracing çekirdekleri güncellenmişti. NVIDIA şimdi Ada Lovelace mimarisiyle birlikte dördüncü nesil Tensor çekirdeklerine ve üçüncü nesil RT çekirdeklerine geçiş yapıyor. İddialara bakılırsa iki kata kadar daha yüksek yapay zeka performansı ve iki kata kadar performanslı Işın İzleme performansı sunulacak.
RT ve Tensor Çekirdekleri
Ada’nın yeni dördüncü nesil Tensor çekirdekleri, ilk olarak Hopper H100 veri merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak verimi 5 kata kadar artırıyor ve 1,4 Tensor-petaFLOPS’a çıkarıyor. Öte taraftan, RT çekirdekleri yeni Opacity Micromap (OMM) Motoru ve yeni Displaced Micro-Mesh (DMM) Motoru ile birlikte geliyor. OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha iyi işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha hızlı Bounding Volume Hierarchy (BVH) oluşturma süresi sunarak geometrik olarak karmaşık sahnelerin gerçek zamanlı ışın takibini mümkün hale getiriyor.
Shader Execution Reordering
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı nesneye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylelikle çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, önceden verimsiz olan bu iş yüklerini dinamik olarak yeniden düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme işlemleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare hızlarını %25’e kadar artırabiliyor.
AV1 Kodek Desteği
Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama desteği sunan sekizinci nesil NVIDIA Encoder’a (NVENC) sahip olacak. Böylelikle yayıncılar ve video işiyle uğraşanlar için yeni olanaklar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların aynı bit hızı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
DLSS 3
DLSS 3, performansı büyük ölçüde artırırken yapay zeka destekli grafiklerde devrim niteliğinde atılımlar sunuyor. Kötü haberi baştan verelim, yeni nesil DLSS sürümü yalnızca RTX 4000 serisi ekran kartlarında desteklenecek. Eski nesil RTX 3000 serisi ise DLSS 2 ile yoluna devam edecek. NVIDIA, DLSS 3 ile DLSS 1 arasında 16 katlık performans artışı meydana geldiğini söylüyor.
Mimarinin Getirileri
Genel olarak, Ampere ve Ada Lovelace mimarisini kıyaslayacak olursak aşağıdaki sonuçlar karşımıza çıkıyor.
- 2 kat daha fazla GPC (Grafik İşleme Kümeleri).
- %50 daha fazla çekirdek.
- %50 daha fazla L1 önbellek.
- 16 kat daha fazla L2 önbellek.
- ROP sayısı iki katına çıktı.
- 4. Nesil Tensor ve 3. Nesil RT Çekirdekleri.
NVIDIA GeForce RTX 4080 16 GB Özellikleri
GeForce RTX 4080, toplamda 84 SM’lik kapasiteye çıkan AD103-300 GPU’nun 76 adetlik birimini kullanıyor. Böylelikle toplamda 9728 CUDA çekirdeği ortaya çıkıyor. Tam yapılandırmalı AD103 GPU, 64 MB L2 önbellek ve 224’e kadar ROP sunuyor. RTX 4080’in kullandığı GPU’da ise daha düşük ROP ve önbellek miktarı mevcut.
2210 MHz’lik temel frekansa sahip olan GPU, 2510 MHz hızla neredeyse RTX 4090 ile eşit frekans hızı sunuyor. Elbette burada referans tasarımdan söz ediyoruz. NVIDIA, laboratuvar testlerinde yeni GPU’ları 3.0 GHz’ın üzerine çıkardığını belirtmişti. Yani özel soğutmayla desteklenen kartlar 3.0 GHz’e yakın frekanslarla gelebilir.
16 GB’lık RTX 4080, 256 bit veri yolundan iletişim kuran, 23 Gbps hıza ulaşabilen GDDR6X bellek ile çalışıyor. Böylelikle 720 GB/s gibi bir teorik bant genişliğine ulaşıyoruz. Geçmiş nesil RTX 3080 760 GB/s ile daha yüksek bant genişliğine sahipti çünkü 320 bitlik bellek veri yolu kullanılıyordu.
NVIDIA, 320W TBP (Toplam Kart Gücü) değerine sahip olan kartı için en az 750W’lık bir güç kaynağı öneriyor. Resmi olarak açıklanmamış olsa da, BIOS ile maksimum TGP değerinin 516W olarak ayarlandığı söyleniyor.
NVIDIA GeForce RTX 4080 12 GB Özellikleri
RTX 3070’in yerini alan GeForce RTX 4080, toplamda 7.680 çekirdek taşıyan 60 SM ile destekleniyor. AD104 GPU, toplam 48 MB L2 önbelleğe sahip olacak. Bellek tarafına gelince, 192 bit ile arayüz genişliği üst modele kıyasla düşüyor. Bu nedenle alt sürümde 12 GB kapasiteli GDDR6X bellekler kullanıldı. Sonuç olarak, 21 Gbps hızında çalışan belleklerle birlikte bant genişliği 504 GB/sn’de kısıtlanıyor.
Founders Edition, 2310 MHz taban saat hızına ayarlanırken maksimum 2610 MHz frekansa çıkabiliyor. Yani frekans hızı RTX 4080 16 GB ve RTX 4090’dan daha yüksek. Güç konusunda, TBP değeri RTX 3080 10 GB modeline göre 35W daha düşük ve 285W olarak derecelendirildi.
NVIDIA, bu kartın RTX 3080 Ti’den daha hızlı olduğunu söylüyor. Ancak RTX 4080 16 GB ile teknik özellikler kıyaslandığında her iki model arasında büyük bir boşluk olacak. Ayrıca maksimum BIOS TGP değerinin 366W olarak ayarlandığını belirtelim.
RTX 4090 | RTX 4080 16 GB | 4080 12 GB | RTX 3090 Ti | RTX 3080 | |
---|---|---|---|---|---|
GPU | AD102-300 | AD103-300 | AD104-400 | Ampere GA102-225 | Ampere GA102-200 |
Üretim Teknolojisi | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Kalıp Boyutu | ~600mm2 | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
Transistör | ~75 milyar | ? | ? | 28 milyar | 28 milyar |
CUDA Çekirdekleri |
16384 | 9728 | 7680 | 10240 | 8704 |
TMU / ROP | ? | ? | ? | 320 / 112 | 272 / 96 |
Tensor / RT Çekirdekleri | ? | ? | ? | 320 / 80 | 272 / 68 |
Taban Saat | 2230 MHz | 2210 MHz | 2310 MHz | 1365 MHz | 1440 MHz |
Boost Saati | 2520 MHz | 2510 MHz | 2610 MHz | 1665 MHz | 1710 MHz |
FP32 Hesaplama | 82.6 TFLOPs | ~50 TFLOPs | ~40 TFLOPs | 34 TFLOPs | 30 TFLOPs |
Bellek | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
Veri Yolu | 384-bit | 256-bit | 192-bit | 384-bit | 320-bit |
Bellek Hızı | 21 Gbps | 22.5 Gbps | 21 Gbps | 19 Gbps | 19 Gbps |
Bant Genişliği | 1008 GB/s | 720 GB/s | 504 GB/s | 912 Gbps | 760 Gbps |
TBP | 450W | 320W | 285W | 350W | 320W |
Maks. TGP | 660W | 516W | 366W | – | – |
Liste Fiyatı | 1599$ | 1199$ | 899$ | 1199$ | 699$ |
Çıkış Tarihi | 12 Ekim 2022 | Kasım 2022 | Kasım 2022 | 3 Haziran 2021 | Eylül 2020 |
NVIDIA GeForce RTX 4090 Performansı
Yeni nesil ekran kartları, NVIDIA’nın iddialarına bakılırsa kullanım senaryosuna bağlı olarak iki ila dört kata kadar daha yüksek performans sunacak.
RTX 4080 serisi hakkında detaylı performans değerleri göremedik. Bu nedenle yakında gelecek olan detaylı incelemelerimizi beklemenizde fayda var. Şirket tarafından yayınlanan kıyaslamada yalnızca üç oyuna yer verilmiş. RTX 3080 Ti ile yapılan kıyaslamalarda ortalama iki katlık performans artışı sağlandığını görüyoruz. Tabloya bakılırsa RTX 4080 serisi ekran kartları RTX 3090 serisinden de performanslı olacak.
NVIDIA GeForce RTX 4090 Çıkış Tarihi ve Fiyatı
NVIDIA GeForce RTX 4080 16 GB ve RTX 4080 12 GB ekran kartları sırasıyla 1199 dolar ve 899 dolarlık fiyatla piyasaya sürülecek. Tam bir gün verilmedi, ancak satışların Kasım ayında başlamasını bekliyoruz.