NVIDIA, aylar ve hatta yıllar süren söylentilerin ardından GeForce RTX 4000 serisi ekran kartlarını oyuncuların ve içerik üreticilerin beğenisine sundu. GTC 2022 etkinliği özel bir “GeForce Beyond” sunumuna sahne olurken “Ada Lovelace” mimarisi hakkında detaylar sağlandı. Bu mimari ismini tarihteki bir matematikçiden alıyor.
NVIDIA CEO’su Jensen Huang, ilk etapta RTX 4090, RTX 4080 16 GB ve RTX 4080 12 GB modellerini tanıttı. RTX 4070 ile ilgili henüz bir gelişme bulunmuyor. Ya da şirketin RTX 4070 yerine RTX 4080 12 GB gibi bir kart hazırladığını söyleyebiliriz. NVIDIA, anladığımız kadarıyla bir süre düşük performans segmenti için RTX 3000 serisine güvenmeye devam edecek.
Ada Lovelace Mimarisi
Yeşil ekibin mühendisleri, 5nm (N5) üretim teknolojisinin optimize edilmiş bir versiyonu olan TSMC 4nm (N4) üretim teknolojisinden faydalandı. Şirket böylelikle GPU’larına 76 milyar transistör ve 18.000’den fazla gölgelendirici dahil etmeyi başardı. RTX 4000 serisi GPU’ların hiçbirinde NVLink bulunmuyor. Kartlar ayrıca aynı şekilde PCIe Gen4 x16 arabirimini kullanmaya devam edecek.
Hatırlarsanız Ampere mimarisiyle birlikte birlikte Tensor ve Ray Tracing çekirdekleri güncellenmişti. NVIDIA şimdi Ada Lovelace mimarisiyle birlikte dördüncü nesil Tensor çekirdeklerine ve üçüncü nesil RT çekirdeklerine geçiş yapıyor. İddialara bakılırsa iki kata kadar daha yüksek yapay zeka performansı ve iki kata kadar performanslı Işın İzleme performansı sunulacak.
RT ve Tensor Çekirdekleri
Ada’nın yeni dördüncü nesil Tensor çekirdekleri, ilk olarak Hopper H100 veri merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak verimi 5 kata kadar artırıyor ve 1,4 Tensor-petaFLOPS’a çıkarıyor. Öte taraftan, RT çekirdekleri yeni Opacity Micromap (OMM) Motoru ve yeni Displaced Micro-Mesh (DMM) Motoru ile birlikte geliyor. OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha iyi işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha hızlı Bounding Volume Hierarchy (BVH) oluşturma süresi sunarak geometrik olarak karmaşık sahnelerin gerçek zamanlı ışın takibini mümkün hale getiriyor.
Shader Execution Reordering
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı nesneye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylelikle çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, önceden verimsiz olan bu iş yüklerini dinamik olarak yeniden düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme işlemleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare hızlarını %25’e kadar artırabiliyor.
AV1 Kodek Desteği
Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama desteği sunan sekizinci nesil NVIDIA Encoder’a (NVENC) sahip olacak. Böylelikle yayıncılar ve video işiyle uğraşanlar için yeni olanaklar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların aynı bit hızı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
DLSS 3
DLSS 3, performansı büyük ölçüde artırırken yapay zeka destekli grafiklerde devrim niteliğinde atılımlar sunuyor. Kötü haberi baştan verelim, yeni nesil DLSS sürümü yalnızca RTX 4000 serisi ekran kartlarında desteklenecek. Eski nesil RTX 3000 serisi ise DLSS 2 ile yoluna devam edecek. NVIDIA, DLSS 3 ile DLSS 1 arasında 16 katlık performans artışı meydana geldiğini söylüyor.
Mimarinin Getirileri
Genel olarak, Ampere ve Ada Lovelace mimarisini kıyaslayacak olursak aşağıdaki sonuçlar karşımıza çıkıyor.
- 2 kat daha fazla GPC (Grafik İşleme Kümeleri).
- %50 daha fazla çekirdek.
- %50 daha fazla L1 önbellek.
- 16 kat daha fazla L2 önbellek.
- ROP sayısı iki katına çıktı.
- 4. Nesil Tensor ve 3. Nesil RT Çekirdekleri.
NVIDIA GeForce RTX 4090 Özellikleri
NVIDIA’nın GeForce RTX 4090’ı uzun zamandır bekleniyordu ve nihayet burada. Yeni amiral gemisini kalbinde Ada Lovelace AD102 GPU yer alıyor. Yaklaşık 600 mm2 boyuta sahip olan GPU, muazzam şekilde 76 milyar transistör barındırıyor.
AD102 GPU aslında 144 adede kadar SM desteği sunuyor. GeFore RTX 4090, bunların 128 adedini kullanırken 16.384 CUDA çekirdeğini bir araya getiriyor. Yeni GPU 96 MB L2 önbellek ve toplam 384 ROP’a sahip olabilecek. Ancak RTX 4090’ın kullandığı GPU kırpılmış olduğundan dolayı bu rakamlar biraz daha düşük olabilir.
RTX 4090 Founders Edition, 2.23 GHz standart saat hızı ve 2.52 GHz artırılmış saat hızına sahip görünüyor. NVIDIA, laboratuvarlarında hız aşırtma ile Ada GPU’ları 3 GHz’in üzerine çıkardığını söylüyor. Referans tasarım bu hızlara ulaşamıyor. Ancak fabrika çıkışlı olarak overclock edilen özel soğutmalı modellerin 3.0 GHz’e yakın hızlara erişmesini bekliyoruz.
Bellek özelliklerine gelince, AD102 GPU’ya 384 bit veri yolu arabiriminde ve 21 Gbps hızında çalışan 24 GB kapasiteli 24 GDDR6X bellekler eşlik edecek. Böylelikle kağıt üzerinde GeForce RTX 3090 Ti ile aynı olan 1 TB/s bant genişliği ortaya çıkıyor.
Ekran kartının TBP değeri (toplam kart gücü) 450W olarak listeleniyor, bu da TGP’nin (toplam grafik gücü) daha düşük olabileceği anlamına geliyor. Bununla birlikte, devasa soğutmaya sahip özel tasarımların 500W üzerinde güç tüketmesi muhtemel görünüyor.
RTX 4090 | RTX 4080 16 GB | NVIDIA GEFORCE RTX 4080 12 GB | RTX 3090 Ti | RTX 3080 | |
---|---|---|---|---|---|
GPU | AD102-300 | AD103-300 | AD104-400 | Ampere GA102-225 | Ampere GA102-200 |
Üretim Teknolojisi | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Kalıp Boyutu | ~600mm2 | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
Transistör | ~75 milyar | ? | ? | 28 milyar | 28 milyar |
CUDA Çekirdekleri |
16384 | 9728 | 7680 | 10240 | 8704 |
TMU / ROP | ? | ? | ? | 320 / 112 | 272 / 96 |
Tensor / RT Çekirdekleri | ? | ? | ? | 320 / 80 | 272 / 68 |
Taban Saat | 2230 MHz | 2210 MHz | 2310 MHz | 1365 MHz | 1440 MHz |
Boost Saati | 2520 MHz | 2510 MHz | 2610 MHz | 1665 MHz | 1710 MHz |
FP32 Hesaplama | 82.6 TFLOPs | ~50 TFLOPs | ~40 TFLOPs | 34 TFLOPs | 30 TFLOPs |
Bellek | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
Veri Yolu | 384-bit | 256-bit | 192-bit | 384-bit | 320-bit |
Bellek Hızı | 21 Gbps | 23 Gbps | 21 Gbps | 19 Gbps | 19 Gbps |
Bant Genişliği | 1008 GB/s | 736 GB/s | 504 GB/s | 912 Gbps | 760 Gbps |
TBP | 450W | 320W | 285W | 350W | 320W |
Maks. TGP | 660W | 516W | 366W | – | – |
Liste Fiyatı | 1599$ | 1199$ | 899$ | 1199$ | 699$ |
Çıkış Tarihi | 12 Ekim 2022 | Kasım 2022 | Kasım 2022 | 3 Haziran 2021 | Eylül 2020 |
NVIDIA GeForce RTX 4090 Performansı
Yeni nesil ekran kartları, NVIDIA’nın iddialarına bakılırsa kullanım senaryosuna bağlı olarak iki ila dört kata kadar daha yüksek performans sunacak.
NVIDIA, rekabetçi oyunlarda 1440p çözünürlükte 300 FPS’nin üzerinde değerlere ulaştıklarını söylüyor. Piyasada halen 360 Hz tazeleme hızına sahip 1440p monitör yok, ancak artık üreticiler kolları sıvamış olmalı çünkü bundan faydalanabilecek donanımlar piyasaya çıkıyor.
NVIDIA tarafından sunulan RTX 3090 Ti kıyaslama tablosunda Microsoft Flight Simulator, Warhammer 40,000: Darktide ve Cyberpunk 2077 gibi oyunlar görüyoruz. Testler i9-12900K işlemci, 32 GB RAM ve Windows 11 işletim sisteminde yapıldı. DLSS Performans modunda çalışıyordu.
NVIDIA GeForce RTX 4090 Çıkış Tarihi ve Fiyatı
NVIDIA GeForce RTX 4090 Founders Edition, 1599 dolarlık fiyatla birlikte 12 Ekim’de satışa sunulacak. Bildiğiniz gibi MSI, ASUS ve Gigabyte gibi üretim ortaklarının ekran kartları modeline göre farklı fiyat etiketine sahip oluyor. Bu nedenle fiyatlan
RTX 3090 Ti, RTX 3000 serisi tanıtıldıktan uzun zaman sonra piyasaya çıkmıştı. Bu nedenle RTX 4090 Ti veya olası Titan modelini yakın bir zamanda beklemiyoruz.