Anasayfa Makale NVIDIA Pascal Hakkında Bilmeniz Gereken Her Şey

NVIDIA Pascal Hakkında Bilmeniz Gereken Her Şey

NVIDIA’nı yeni mimarisi Pascal hakkında teknik detaylar, Maxwell karşılaştırması ve bilmeniz gereken önemli noktaları bu yazıda bulacaksınız.

Geçtiğimiz yıl GTC (GPU Technology Conference) 2015’te ilk bilgilerini aldığımız en yeni NVIDIA mimarisi Pascal’ın çıkışı yaklaşıyor. HBM2 bellek, daha az güç tüketimi, daha fazla bellek kapasitesi gibi önemli gelişmeler vadeden Pascal mimarisine ait ilk ürünlerin, önümüzdeki ay gerçekleşecek olan GTC 2016’da duyurulması bekleniyor. Yeni mimariye dair nihai bilgiler, önümüzdeki ay ilk örneklerle birlikte ortaya çıkacaktır. Ancak biz o zamana kadar Pascal mimarisine dair bildiğimiz her şeyi gözden geçirelim.

GTC 2015 sırasında NVIDIA CEO’su esprili bir şekilde Pascal mimarisinin performansının Maxwell’e göre kabaca 10 kat daha fazla olduğunu belirtmişti. Bu iddianın arkasındaki matematiğe, Pascal’ın Maxwell’e göre üstünlük sağladığı farklı kategorilerin toptan bir araya getirilmesi gözüyle bakabiliriz. Örneğin Pascal, Maxwell’e göre 3 kat daha fazla bellek bant genişliği, 2 kat daha fazla tek duyarlı işlem performansı ve 2 kat daha fazla Watt başına performans sunuyor.

pascal maxwell

Elbette Pascal mimarisi her alanda Maxwell’den 10 kat daha hızlı değil ve NVIDIA da böyle bir beklentinin gerçekçi olmadığını itiraf ediyor. Ancak her ne kadar “10 kat” deyimi süslü bir başlık olarak görünse de, Pascal’ın sunduğu geliştirmeleri göz önüne aldığımızda, Pascal GPU’ların teoride Maxwell GPU’lara göre ciddi bir performans artışı sunduğu çok açık.

Pascal mimarisinin NVIDIA dünyasına kazandıracağı dört temel teknoloji bulunuyor. Bunlar sırasıyla HBM bellek, karma duyarlılık, NV-Link ve TSMC 16nm FinFET üretim süreci. Bunların her biri kendi alanları için mihenk taşı olma özelliğine sahip ve yazımızda her birine detaylı bir şekilde değineceğiz.

HBM2

SK Hynix ve AMD tarafından ortak bir şekilde geliştirilen yüksek bant genişlikli yığın bellek standardı, Pascal ile birlikte NVIDIA tarafında da resmen kullanıma girecek. Yeni bellek standardı, bellek bant genişliğinin saniyede 1 TB’a ulaşmasına olanak sağlayacak. Bu değer kabaca Titan X’in sahip olduğunun üç katı. HBM2 ile birlikte bir diğer önemli kısıtlama olan maksimum VRAM sınırı da artacak. Maxwell’de 12 GB olan bu sınır, Pascal ile birlikte 32 GB’a çıkacak.

NVIDIA’nın en büyük rakibi AMD, hali hazırda Fiji XT GPU’su ile HBM kullanıyor. HBM destekli bu GPU tam olarak 512 GB/s bellek bant genişliğine sahip ki, bu değer GTX 980’in iki katı. Ayrıca AMD ikinci nesil HBM bellekleri, 2016’da tanıtacağı Arctic Islands GPU’larında kullanmaya hazırlanıyor. Yani önümüzdeki yıllarda hem AMD, hem de NVIDIA’nın HBM2 bellekleri standart belirleyeceğini tahmin edebiliriz.

Her HBM yığını, GPU’ya 1024-bit’lik bir bellek veriyolu ile bağlanıyor. Bu sayede her ne kadar HBM bellekler kağıt üstünde GDDR5 belleklere göre daha düşük frekansta çalışsa da, daha geniş bellek arayüzü sayesinde 9 kata kadar daha fazla performans sunabiliyor.

NV-Link

nv link

Pascal ile birlikte hayatımıza girecek bir diğer yeni teknoloji ise NV-Link. NVIDIA’nın iddiasına göre PCIE 3.0’dan 5 ile 12 kat arası daha hızlı olan NV-Link, özellikle verimli enerji kullanımı ile dikkat çekiyor. NVIDIA, NV-Link bağlantısının PCIe Gen 3.0 x16 kanalına göre 3 kat daha az enerji harcadığını iddia ediyor.

Özellikle süper bilgisayarlar için geliştirilen NV-Link, Summit ve Sierra süper bilgisayarlarının sunucu düğümü mimarisi için kilit bir rol oynuyor. NV-Link ile IBM Power CPU ve NVIDIA GPU, birbirleriyle hızlı ve kesintisiz bir iletişim kurabiliyor. Programcı gözüyle bakacak olursak NV-Link, CPU ve GPU ile ilişkilendirilmiş verilerin açıklıklarını, CPU ve GPU’nun bellek sistemlerini birleştirerek ortadan kaldırıyor. Hem CPU, hem de GPU kendi bellek kontrolcülerine sahip olduğu için kullanılan temel bellek ihtiyaca göre optimize edilebiliyor.

Kısaca NV-Link, HPC (High Performance Computing) kullanıcılarına iki önemli kolaylık sunuyor. İlki, düğüm elementleri arasındaki bant genişliği arttığı için kullanılan uygulamaların genel performansı ciddi bir şekilde artıyor. İkincisi ise, birleşik bellek teknolojisi sayesinde GPU ve CPU için kod yazmak daha da kolaylaşıyor.

16nm FinFET

Pascal, TSMC’in 16nm FinFET üretim sürecinden geçen ilk NVIDIA GPU’su olacak. Bu sayede güç tüketimi, 28nm Maxwell ve öncüllerine göre çok daha düşük seviyede. Ayrıca 16nm ölçek, NVIDIA’nın daha karmaşık tasarımları, güç tasarrufundan fedakârlık yapmadan elde etmesine olanak sağlıyor.

İşin teknik kısmında ise 16FF+ (FinFET Plus), 28nm öncülüne göre %65 daha yüksek hız, 2 kat daha yoğunluk ve %70 daha düşük güç tüketimi sunuyor. 20SoC teknolojisi ile karşılaştırdığımızda ise %40’a varan performans artışı ve %60’a varan güç tasarrufu gözlemliyoruz.

FP16

Yeni mimarinin sunduğu teknolojiler arasında FP16 karma duyarlılık veya yarı duyarlılık desteği, oldukça önemli bir yer kaplıyor. FP16 modunda GPU’nun yaptığı hesaplama işlemlerinin tutarlılık oranı, standart FP32 moduna göre daha düşüktür. FP32, son yıllarda aramızda olan neredeyse bütün grafik programlama arayüzleri için vazgeçilmez bir teknoloji. DirectX 12, 11, 10 ve DX9 Shader 3.0 bu arayüzlerden bazıları. Yani görüldüğü gibi FP16 ve karma duyarlılık, modern oyun ihtiyaçlarımız konusunda neredeyse kullanılamaz durumda.

pascal gpu

Ancak FP16’nın FP32 ve FP64’e göre büyük bir güç tasarrufu avantajı mevcut. Bu sayede yüksek derecede kompleks hesaplamalar haricinde, FP16’nın kullanılması ciddi güç tasarrufu sağlayabiliyor. FP16 desteği özellikle mobil cihazlar için oldukça önemli bir gelişme.

NVIDIA’nın Maxwell GPU mimarisi, FP32 ile sınırlı olduğu için GPU, FP16 ve FP32 işlemlerini aynı oranda işliyordu. Ancak Pascal ile denkleme dahil olan karma duyarlılık sayesinde GPU, FP16 gerektiren işlemleri artık iki kat daha hızlı işleyebilecek.

Pascal GP100 GPU’su Hakkında Bildiklerimiz

  • Pascal mimarisi.
  • Maxwell’e kıyasla Watt başına performans oranı yaklaşık iki kat arttı.
  • 2016’nın ikinci yarısında piyasaya sürülmesi bekleniyor.
  • DirectX 12’yi 12_1 veya daha yüksek seviyede destekliyor.
  • GTX Titan X ve GTX 980 Ti’da bulunan GM 200’ün yerini alacak.
  • TSMC tarafından 16nm FinFET üretim süreciyle geliştirildi.
  • Yaklaşık 17 milyar transistöre sahip. Bu değer, GM200’ün neredeyse iki katı.
  • Toplamda 16 GB VRAM için dört adet 4-Hi HBM 2 yığını, 32 GB VRAM için ise dört adet 8-Hi yığını içeriyor.
  • 4096-bitlik bellek arayüzüne sahip.
  • Yeni nesil IBM PowerPC sunucularla uyumlu NV-Link desteği.
  • FP16 yarı duyarlı işleme desteği.

Karşılaştırma Tablosu

GPU Mimarisi NVIDIA Fermi NVIDIA Kepler NVIDIA Maxwell NVIDIA Pascal
GPU Üretim Süreci 40nm 28nm 28nm 16nm (TSMC FinFET)
Amiral Gemisi Çekirdek GF110 GK210 GM200 GP100
GPU Tasarımı SM (Streaming Multiprocessor) SMX (Streaming Multiprocessor) SMM (Streaming Multiprocessor Maxwell) Duyurulacak
Maksimum Transistör Sayısı 3.00 Milyar 7.08 Milyar 8.00 Milyar 17 Milyara Kadar
Maksimum GPU Ölçeği 520mm2 561mm2 601mm2
İşlem Birimi Başına Düşen SP Sayısı 32 SP 192 SP 128 SP
Maksimum CUDA Çekirdeği 512 CC (16 CU) 2880 CC (15 CU) 3072 CC (24 CU)
İşlem Performansı 1.6 TFLOP 5.1 TFLOP 6.1 TFLOP 12 TFLOP
Maksimum VRAM 1.5 GB GDDR5 6 GB GDDR5 12 GB GDDR5 32 GB HBM2
Maksimum Bant Genişliği 192 GB/s 336 GB/s 336 GB/s 1 TB/s
Maksimum Güç Tüketimi 244W 250W 250W 250W
Öncülüne Göre Performans Artışı +45%
(GTX 285’e Karşı GTX 580)
+55%
(GTX 580’e Karşı GTX TITAN BLACK)
+30%
(GTX TITAN BLACK’e Karşı GTX TITAN X)
Amiral Gemisi Ekran Kartı Fiyatı $499
(GTX 580)
$999
(GTX Titan Black)
$999
(GTX Titan X)
Çıkış Tarihi 2010 (GTX 580) 2014 (GTX Titan Black) 2015 (GTX Titan X) 2016

NVIDIA GeForce GTX 1080 İncelemesi