Donanım duyurularında, teknik özellik sayfalarında ve bazı tanıtımlarda Teraflop (TFLOP) cinsinden bazı değerler sergilenir. Bu değerler GPU performansıyla doğrudan bağlantılıdır ancak donanımı kullandığımız alana göre işler değişiklik gösterebilir.
Teraflop, bir sistemin saniyede sunabildiği hesaplama gücünün bir ölçütüdür. TFLOP, saniyede trilyonlarca hesaplama anlamına geliyor.
TFLOP Nedir ve Ne İşe Yarar?
Bildiğiniz üzere, bir bilgisayarın performansını doğrudan ölçmek kolay değil. Bir iş yükünde harika performans gösteren bir sistem, farklı bir bir görevde daha zayıf performans gösterebilir. Yeni nesil bir dizüstü bilgisayar, yaptığınız işe bağlı olarak on yıl önceki bir süper bilgisayardan daha iyi işler çıkarabilir.
Bir işlemcinin saat hızını ölçen gigahertz’in (GHz) aksine, TFLOP bir bilgisayarın performansının doğrudan matematiksel bir ölçümüdür.
Ayrıca saat hızları, çekirdek sayıları ve hatta saniye başına komut gibi birçok unsur her zaman doğrudan karşılaştırılabilir değildir. CPU veya GPU fark etmeksizin bir donanımın performansını etkileyen birçok etken var. En başında ise mimari geliyor.
Uzun zamandır FLOPS (floating-point operations per second-saniye başına kayan nokta işlemi) tabiri kullanılıyordu lakin donanımlar güçlendikçe TFLOPS’a geçmeye başladık. TFLOPS, bir bilgisayarın neler yapabileceğine dair daha sağlam bir ölçüt sunmak üzere nesiller ve hatta farklı bileşenler arasında geçiş sağlayan bir ölçüm aracıdır. Yani farklı nesillerden, tamamen farklı mimariye sahip ve farklı teknik detaylara sahip donanımların TFLOPS performansı kıyaslanabilir. Ancak tekrar belirtelim, TFLOPS tek başına belirleyici değil.
TFLOPS Performansı Nasıl Etkiler?
Kayan noktalı aritmetik, doğruluk ve performans arasında bir miktar değiş tokuş yapan bir hesaplama yöntemidir. Bir metrik olarak FLOPS, saniyede bu hesaplamalardan kaç tanesinin yapılabileceğinin ölçüsünü verir. Bunun yanında, teraflop kıyaslamalarında 16 bit (yarım hassasiyet), 32 bit (tek hassasiyet) ve 64 bit (çift hassasiyet) gibi farklı ölçümler mevcut.
Farklı iş yükleri farklı FLOPS türlerinden yararlanıyor; oyunlarda tek hassasiyete odaklanılırken, daha bilimsel görevler ve yapay zeka hesaplamaları çift hassasiyetli FLOPS’tan yararlanır.
Ancak hangi görevi gerçekleştiriyor olursanız olun, bunları gerçekleştirmek için kullandığınız modern cihazlar o kadar hızlıdır ki performansları FLOPS cinsinden değil TeraFLOPS (TFLOPS) cinsinden ölçülür. Her bir TFLOP, saniyede bir trilyon hesaplama demek.
Ekran kartı performansı söz konusu olduğunda son on yıldır TFLOP kıyaslaması daha fazla kullanılır oldu. AMD 2008 yılında ilk TFLOPS özellikli ekran kartını piyasaya sürdü ve aynı yıl 2 TFLOPs bariyerini aştı.
Modern ekran kartları ve oyun konsolları çok daha hızlı, çok da yetenekli. Eski GPU’ların TFLOP performansına kıyasla kat kat fazlası sunuluyor. Örneğin RTX 3090 yaklaşık 36 TFLOPS gölgelendirici performansına sahip. Halefi RTX 4090 ise 82.6 TFLOPS ile ham hesaplama gücü açısından çok daha performanslı. Apple’ın MacBook Pro’sunda bulunan Radeon Pro 5600M gibi mobil GPU’lar ise yaklaşık 5,3 TFLOPS sunuyor.
Çin Üretimi MTT S80 ve GTX 1050 Ti Kıyaslaması
Zaman zaman Çinli GPU üreticisi Moore Threads ve MTT serisi ekran kartlarından söz ediyoruz. Bu kartlar ham performans gücü açısından başarılı olsa da optimizasyon ve sürücüler zayıf olduğundan dolayı vasat performans sunuyor. Şimdi 14.2 ve 2.1 TFLOPS hesaplama gücüne sahip iki bambaşka kartın kıyaslamasına bakalım.
Bu kart, Moore Threads yönetimi tarafından yapılan bazı gizlemelere rağmen Imagination Technologies PowerVR mimarisini kullandığı anlaşılan bir GPU ile güç kazanıyor. Resmi teknik özelliklere gelince, ekran kartı 4096 MUSA çekirdeği kullanan Chunxaio mimarisi üzerine inşa edilmiş. GPU 1,8 GHz’lik saat hızına ve 14.2 TFLOPS’luk hesaplama performansına sahip. PC Watch tarafından test edilen örnekte 16 GB GDDR6 14 Gbps bellek bulunuyor. Bellekler 256-bit veri yolu üzerinden GPU’ya bağlanırken 448 GB/sn’lik bant genişliği sağlayabiliyor.
| Test | MTT S80 | GTX 1050 Ti |
|---|---|---|
| 3DMark 06 | 28589 | 61414 |
| Unigine Valley (DX9) | 2707 | 5180 |
| Counter-Strike: Global Offensive (DX9) | 92.5 | 211.5 |
| Payday 2 (DX9) | 72.6 | 104.3 |
| Dragon Quest X (DX9) | 103.3 | 156.9 |
| Rainbow Six Siege (DX11) | 35.0 | 165.5 |
| Apex Legends (DX11) | 29.9 | 108.9 |
| Elder Scrolls: Skyrim SE (DX11) | 25.2 | 70.2 |
| Asetto Corsa (DX11) | 3.5 | 318.9 |
| Final Fantasy XIV (DX11) | 32.8 | 55.5 |
| Valheim (DX11) | 19.3 | 30.0 |
| Genel Ortalama | 90.0 | 277.1 |
Tabloda açıkça görebileceğiniz gibi, MTT S80 2016’da piyasaya sürülen ekonomik bir kart olan GeForce GTX 1050 Ti’ın çok altında. 4 GB GDDR5 bellek, 75W TGP ve 112 GB/s bant genişliği sunan GTX 1050 Ti kağıt üzerinde 2.1 TFLOPS işlem gücüne sahip. Böylesine zayıf bir rekabette bile Moore Threads’in kartı sınıfta kalıyor. MTT S80, DX9 grafik karşılaştırmalarında daha iyi performans gösteriyor. Ancak her şekilde GTX 1050 Ti’ın gerisinde.
TFLOPS Kıyaslaması: PlayStation 5 vs Xbox Series X
Sony ve Microsoft’un son nesil oyun konsolları PS5 ve Xbox Series X, piyasadaki en güçlü iki konsol. Her iki konsol da sekiz Zen 2 CPU çekirdeği ve özel RDNA2 grafik çekirdeğini bir araya getiren özel bir AMD APU (Hızlandırılmış İşlemci Birimi) kullanıyor.
TFLOPS, böyle karşılaştırılabilir donanımlarda kıyaslama ve performans açısından daha kullanılabilir bir yol. PS5’in grafik yongası 10.28 TFLOPS’luk güç üretirken, Xbox Series X’in çipi 12 TFLOPS’a kadar ulaşabiliyor.
Özetle, önceki nesil konsollara göre saf performans açısından büyük artışlar sağlanmıştı. Xbox One X 6 teraflopluk tek nokta hassasiyetine sahipken, PS4 Pro 4.2 TFLOP hesaplama değerine ulaşıyor.
Tüm bu ilave güç, daha yüksek kare hızları ve çözünürlük desteğinin yanı sıra donanım hızlandırmalı ışın izlemeyi mümkün kılıyor. Ayrıca performans, Microsoft’un değişken oranlı gölgelendirme (VRS) için özel bir algoritma uygulamasıyla daha da artırılıyor; yeni algoritma, odağın nerede olduğuna bağlı olarak bir sahneyi farklı ayrıntılarda işliyor. Böylelikle performansın en çok ihtiyaç duyulan yerlerde en üst düzeye çıkması sağlanıyor, sistem kaynakları verimli kullanılıyor.
TFLOPS’un Sınırlamaları
TFLOPS her ne kadar faydalı olsa da, bir ekran kartının veya oyun konsolunun performansının ve ham potansiyelinin yalnızca bir yönünü dikkate alır. Saat hızı, mimari, çekirdek sayısı, üretim teknolojisi veya bellek hızı gibi hiçbir teknik detay hesaba katılmıyor. Özetle karşılaştırma yaparken faydalı bir ölçüt, ancak tek başına yeterli değil.
Bu durum özellikle oyunlar söz konusu olduğunda geçerli. Biraz önceki örnekte gördüğünüz gibi, GPU’nun gerçek dünyadaki oyun performansını etkileyen başka faktörler de var. İster konsol ister PC olsun, oyunlar CPU, bellek, GPU, VRAM ve depolama gibi birçok donanıma ihtiyaç duyar. Bileşen darboğazları tüm sistemi yavaşlatabilir ve bir oyunun tüm yönleri her bileşene eşit derecede bağlı değildir.
Ayrıyeten kullanıcının seçtiği ayarlar da önemli. Mümkün olan en yüksek TFLOPS ile dünyanın en güçlü ekran kartına sahip olabilirsiniz, ancak 1080P çözünürlükte oyun oynuyorsanız tam kapasiteyi hiçbir zaman kullanamazsınız.



