Rehber DLSS Nasıl Çalışıyor?

Merhaba.
Bu rehberde DLSS üzerine farklı bir konu işleyeceğiz, teknolojinin derinlerine ineceğiz ve verdiği performanstan çok bu performansı nasıl sağladığını inceleyeceğiz.

DLSS Nedir?
Önce bu teknolojinin ne olduğuna dair kısa bir hatırlatma yapalım:

DLSS, Nvidia'nın geliştirdiği yapay zeka tabanlı bir yeniden ölçeklendirme kütüphanesidir.

Oynadığınız oyunun yerel çözünürlüğünü düşürerek ekran kartının işlediği piksel sayısını azaltır, çıkan görüntüyü de monitörünüzün çözünürlüğüne yapay zeka aracılığıyla yeniden boyutlandırarak aynı görüntü kalitesinde daha yüksek kare hızı almanızı amaçlar.

Ama bunu nasıl yapıyor? İşte asıl konumuz burası.

4K görüntüyü hedefleyen, Performans modunda bir DLSS senaryosu hayal edelim:

1.png


Ekran kartından çıkan 1080p çözünürlükteki görüntü, Super Resolution (Süper Çözünürlük) algoritmasında bir önceki işlemeden elde edilen Hareket Vektörleriyle birlikte işleniyor ve 4K görüntü monitöre gönderiliyor. Peki Super Resolution algoritması nasıl çalışıyor?

2.png


Algoritmaya Hareket Vektörleriyle sokulan 1080p görütü, Evrişimsel Otoçözümleyici adı verilen bir yapay zeka ağına sokuluyor. Bu ağ ile görüntü, 4K çözünürlüğe boyutlandırılıyor ve bu görüntüden de bir sonraki kareye gönderilmek üzere vektör haritası oluşturuluyor.

Oluşturulan 4K görüntü, algoritmanın veri tabanında bulunan 16K çözünürlükteki Ground Truth (Temel Gerçek) görüntülerle karşılaştırılarak iyileştiriliyor ve monitöre gönderiliyor.

Aslında DLSS'in çalışma mantığı bu kadar basit, tüm olay yapay zekada.

DLSS 3.0'ın Olayı Nedir?
DLSS 1.0 ve 2.0'ın çalışma mantığı aynı. 2.0'da sadece kullanılan yapay zekada değişikliğe gittiler, böylece daha genel bir algoritmayla oyunlara daha kolay entegre edilebilecekti. Ama 3.0'da işler bir hayli değişiyor.

3.png


DLSS 3.0, Frame Generation (Kare Oluşturma) denilen bir özellik sunuyor bizlere. Bu özellik, görüntünün yeniden boyutlandırması bir yana, üstüne bir de oluşturulan 2 görüntü arasına sıfırdan, yeni bir kare oluşturarak yerleştirilmesini sağlıyor.

"Bunu nasıl sağlıyor?" dediğinizi duyar gibiyim, sakin olun, bu konunun var olsa sebebi zaten bu.

4.png


Super Resolution kısmı 2.0 ile aynı. Ancak fark, sıralı 4K görüntülerin sadece monitöre değil, Optical Flow Accelerator (Optik Akış Hızlandırıcı) dediğimiz, RTX kartlarda bulunan bir çipe de gönderilmesiyle doğuyor. Bu çip, görüntüleri işleyerek Optical Flow Field (Optik Akış Alanı) dediğimiz vektörler oluşturuyor.

Bu görüntüler, oluşturulan vektörlerle Optical Multiframe Generation (Optik Çoklu Kare OIuşturma) ağına dahil edilerek sıfırdan kareler yaratılıyor, bu kareler monitöre gönderiliyor ve Super Resolution ile oluşturulan karelerin arasına yerleştiriliyor. Böylece 2 katından fazla kare hızı oluşturulmuş oluyor.

Optical-flow.png


Optical Flow Accelerator da Neyin Nesi?
Bu arkadaşımız, RTX serisiyle birlikte çıkış yapmış olan Optical Flow çipini kullanan bir kütüphane. Kendisi, görüntülerin işlenerek vektör haritalarını çıkarmakla görevli bir hesaplama motoru.

Bu donanıma olan geri dönüş o kadar olumluydu ki Nvidia, Ada Lovelance (RTX 4000 serisi) mimarisinde bu donanıma ciddi bir yatırım yaptı ve performansını önemli ölçüde arttırdı. Optical Flow, artık DLSS gibi eş zamanlı yapılması gereken işleri dahi yapabilecek güçte olduğu için Nvidia, bu donanımı DLSS'e de entegre etmek istedi ve oldukça da başarılı oldu.

Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.
2022-09-22-image-25.jpg


1684595539596.png
---
1684595550978.png


Aslında DLSS 3.0'ın Ada Lovelance mimarisi dışında kullanılamamasının sebebi de bu donanım. Turing (RTX 2000) ve Ampere (RTX 3000) mimarilerinde bu donanım DLSS'e yetişebilecek güçte değil, bu yüzden bu kartlar sürücüyü modifiye edip Frame Generation'ı aktif hale getirseniz dahi istenilen performansı veremiyor.



Rehberimiz bu kadar. Herkesin anlayabilmesi adına fazla teknik bilgilere girmedim. Umarım okumaktan keyif almışsınızdır.

İyi günler, iyi Sosyaller diliyorum.
 
Son düzenleyen: Moderatör:
Emeğinize sağlık, Frame Generation'ın input lag oluşturduğunu söyleyenler vardı, bunun sebepleri nedir, ve bu teknoloji görüntüde bir değişikliğe sebep oluyor mu?
Hocam, Frame Generation'ın gecikme arttırdığı doğru ancak DLSS açınca Reflex de otomatikmen devreye giriyor. Sonuç itibarıyla native'den daha düşük gecikme alıyorsunuz.

Reflex otomatik devreye girmeyen oyunlarda açılmasında fayda var.
 
Hocam, Frame Generation'ın gecikme arttırdığı doğru ancak DLSS açınca Reflex de otomatikmen devreye giriyor. Sonuç itibarıyla native'den daha düşük gecikme alıyorsunuz.

Reflex otomatik devreye girmeyen oyunlarda açılmasında fayda var.
Anladım, bu NVIDIA Reflex olayını anlayamadım bir türlü, RTX ekran kartlarında mı gerçek etkisini gösteriyor acaba? GTX 1650 kullandığım için hiçbir oyunda etkisini hissetmedim sanki.
 
Hocam, Frame Generation'ın gecikme arttırdığı doğru ancak DLSS açınca Reflex de otomatikmen devreye giriyor. Sonuç itibarıyla native'den daha düşük gecikme alıyorsunuz.

Reflex otomatik devreye girmeyen oyunlarda açılmasında fayda var.
Örneğin R6 da reflex açıkken dlss açmak daha mı iyi olur yoksa kapatmak mı?
 
Anladım. Bu NVIDIA Reflex olayını anlayamadım bir türlü, RTX ekran kartlarında mı gerçek etkisini gösteriyor acaba? GTX 1650 kullandığım için hiçbir oyunda etkisini hissetmedim sanki.
GTX 900 ve üstü tüm kartlarda kullanılabiliyor, tabii ki daha yeni kartlarda daha verimli çalışır ama tüm kartlarda etkisini gösterir.

His kısmı da tabii ki göreceli. Belki siz fark etmemişsinizdir, belki oluşan gecikme zaten düşük olduğu için anlaşılması zordur, belki diğer donanımlar gecikmede başka bir sorun yaratıyordur, belki kare hızı düşük olduğu için düşük gecikme bir fark yaratmıyordur, gibi gibi.
Örneğin R6'da Reflex açıkken DLSS açmak daha mı iyi olur, yoksa kapatmak mı?
Kişisel tercih meselesi bu. Reflex her türlü artı olduğu için açık kalması şart zaten, eğer kare hızım monitörle eşleşmiyorsa ben DLSS'i de açardım.
 
@iloveichigo
images (8).jpeg

GTX 1660 serisinin çipi olan TU116 ve TU117'de SM tasarımı bu şekilde, donanımsal Tensor çekirdekleri olmadığı için (FP32 CUDA çekirdekleri olarak iş görüyor, aynı zamanda Float Point (kayar nokta) işlemlerini yapan işlemciler ki oyunlarda bu hesaplamalar daha önemlidir, INT32 ise tam sayı işlemlerini yapan çekirdekler) DLSS açmak mümkün değil.
images (9).jpeg

Turing ve sonraki nesillerde SM tasarımı buna benzer olduğundan (gördüğünüz üzere FP16 işlemcileri yerine Tensor çekirdekleri var) DLSS açmak mümkün, resimdeki blok diyagram RTX 2060 serisine güç veren TU106 çipine ait.
 

Technopat Haberler

Geri
Yukarı
09:05:00