Skocz do zawartości

Techniki rekonstrukcji obrazu w grach - NVIDIA DLSS, AMD FSR, Intel XeSS, Sony PSSR oraz inne


Rekomendowane odpowiedzi

Opublikowano

"While the core algorithm aims for consistency, a 30-series card running DLSS 4.5 might look different (often with more visual artifacts or performance cost) than a 40-series card running the same version, simply due to hardware limitations. The core image quality is generally the same; differences arise from GPU generational hardware (Tensor Cores), VRAM, driver optimizations, system bottlenecks, and how newer DLSS versions handle older hardware, leading to varying performance impacts and sometimes subtle visual trade-offs like sharpness vs. ghosting"

Czyli ta sama wersja DLSS nie wyglada tak samo na dwoch roznych kartach. Nie wiem jaka to jest skala, bo mnie to nigdy nie interesowalo, ale jest to logiczne ze nowsze modele (4.5) moga powodowac problemy na starszych kartach. Tak jak wyzej opisane potencjalne artefakty - blurrowanie twarzy. 
 

Opublikowano (edytowane)

Niektore posty MOGA cos wnosic do watku, ALE NIE WNOSZA 

DLSS 4.5 korzysta w pelni z fp8, a rtxy 20x0, 30x0 go natywnie nie obsluguja, tylko emuluja przez fp16 > stad sa dropy w szeroko rozuminanym performance (nie chodzi tylko o FPSy, ale i o dodatkowe artefakty). 

 

Edytowane przez oldfashioned
Opublikowano

No tak, przecież napisałem ze DLSS działa wolniej na starszych kartach.

 

Ale jeszcze raz napisze nikt nie potwierdził gorszej jakości obrazu na tych kartach.

Jeśli ona faktycznie występuje jest nie do wyłapania.

 

I aby było jasne mam na myśli kogoś, kto wkłada w te analizy dużo pracy, a nie jakiś lolek z redita któremu się coś wydaje.

Opublikowano
3 godziny temu, oldfashioned napisał(a):

Niektore posty MOGA cos wnosic do watku, ALE NIE WNOSZA 

DLSS 4.5 korzysta w pelni z fp8, a rtxy 20x0, 30x0 go natywnie nie obsluguja, tylko emuluja przez fp16 > stad sa dropy w szeroko rozuminanym performance (nie chodzi tylko o FPSy, ale i o dodatkowe artefakty). 

 

Korzystanie z FP16 zamiast FP8 to nie jest żadna emulacja tylko obliczenia są wykonywane w wyższej precyzji. Wydajność jest niższa na starszych generacjach, to oczywiste, ale dropy i artefakty to już tylko twój wymysł.

Opublikowano
Godzinę temu, galakty napisał(a):

To już lepiej jakby chlał na tych rybach i chociaż obiad by był xD 

W realu tez łowię (sprzęt Mikado) i nie jeden Karp na obiadzie był na talerzu :)

Godzinę temu, skypan napisał(a):

Gościu gra chyba z celi w te ryby :E Ale widać, że wszystkich jeszcze nie złowił bo mu parę osiągnięć zostało :P

Jest nowe łowisko, ale trzeba mieć minimum 100 level, a ja mam zaledwie 96 :( 

Opublikowano
7 minut temu, oldfashioned napisał(a):

Przeczytaj raz jeszcze co napisalem.
Potem sprawdz, czy 20x0 albo 30x0 natywnie obsluguja FP8, czy jednak musza emulowac przez co jest spadek wydajnosci.

I co z tego? W jaki sposób wykonywanie tych obliczeń na FP16 (czyli w wyższej precyzji) miałoby pogorszyć końcowy efekt? Spadek wydajności nie wynika z żadnej emulacji, tylko z tego, że precyzja FP8 hula 2x szybciej na Adzie i Blackwellu niż FP16, a na starszych GPU nie można użyć Tensorów na FP8, więc lecą FP16 i nie ma boosta do obliczeń DLSS. Kolejne bzdurki widzę się wyprodukowały, ciekawe co będzie następne xD

  • Upvote 1
Opublikowano

@tomcug

Tylko co ma precyzja matematyczna do efektywności modelu AI w runtime? W tym przypadku puszczanie obliczeń FP8 na ścieżce FP16 to żaden plus, tylko czysty overhead. DLSS 4.5 jest zoptymalizowany pod architekturę z natywnym FP8, więc rzutowanie tych danych na starsze karty, które fizycznie ich nie obsługują, to po prostu dodatkowa, zbędna robota dla GPU.

Identyczna sytuacja jak w Data Science: upcasting modelu nie przywraca utraconych informacji, bo wagi i tak są już obcięte do niższego formatu – marnujesz tylko cykle zegara na mielenie zer. W efekcie każda dodatkowa milisekunda stracona na casting danych (FP8 > FP16) zwiększa latenc i model "przestaje sie wyrabiac" wzgledem silnika gry > stad dropy rzedu 20% performance na starszych kartach. No i właśnie z tego desyncu biorą się potencjalne artefakty, o których wspominałem, a których „wyższa precyzja” FP16 w żaden sposób nie naprawi. 

 

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się
  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.

×
×
  • Dodaj nową pozycję...