Skocz do zawartości

SebastianFM

Użytkownik
  • Postów

    628
  • Dołączył

  • Ostatnia wizyta

Treść opublikowana przez SebastianFM

  1. Ten sterownik nie jest wymagany, na 566.36 też działa.
  2. Sprawdziłem, że w nowych bibliotekach DLSS domyślnie używany model to Transformer. Cyberpunk 2077, DLSS Q, Ray Reconstruction, ustawiony model CNN. Cyberpunk 2077, DLSS Q, Ray Reconstruction, ustawiony model Transformer. Alan Wake 2, DLSS Q, Ray Reconstruction, wgrane najnowsze biblioteki DLSS.
  3. Okaże się po premierze. Po pierwsze będzie to doskonale widać po różnicy w wydajności np. DLSS RR porównując działanie na RTX 4080 i RTX 5080. Ja jak najbardziej będę mógł to sprawdzić i udowodnić. Mam napisany prosty programik do przechwytywania wszystkich programów CUDA uruchamianych na GPU podczas przetwarzania DLSS, RR czy FG. Po ich przechwyceniu będzie można sprawdzić, jakich instrukcji używają i w jakiej precyzji wykonują obliczenia. Jak to nie? Już teraz stanowią wąskie gardło, najbardziej podczas DLSS RR a model Transformer ma być znacznie bardziej obciążający, nowy FG też ma w o wiele większym stopniu korzystać z obliczeń na rdzeniach Tensor. To jest nielogiczne, że niby FP4 nie będzie wykorzystywane. NVIDIA nie chwaliłaby się wtedy wyższą wydajnością AI, ponieważ nie miałaby się czym chwalić. Napisałem ci już wcześniej, jeżeli na RTX 5080 nie będzie używane FP4 to wydajność AI będzie tylko 10% - 15% wyższa niż RTX 4080. Zastanów się czemu NVIDIA cały czas podkreśla, że Transformer wymaga 4 razy większej ilości obliczeń. Ciekawie niby do czego równolegle. 😁 GPU wykonuje obliczenia etapami. Powinieneś to wiedzieć jeżeli chociaż raz odpaliłeś profiler. Podczas obliczeń AI inne jednostki niż rdzenie Tensor są używane w bardzo małym stopniu. Dopiero jak na GPU zakończy się jeden etap to rozpoczynany jest kolejny. Niższa wydajność rdzeni Tensor wydłuży etap obliczeń AI.
  4. @sideband, wywnioskowałem z informacji podanych przez NVIDIA, wynika to m. in. z poniższego zdania. "Even with these efficiencies, the GPU still needs to execute 5 AI models across Super Resolution, Ray Reconstruction, and Multi Frame Generation for each rendered frame, all within a few milliseconds, otherwise DLSS Multi Frame Generation could have become a decelerator. To achieve this, GeForce RTX 50 Series GPUs include 5th Generation Tensor Cores with up to 2.5X more AI processing performance." Przecież taka wydajność jest właśnie przy użyciu niższej precyzji FP4, inaczej różnica pomiędzy RTX 4080 i RTX 5080 wynosiłaby około 10% a pomiędzy RTX 4090 i RTX 5090 może 30%.
  5. Tak będzie na pewno tylko nie wiadomo w jakim stopniu wpłynie to na wydajność. Jeżeli chodzi o DLSS, RR i DLAA to nowy model Transformer wymaga 4 razy więcej obliczeń. Co za przypadek, że akurat RTX 5080 będzie ponad 4 razy wydajniejszy od RTX 4080 w obliczeniach AI (uwzględniając to, że na RTX 40x0 obliczenia są wykonywane z precyzją FP16 a na RTX 50x0 ma być używane FP4). 😊 Nowy FG ma nie korzystać ze sprzętowego OFA, zamiast tego używać większej ilości obliczeń AI. Nowy FG na RTX 50x0 ma być wydajniejszy a na RTX 40x0 to się dopiero okaże jaka będzie wydajność. Ci co kupią RTX 50x0 nie będą musieli wybierać. 😁 Był pokazany zrzut z ustawień Cyberpunk 2077 z możliwością wyboru modelu.
  6. Wcale sobie nie strzelił, wręcz przeciwnie. Wszystkie features w coraz większym stopniu wykorzystują AI i wymagają coraz większej wydajności rdzeni Tensor a właśnie ta wydajność została najbardziej zwiększona.
  7. @Kadajo, na 100%, on już jest do tego od dawna przygotowany (temat z rankingiem). 😁
  8. Star Wars Episode I: Racer (1999)
  9. Quake III Arena (1999)
  10. @Phoenix., design tego RTX 5090D Frost to w stylu jakiegoś sprzętu AGD. 🙂
  11. @Phoenix., ja zakładam, że nowy FG będzie w dużym stopniu wykorzystywał Tensory. Po premierze okaże się, czy miałem rację. Dopiero po sprawdzeniu profilerem użycia rdzeni Tensor przez FG będę mógł oszacować ile czasu zajęłoby generowanie klatek na starszych kartach graficznych. Weź pod uwagę, że RTX 2080 Ti ma 30 razy niższą wydajność w AI niż RTX 5090 więc może się okazać, że nawet w 1080p by sobie nie poradził w rozsądnym czasie.
  12. Tak, jeżeli chodzi o pierwszą część pytania. 😊 Ta informacja jest na stronie NVIDIA już od 2 tygodni. 😊 "We have also sped up the generation of the optical flow field by replacing hardware optical flow with a very efficient AI model. Together, the AI models significantly reduce the computational cost of generating additional frames." https://www.nvidia.com/en-us/geforce/news/dlss4-multi-frame-generation-ai-innovations/ Z tym przyspieszeniem to jednak dotyczy to Blackwell'a. A to, że będzie możliwe wcale nie znaczy, że NVIDIA się na taki ruch zdecyduje. Poza tym wydajność rdzeni Tensor w RTX 30x0 może być niewystarczająca.
  13. @Kadajo, cały czas podkreślają dużą wydajność RTX 50x0 w obliczeniach AI i wszędzie ładują to AI. Nowe 4x bardziej obciążające modele DLSS i RR a pewnie zaraz się okaże, że nowy FG na RTX 40x0 też będzie miał gorszą wydajność niż stary.
  14. Nie zabija a to o ile zmniejsza się ilość prawdziwych FPS zależy od rozdzielczości i od tego ile jest FPS bez włączonego FG. Ty podałeś ekstremalny przykład z tym 8K. Na RTX 4090 generowanie klatki pośredniej w 4K zajmuje około 2,5 ms. Przy bazowych 100 FPS po włączeniu FG będzie około 160 FPS czyli 80 prawdziwych klatek i 80 generowanych na sekundę. W takim przypadku to jest -1/5 a nie -1/3.
  15. Aktualnie za pomocą shaderów jest obliczane przetwarzanie wyniku OFA. W nowej wersji FG ma być używany do tego model AI. Czy teraz wszystko jasne?
  16. @WKNOM, na twojej płycie są 4 LED informujące co powoduje problem przy uruchamianiu. Czy po włożeniu nowej karty graficznej pokazuje, że jest problem z VGA? Masz jeszcze starą kartę graficzną żeby uruchomić komputer? Powinieneś sprawdzić czy masz aktualną wersję BIOS na płycie głównej i ewentualnie zaaktualizować.
  17. @RTX4090, ankieta będzie miała sens jeżeli będzie przeprowadzona na reprezentatywnej grupie osób. Z ankiety Steam dowiesz się tylko tego, z jakiego sprzętu korzystają użytkownicy Steam.
  18. Ten ranking nie ma żadnej wartości. To już było 1000 razy wałkowane. Ze Steam korzystają osoby, które grają tylko w indyki.
  19. Jeżeli ja się nie zdecyduje to i tak zawsze mogę poprosić @PiPoLiNiO o sprawdzenie. Napiszę mu dokładną instrukcję. 😁
  20. Ja sprawdzę dokładnie profilerem na moim RTX 4070 Ti. To jest akurat banalnie proste. 😊
  21. To się da prosto wytłumaczyć. Każdy, kto renderował coś w 3ds max lub podobnym programie będzie od razu wiedział o co chodzi. Żeby obliczyć oświetlenie dla każdego piksela puszcza się wiele promieni w różnych kierunkach. To może być np. 4096 próbek na piksel. Przy renderowaniu w czasie rzeczywistym jest natomiast takie założenie, że sąsiednie piksele nie różnią się zbyt bardzo więc można używać danych z sąsiednich pikseli. Dodatkowo oświetlenie nie zmienia się diametralnie w każdej klatce więc można korzystać z danych z poprzednich klatek to tak w skrócie. Jeżeli brakuje danych to oświetlenie będzię po prostu bardziej rozmyte.
  22. @RTX4090, ja nie będę się wdawał z tobą w polemikę. Po prostu włącz sobie w jakiejś grze FG, przechwyć trochę klatek podczas ruchu i porównaj renderowane z tymi generowanymi przez FG.
  23. @RTX4090, ja się z tobą nie zgadzam. Najprostszy przykład. Czy wyświetlałbyś obraz 1440p na ekranie 4K używając najprostszego skalowania? Oczywiście, że nie. A jak działa generowanie klatek? Pośrednia klatka jest interpolowana pomiędzy dwoma prawdziwymi. Podczas ruchu bardzo często klatki są skalowane. Przecież to jest oczywiste, że przy takiej interpolacji obraz będzie tracił na jakości. Dodatkowo przy MFG przez 3/4 zamiast 1/2 czasu na ekranie będą wyświetlone klatki o niższej jakości.
  24. Pisałeś już o tym 2 razy więc się odezwałem. Ta zmiana w Blackwell dla graczy czyli, że wszystkie jednostki mogą wykonywać instrukcje INT nie ma dużego znaczenia, ponieważ większość obliczeń to i tak FP32. Przecież to co było w tym tekście dokładnie pokrywa się z tym co w ogólnodostępnej dokumentacji NVIDIA.
  25. @sideband, chyba przegapiłeś jeden z ostatnich slajdów. 😁 Nie ma osobnych jednostek INT tylko teraz jedna i druga połowa może liczyć albo INT albo FP32 a nie jak do tej pory, że tylko połowa partycji była FP32/INT a druga tylko FP32.
×
×
  • Dodaj nową pozycję...