Skocz do zawartości

RTX 50x0 (Blackwell) - wątek zbiorczy


Rekomendowane odpowiedzi

Opublikowano (edytowane)

Faktycznie - zbyt pobieżnie sprawdziłem temat. DLSS4 nie korzysta już ze sprzętowego OFA, tylko używa modelu AI (transformera) do wyliczania ruchu między klatkami.

 

https://www.nvidia.com/en-us/geforce/news/dlss4-multi-frame-generation-ai-innovations/

 

"We have also sped up the generation of the optical flow field by replacing hardware optical flow with a very efficient AI model. Together, the AI models significantly reduce the computational cost of generating additional frames."

 

Blackwell ma nowsze Tensory z większą przepustowością i niższym opóźnieniem, więc szybciej liczy model AI od FG. Przy niższym FPS Blackwell trzyma frame pacing, a Ada zaczyna się rozjeżdżać.

Edytowane przez DżonyBi
Opublikowano

Raczej ma dlatego możliwość generowania x3 i x4, generator klatek działa na ADA i Blackwelll identycznie. Różnica jest tylko w mnożniku.

Dzięki OFA FG powinno też działać na starszych kartach tylko obciążać je trochę bardziej, oczywiście Nvidia nic z tym do dziś nie zrobiła.

Opublikowano (edytowane)

Niekoniecznie, dlatego dostał MFG, ale zyskał też poprawiony FG. To wydaje się całkiem logiczne. Mówimy o frame pacing, a on dotyczy FG i MFG.

 

MFG to tylko mnożnik x3/x4. Różnica między Ada a Blackwell'em wynika z tego, jak szybko i stabilnie AI liczy klatkę. Blackwell robi to szybciej, więc miało sens dopiero na nim wprowadzić MFG.

 

Różnice robią się bardziej zauważalne przy niższym FPS.

 

Po drugie EH pisał o różnicy w FG, bo Ada nie ma MFG.

Edytowane przez DżonyBi
Opublikowano

Według Nvidii frame pacing staje się większym problemem przy x3 i x4, dlatego trzeba było stworzyć Flip Metering natomiast nie wyjaśnili, dlaczego jest on znowu na poziomie sprzętowym, tzn. my wiemy dlaczego, ale nie potrafili tego sensownie wyjaśnić.

Tak jak przy ADA nie potrafili sensownie wyjaśnić OFA, a potem się okazało ze on w sumie nie jest już potrzebny co tylko pokazuje ze oni po prostu lecą w uja.

Myślę ze ADA bez problemu mogłaby ogarnąć MFG tylko pewnie z większym narzutem na bazową wydajność.

Tak samo jak na bank Ampere mógłby ogarnąć x2.

Nie zdziwiłbym sie gdyby nawet Turing był w stanie użyć x2.

 

Myślę, że od Rubina zacznie się kombinowanie z blokowaniem MFG do konkretnych tire GPU.

Tym razem wymyślą bajkę ze niższe modele są "za słabe" do powiedzmy MFGx8 dlatego dostana tylko x6.

Dodatkowo będą musieli znowu wymyślić jakąś "magiczna" technologie na poziomie sprzetowym aby zablokować dostępność wyższego MFG dla starszej generacji.

  • Upvote 1
Opublikowano (edytowane)

Dobrze, że poprzednie generacje dostały cokolwiek z DLSS4, bo w przypadku nvidii nie jest to takie oczywiste. Może to ostatni taki prezent.

 

Z generacji na generację będzie coraz drożej i trudniej dołożyć natywną moc, a jak nie będzie już z czego karmić to dopiero zaczną się fikołki.

Edytowane przez DżonyBi
Opublikowano (edytowane)

Przecież mówił ten z pomalowanymi paznokciami na czarno chyba drugi po Jensenie w nVidii, że przy modelu transformer dla 2000 i 3000 rtxow FG zwykły jest możliwy. Ale, że musieli by robic do tego sterowniki, patrzac jak duzo zasobów przerzucili na A.I. watpie zeby to wyszlo. Byc moze przy DLSS 5 i MFGx8 nvidia zdecydowalaby sie na taki krok. Polki co zasoby przeznaczaja na co innego. 

Nie musisz uzywac OFA, ale mozesz, nvidia nie kazde Ci na jakich ustawieniach masz grac przeciez. Masz do wyboru tak potezna ilosc ustawien na kartach nv szczegolnie rtx 5000, ze naprawde idzie sie pogubic jak grac. Masz w CP TAA, ustawienia od low do ultra, do tego mozesz jak chesz zmienic na CNN lub transformer od DLAA po Ultra quality, po czym mozesz dla TAA i DLSS wlaczyc MFG od x2 do x4, potem mozesz to samo wszystko zrobic tylko ze z ray tracingiem, czesciowym albo calkowitym (tez jest duzo opcji) potem ostatecznie mozesz wlaczyc path tracing, i w opcjach jak powyzej od TAA do DLSS, z ray reconstrucion od DLAA do ULtra quality od FGx2 do MFGx4. Opcji jest cala masa, nie ma co narzekac, na konsoli masz tylko quality albo performance do wyboru czyli nie masz zadnego wyboru. I tam quality na tym FSR czy PSSR, wyglada jak ultra quality DLSS 310.4 .... z minimalnym RT i 60fps zamiast x razy wiecej na PC. 

A jezeli chodzi o to, czy FGx4 działałoby na RTX 4000, to nie. Juz teraz przy nizszym FPS jest problem, da sie grac nawet przy 40fps na 160, i jak sie nie macha jak zwariowany to obraz jest bardzo dobry, problemem jest jak sie macha przerzuca kamra bardzo szybko, wtedy lepiej miec te 60fps bazowe. Natomiast flip metering wlasnie działa najlepiej z gsync i idealnie wkraja framy w czas. Po to został wymyslony. nVidia i tak sie dobrze zachowala, bo RTX 2000 3000 i 4000 dostał upgread geanilny do DLSS 4 i najnowszych wersji DLL 310.4 dlatego chocby cena 4090 tak dobrze sie trzyma. Wiec mowienie, ze oni cos tam ukrywaja albo nie dowoża. Sorry zobacz na AMD i FSR 4 

Edytowane przez maxmaster027
Opublikowano

 

@maxmaster027

Widzę, że trzeba sobie odświeżyć trochę pamięć :D

8 minut temu, SebastianFM napisał(a):

To już się robi absurd, dyskutowanie czy MFG działałby wystarczająco dobrze na RTX 4000. Działa na RTX 5080? Działa. O ile niższą wydajność ma RTX 4080? :)

 

A sprzętowy Flip Metering to jest tylko wymówka.

Przy ADA jeszcze to ich OFA "kupiłem", ale po tym jak wyszedł Blackwell i oni stwierdzili ze sprzętowy OFA nagle już nie ma znaczenia i teraz liczy się Flip Metering zrozumiałem co się dzieje.

Dlatego dziś nie wierzę już w ani jedno slowo jakie wypluwa Nvidia bo ich pitolenie to w coraz większej mierze marketingowy bełkot.

Mało tego kombinują jak moga aby nie dało się tego wszystkiego poprawnie przetestować i zmierzyć.

  • Like 1
Opublikowano
Godzinę temu, Kadajo napisał(a):

Raczej ma dlatego możliwość generowania x3 i x4, generator klatek działa na ADA i Blackwelll identycznie. Różnica jest tylko w mnożniku.

Dzięki OFA FG powinno też działać na starszych kartach tylko obciążać je trochę bardziej, oczywiście Nvidia nic z tym do dziś nie zrobiła.

Nie działa tak samo skoro nie wykorzystuje OFA w Blackwellu i dlatego majster pisał o możliwym FG na starszych generacjach.

Mnie tam wcale nie zdziwiło, że nowy model DLSS jest dostępny dla starszych generacji. W żaden w sposób to nie przedłużyło żywotności tych kart. Na transformerze ADA/Blackwell jeszcze bardziej odjechał o Ampere i Turinga. Dlatego też również nie blokowali Mega Geometry bo i tak braknie wydajności nawet sztucznego blokowania nowych funkcjonalności.

Opublikowano
59 minut temu, DżonyBi napisał(a):

Dobrze, że poprzednie generacje dostały cokolwiek z DLSS4, bo w przypadku nvidii nie jest to takie oczywiste. Może to ostatni taki prezent.

Własnie przez DLSS4 nie wymieniłem 4070Ti, tak bym się złamał xD 

  • Haha 3
Opublikowano
3 minuty temu, Kadajo napisał(a):

Ale działa tak samo skoro nie wykorzystuje OFA w ADA ;)

Ma dokładnie taka sama jakość obrazu.

Zasada działania taka sama tylko inaczej jest wykonane na poziomie sprzętu i softu.

Poza tym jak sprawdzałem FG na Blackwellu to wydawało mi się, że działa nieco lepiej niż na ADA.

Opublikowano (edytowane)

Ada nie wspiera też obliczeń FP4. Nie wiem czy to ma wpływ..

 

Generalnie też uważam, że jak powstaje nowa karta to można ją lepiej zoptymalizować sprzętowo pod nowe technologie. Pewnie MFG dałoby się zaimplementować do Ady, ale wymagałoby to dużo optymalizacji i kompromisów, a finalny efekt i tak byłby niezadowalający. Z resztą większość i tak twierdzi, że to całe MFG to kupa, więc strata nie duża:E

Edytowane przez DżonyBi
Opublikowano (edytowane)
3 minuty temu, Kadajo napisał(a):

Jeśli był szybszy to czy to nie wynikało z samego faktu ze Blackwell jest po prostu szybszy od Ady ?

Jeżeli startujemy z tej samej liczby FPS to co za różnica?

A szybszy jest w obliczeniach AI, które są wykorzystywane do FG.

Edytowane przez DżonyBi
Opublikowano
Teraz, DżonyBi napisał(a):

Z resztą większość i tak twierdzi, że to MFG to kupa, więc strata nie duża:E

To kupa. Jak jeszcze będziesz zaraz miał zgadnięte 7 klatek przy 35fps by nie wyjść poza odświeżanie 500hz monitora to pewnie wtedy zobaczysz.

Nawet jak nie ruszasz myszką a obliczenia z silnika na 360° robione tego nie przepchną...

Opublikowano
12 minut temu, DżonyBi napisał(a):

Jeżeli startujemy z tej samej liczby FPS to co za różnica?

A szybszy jest w obliczeniach AI, które są wykorzystywane do FG.

No chyba na tym polega testowanie, aby sprawdzić ile z tego to faktycznie poprawione działanie FG, a nie tylko czysta wydajność AI, zresztą jak słusznie zauważył @SebastianFM ile tak naprawdę szybszy od 4080 jest 5080 wiec, dlaczego MFG ma na nim nie działać, bo wymyślili sobie Flip Metering i wymyślili sobie ze będzie sprzętowy, tak jak wcześniej OFA.

  • Upvote 1
Opublikowano (edytowane)

Screenshot_20251109-120412.thumb.png.37a8b90b318af93fac8675aa94883dfa.png

7 minut temu, Kadajo napisał(a):

ile tak naprawdę szybszy od 4080 jest 5080 wiec, dlaczego MFG ma na nim nie działać, bo wymyślili sobie Flip Metering i wymyślili sobie ze będzie sprzętowy, tak jak wcześniej OFA.

Nigdy się nie dowiemy, jak to będzie działać na ADA, ale EH napisał o różnicy w FG między Ada i Blackwell, i nie mam żadnych logicznych dowodów, żeby mu nie wierzyć. Patrząc ile tego ostatnio testuje, to mógł to zauważyć.

Edytowane przez DżonyBi
Opublikowano

@DżonyBi, nigdzie nie ma potwierdzenia, że MFG korzysta z FP4.

 

NVidia przy wprowadzaniu MFG zmieniła sposób ładowania kerneli CUDA i nie mam już możliwości ich przechwycenia jednak sprawdzałem wcześniejsze wersje FG i one korzystały tylko z instrukcji FP16, nie używały nawet FP8.

Opublikowano
Godzinę temu, SebastianFM napisał(a):

To już się robi absurd, dyskutowanie czy MFG działałby wystarczająco dobrze na RTX 4000. Działa na RTX 5080? Działa. O ile niższą wydajność ma RTX 4080? :)

 

A sprzętowy Flip Metering to jest tylko wymówka.

VSVS.thumb.jpg.ef598299845d9019cb35b03d43bf7605.jpg

Zależy od gry. Dla SOTTR wyglada tak. W innych grach to jest roznie. Tez zalezy czy porownujesz karty OC vs OC czy def vs def. Jak def vs def to roznice sa mniejsze, jak po OC jak widac to blackwell odjezdza

Opublikowano
10 minut temu, DżonyBi napisał(a):

ale EH napisał o różnicy w FG między Ada i Blackwell

Ale jakiej różnicy ? Konrad nie przeprowadza żadnych dogłębnych testów przecież.

3 minuty temu, maxmaster027 napisał(a):


leży od gry. Dla SOTTR wyglada tak. W innych grach to jest roznie. Tez zalezy czy porownujesz karty OC vs OC czy def vs def. Jak def vs def to roznice sa mniejsze, jak po OC jak widac to blackwell odjezdza

Bo Blackwell lepiej się kreci wiec oczywistym jest ze będzie wydajniejszy.

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się

×
×
  • Dodaj nową pozycję...