Pogrzebałem ponownie i wychodzi na to, że Ada ma prawie dwukrotnie słabsze obliczenia FP8. Przy FP16 różnica jest nieduża, bo Tensory dojrzały do obsługi tego, ale przy FP8 Blackwell znacznie zyskał, a na tym siedzi DLSS transformer.
Pewnie podobnie będzie z FP4 na RTX5xxx oraz FP8 na radeonach... Jak zwykle najlepiej kupować drugą generację z nowych cackiem.
Jest plotka że Nvidia ogranicza tensory w konsumenckim Blackwellu, robiąc "FP32 Accumulate Limit" przez co jest dostępna tylko połowa przepustowości.
Rekomendowane odpowiedzi