【图片】关于FSR4，老卡用户要做好心理准备【amd吧】

amd吧关注：791,627贴子：18,191,377

1 2 3 下一页尾页
136回复贴，共3页
，跳到页

关于FSR4，老卡用户要做好心理准备

作为引入先说一下RDNA4关于AI上的改进。RDNA4率先引入了N卡自20系就有的AI矩阵单元，具有了Tensor和光栅并行运算的能力，直观体验就是AI算力暴涨。图二四有多展现，包括但不限于单CU对比上代(79XT)Int8算力暴涨8倍，FP16暴涨4倍，基本上Tensor算力提升到了和40系一个水准
。。
而这和FSR4有什么关系呢? FSR4用的是CNN(卷积神经网)模型，在其实际部署推理时常用INT8来进行量化，这样可以节约显存容量显存带宽和算力等显卡资源。所以一个大的，效果好的，精细的CNN模型需要很高Int8算力支持
。。
而RDNA3以及以下的老卡在Int8算力上严重不足，就连7900XTX也只有122.83Tops的Int8算力，不足9070XT 779Tops的六分之一。所以现在有意思的来了，7900XTX的高光栅能力代表它需要很高的AI超分技术，但它的AI算力却无法支撑这点
。。
所以AMD未来的做法也显而易见，FSR4 For RDNA3就是专门训练一个参数量较小的模型来用，先不说效果会差等因素，什么时候出是个好问题
。。
AMD这种小作坊在软件，驱动上有多拉胯想必各位已经有所耳闻，任务管理器的NPU框框这么简单的事都能拖上那么久，HX370的核间延迟也是半天没修，7840H的很多问题(像睡死BUG)也是下代出来后才解决。所以说老卡用户要做好心理准备，为上代卡专门适配的AI超采样技术要等很久，而且出来效果也不会好到哪去，跟9070XT上的效果没法比的

送TA礼物

IP属地:广东

来自Android客户端1楼2025-03-01 13:44回复

https://gpuopen.com/learn/wmma_on_rdna3/
。。
还有很多人经过常说的RDNA3的AI单元成电阻丝的问题。首先RDNA3的“AI单元”实际上就是一个WMMA指令，一个矩阵累积算法，实际上的运算还是交给着色器Shader来算的，和RDNA4和牢黄N卡这种Tensor Core专有矩阵单元有本质差别，也没有他它俩这种矩阵+光栅并行运算的能力
。。
本吧名人秒爷在ATI吧的帖子里也提到过RDNA3对于AI的支持是“功能性的”，从实际看也确实如此，从下图看RDNA3除了FP16半精度因为双发射收益其它的单位算力和上代没区别