作为引入先说一下RDNA4关于AI上的改进。RDNA4率先引入了N卡自20系就有的AI矩阵单元,具有了Tensor和光栅并行运算的能力,直观体验就是AI算力暴涨。图二四有多展现,包括但不限于单CU对比上代(79XT)Int8算力暴涨8倍,FP16暴涨4倍,基本上Tensor算力提升到了和40系一个水准
。。
而这和FSR4有什么关系呢? FSR4用的是CNN(卷积神经网)模型,在其实际部署推理时常用INT8来进行量化,这样可以节约显存容量显存带宽和算力等显卡资源。所以一个大的,效果好的,精细的CNN模型需要很高Int8算力支持
。。
而RDNA3以及以下的老卡在Int8算力上严重不足,就连7900XTX也只有122.83Tops的Int8算力,不足9070XT 779Tops的六分之一。所以现在有意思的来了,7900XTX的高光栅能力代表它需要很高的AI超分技术,但它的AI算力却无法支撑这点
。。
所以AMD未来的做法也显而易见,FSR4 For RDNA3就是专门训练一个参数量较小的模型来用,先不说效果会差等因素,什么时候出是个好问题
。。
AMD这种小作坊在软件,驱动上有多拉胯想必各位已经有所耳闻,任务管理器的NPU框框这么简单的事都能拖上那么久,HX370的核间延迟也是半天没修,7840H的很多问题(像睡死BUG)也是下代出来后才解决。所以说老卡用户要做好心理准备,为上代卡专门适配的AI超采样技术要等很久,而且出来效果也不会好到哪去,跟9070XT上的效果没法比的







。。
而这和FSR4有什么关系呢? FSR4用的是CNN(卷积神经网)模型,在其实际部署推理时常用INT8来进行量化,这样可以节约显存容量显存带宽和算力等显卡资源。所以一个大的,效果好的,精细的CNN模型需要很高Int8算力支持
。。
而RDNA3以及以下的老卡在Int8算力上严重不足,就连7900XTX也只有122.83Tops的Int8算力,不足9070XT 779Tops的六分之一。所以现在有意思的来了,7900XTX的高光栅能力代表它需要很高的AI超分技术,但它的AI算力却无法支撑这点
。。
所以AMD未来的做法也显而易见,FSR4 For RDNA3就是专门训练一个参数量较小的模型来用,先不说效果会差等因素,什么时候出是个好问题
。。
AMD这种小作坊在软件,驱动上有多拉胯想必各位已经有所耳闻,任务管理器的NPU框框这么简单的事都能拖上那么久,HX370的核间延迟也是半天没修,7840H的很多问题(像睡死BUG)也是下代出来后才解决。所以说老卡用户要做好心理准备,为上代卡专门适配的AI超采样技术要等很久,而且出来效果也不会好到哪去,跟9070XT上的效果没法比的






