
第一张图对比是是GP102和最新的图灵核心,面积是471mm2 vs 754mm2,晶体管118亿 vs 186亿,图灵比帕斯卡多了283mm2的面积和68亿晶体管,从晶体管密度上来看,图灵核心反而不如帕斯卡,虽然差距不大。

第二张图则是图灵和帕斯卡各自单元的占比,看起来图灵核心的tensor单元和RT单元各占据了1/4的面积,传统的SP单元则占据了1/2。但实际上无论是tensor RT还是SP,都是运算和渲染单元,稍微对gpu构架有点了解的都知道gpu不可能只有运算和渲染单元,还得有前端和后端,包括显存控制器、ROPS、指令读取解析和分派单元等等,因此这里的三类运算单元占据面积实际上被夸大了,tensor单元实际占据面积很可能只有1/5。
为什么我要算这个tensor单元的面积呢,因为这个tensor单元是深度学习用的,与游戏没什么关系,在真正的游戏核心上,这玩意儿几乎可以肯定会被割掉,也就是说,实际的游戏核心面积应该只有754*4/5=601mm2,看到这个数字有些人应该能想到某个核心,那就是GM200,第一代TTX和980ti的核心面积就是这个数值。换句话说,这个超大的图灵核心,去掉对游戏无用的单元后,剩下的面积依旧巨大,因此基本可以断定这个超大核心去掉tensor后,剩下的就是GT102核心。
换句话说,16T的单精度性能,是2080ti的性能,而非2080的性能,这与很多人第一眼看到这几张图时的想象是不一样的,有不少人认为这就是2080的性能。我想,除非图灵核心这一代不出80ti,否则这一代的80不应该会有这么巨大的核心面积。