不知道有人注意到RDNA3的浮点(流处理器)对比RDAN2增加的很夸张?我合理怀疑AMD的RDNA3很可能也跟上了双倍FP32的车。
Nvidia在Ampere消费级上把FP32 ALU在SM中的比例翻倍,造成了“CUDA”和FP32理论性能的暴增。Apple A15上的GPU也是做了FP32翻倍的设计。
现在从RDNA3的入魔来看,大概也是类似的。
RDNA2 Navi 21 是有4个Shader Engines,共计40个WGP,80个CU,每个CU有64SP,最终共计5120SP,那么可以看到说每个Shader Engine是1280SP,每个WGP是128SP。
而现在这个RDNA3的传闻是2*3个Shader Engines,共计60个WGP,最终15360SP,小学数学计算可以看出来1个Shader Engine 是2560SP,一个WGP是256SP,一个CU大概率是128SP了,或者是类似形式。
所以RNDA2到RDNA3,大概率是有类似Ampere那种WGP/SM浮点轻松翻倍FP32 ALU的设计的~ 属于数字可以刷的很好看,实际性能得打折那种。
其实我一直有个问题,为什么现在的GPU都不约而同的这么做?从Apple和Nvidia来看,这个倍增的FP32所带来的提升其实不是很大(可参考性能和FP32理论的比值)...
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有