RDNA3架构设计存在致命缺陷,
那就是增加了SIMD32单元之后,却没有相应地提升寄存器规格,
导致Wave32单元内的VOPD格式下的两个FMA指令只能同时使用一个源操作数寄存器(operand register)、
一个共享的立即数(immediate value),
Wave64下的情况也是类似。
这就导致RDNA3 GPU的内部计算资源紧张,发挥不出来最初设计好的游戏性能。
RX6950XT的峰值单精度计算性能 23.65 TFLOPs
RX7900XT的峰值单精度计算性能 52 TFLOPs
RX7900XTX的峰值单精度计算性能 61 TFLOPs
大胃王设计RDNA3架构,最初的游戏性能,应该是这样的:
在相同的游戏频率2000MHz的游戏性能,RX7900XT 比 RX6950XT 提升 50%以上
在相同的游戏频率2000MHz的游戏性能,RX7900XTX 比 RX6950XT 提升 70%以上
那就是增加了SIMD32单元之后,却没有相应地提升寄存器规格,
导致Wave32单元内的VOPD格式下的两个FMA指令只能同时使用一个源操作数寄存器(operand register)、
一个共享的立即数(immediate value),
Wave64下的情况也是类似。
这就导致RDNA3 GPU的内部计算资源紧张,发挥不出来最初设计好的游戏性能。
RX6950XT的峰值单精度计算性能 23.65 TFLOPs
RX7900XT的峰值单精度计算性能 52 TFLOPs
RX7900XTX的峰值单精度计算性能 61 TFLOPs
大胃王设计RDNA3架构,最初的游戏性能,应该是这样的:
在相同的游戏频率2000MHz的游戏性能,RX7900XT 比 RX6950XT 提升 50%以上
在相同的游戏频率2000MHz的游戏性能,RX7900XTX 比 RX6950XT 提升 70%以上