AMD|Ampere架构和RDNA 2架构显存延迟测试 Infinity Cache显示优势

经过了多年的发展 , GPU也具备了多层缓存的结构 。这些精心设计的缓存架构 , 可以填补显存和计算单元之间读写速度不匹配的矛盾 , 与CPU的缓存有类似的作用 。由于GPU架构的不同 , 不同芯片设计厂商对其缓存的设计也不一样 。在Ampere架构上 , 英伟达仍然坚持使用相对传统的L1和L2缓存两级结构 。

访问购买页面:
AMD旗舰店


AMD|Ampere架构和RDNA 2架构显存延迟测试 Infinity Cache显示优势
文章图片

AMD在RDNA 2架构上 , 则采用了L0、L1、L2和Infinity Cache , 事实上Infinity Cache是充当了L3缓存的角色 。近期Chips and Cheese发布了一项新研究 , 比较了英伟达与AMD最新显卡的显存延迟情况 。
Chips and Cheese采用了OpenCL编写的指针追踪基准 , 用于评估GPU显存缓存中的延迟 。在测试里 , 使用的是Radeon RX 6800 XT和GeForce RTX 3090显卡 。测试结果表明 , RDNA 2架构比Ampere架构具有更低的显存延迟 。
在测试中 , 英伟达GA102的L1和L2缓存之间的延迟超过了100ns , 而AMD Navi 21的L0至L2缓存之间的延迟为66ns , 加上Infinity Cache仅增加了20ns的额外延迟 。这可能可以解释为什么RDNA 2架构在较低分辨率的时候会有更出色的性能表现 , 而Ampere架构需要更多并行运算才能有更好的发挥 。
无论英伟达还是AMD , 都注意到了大型高效缓存的重要性 。英伟达GA100(Ampere)的L2缓存已经增加到了40MB , 是GV100(Volta)的七倍 。AMD则率先使用了高带宽的设计 , 类似的结构也有用于CDNA架构的Instinct系列 , 在Radeon RX系列中(RDNA)为游戏开发了Infinity Cache 。
【AMD|Ampere架构和RDNA 2架构显存延迟测试 Infinity Cache显示优势】Chips and Cheese还比较了英伟达和AMD较老的一些架构 , 总体而言都在不断改善 。不过AMD每一代架构都随有一定程度的降低 , 相对来说更明显 。

    推荐阅读