英伟达吧 关注:163,663贴子:245,919
  • 1回复贴,共1

论AMD黑科技无限缓存

只看楼主收藏回复

AMD去年就通过CU集群进行的自适应缓存重新配置申请了专利,其基本要点是,通过动态地将l1 cache集合在一起,合并利用其缓存,最大程度地减少重复使用缓存(增加有效容量)并提高命中率,使RDNA中的新共享L1更有效(命中率更高)。这样可以减少L2 cache上的压力,从而进一步减轻了对内存带宽的压力,作者发表了关于该主题的论文,它讨论了在GPU内核之间共享L1缓存的可能性。
近日,AMD于9月29日提交了这一AMD INFINITY CACHE商标注册申请,它可能与即将发布的rdna2架构显卡有关。传统上,GPU内核具有自己的单独的L1缓存,而L2缓存在所有内核之间共享。专利建议允许每个CU核可以访问另一个的L1缓存,目的是通过消除高速缓存的每个切片中的复制数据来优化高速缓存的使用。结果非常惊人,在28个GPGPU应用程序测试中,新方法将IPC提高了22%-52%,并将能耗比提高了49%。


1楼2020-10-10 14:23回复
    其实很简单的道理(当然是我脑补):
    某个数据多次需要使用,往往需要多次读写显存,那么我就把这类数据放在缓存,并且让所有单元都可以直接调用。结果就是减少带宽需求。由于开关次数减少,附带还可以降低功耗,但AMD说的降低49%功耗应该是这部分的读写功耗而非整体功耗,而且很可能是较佳情况;
    不过根据AMD自己的数据,提高的效率是22%或者更高,同样这个22%或者更高是带宽效率而且非整体IPC提高。也就是256bit可以等效256乘(100+22或者更高)%=312bit或者更高;
    这技术可信的话,256bit带宽基本可支持接近3080(320bit)性能的需要,不过话说回来,我对该技术是否100%情况下都能保持22%以上的效率,表示怀疑,毕竟事物都有两面性。


    2楼2020-10-10 14:24
    回复