AMD去年就通过CU集群进行的自适应缓存重新配置申请了专利,其基本要点是,通过动态地将l1 cache集合在一起,合并利用其缓存,最大程度地减少重复使用缓存(增加有效容量)并提高命中率,使RDNA中的新共享L1更有效(命中率更高)。这样可以减少L2 cache上的压力,从而进一步减轻了对内存带宽的压力,作者发表了关于该主题的论文,它讨论了在GPU内核之间共享L1缓存的可能性。
近日,AMD于9月29日提交了这一AMD INFINITY CACHE商标注册申请,它可能与即将发布的rdna2架构显卡有关。传统上,GPU内核具有自己的单独的L1缓存,而L2缓存在所有内核之间共享。专利建议允许每个CU核可以访问另一个的L1缓存,目的是通过消除高速缓存的每个切片中的复制数据来优化高速缓存的使用。结果非常惊人,在28个GPGPU应用程序测试中,新方法将IPC提高了22%-52%,并将能耗比提高了49%。
近日,AMD于9月29日提交了这一AMD INFINITY CACHE商标注册申请,它可能与即将发布的rdna2架构显卡有关。传统上,GPU内核具有自己的单独的L1缓存,而L2缓存在所有内核之间共享。专利建议允许每个CU核可以访问另一个的L1缓存,目的是通过消除高速缓存的每个切片中的复制数据来优化高速缓存的使用。结果非常惊人,在28个GPGPU应用程序测试中,新方法将IPC提高了22%-52%,并将能耗比提高了49%。