NVIDIA这次发布的“开普勒”架构GK104芯片,流处理器数量1536个,达到了上一代旗舰GTX580的三倍,如此激进,令人始料未及。芯片集成了35亿个晶体管,核心面积却仅仅294平方毫米,TDP功耗更降到了195W,只是GTX580的一半稍多。由此看来,“开普勒”与“费米”在架构上有巨大的不同,明显更高效、更节能。

GK104芯片内建的1536个CUDA流处理器,被分配成16组SM阵列,每组SM包含96个流处理器,接下来的GTX660、GTX650、GTX620...流处理器数量都有可能会比上代产品至少翻一倍。在核心规模上,GK104比GF110复杂很多,但借助28纳米工艺,GK104芯片核心面积只有294平方毫米,远远小于GF110 520平方毫米的规模,也小于对手HD7970的365平方毫米。

GK104芯片内部结构图
GK104芯片的晶体管数量是35亿个,比GF110芯片30亿个的规模高不了多少,这就又产生了一个很的疑问:三倍的流处理器“建筑”规模,却只多用了1/6的晶体管“砖头”,NVIDIA是如何做到的?

GF110芯片结构图
正如大家所想,GK104采用了一种“简化CUDA核心”的设计方案。GK104的1536个流处理器,被划分为8个SM单元,每个SM单元内部具有192个流处理器,密度非常大。“开普勒”还在架构内部加入一些固定功能的模块,以提升光栅化、纹理渲染性能,统一调配流处理器的任务分派。“开普勒”还支持全新的GPU Boost 技术,能够动态调节运行频率,针对性能与功耗作出动态调整。

GK104芯片内建的1536个CUDA流处理器,被分配成16组SM阵列,每组SM包含96个流处理器,接下来的GTX660、GTX650、GTX620...流处理器数量都有可能会比上代产品至少翻一倍。在核心规模上,GK104比GF110复杂很多,但借助28纳米工艺,GK104芯片核心面积只有294平方毫米,远远小于GF110 520平方毫米的规模,也小于对手HD7970的365平方毫米。

GK104芯片内部结构图
GK104芯片的晶体管数量是35亿个,比GF110芯片30亿个的规模高不了多少,这就又产生了一个很的疑问:三倍的流处理器“建筑”规模,却只多用了1/6的晶体管“砖头”,NVIDIA是如何做到的?

GF110芯片结构图
正如大家所想,GK104采用了一种“简化CUDA核心”的设计方案。GK104的1536个流处理器,被划分为8个SM单元,每个SM单元内部具有192个流处理器,密度非常大。“开普勒”还在架构内部加入一些固定功能的模块,以提升光栅化、纹理渲染性能,统一调配流处理器的任务分派。“开普勒”还支持全新的GPU Boost 技术,能够动态调节运行频率,针对性能与功耗作出动态调整。