amd吧 关注:781,088贴子:17,904,907

多核时代上午的随笔与intel sunny cove(icelake)我之见

只看楼主收藏回复

自2017年ryzen发布以降,多核时代正式来临;到了2019年年中,随着zen2的发布,多核时代已经彻底进入鼎盛时期。可以预见,现在类似2002~2011年那个pc大发展的世代。a家这边,16核zen2已经登场;i社那边,8核9900ks做最后的挣扎(年底据说要来10核的14nm++++,算上给core i系列画上一个句号)。相比amd这边堆核较为容易来说,intel堆核更加困难(从7700k-8700k-9900k以降,功耗飙升,良品率迅速下降),而且目前的ringbus最佳适用范围为10核以内(参考6950x,极限条件下12核也勉强(这样和mesh总线已经持平,再往下就是mesh总线占优了)。intel就算再能依靠舆论和渠道减缓失血的速度,没有高效的堆核技术也是缘木求鱼而已。实际上据说mesh总线的最大容量也不过40核而已,这意味着服务器平台的失利(虽然服务器平台用户粘性较大,但也更不容易受到舆论的影响,intel如果在服务器平台还像主流那样吹嘘7350k会吃耳刮子的)。

这里是intel skylake-x和amd ryzen一代的架构对比图。可以看出intel堆核方面很不利(amd是四个胶水,到了现在amd可以做到8个胶水;intel做2个胶水已经要了亲的命)。
试想一下10nm世代的intel icelake如果堆更多的核(这是必然的事,哪怕icelake ipc提升18%相对于zen2也不过10%的提升,考虑到icelake一开始主频没法很高(参考6700k,7700k),这样优势并不大。intel靠10/12核在zen3面前毫无胜算(7nm euv的zen3哪怕简单继续堆核(单ccx增加到6核,单die提升到12核)都足够了)。如果intel在icelake中把mesh总线下放,堆到最多18核(否则靠10/12核毫无胜算),这样光cpu部分就有484*37.5/100=181.5mm2(晶体管密度百度得到(intel10nm的提升相对于14nm为100/37.5)虽然icelake每核面积(内容)继续增加,但考虑到skylake-x里面还有qpi总线,六通道内存一类,这里姑且取最小值),加上核显部分(这里取64eu,虽然高端平台核显就是鸡肋,但考虑到intel要推广自己的独显,故高端平台多堆点eu也很有可能),这样整个cpu面积就有240~250mm2。当然intel可以在中低端采用较小的规模,比如10核这个级别。
但是,无论是哪种规模,单die的提升总有尽头(10nm世代intel如果靠18核还可以维持下去,但7nm(对应台积电的5nm)明显只能采取28核这个级别,这里还没有考虑更需要堆核的服务器平台。所以笔者断言intel要不采用其他总线,要不就是amd这种高级胶水结构。考虑到intel也请了jim keller大神,估计不久的将来intel也会采用高级胶水结构,或许和刚刚出台规则的pcie5.0相关的cxl总线(intel的原创)相关。amd这边,zen2目前集成8个die的rome已经是胶水的极限,估计zen4就开始增加ccx中核心数目了(通俗地讲就是ccx,die开始变大了)~


IP属地:辽宁1楼2019-06-30 16:41回复
    试想2020年后半段,amd这边会有更多核的zen3架构(桌面主流最高端可能有24核),intel可能会拿出18核(mesh总线下放)或者其他类似规模的cpu。


    IP属地:辽宁2楼2019-06-30 16:43
    收起回复
      根据将近十年前的情况(i7-975/i7-990x;phenom ii 965/phenom ii 1100t),单元内4核升级到6核问题不大(换句话说就是ccx很容易扩增到6核而几乎不引起内耗增加),也就是说zen3很容易扩容到单die12核,双die24核(目前3950x就是双die),至于内存带宽,当年broadwell-e24核四通道2400都够了,如今正好可以升级到双通道ddr4-4266,正好为ddr4画上圆满的句号(而且zen4不需要cpu之间的通信,可以节省不少带宽)。接下来2021年就可以升级到ddr5了。至于以后的升级扩容,或许ccx内部也需要增加次生的总线了(当年sandybridge-e和更早的45nm世代xeon 7500系列(最高8核)都有了ringbus总线,至于推土机系列,严格说算不上完整的8核,更早的opteron 6100系列是两块phenom ii的胶水)~


      IP属地:辽宁3楼2019-06-30 16:58
      收起回复
        服务器领域AMD之前的一个专利很有意思,多路SMT,一个核心可以最多4个线程估计zen4会用上


        来自Android客户端5楼2019-06-30 17:03
        收起回复
          反正已知牙膏厂今年底到明年的10代桌面还是14nm+++++
          到2021年两家的桌面级应该都会上DDR5了吧,到时候5nmZEN4大战10nm++老虎湖?
          就是不知道zen3和zen4的IPC会再提高多少


          7楼2019-06-30 17:17
          收起回复
            AMD堆核心像变魔术似的,只要CPU的PCB够大,有多少来多少


            IP属地:上海9楼2019-06-30 17:27
            收起回复
              总结一下,对于堆核来说,单个单元(amd这边的单ccx,目前intel那边的整个cpu部分),靠交叉互联(没有特定的总线系统)堆到6核毫无压力(9年前的1100t/i7-990x),再往上就需要ringbus总线(增加到10核毫无问题(6950x),极限条件单ring可以堆到12核(这时和mesh总线性能相当,再往后mesh总线占优势)),目前intel这边mesh总线支持到28核,理论上堆到40核都没有问题。amd这边目前现状实际上类似mcm(胶水)体系,当然能效比core2那个时候的胶水能效高多了。


              IP属地:辽宁10楼2019-06-30 17:37
              收起回复
                至于单个die内部堆更多的ccx,这种玩法理论上会增加布线难度和内部通信的延迟。不过只有想不到没有做不到,amd这次玩高级胶水的套路也是让人眼睛一亮~


                IP属地:辽宁11楼2019-06-30 17:52
                收起回复
                  最后还有一点,现在微软针对amd优化,少线程运行尽量在一个ccx内部进行。因而个人认为amd增加ccx内部核心数目比较划算,如果增加ccx数目(比如一个die内部采用3~4个ccx),这样内部延迟会增大,也不利于系统优化。


                  IP属地:辽宁12楼2019-06-30 20:33
                  收起回复
                    硅是有极限的不用新材料,新理论,新体系,沙子cpu总归有尽头。现在消费级cpu性能都是过剩的(臭打游戏的)


                    IP属地:四川来自Android客户端14楼2019-06-30 21:31
                    收起回复
                      其实吧ccx内核增加还是有点麻烦,都知道ccx核心直接连接,四核心要6条线,6核心就要40条,所以不改变结构加到六核心不太可能吧


                      IP属地:浙江来自Android客户端15楼2019-06-30 21:45
                      收起回复
                        现在amd的cpu成本能压的很低,intel不出胶水会很难受的


                        IP属地:江苏16楼2019-06-30 23:36
                        回复
                          牙膏10nm密度高性能库是六千多万不是一亿


                          IP属地:河南17楼2019-06-30 23:57
                          回复


                            IP属地:河南18楼2019-07-01 00:04
                            回复