根据技术市场研究机构Jon Peddie Research的一份新报告,中国的GPU初创企业数量非同寻常,因为该国试图获得人工智能的优势以及半导体主权。
随着人工智能(AI)、高性能计算(HPC)和图形处理的需求以前所未有的速度增长,近年来全球GPU制造商的数量也在增长。谈到个人电脑的独立显卡,AMD和Nvidia保持领先,而英特尔正在努力追赶。
在上世纪八九十年代,全球一度有多达数十家公司在开发了显卡和独立图形处理器,但为了在3D游戏中获得最高性能而进行的残酷竞争,其中绝大多数公司被淘汰。
到大约2010年时,只有AMD和Nvidia能够为游戏和计算提供有竞争力的独立GPU,而其他公司则专注于集成GPU或GPU IP。
从2015年左右开始,中国的PC GPU开发商数量开始迅速增加,这得益于中国对技术自给自足的推动,以及AI和高性能计算作为高科技大趋势的出现。
根据Jon Peddie Research的数据,目前总共有18家公司在开发和生产GPU。有两家公司主要针对智能手机和笔记本电脑开发SoC绑定的GPU,有6家开发GPU IP,有11家GPU开发商专注于PC和数据中心的GPU,包括AMD、英特尔和英伟达。
事实上,如果在名单中加入其他中国公司,如壁仞科技和天枢智信,那么GPU企业数量将更多。不过,壁仞科技和天枢智信目前只专注于AI和高性能计算,所以JPR不认为他们是传统意义上的GPU开发商。
中国的技术救国之路:GPU开发
作为世界第二大经济体,中国不可避免地与美国和其他发达的国家在几乎所有方面进行竞争。中国竭尽所能地吸引世界各地的工程师。
事实上,在中国,每年都有数百家新的IC设计公司成立。他们开发的产品种类繁多,从微小的传感器到复杂的通信芯片均由涉猎,力图实现对西方国家供应商的自给自足。
但要真正跳上人工智能和高性能计算的浪潮,需要CPU、GPU和特殊用途的计算加速技术。
谈到CPU,中国面临美国在制造设备和技术上的越来越严密的技术封锁,不可能很快赶上全球先进水平。然而在另一个赛道上,可以说,开发和生产一款像样的GPU,比试图造出一款有竞争力的CPU更容易出成果。
「对于中国公司来说,人工智能训练是自主研发GPU的主要驱动力,一方面是因为英伟达的GPU太贵了,另外也是出于对自给自足的渴望。」JPR的负责人Jon Peddie说。
GPU本质上是并行设备,其内部有大量的计算单元可以用于冗余,这使得GPU更容易启动和运行,单位晶体管的成本相对较低,整体产量也不错。此外,GPU的并行性质使其更容易以扩展的方式实现部署。
与CPU相比,GPU在设计和制造上对制程工艺的要求没有那么苛刻,即使目前中国最先进的芯片制造商中芯国际并没有像台积电那样先进的生产工艺,仍然可以利用GPU性能扩展的方式实现足够可观的性能。
事实上,即使中国的GPU开发商失去了使用台积电先进节点(N7及以下)的机会,至少他们中的一些人仍然可以在中芯国际生产更简单的GPU设计,并满足AI、HPC和部分游戏/娱乐市场的需求。
而且,从国家的角度来看,具有AI和HPC能力的GPU可能也可以说比CPU更重要,因为AI和HPC可以实现全新的应用,如自动驾驶汽车和智能城市等应用。
尽管美国政府大力限制向中国出口以超级计算机为基础的CPU和GPU,但比起CPU,GPU在设计和制造上的相对较低的门槛,使得这种限制的效果远没有CPU来的明显 。
GPU微架构相对容易,硬件设计却很昂贵
不过,应该注意的是,虽然目前有很多GPU开发商,但只有两家能真正为PC打造有竞争力的独立GPU。这也许是因为,开发一个GPU架构相对容易,但要正确实现它并设计适当的驱动程序确实很难。
CPU和GPU微架构基本上是「科学和艺术的交汇」。这些架构是一组复杂的算法,开发这些架构的团队规模可能相当小,但可能需要长达几年的时间。
可以这么理解,微架构是在餐巾纸和白板上完成的。至于成本,如果只是架构师自己,团队规模可以只有一个人,也许是三四个人。但是任何类型的建筑,建筑、火箭飞船、网络或处理器都是一个复杂的棋局。
比如,试图预测五年后的制造工艺和标准,性价比的权衡,增加什么功能,放弃或忽略什么功能,这些都是非常棘手和耗时的工作。
架构师们花了很多时间在头脑中进行假设,比如如果把缓存做大25%,如果有6000个FPU,是否应该做一个PCIe 5.0 I/O总线?这么做能不能按时完成?诸如此类。
" class="BDE_Image" onload="EditorUI.resizeImage(this, 560)" unselectable="on"/>
由于微架构的开发可能需要数年时间,而且需要有才华的设计师,在这个上市时间至关重要的世界里,许多公司就干脆从Arm或Imagination Technologies等公司授权使用现成的微架构,或者是是经过验证的GPU IP。
例如,中国的芯动科技(Innosilicon)就从英国的Imagination公司授权GPU微架构IP用于其Fantasy GPU。
还有一家中国的GPU开发商,使用了Imagination的PowerVR架构。同时,另一家GPU制造商兆芯(Zhaoxin)使用的是Via Technologies获得的GPU微架构。
开发一个微架构的成本可能有所不同,但与现代高端GPU的物理实现成本相比,它的开发成本相对较低。
多年来,苹果和英特尔这两家拥有大量工程人才的公司都依赖Img进行GPU设计。联发科和其他小型SoC供应商依靠Arm。高通公司在很长一段时间内使用ATI/AMD,而三星在尝试设计自己的图形引擎数年后,也转向了AMD。
最近,两家新的中国GPU公司聘请了前AMD和英伟达的架构师,另外两家使用Img。进入市场的时间和学习作为一个架构师的技能,要担心什么,以及如何找到解决方法,是一个非常耗时的过程。
「如果你能去找一家已经有了设计方案,并且已经设计了很长时间的公司,可以节省大量的时间和金钱,而在市场上,时间就是一切。」
「这个过程中会有太多的问题。并非每一个由AMD或英伟达设计的GPU都能成为赢家。不过,一套好的架构设计可以经历几代的调整,慢慢进步。」研究机构Jon Peddie Research的负责人表示。
对于新的生产制程来说,硬件实现和软件开发的成本太高了。据《国际商业时报》估计,使用5nm级技术制造的设备,其设计成本超过5.4亿美元。如果制程为3nm,设计成本还将增加3倍。
「如果将布局和平面图、模拟、验证和驱动程序全部考虑在内,GPU开发的成本和时间就会激增。」Peddie解释说。
「硬件设计和布局是非常直接的:如果弄错一条线,可能要花几个月的时间来查错。」
目前,世界上只有少数几家公司能够开发出具有AMD和英伟达级别的现代游戏或计算用GPU(460亿-800亿个晶体管规模)芯片。
不过,前不久中国的壁仞科技发布的BR104和BR100也达到了几乎类似的水平。(据猜测,BR104包含大约385亿个晶体管)。
目前,全球11个PC/数据中心GPU设计供应商中的8个来自中国,这本身就说明了问题。
也许在不久的将来,除了美国公司,我们不会看到有竞争力的独立游戏GPU。中国是否能推出有竞争力的竞争对手,目前还有待观察。
随着人工智能(AI)、高性能计算(HPC)和图形处理的需求以前所未有的速度增长,近年来全球GPU制造商的数量也在增长。谈到个人电脑的独立显卡,AMD和Nvidia保持领先,而英特尔正在努力追赶。
在上世纪八九十年代,全球一度有多达数十家公司在开发了显卡和独立图形处理器,但为了在3D游戏中获得最高性能而进行的残酷竞争,其中绝大多数公司被淘汰。
到大约2010年时,只有AMD和Nvidia能够为游戏和计算提供有竞争力的独立GPU,而其他公司则专注于集成GPU或GPU IP。
从2015年左右开始,中国的PC GPU开发商数量开始迅速增加,这得益于中国对技术自给自足的推动,以及AI和高性能计算作为高科技大趋势的出现。
根据Jon Peddie Research的数据,目前总共有18家公司在开发和生产GPU。有两家公司主要针对智能手机和笔记本电脑开发SoC绑定的GPU,有6家开发GPU IP,有11家GPU开发商专注于PC和数据中心的GPU,包括AMD、英特尔和英伟达。
事实上,如果在名单中加入其他中国公司,如壁仞科技和天枢智信,那么GPU企业数量将更多。不过,壁仞科技和天枢智信目前只专注于AI和高性能计算,所以JPR不认为他们是传统意义上的GPU开发商。
中国的技术救国之路:GPU开发
作为世界第二大经济体,中国不可避免地与美国和其他发达的国家在几乎所有方面进行竞争。中国竭尽所能地吸引世界各地的工程师。
事实上,在中国,每年都有数百家新的IC设计公司成立。他们开发的产品种类繁多,从微小的传感器到复杂的通信芯片均由涉猎,力图实现对西方国家供应商的自给自足。
但要真正跳上人工智能和高性能计算的浪潮,需要CPU、GPU和特殊用途的计算加速技术。
谈到CPU,中国面临美国在制造设备和技术上的越来越严密的技术封锁,不可能很快赶上全球先进水平。然而在另一个赛道上,可以说,开发和生产一款像样的GPU,比试图造出一款有竞争力的CPU更容易出成果。
「对于中国公司来说,人工智能训练是自主研发GPU的主要驱动力,一方面是因为英伟达的GPU太贵了,另外也是出于对自给自足的渴望。」JPR的负责人Jon Peddie说。
GPU本质上是并行设备,其内部有大量的计算单元可以用于冗余,这使得GPU更容易启动和运行,单位晶体管的成本相对较低,整体产量也不错。此外,GPU的并行性质使其更容易以扩展的方式实现部署。
与CPU相比,GPU在设计和制造上对制程工艺的要求没有那么苛刻,即使目前中国最先进的芯片制造商中芯国际并没有像台积电那样先进的生产工艺,仍然可以利用GPU性能扩展的方式实现足够可观的性能。
事实上,即使中国的GPU开发商失去了使用台积电先进节点(N7及以下)的机会,至少他们中的一些人仍然可以在中芯国际生产更简单的GPU设计,并满足AI、HPC和部分游戏/娱乐市场的需求。
而且,从国家的角度来看,具有AI和HPC能力的GPU可能也可以说比CPU更重要,因为AI和HPC可以实现全新的应用,如自动驾驶汽车和智能城市等应用。
尽管美国政府大力限制向中国出口以超级计算机为基础的CPU和GPU,但比起CPU,GPU在设计和制造上的相对较低的门槛,使得这种限制的效果远没有CPU来的明显 。
GPU微架构相对容易,硬件设计却很昂贵
不过,应该注意的是,虽然目前有很多GPU开发商,但只有两家能真正为PC打造有竞争力的独立GPU。这也许是因为,开发一个GPU架构相对容易,但要正确实现它并设计适当的驱动程序确实很难。
CPU和GPU微架构基本上是「科学和艺术的交汇」。这些架构是一组复杂的算法,开发这些架构的团队规模可能相当小,但可能需要长达几年的时间。
可以这么理解,微架构是在餐巾纸和白板上完成的。至于成本,如果只是架构师自己,团队规模可以只有一个人,也许是三四个人。但是任何类型的建筑,建筑、火箭飞船、网络或处理器都是一个复杂的棋局。
比如,试图预测五年后的制造工艺和标准,性价比的权衡,增加什么功能,放弃或忽略什么功能,这些都是非常棘手和耗时的工作。
架构师们花了很多时间在头脑中进行假设,比如如果把缓存做大25%,如果有6000个FPU,是否应该做一个PCIe 5.0 I/O总线?这么做能不能按时完成?诸如此类。
" class="BDE_Image" onload="EditorUI.resizeImage(this, 560)" unselectable="on"/>
由于微架构的开发可能需要数年时间,而且需要有才华的设计师,在这个上市时间至关重要的世界里,许多公司就干脆从Arm或Imagination Technologies等公司授权使用现成的微架构,或者是是经过验证的GPU IP。
例如,中国的芯动科技(Innosilicon)就从英国的Imagination公司授权GPU微架构IP用于其Fantasy GPU。
还有一家中国的GPU开发商,使用了Imagination的PowerVR架构。同时,另一家GPU制造商兆芯(Zhaoxin)使用的是Via Technologies获得的GPU微架构。
开发一个微架构的成本可能有所不同,但与现代高端GPU的物理实现成本相比,它的开发成本相对较低。
多年来,苹果和英特尔这两家拥有大量工程人才的公司都依赖Img进行GPU设计。联发科和其他小型SoC供应商依靠Arm。高通公司在很长一段时间内使用ATI/AMD,而三星在尝试设计自己的图形引擎数年后,也转向了AMD。
最近,两家新的中国GPU公司聘请了前AMD和英伟达的架构师,另外两家使用Img。进入市场的时间和学习作为一个架构师的技能,要担心什么,以及如何找到解决方法,是一个非常耗时的过程。
「如果你能去找一家已经有了设计方案,并且已经设计了很长时间的公司,可以节省大量的时间和金钱,而在市场上,时间就是一切。」
「这个过程中会有太多的问题。并非每一个由AMD或英伟达设计的GPU都能成为赢家。不过,一套好的架构设计可以经历几代的调整,慢慢进步。」研究机构Jon Peddie Research的负责人表示。
对于新的生产制程来说,硬件实现和软件开发的成本太高了。据《国际商业时报》估计,使用5nm级技术制造的设备,其设计成本超过5.4亿美元。如果制程为3nm,设计成本还将增加3倍。
「如果将布局和平面图、模拟、验证和驱动程序全部考虑在内,GPU开发的成本和时间就会激增。」Peddie解释说。
「硬件设计和布局是非常直接的:如果弄错一条线,可能要花几个月的时间来查错。」
目前,世界上只有少数几家公司能够开发出具有AMD和英伟达级别的现代游戏或计算用GPU(460亿-800亿个晶体管规模)芯片。
不过,前不久中国的壁仞科技发布的BR104和BR100也达到了几乎类似的水平。(据猜测,BR104包含大约385亿个晶体管)。
目前,全球11个PC/数据中心GPU设计供应商中的8个来自中国,这本身就说明了问题。
也许在不久的将来,除了美国公司,我们不会看到有竞争力的独立游戏GPU。中国是否能推出有竞争力的竞争对手,目前还有待观察。