Imagination人工智能产品营销高级总监Andrew Grant:“相比从硬件转向软件,将会更多地出现从使用GPU这样更通用的元件转向关注ASIC。尤其在AI领域,拥有专为与GPU协同工作及增强GPU批量计算能力而设计的电路,就可以持续支撑AI任务中不断增加的数据量和复杂性。NNA就是这样一种ASIC,它将持续开拓数据中心的AI和机器学习功能。当与GPU的通用计算协同实现,并与高效、丰富的数据集和算法集成在一起时,跟上AI的发展步伐将变得更加可控。”
如今的服务器芯片市场正积极拥抱“多样化”。结合当前的市场形势,这种多样化不仅限于指令集和IP核,在微架构层面上,为解决当下实际应用中日益突出的算力不足、功耗过高以及由此衍生的各类成本问题,行业也迫切需要发起一场“芯变”。
服务器芯片市场的“质变”
以传统数据中心当中采用的GPU为例,Imagination人工智能产品营销高级总监Andrew Grant认为:“对于从机器学习和AI到云游戏的众多数据中心应用而言,使用GPU是因为其可提供大规模的并行算力。然而,传统的数据中心GPU最大的缺点之一是其产生的热量和能耗。这将引发两方面的问题,首先,它们的供电和冷却成本会非常高。其次,也是更重要的,这意味着它们无法在现有的机架中高密度部署,进一步意味着数据中心每平方米的单位计算密度更低。”
为此,Imagination开发了非常适合数据中心的GPU方案,但这种方法并不是把高耗能的桌面级GPU组件精简后直接用于数据中心,而是利用了Imagination在嵌入式和汽车领域的长期研究成果来降低能耗。
Andrew Grant指出:“这意味着像IMG B系列GPU这样的产品可以在非常低的功耗限制和散热配置下提供令人难以置信的高性能。虽然每个单独的GPU可能不像某些同类产品那么强大,但是我们能够以无限扩展和高密度机架部署的方式来提高数据中心单位面积的计算密度。对AI工作负载而言,IMG Series4 NNA专用集成电路(ASIC)专为多核集群而设计,是减少数据中心面积的理想选择,并且作为ASIC,它运行神经网络任务时的速度比其它组件要快几个数量级。”
为了进一步挖掘芯片微架构的潜能,AI高性能计算市场也逐渐兴起一阵“异构计算”的狂潮,Andrew Grant补充到:“我们注意到人们对异构计算的兴趣与日俱增。在异构计算中,特性不同的运算单元被组合在一起,用于处理与其各自设计相适应的任务,例如GPGPU用于浮点运算,加速器用于推理等特定的工作负载。”而加速器可以是FPGA、GPU抑或是ASIC,通过多种模块的互补组合与搭配,从而找到能够在功耗、算力以及成本等多个层面上的最优解方案。
当然,围绕超高性能嵌入式系统级芯片(SoC)去设计下一代数据中心也是一种可行路径,这些SoC可以使用通用的工具,处理互补的工作负载,并提供出色的性能、功耗和面积(PPA)。因此,对数据中心而言,它可以降低功耗和热量,同时提高面积效率并最小化硅成本——从而使超大规模数据中心能够提供更具竞争力的解决方案。
硬件Or软件:“智算”时代究竟谁更重要?
即便是“智算”时代,软件的壁垒比硬件要更高,可这二者之间仍然是齐头并进、相互依存、共谋发展的关系。毕竟,AI芯片成功的关键在于硬件/软件的协同设计,AI芯片本身只起到加速的作用, 除了少量定制化AI芯片具备一定功能外,大多数AI芯片本身并不具备功能,它们的功能必须结合相关软件来实现,这里的软件包含芯片底层的驱动、开发工具链、各类计算库、IR中间件、深度学习框架以及人机交互的界面等等。
Imagination也认为硬件和软件应该是高度相互依赖的,没有正确的硬件,世界上最好的软件也是无用的,反之亦然,Andrew Grant指出:“相比从硬件转向软件,将会更多地出现从使用GPU这样更通用的元件转向关注ASIC。尤其在AI领域,拥有专为与GPU协同工作及增强GPU批量计算能力而设计的电路,就可以持续支撑AI任务中不断增加的数据量和复杂性。NNA就是这样一种ASIC,它将持续开拓数据中心的AI和机器学习功能。当与GPU的通用计算协同实现,并与高效、丰富的数据集和算法集成在一起时,跟上AI的发展步伐将变得更加可控。AI是一个令人兴奋的领域,AI框架的开发在不断演进。我们在自己的软件工具中已经考虑了这一点,从而可以支持客户在现有设计上运行最新的网络,延长了我们设计的使用寿命和实用性,同时有助于向客户确保我们在设计产品时有效地考虑了未来发展。”
但这并不能改变软件构成芯片企业核心竞争力的事实,邹挺告诉记者:“生态和开源软件是Arm长久以来努力工作的方向。一直以来,Arm都在跟生态中的主要公司保持密切合作,包括软件生态中的各个环节,从固件、操作系统、虚拟化软件,到编程语言,到应用程序。近年来Arm软件生态有了长足的进步,各种主流开源软件都能直接运行于Arm的硬件,基于Arm的软件开发越来越容易。比竞争壁垒更重要的是可重用性、标准化和合作。Arm去年发布了Cassini项目,它的目标是让硬件厂商、开发者、和最终用户有了一套共同的操作框架,遵循这个框架会容易地开发和部署应用程序。这些标准化工作避免了分歧,使能了创新和合作。”而这,也将成为Arm公司接下来持续引领全球芯片IP市场的关键。
总之,历经充实“量变”之后的服务器芯片市场,已经开始从多个角度酝酿着“质变”。而对于各路沉浮这一领域多年的“老江湖”们来说,这既是一个拼“家底儿”的时刻,又是“更上一层楼”的契机。显然,在这条竞争已经白热化的赛道上,从硬件的角度能够挖掘的“差异化”价值会越来越少,更多的发力软件生态或许会是各路玩家构建核心竞争力之路上比较明朗且真正能够有回报的路径。