尽管已步入2021年,但全球疫情形势仍充满变数,远程办公、线上交互依旧是今年世界各国防控疫情的绝对“主题”。而随着大量智能边缘设备、企业数字化服务以及社区媒体互动、网络消费等线上应用的成倍飙升,全球数据中心的压力也持续陡增,建设新型的“智算中心”已迫在眉睫。据TrendForce预计,2020年第四季超大规模数据中心服务器需求占比已攀升至近四成,整体数量是2012至2014年的三倍。而2021年,受惠于多个主流平台的导入,加之市场对云端应用需求的攀升,数据中心市场也正加速驶入“量变+质变”的高速轨道。
2020年,是服务器芯片市场“改朝换代”的起点。尽管英特尔仍以96%左右的份额稳居高位,但身为“后浪”的AMD和Arm正紧追不舍,逐步蚕食本就属于英特尔的份额。以2020年Q3数据为例,据IDC发布的市场报告显示,中国市场的服务器收入同比增长了14.2%,与此同时配置AMD CPU的服务器全球收入同比增长了112.4%,作为另一大重要参与者的Arm,服务器收入同比增长了430.5%。除了Arm和AMD外,猎场周边蛰伏许久的高通、Nvidia甚至AWS这类过去未曾涉及云计算服务器芯片的猎手们,也陆续开始向这一市场发起猛攻。
毕竟,随着全球范围内生成的数据继续以指数形式增长,通用及专用计算芯片将有很大的用武之地。Statista表示,到2024年,全球范围内将有近150泽字节(ZB)的数据被“创建、捕获、复制和使用”,这些数据大多需要实时或近乎实时的处理。
Achronix产品营销高级经理Tom Spence在接受《华强电子》记者采访时指出:“无论数据是在云端还是在边缘进行计算,中央处理器(CPU)都将继续尽可能满足需求。现场可编程逻辑门阵列(FPGA)、图形处理器(GPU)和定制专用集成电路(ASIC)通过提供加速计算、连接网络和存储功能来满足这一市场需求。其中,GPU和FPGA作为应用加速器已经在云计算中占有重要的地位,而且随着边缘计算变得越来越普遍,对应用和数据加速的需求将急剧增加。与GPU和定制ASIC相比,FPGA提供了最高效的功耗和性能,同时还保持了灵活性。”
对此,Arm基础设施业务事业部全球高级总监邹挺颇为赞同,而2020年,也是Arm数据中心业务突破性增长的一年。比如在公有云领域,AWS发布了基于Arm Neoverse的Gravition2处理器,在性能、功能、成本方面有了质的提升,基于Gravition2的云服务受到了Netflix、Flickr等越来越多最终用户的采用;基于Arm架构的智能网卡也在百度等云厂商得到了广泛采用,体现出了Arm架构的高能效比等优势。
在企业和电信领域,中国移动、中国电信等运营商、Oracle等企业也积极采用了基于Arm架构的服务器,邹挺表示:“在国内的信创市场上,基于Arm架构国内服务器芯片出货量也在持续增长。可以说,基于Arm架构的处理器在数据中心领域已经得到验证,并将在2021年持续发展。因为Arm开放的平台,我们看到越来越多的中国客户也在与Arm合作,定制适合自己的服务器、智能网卡和网络等设备。”
这也充分说明,服务器芯片市场正积极拥抱“多样化”。当然,这种多样化不仅限于指令集和IP核,在微架构层面上,为解决当下实际应用中日益突出的算力不足、功耗过高以及由此衍生的各类成本问题,行业也迫切需要发起一场“芯变”。
以传统数据中心当中采用的GPU为例,Imagination人工智能产品营销高级总监AndrewGrant认为:“对于从机器学习和AI到云游戏的众多数据中心应用而言,使用GPU是因为其可提供大规模的并行算力。然而,传统的数据中心GPU最大的缺点之一是其产生的热量和能耗。这将引发两方面的问题,首先,它们的供电和冷却成本会非常高。其次,也是更重要的,这意味着它们无法在现有的机架中高密度部署,进一步意味着数据中心每平方米的单位计算密度更低。”
为此,Imagination开发了非常适合数据中心的GPU方案,但这种方法并不是把高耗能的桌面级GPU组件精简后直接用于数据中心,而是利用了Imagination在嵌入式和汽车领域的长期研究成果来降低能耗。
Andrew Grant指出:“这意味着像IMG B系列GPU这样的产品可以在非常低的功耗限制和散热配置下提供令人难以置信的高性能。虽然每个单独的GPU可能不像某些同类产品那么强大,但是我们能够以无限扩展和高密度机架部署的方式来提高数据中心单位面积的计算密度。对AI工作负载而言,IMG Series4 NNA专用集成电路(ASIC)专为多核集群而设计,是减少数据中心面积的理想选择,并且作为ASIC,它运行神经网络任务时的速度比其它组件要快几个数量级。”
为了进一步挖掘芯片微架构的潜能,AI高性能计算市场也逐渐兴起一阵“异构计算”的狂潮,Andrew Grant补充到:“我们注意到人们对异构计算的兴趣与日俱增。在异构计算中,特性不同的运算单元被组合在一起,用于处理与其各自设计相适应的任务,例如GPGPU用于浮点运算,加速器用于推理等特定的工作负载。”而加速器可以是FPGA、GPU抑或是ASIC,通过多种模块的互补组合与搭配,从而找到能够在功耗、算力以及成本等多个层面上的最优解方案。
当然,围绕超高性能嵌入式系统级芯片(SoC)去设计下一代数据中心也是一种可行路径,这些SoC可以使用通用的工具,处理互补的工作负载,并提供出色的性能、功耗和面积(PPA)。因此,对数据中心而言,它可以降低功耗和热量,同时提高面积效率并最小化硅成本——从而使超大规模数据中心能够提供更具竞争力的解决方案。
Tom Spence认为:“当涉及到物理空间、功耗和散热时,许多位于边缘的服务器将面临极大的挑战。这意味着服务器的外形尺寸将变得更小,功耗更低,成本更低。许多由边缘计算和5G基础设施所产生的应用也对延迟非常敏感,远远超出了传统云基础设施所能支持的范围。FPGA、GPU和定制ASIC正迅速成为边缘执行网络、计算和存储加速的首选解决方案。Achronix提供了一流的FPGA平台,可以使用Speedster7t FPGA器件在芯片级实现,也可以使用SpeedcoreeFPGA半导体知识产权(IP)在您的ASIC或系统级芯片(SoC)中作为IP来实现。”如此这些,都将成为“智算”时代,服务器芯片寻求“质变”之路上切实可靠的硬实力依据。