欢迎访问
行业巨头都在打造靠异构算力,这种架构已经“抢跑”
2023-11-30 来源:贤集网
1033

关键词: 人工智能 芯片 英特尔

根据IDC的预测,到2023年,中国的人工智能芯片出货量将达到133.5万片,同比增长22.5%。这一预测得到了11月29日在北京举行的2023人工智能计算大会的证实。

会上,与大模型和生成式人工智能的发展相关的智能算力市场的增长被强调,智能算力规模增速快于通用算力,预计2022年至2027年中国智能算力规模年均复合增长率将达到33.9%,而同期通用算力规模年均复合增长率仅为16.6%。 业内人士指出,打造异构算力、建立开放生态、突破高性能算力瓶颈已成为共识。目前,许多大模型企业都愿意主动适配国产芯片,这将为国产芯片带来新的发展机遇。



“通用”与“专用”相向而行

从20世纪60年代的字符终端时代到如今的智能计算时代,数据的量和质都发生了显著的变化。以文本、图表为主的结构化数据比例不断下降,融媒体数据、实时处理的传感级数据等非结构数据,以及深度学习的元数据的持续激增,将越来越多种类、精度的数据以更快的速度进行传输和处理,并成为智能计算的刚需。

作为通用处理器的代表型厂商,英特尔已经将异构计算作为应对AI时代算力挑战的关键战略。如果将数据看作食材,CPU就相当于“瑞士军刀”,适用于一切食材,却不一定能将所有食材处理得又快又好。GPU、FPGA、DSP等专用处理器的加入,让计算架构能更有效地应对场景化数据。

“异构计算的产业的基础是数据的爆炸式增长,这其实是我们发展异构计算的主要驱动力。”英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清在接受《中国电子报》采访时指出,“CPU提供的是通用型计算的能力,解决的问题很广义。但是GPU、FPGA,或者AI加速芯片解决的是特定领域的问题。现在很多数据的产生都有一定的特点,以至于在CPU上的运算效果不一定是最理想的,在GPU或者其他并行计算能力高的芯片上会跑得更好,这是异构计算的主要驱动力。”

作为专用处理器厂商,赛灵思从器件向异构平台的转变也已开始。赛灵思大中华区核心市场业务发展总监酆毅向《中国电子报》记者指出,智能驾驶正在从ADAS逐渐向全面自动驾驶持续演进,传感器数量的增多势必会带来爆炸式的数据增长,这就需要汽车具备强大的异构计算平台。在工业视觉领域,机器人技术、工业PC、I/O的模块、智能传感器、人机界面等都在产生不同类型的数据。在专业音视频和广播领域,从内容采集到内容消费的全部过程也需要远程管理不同的服务器和计算平台。

“单独的计算架构,无法满足越来越多样的开发需求,因此,异构计算是未来的发展之路。”酆毅指出,“伴随工艺的进步,FPGA也打破了传统的应用边界,进入到AI、数据中心、视频处理、自动驾驶、5G等新兴领域中。而FPGA也通过集成标量处理引擎、自适应硬件引擎和智能引擎,完成了从器件到异构平台的转变。”



三大厂商引领异构计算

现在随着5G、AI、云计算等新兴领域对计算量的需求,已经超过了通用CPU的发展速度,仅通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈,所以需要GPU、FPGA、DSP,现在还多了DPU,这些计算单元去配合CPU进行并行计算,大家分工协作,“专人干专事”,以此来很好的满足这些计算需求。

而英特尔、AMD、英伟达三大厂商最近的一些列集中的动作更是把异构计算推上了风口浪尖:


英特尔CPU+GPU新架构Falcon Shores

英特尔在最近的投资者会议中提出了一个新架构——Falcon Shores。这是一款将X86和Xe GPU 整合到一个Xeon插槽中的新架构。该架构将利用英特尔埃米时代工艺技术、下一代封装、英特尔正在开发的新型超带宽共享内存以及领先的I/O技术。他们预计,相对于当前平台,Falcon Shores将提供超过5倍的每瓦性能、超过5倍的计算密度增加以及超过5倍的内存容量和带宽提升。


英伟达Grace CPU

2021年4月,英伟达公布了其首款代号为Grace的CPU产品,这是专为人工智能和超算使用需求打造的。该产品采用下一代Arm Neoverse内核,在NVIDIA放出的设计示图中,Grace CPU是以MCM(Multi-Chip Module,多芯片模组)形式构成,包括CPU、GPU、DPU和带有ECC的LPDDR5x的新型高带宽内存子系统,辅以使用 NVLink 通道技术。可以说是专为连接英伟达GPU所设计。据悉,Grace预计在2023年发布。

对于英伟达来说,Grace CPU的研发将对其意义深远,使其不必完全受制于AMD和英特尔在CPU上的的合作关系,可以说是自立自强的一个表现。因为即使GPU的并行能力不断提高,但GPU终究在加速运算中扮演资料运算,仍需搭配CPU执行基本的系统,以及由CPU 发号运算的命令,所以GPU和CPU之间的沟通很重要。而x86架构的CPU又受限PCIe频宽的影响,GPU与CPU之间沟通效率很低,无法满足巨量数据传输处理效率需求,此前英伟达为了解决这个问题,研发了高速通道技术NVLink,但合作伙伴只有较冷门的IBM Power,而市场占有率较大的英特尔和AMD都有自身的加速器,自然也不会加入英伟达的支援阵列。


AMD收购赛灵思,补齐FPGA产品线

近日AMD完成了对赛灵思的收购,AMD的CPU和赛灵思的FPGA,未来也将走向CPU+FPGA的异构整合中。因为,这条路英特尔已经趟过,收购了Altera之后,FPGA产品线在英特尔中发挥的不错,2018 年,英特尔宣布将“Skylake”至强SP处理器 Arria 10 FPGA 混合在一个封装中的产品。FPGA在现成CPU 上运行的编程语言和用于实现某些功能或软件堆栈的定制ASIC之间的边界仍然具有吸引力。

总之,收购赛灵思之后,AMD 设计的每个计算设备,无论是单芯片还是封装中的Chiplet集合,都可以在 AMD 认为合适的时候添加一些可编程逻辑。

英特尔向GPU扩展的动作很大,英伟达研究CPU自立自强的决心也很大,气势正旺的AMD有了FPGA也如虎添翼。随着三大厂商逐渐补齐产品线,异构计算或将进入全面爆发。未来,异构计算会越来越多的取代原来通用计算不擅长的部分。


国内芯片厂商跟进

不同于国际大厂在各方面实力雄厚,国内厂商难以在短时间内形成如此全的产品线,但是国产芯片厂商现在已经渐渐开始选择通过投资和合作的方式埋下异构的种子。

2021年11月,GPU芯片企业壁仞科技,与IDG资本、字节跳动等共同参与了国产DPU初创企业云脉芯联数亿元的天使轮投资。据壁仞科技创始人、董事长、CEO张文透露,除了DPU之外,从布局整体计算产业出发,壁仞科技正在密切关注国产CPU的最新发展,未来形成CPU+GPU+DPU的全国产系统级解决方案。



日前,DPU芯片厂商云豹智能与AI芯片厂商燧原科技达成了战略合作,共同研发和提供大规模高性能AI算力平台解决方案。基于云豹智能云霄DPU和燧原科技云燧T20率先推出了DataDirectPathStorage解决方案,为AI训练储存访问提供更高效的解决方案。在传统解决方案中,云燧T20访问存储时,需要将数据先搬移到系统内存,再由系统内存搬移到目标设备。而基于DataDirectPath Storage技术,云燧T20可通过DPU直接获得数据,从而绕过系统内存和CPU,让数据访问速度更快,访问延迟更短,系统开销更小。

此外,国内还有异构处理器IP提供商华夏芯,通过自主设计的Unity统一指令集架构和基于此架构的CPU、DSP、GPU、AI专用处理器系列IP与SoC,在提升性能价格比的同时,显著降低计算芯片研发成本和研发复杂度,同时缩短研发周期,减少开发人员工作量和降低开发门槛。据悉,华夏芯的Unity和英特尔的OneAPI都是为了简化编程环境,但不同的是,OneAPI是面向不同体系架构的统一编程环境,Unity是面向不同微架构的统一体系架构和统一编程环境。


RISC-V架构与异构计算相当适配

在异构计算的框架下,RISC-V可谓是如有得水,其提供了远超x86架构和ARM架构的灵活性,并因为是后起架构,没有历史包袱,创新限制更少,因此RISC-V在异构计算时代拥有广阔的应用前景。

RISC-V在异构计算领域的发展前景是极好的,当然所面对的挑战也不小。我们都知道,对于RISC-V而言,其在异构计算方面的进展和在高性能方面的进展是同步,异构计算可以被看作是RISC-V冲击高性能计算市场的重要抓手,那么面临的挑战其实和基于RISC-V实现高性能计算便较为一致,当然也会有一些挑战是从异构计算理念出发的。

实际上,电子发烧友网此前的报道有过此方面的表述,相关言论来自中国科学院软件研究所总工程师武延军研究员。对于RISC-V在高性能领域的硬件发展,他表示,“当RISC-V生态发展到一定程度后,将不会再笼统地说一个处理器有多少个核,主频多少,算力多少。而是讲一个处理器中有多少种类型的核心,每一个核心有怎样的定制能力。这些不同类型的核心集中在一个平台上,能够满足丰富的应用场景需求。”

很显然,RISC-V想要在异构计算领域有所作为,产品的丰富度和定制性要能够完美展现,比如目前异构计算延伸出了“XPU”的概念,RISC-V对此都要进行实现。并且,XPU理念现阶段还是以ARM架构为主导,RISC-V需要先模仿后超越,全面释放自己的模块化和灵活性优势。在此过程中,基于RISC-V打造的计算芯片还需要满足通用标准,未来也主导通用互联标准。

武延军研究员也在软件层面讲到了RISC-V后续需要强化的点,“往高性能去发展,对于上面的软件生态是一个非常大的挑战。可以看到目前还有很多核心的基础软件没有很好地跑在RISC-V平台上。这里可能会有指令集规范还不成熟的问题,但更多的是这些基础软件包之前都是在x86和ARM平台上面跑,从维护者、社区的角度,还没有把RISC-V当成Tier-1或者First-Class-Citizen去对待。这里面有理念问题,有投入问题,也有商业利益回报问题。”他对此讲到。

因此,RISC-V做异构计算其实并不只是单纯丰富芯片种类,提升芯片性能,也需要完善软件生态,这个难度可能比硬件更大。但无论前路如何充满荆棘,异构计算都是RISC-V必须把握好的一个产业大趋势,在处理器架构方面,RISC-V要想实现和x86架构以及ARM架构三分天下,不能一直靠模仿ARM,而异构计算有足够的市场容量和市场广度让RISC-V走出自己的路,这是至关重要的。



Baidu
map