在替代英伟达的道路上,国产算力一直面临一个“鸡生蛋、蛋生鸡”的难题。
当国产芯片问世之后,要想真正用起来,需要种子客户用实际业务将其打磨、优化、迭代,然后服务更多的客户,并持续形成飞轮。
然而实际情况却是,没有哪一家企业愿意被当成小白鼠来试验。这就进入了一个死胡同,越是没有企业愿意尝试,国产算力就越难用。
不过,在近几年产业链上下游的通力合作下,国产算力迎来了两个突破口。
一是国产算力迎来技术突破。
国内AI芯片正百花齐放,从产品性能、量产规模、拥有集群能力且已有场景落地等要素来考量,以华为和摩尔线程等为代表的国内AI芯片第一梯队玩家已经涌现,并且具备了基于全国产芯片的千卡计算集群。
事实上,去年12月摩尔线程就面向客户发布了首个国产全功能GPU千卡千亿大模型训练平台:夸娥(KUAE)智算中心全栈解决方案,并且已率先实现三个千卡智算集群的落地。
二是国产算力迎来政策东风。
过去一年,全国各地陆续出台了算力相关的扶持政策。近期,北京市发布《北京市算力基础设施建设实施方案(2024-2027年)》,明确表示对采购自主可控GPU芯片开展智能算力服务的企业,按照投资额的一定比例给予支持,加速实现智算资源供给自主可控。
技术突破与政策扶持就像是螺旋上升的两条纽带,互相驱动打造更加可靠的国产算力。
这一次,国产算力有望迎来“中国英伟达”的时刻。
中国版英伟达崭露头角
提到GPU,大家基本第一个想到的就是英伟达,的确,在GPU这个领域上,英伟达几乎是独占鳌头的存在。
只不过,随着科技的发展,我国的很多企业也都开始纷纷研究起来了这些GPU,尤其是随着人工智能的发展,GPU有了越来越重要的作用,因此越来越多的中国企业开始涉足这一领域,全力研究起GPU起来。
而在这众多的前赴后继的中国企业之中,有一个企业可以说是一马当先,早早的就开始了研究,并且很迅速的便斩获了研究成果。
如今,这家企业更是被人们夸赞“中国版英伟达”,表示这家企业产生的芯片可以代替英伟达。
这家企业的名字叫做景嘉微,是一家2006年就已经创立了的纯国产企业。最初,景嘉微所研发的基本也只是一些图像处理器和小型雷达等产品。由于这些产品所要求的技术准则其实并不算高,因此成立公司才刚刚第二年的时候,景嘉微也顺势就开始研究起来了GPU芯片研发的领域。
在2014年的时候,景嘉微就已经推出了一款GPU的芯片,这款芯片的性能更是甚至超过了一些进口的芯片,也是因为这些,景嘉微的这款芯片也就成为了我国军工企业的指定芯片。
而后来景嘉微推出的一系列JM7显卡,也成为了民用市场上的一个佼佼者,还有人戏称它为“中国版英伟达”。
尽管大家都知道,英伟达的种种技术和芯片,景嘉微一时半会儿是绝对不可能做到“复刻”实力的,但我们也要明白,英伟达在GPU芯片这一领域已经研究了三十年左右了。
因此在这样的时间和技术的差距之下,景嘉微能够用短短八年时间追上这宛如天堑的差距,简直可以说是奇迹了。
国产芯片的机会:软硬兼施,生态为王
目前,受制于CUDA庞大的软件生态,国产单卡的性能与H100、A100相比,差距并不明显。但在千卡以上的集群领域,国产芯片有了一展拳脚的机会。
正如中国工程院院士郑纬民所说,构建国产万卡系统虽难但必要,只要生态做好了,多数任务不会因为芯片性能的微小差异而有明显感知。
在国内,目前只有华为和摩尔线程两家公司具备部署全国产AI千卡集群的能力。华为推出了Atlas900 SuperCluster,支持超万亿参数的大模型训练,并在软件生态层面发力。
而作为GPU芯片头部创企的摩尔线程,则推出了首个全国产千卡千亿模型训练平台——夸娥智算集群,有望在功能上对标英伟达,成为大模型国产算力的最佳选择之一。
摩尔线程的夸娥智算集群,通过软硬一体化的服务,为大模型企业提供了一整套解决方案。它覆盖了主流的大模型,兼容CUDA等主流生态,支持断点续训、分布式训练、推理加速等功能,并在高性能通信、存储、集群可靠性等方面进行了优化,实现了全栈式的工程、端到端的交钥匙方案。
郑纬民院士指出,构建基于国产AI卡的万卡大模型训练平台,需要在网络、内存、IO等方面进行平衡设计。而摩尔线程的夸娥千卡集群,正是在软硬件一体化方面实现了全局突破,成为了国产AI算力第一梯队的一员。随着摩尔线程3家千卡集群智算中心的落地,未来万卡集群将指日可待。
核心政策助力“算力”建设
事件:近日,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会,强调中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展智能产业。加快建设一批智能算力中心,开展AI+专项行动。会上,10家中央企业签订倡议书,表示将主动向社会开放人工智能应用场景。
在节后Sora连续刷屏的大背景下,国资委打响了“国家队”抢占AI制高点的第一枪,彰显了对AI的重视,相信后面,工信部等其它部委可能也有跟进动作。这个对算力板块和AI都是直接利好,对央企也是利好。
长期来看,算力国产化是国内AI产业发展的趋势。国内AI芯片市场需求旺盛,根据艾瑞咨询测算,2022年中国的AI芯片市场规模约为385亿元,到2027年将有望达到2164亿元。
目前中国AI算力产业中,部分企业会部署更具全球竞争力的产品,例如微软、谷歌、英特尔、英伟达、AMD和亚马逊的AI算力产品,但部分也会进行国产算力产品的采购。我国具有竞争力的是阿里、百度、腾讯和华为,在产品和解决方案具备竞争力的是宝信软件、中科曙光、电科数字、网宿科技等。
从整体的算力行业来看,我国无论是在通用算力还是智能算力上均与国外差距明显。英特尔、AMD、英伟达是算力的主要厂商,在全球具有极高的话语权,同时对中国市场进行供应。但近年来随着美国芯片法案等对中国的制裁,我国AI算力自主研发任重而道远。
创新,仍是国产算力关键词
算力市场仍是风起云涌、变幻莫测,而创新始终是不变的话题。
“市场混乱很大的原因是芯片型号太多,从早前的A100到现在的A800、H800,再到910B、H20等,大多厂商在选择适配芯片的时候较难做到集群的统一。”彭璐介绍,由于型号众多,异构算力集群的建设与突破是目前主流趋势。不少厂商曾建设了单一品牌的GPU集群,但面对禁令,需要更换GPU,这对于现有集群来说是不小的损耗。“在没有银联的时代,店铺里有10台不同银行的POS机,用户用什么卡刷哪台POS机都有限制。而异构算力集群就相当于银联,把所有算力资源都统一起来,可以很好解决当下算力市场单卡单卖成本高、不便捷的缺陷。”彭璐表示。
自主创新是永恒不变的话题。异构算力集群,将会是明年国内运营商发力的重点方向之一。
运营商被寄予厚望,芯片厂商的压力自然不小。目前包括华为、寒武纪、海光等国内芯片厂商被业界看好,尤以华为昇腾为代表,被业界视为将在未来5年引领国产芯片迈入国际市场的领军先锋。
“届时,就是国力之争。国际市场如何选择就要看政策和价格导向。但中国算力仍有独特的优势,相信势必会引起未来国际市场的震荡”。吕天文表示。