国产CPU的路不好走,但走得人多了,希望就大了起来。当前三大指令集架构中,唯一不受商业公司牵制的RISC-V,正酝酿出越来越丰富的技术创新与商业成果。
这在玄铁RISC-V生态大会上得到集中展示,来自半导体IP、芯片、软件等不同产业环节的代表性玩家们不仅踊跃晒出产品和工具进展,而且兴致勃勃地分享RISC-V有望带给中国芯片产业的新趋势、新赛点、新机会。
RISC-V加速赛跑
想当年,14年前,在伯克利的实验室里,RISC-V这套开源指令集就诞生了。那会儿,谁也没想到它将来能有多大作为。但现在呢,看着它从零做到有100亿颗芯片的飞跃,RISC-V不仅比Arm用更少的时间做到这一点,还给国内CPU的发展来了一针强心剂。
国内对RISC-V的拥抱,显然不仅仅是因为它是开源的。更重要的是,它代表了一种新的可能性——在这个由x86和Arm主宰的世界里,RISC-V的自主可控、灵活可扩展正是国产CPU追求的方向。
从算能科技在基于RISC-V的加速器上运行大语言模型,到达摩院基于RISC-V的安卓终端设备的商业化落地,我们可以清晰地看到一幅国产CPU技术和生态的迅速进步图景。
这一系列动作背后,可是技术革新和钱力支持齐头并进的结果。就拿2023年1月到2024年1月来说,至少16家国内做RISC-V芯片的创业公司拿到了新一轮投资,这股资金的注入,不仅让技术开发和应用加速了,也给整个产业注入了一股新鲜血液。
同时,看到不少国内的RISC-V芯片公司跟大企业搞得铁铁的合作,这肯定会让RISC-V技术成熟得更快,应用得更广。
说到RISC-V的用途,AI计算绝对是众人关注的热点。无论是Meta推出的基于RISC-V架构的AI推理加速器,高通宣布的智能穿戴设备芯片,还是算能科技的大模型加速器,都说明RISC-V正在慢慢深入到高性能和AI计算这些复杂领域。这不仅显示出RISC-V技术自身已经成熟,还说明了它在将来科技界有着巨大的应用空间。
虽然RISC-V技术方面有不少突破,但它的生态圈建设还是遇到了些挑战。软件的兼容问题、整个生态圈还不够成熟,这些都是限制RISC-V进一步发展的难题。
RISC-V芯片赛道融资密集,逐渐走向高性能和大算力
三大指令集架构中,x86与Windows联盟在PC领域独孤求败,Arm与安卓在移动终端领域叱咤风云,RISC-V的市占率跟两位前辈没法比,但就凭背负着自主可控的希望,不仅国内生态发展精气神旺盛,战略地位更是遥遥领先。
投资机构对RISC-V创企已给予许多积极反馈。从2023年1月到2024年1月,至少有16家研发RISC-V芯片的国内创企获得新一轮融资,其中奕斯伟计算、进迭时空、希姆计算、蓝芯算力、知合计算的最新单笔融资均达到亿级。
其中,国内不少RISC-V芯片创企的核心团队都与大厂关系匪浅。例如,知合计算CEO孟建熠是前平头哥副总裁,进迭时空联合创始人陈志坚是玄铁处理器主要研发负责人,蓝芯算力创始人兼CEO卢山是前字节跳动服务器芯片负责人,之行无界创始人兼CEO楚含进是原AMD XR与计算平台高级总监,晶远芯创始人刘钢是前西部数据中国区业务总经理,尚未公布融资动向的旭日辰芯由前英特尔中国区高管创办。
目前中国有数百家公司在关注或以RISC-V指令集进行开发。RISC-V International的25个高级会员中有阿里、华为、腾讯等12家中国企业,去年达摩院领导了13个技术小组的标准制定。
张建锋在演讲中分享了一些数据:RISC-V正呈高速发展,在可穿戴MCU、计算笔记本、通信5G、消费级AI加速、工业智能电网、自动驾驶AI驾驶等主流应用中的占比接近或达到30%;未来几年在主流市场年复合增长率预计超过40%。
倪光南院士预测,未来世界三大主流CPU生态将是:1)服务器/桌面的Wintel联盟;2)移动终端的安卓Arm生态;3)智能物联IoT的RV++(1套RISC-V指令集架构+1套基础软件+N种定制化芯片)。其中,AIoT生态会出现数万种定制化需求,而RISC-V最有优势。
他认为RISC-V自定义扩展指令是实现特定领域架构(DSA)的有效途径,随着RISC-V扩展指令集功能的充分发挥,芯片定制化或”芯片定义”将会被人们所普遍接受。
RISC-V在AI大模型领域的挑战
根据此前的报道,在一项专业基准测试中,专注高性能RISC-V芯片的Tenstorrent推出基于自有处理器内核的RISC-V CPU芯片,该芯片的评分领先于英特尔的Sapphire Rapids、英伟达的Grace和AMD的Zen4。这说明,在传统CPU方向上,RISC-V架构已经开始崭露头角,证明了RISC-V架构做高性能芯片的能力,那么在AI大模型方面会遇到哪些挑战呢?
在AI大模型这类型应用中,RISC-V架构第一大挑战肯定是内核本身。通过美国对于我国的AI芯片禁令就可以看出,AI芯片做大模型训练是有一定门槛的,低于这个门槛效果就会大打折扣,虽然RISC-V架构已经做了很多尝试,不过总体性能和长期深耕GPU领域的ARM架构肯定没法比。当然,英特尔和芯至科技这类尝试说明,RISC-V架构可以率先攻克大模型推理芯片市场以及终端一体机市场。
在性能背后就会牵扯出第二问题——专利。英伟达等芯片厂商以及Arm公司在高性能计算芯片领域储备了大量的专利,为了追求极致的运算性能,很多方式方法都已经被论证过了,并形成了专利,要绕开这些专利限制实现高性能计算芯片,进一步提升了相关厂商的研发难度。
第三个问题也是一个老生常谈的问题,那就是生态。AI大模型这类型的应用,无论是训练端还是推理端,都会是一个软硬件结合的系统,尤其是具体到某一个细分领域的推理应用,具有丰富的上层应用,也就需要更高效的软硬件融合。不过,目前对于RISC-V架构而言,很多生态还是荒漠,比如DDK、接口、中间件这些关键的生态工具,基本还没有。