别一说起CPU,大家就只想起intel、AMD。其实国内目前已经有N种CPU了,除了最典型的6家厂商(兆芯、海光、鲲鹏、飞腾、龙芯、申威)之外,还有阿里、中兴,以及众多的创业企业。
不过,虽然有N多家企业,但研发的所有国产CPU,其采用的都是6种指令集,今天给大家说一说,这6种指令集的情况,看看谁才能真正的自主可控。
什么是指令集?
首先要给大家普及一点知识,何为指令集、何为架构,何为IP。
CPU运行的指令是0、1这种二进制数,而所谓的指令集则是规定指令格式的东西,是软件和硬件之间的接口“语言“,是交互的一种标准规范。我们用写英文来形容的话,指令集是26个字母,芯片架构则是由这些字母组成的单词,而IP则是由单词组成的文章提纲。
如果获得了永久的指令集授权,那么自己可以根据这26个字母,随便组成单词,再随便写成文章,自由度非常高。
如果只获得架构授权,那么只能用固定好的单词,来写文章,不能自己组装出新的单词。
如果获得了架构和IP,那么就只能按照对方给的提纲,在提纲的规定范围内,用对方提供的单词写文章。
接下来我们说说国内CPU情况,看看哪些CPU是获得的指令集授权,哪些是架构授权,哪里是IP授权,基本上就明白了。
国内CPU开发常用的指令集
如上图所示,复杂指令集下有兆芯和海光,Z芯收购了VIA(威盛),而威盛曾获得X86指令集授权,属于继承。而AMD将X86指令集,以及Zen1架构授权给了海光,海光可以基于X86自由研发芯片,就像拿到了26个字母一样,随便组单词,写文章。
再看简单指令集中,则有4种,分别是ARM、MIPS、alpha、RISC-V。
ARM对国内没有指令集授权,均是架构授权,比如V8架构授权给了华为鲲鹏、飞腾,鲲鹏、飞腾只能基于V8架构开发芯片,另外这两家也拥有一些CPU、GPU核的IP授权。
V9架构,以及一些IP,则授权给了阿里、中兴以及一些其它芯片创业企业,大家可以基于V9架构研发芯片,但自由发挥空间不是特别大,毕竟只能使用规定的单词。
龙芯早期用的是MIPS指令集,后来自己拓展了LoongISA指令集,去年龙芯干脆干了一票大的,抛弃掉MIPS,100%自研出了一个LoongArch指令集,相当于自己创造了一套26个字母出来,以后组单词,写文章,随便自己玩。
申威早期用alpha指令集,后面自己拓展了SW64,但还是离不开alpha指令集,不过alpha很早就没“妈”了(无实体公司运营),其实也是自由的。
最后说说RISC-V指令集,这是完全免费开源的,相当于26个字母对外公开,大家都可以拿这26个字母去组单词,写文章。
可见,真要说自主可控,龙芯应该是排第一的,另外RISC-V、申威、海光自由度都是非常高的。相对而言,自由度不那么高的,还是在ARM芯片这一块,毕竟ARM只授权架构,还分V8、V9版本等,会不断的升级,芯片厂商要持续使用ARM,得不断的购买,随时面临断供风险,且授权价格昂贵。
从MIPS到完全自主可控LoongArch
作为芯片产业最重要的芯片之一,CPU实现国产自主可控对支撑国家信息产业发展和保证信息安全都至关重要。2021年4月15日,坚持了20年自主研发的龙芯中科技术股份有限公司正式推出龙芯自主指令系统架构LoongArch,实现了历史性的突破,让中国的芯片从必然王国走到自由王国。
龙芯中科2010年脱胎于中科院计算所,很长一段时间,龙芯都是国内为数不多坚持CPU自研,走芯片自主可控路线的少数派。
公司创立的前五年,龙芯主攻工控市场,2015年龙芯CPU出货几万颗,从无到万颗用了五年。这并没有动摇龙芯坚持自主可控的决心。“十三五”期间,龙芯一方面继续深耕工控市场,一方面开始进军电子政务市场,出货量不断增加,2019年出货几十万颗,从几万颗到几十万颗的出货量用了四年。
2020年,龙芯自主CPU的出货量又提升了一个数量级,达到了百万级。龙芯中科董事长兼龙芯CPU首席科学家胡伟武告诉雷锋网:“龙芯经过过去20年完成了技术补课,CPU不断迭代,我觉得2022年我们的CPU能够稳定在每年几百万片的出货量,我们也将逐步走向开放市场。”
完成技术补课准备走向开放市场的龙芯在2018年左右发现,MIPS已经不是他们最好的选择。“龙芯过去基于MIPS指令系统研制CPU并发展软件生态,经过20年的努力,不管是软件生态还是CPU核,龙芯的设计都超过MIPS公司。MIPS社区大概三分之二的维护工作都是龙芯在做,像浏览器、Java、媒体播放器等,MIPS公司主要是维护CPU内核和基础编译器。另外,MIPS有些技术特征很老了,MIPS顶层的64个指令槽基本上用完了,要加指令也比较难加了,像延迟槽也成为一个设计负担。”胡伟武说。
这是龙芯放弃MIPS的内因,外因是MIPS的所有权一直在变化。
“那时候我想明白了一个道理,采用授权指令系统可以研制产品,但不可能形成自主产业生态,就像中国人可以用英文写文章,但不可能基于英文形成民族文化。。于是在内因和外因的共同作用下,我们决定自主开发一套指令集架构。”胡伟武表示。
国产CPU突破的另一条出路
中科院计算所等机构用AI技术设计出了世界上首个无人工干预、全自动生成的CPU芯片——启蒙1号。相关论文已于6月27日发布。论文名称:“Pushing the Limits of Machine Design: Automated CPU Design with AI”《突破机器设计的极限:利用人工智能进行自动化 CPU 设计》
该论文详细介绍了研究人员在 5 小时内设计出新型工业级 RISC-V CPU 的工作。据称,这一人工智能自动化的壮举比人类团队完成类似 CPU 设计的速度快约 1000 倍。这颗完全由AI设计的32位RISC-V CPU比目前GPT-4所能设计的电路规模大了4000倍,性能堪比Intel 80486SX CPU。
中国研究团队的目标是回答机器是否可以像人类一样设计芯片的问题。该团队认为,早期的人工智能设计相对较小或范围有限。因此,为了测试人工智能设计的边界,研究人员认为他们会尝试让人工智能自动设计 RISC-V CPU。
此类项目通常从一段时间的机器学习开始。训练包括观察一系列 CPU 输入和输出。CPU的设计仅来自于外部输入输出的观察,而不是正式的程序代码。科学家们从这些I/O中生成了一个二进制推测图(BSD),并利用基于蒙特卡罗的扩展和布尔函数的原理来提高基于人工智能的CPU设计的准确性和效率。因此,科学家们解释说,CPU 设计是“仅根据外部输入输出观察而不是正式的程序代码”形成的。它还拥有令人印象深刻的 99.99999999999% 准确率。
使用上述流程,创建了 CPU 的自动化 AI 设计。流片的 RISC-V32IA 指令集的 CPU 采用 65nm 制造,运行频率高达 300 MHz。在 AI 生成的 CPU 上运行 Linux(内核 5.15)操作系统和 SPEC CINT 2000 验证了其功能。在 Drystone 基准测试中,AI 生成的 CPU 的性能与 i486 相当。有趣的是,在同一测试中,它似乎比 Acorn Archimedes A3010 快一点。
尽管有些人可能对人工智能生成的CPU的性能不以为然,但科学家们似乎也相当自豪,他们生成的BSD 从零开始发现了冯·诺伊曼架构”。
使用人工智能从头开始构建一个新的RISC-V CPU并不只是学术上的兴趣,也具有从头开始制造新 CPU 的潜在用途。根据研究人员的说法,人工智能可以被用来大大减少现有半导体行业的设计和优化周期。此外,在他们的结论中,科学家们甚至在思考这项研究是否可能进一步形成一个自我进化机器的基础。