事实上,这个也在大家的意料之中,因为自2020年9月15日后,华为麒麟芯片就成为了绝唱,没有代工厂了,只能靠库存撑着,自然有用光的一天。
有人表示,华为苦等两年,没有等来解封,也没有等来突破封锁的“奇迹”,真是可惜。
确实从现在的情况来看,虽然“奇迹”没有等来,等众多企业的努力,还是没有白费,这些企业的努力,或深远的影响着未来全球芯片的格局。
华为海思提出的芯片堆叠技术,现在来看,暂时没有成为华为突破芯片封锁的技术,但通过一些企业的验证,未来还是有希望的。
比如龙芯,近日就给华为打了个样,用两颗相对工艺不那么先进的芯片,封装在一起,使得性能翻倍了。龙芯这颗芯片叫做3D5000,是通过两颗3C5000芯片,封测在一起而实现的。
3C5000芯片,采用12nm工艺,内部集成 16 个高性能的龙芯 LA 464 核心,单芯片双精度浮点峰值运算速度超过 0.5TFLOPS。
而将两颗3C5000芯片封装在一起后,变成了内部集成32个高性能核心了,变成了32核,而多核性能上,相比于3C5000,性能直接翻倍。
3D5000性能战Zen2?
此次龙芯发布的3D5000与去年发布的3C5000同属一个系列,实质上就是将两颗3C5000核心封装在一起,通过特殊的连接协议使其成为一颗单独的处理器,类似的设计思路在半导体行业中并不少见,一般会被网友称之为“胶水核”。
虽然这种设计方式看起来简单且粗暴,但是设计合理,那么就可以轻松提升单颗处理器的性能上限。当然,缺点也是明显的,一方面是双核封装会带来功耗的飙升,另一方面则是封装体积过大,不适用于普通民用市场。
所以,3D5000与3C5000的定位不同,将主要面向服务器市场,不会在消费级市场发售。作为基础核心的3C5000,性能并不弱,早前小雷也专门进行过一次报道,3C5000采用16核心设计,主频为2.0GHz-2.2GHz,unixbench分数达到95000分以上,双精度计算能力可达560GFlops,峰值性能与典型ARM 64核处理器相当。
那么封装了两个3C5000的性能又如何呢?从官方给出的参数来看,3D5000采用32核设计,集成64MB L3缓存,支持最多8个DDR4-3200 DRAM,同时支持HyperTransport接口,最多可以支持四路处理器互联,单主板最高可以提供128核的运算支持。
另外,从目前的测试结果来看,单就IPC性能而言基本上是持平了同主频且核心数相同的Zen2 EPIC处理器,但是对于Zen2 EPIC处理器而言,3D5000的最高2.2GHz仅仅是勉强摸到了同核心数处理器的下限,比如EPYC 7452的基准频率就达2.35GHz,加速频率可达3.35GHz。
或许看完数据对比,大家会对龙芯的性能感到悲观,但是从产业发展角度来说,其实已经是一个很大的进步,而且3C5000与Zen2系列处理器使用的制程工艺并非一个世代的,前者为12nm工艺,后者则是7nm工艺,架构+主频的差距,使得3C5000主频表现疲弱,而这并不是无法解决的。
3D5000能否撑起国产服务器需求?
在实测性能方面,官方给出了单路和双路的SPEC CPU2006 Base测试结果,在实测中单路得分超过400,双路得分超过800,在完整的四路配置下,预计SPEC CPU2006 Base分数可以达到1600分,基本上与英特尔的至强E5 2699 V4性能持平。
从目前的性能来看,3D5000已经可以取代部分英特尔的至强处理器,活跃在一些服务器和软件部署场景之中。当然,理智上讲,两者的区别依然巨大,但是至强系列本就是世界领先的服务器处理器,E5-2699 V4作为一款2016年推出的中高端产品,其性能还是颇为可观的。
当然,如果对比最近两年发布的处理器,那么不管是3D5000还是E5-2699 V4都相形见绌,自从在架构上取得突破后,英特尔和AMD的新一代处理器性能就以前所未有的速度向前狂奔,几乎淘汰了2019年之前的所有处理器。
即使是在服务器领域,新架构的服务器处理器在核心数、主频和IPC性能等方面都有着恐怖的提升。以AMD在2019年针对个人服务器市场推出的线程撕裂者3960X为例,在多核性能上已经被英特尔在2022年发布的i9-13900K击败,而后者只是一颗面向个人消费市场的处理器。
迅猛发展的处理器性能正在加速甩开其他竞争对手,但就目前的发展趋势来看,国产处理器想要完全取代英特尔和AMD是不可能的,至少在超大型服务器和个人工作站领域,英特尔和AMD仍然是目前国内大多数公司和用户的最好的选择。
那么3D5000就没有意义了?当然不是,作为一颗服务器处理器,其性能已经足够应付一般的信创服务器部署需要,在一些关键场所和机要部门,可以完全杜绝海外硬件的使用,带来更高的安全性能。
此外,龙芯的产品计划中,3C6000将会达到更高的IPC性能和主频,甚至可以真正匹敌Zen2架构的AMD EPIC处理器,想要做到这点,意味着3C6000的主频至少需要提高到2.5GHz,对于龙芯来说是一个艰难的任务。
而在更久远的7000系列处理器规划中,龙芯希望可以借助7nm工艺将处理器的IPC性能推进到Zen3和12代酷睿处理器的水平。虽然从现在看来八字还没一撇,但是已经初步验证了架构的可行性,只要相关制程工艺跟上就有机会实现这个目标。
在龙芯的计划中,7000系列将会提供单个24-32核的3D7000和48-64核的3E7000,后者或将由两颗3D7000组合而成,届时性能或许将可以持平国外主流服务器处理,使得中低端服务器的搭建不再依赖于国外产品。
不过,即使在硬件性能方面追上英特尔和AMD,对于龙芯来说还有许多问题需要解决。首先,龙芯使用的并非x86架构,而是一个全新的自研处理器架构,意味着大量的主流专业软件都将无法正常运行在龙芯的处理器环境中。
在服务器等专业领域,失去了专业软件的支持基本上就失去了主流市场,这也是ARM处理器即使在能效比等方面表现出色,依然无法抢占x86市场的原因,许多专业软件都仅仅针对x86架构做了优化,如果想通过编译等方式使其运行在新环境下,会面对性能损失、稳定性下降等问题。
如果龙芯想要进入商用服务器市场,那么在软件生态适配方面也要下功夫,单颗硬件性能是无法站稳商用市场的。当然,我知道现在谈龙芯的商用发展还为时尚早,龙芯目前更多的是服务于政府等对国产化要求高的行业和领域,对于商业公司来说没有必要也不需要采购龙芯来设计部署服务器。
而且,龙芯也在推进软件生态的发展,比如通过二进制编译器来翻译兼容x86生态中的软件,与国产系统合作,推动系统和软件的适配等,随着使用者的增加,相信在未来可以构建出属于自己的架构生态。
目前,ARM是全球第一大芯片IP授权服务商,在移动CPU市场占比超90%的企业,中国芯片设计公司大多采用ARM架构,来设计手机和服务器芯片。然而因为中国芯片的发展速度太快,美国还是坐不住了,再次玩起了限制的把戏。
而龙芯最大的优势在于,拥有自主知识产权的架构,不受任何外力限制,而且100%安全。
相比于消费级CPU,服务器CPU更为重要,它被广泛的用于数据中心、云计算中心等场景,这里存储着大量与国家、民生、经济等方面的数据,事关信息安全问题。
所以可以预见,数据中心的国产化替代,将会迎来提速,取代主流的X86架构、ARM架构的服务器产品,已经势在必行,龙芯也将获得巨大的发展空间。
总之,有了龙芯,我们已经有了十足的底气面对各个方面的压力。所以也让我们一起祝福龙芯,在2023年能够有更好的发展,为国家的信息安全,继续做出更多的贡献,加油。