欢迎访问
华为芯片和硬件战略Fellow艾伟:把握ARM架构未来黄金十年
2020-04-09 来源:中国电子报
2276

  华为芯片和硬件战略Fellow艾伟分析了新时期算力架构的发展趋势。他认为未来十年是属于ARM架构的黄金十年,而且会重写X86的辉煌,而华为现在能够提供基于全ARM的开发平台,希望工程师们在新的计算架构中建立自己的新技能。

 

  ARM正在重演X86的辉煌历史

  艾伟说,从2000年到2020年算力架构在发生变化。

  第一,2000年X86占据市场第一的份额,总算力输出达到了70%。到了2020年,算力架构发生了逆转,世界上最大算力架构变成了ARM平台,基于ARM指令的处理器总算力输出达到了全球82%。

  第二,上游产业产生端到端变化。一是半导体先进工艺的发展,已经不再由PC机牵引,而转向了ARM架构的智能手机,ARM成为半导体产业的主要驱动力。二是基于ARM的产品形态更加丰富多彩,在这种情况下,软件工程师就拥有了一个更加开放、多样化的创新平台,现在ARM平台上的软件越来越多。

  艾伟表示,人们的质疑点是ARM现在还是下里巴人,性能比X86要低。但追溯历史,可以看到当年X86与UNIX相比,性能也要逊色,但自PC机从上世纪80年代开始兴起之后,1993年基于X86架构的PC机的总算力输出超过了基于UNIX的大型机和小型机。1998年英特尔推出的至强处理器达到服务器水平,量变转化成质变,到现在X86依然占据整个数据中心90%以上的市场份额,整个替换过程是颠覆性变化。

  如今,这个历史可能会再次被重复。而主角换成了ARM。

  2007年智能手机上市,很快到了2013年,智能手机的算力输出超过了X86,2019年,基于ARM架构的鲲鹏920处理能力达到了高端服务器的水平。从量变到质变的故事会再次发生。

  工程师要在新计算架构中建立技能

  “对于每一位工程师来说,在这个时候需要把自己的技能转移到新的计算架构中去。”艾伟这样建议。

  目前半导体的摩尔定律遇到了瓶颈。以前处理器主频升高会使性能越来越好,但当处理器性能达到一定水平时,再提高主频会碰到巨大的功耗约束。如何突破这个瓶颈,继续提高CPU的算力呢?

  艾伟说,我们已经看到了一条路径——多核并行。这个路径在ARM架构上走得比较快。从手机看,很早就实现了四核到八核的处理器;从服务器来看,华为推出第一代鲲鹏910时,推出了32核的处理器,去年发布的鲲鹏920,再次把处理器CPU核数提高到64核,其中CPU的核心架构也是华为自研的。

  “这种情况带来整个产业趋势的变化,我们看到现在不只是华为,已经上市的多个ARM处理器都在增加更多的核数。”艾伟说。其中也包括英特尔、AMD。利用多核处理器提升算力,软件工程师也因此面临新挑战。

  除了处理器的多核趋势,新的计算架构里,还需要一个高速低时延的总线,能够实现更加快捷的访问数据、访问外设、访问网络。所以最底层的物理技术也要提升。艾伟说,鲲鹏920支持8通道内存访问,整个性能提升了64%,可以用更多的数据及时喂养给CPU做计算。华为提供了PCIe4.0总线性能,支持64G总线性能,可以用更多的方式连接外设和网络。

  “当我们把先进半导体工艺、多核架构、高速内存访问、高速总线连接在一起,我们为整个软件产业提供了更加开放而且持续实现性能提升的平台。”艾伟说,“这个平台意味着我们仍然可以获得更加廉价充沛的算力支持。”

  半个世纪以前的大型机和小型机时代,用户少、应用数目少;PC机时代,每年可以达到上亿新增用户,应用数目达到十万级别;智能手机时代和云手机时代,用户数增长达到了十亿级别,软件达到了百万级别。艾伟说,所有这些上层应用的繁荣、软件的繁荣,都是从底层开始改变,让单位成本所购买的算力,提升了十亿倍,这是一个非常惊人的数据,而且今后华为还会持续提升性价比,提供更加充沛的算力。

  华为提供基于全ARM的开发平台

  让一个产业接受一个新的指令架构,需要做很多底层工作。艾伟说,我们从操作系统到中间件,再到软件开发工具,各个方面都逐步充实了ARM上基本的软件平台支持。从早期只有少数的几十个应用,到现在有2000多个应用,而且应用量呈现加速发展势头,这得益于我们具备了完整的软件开发平台和工具环境。

  把一个软件从一个CPU迁移到另外一个CPU,除了可能会带来性能提升、成本下降、功耗降低的好处,最关键的是在新的CPU上做出的创新功能和创新价值如何体现?

  艾伟认为,答案在5G网络。5G网络可以用更宽的带宽、更低的时间实现对终端、对云计算、对数据中心的连接,而且5G网络不只是一个简单的通用计算,它会面向人工智能。

  在4G网络上,中国各个产业得到大发展,如移动互联网、移动支付、共享经济、微信、短视频等等。4G网络的空口时延是10毫秒,从终端发起一个呼叫到返回到被呼叫终端的响应时间是100毫秒,手机游戏的玩家可以清晰地看到时延数据,这个时延数据匹配了人体的手、眼、脑的反映时间,所以我们觉得很流畅。

  在5G网络中,带宽和时延的性能改进了10倍。艾伟说,5G网络的时延降低到1毫秒,端到端的请求响应时间降到10毫秒,这个时延超过了人体神经的反应,会给AR、VR应用带来新的体验。同时在智能终端上,在机器人的应用上,会更广泛。利用5G网络,数字世界和物理世界能够更紧密地连接起来,通过软件算法的运算给出高价值的信息,优化物理世界,这个世界会发生不可逆转的变化。

  为实现这样的变化,华为提供了一个更加全面的、基于全ARM的开发平工具平台。“我们可能不再需要买一个X86的PC了,只要是基于ARM的手机、基于ARM的PC,甚至于基于ARM的智能电视,都可以实现编程功能。”艾伟说,“我们可以实现随时随地的编程和创造,我们可以得到触手可得的开发工具,让灵感创造持续发挥出来。”而更重要的是,在掌握这些软件技能后,应用可以部署在终端、部署在边缘计算、部署在数据中心的云计算,所有这些部署场景,都是机会。

  艾伟说,我们相信在一个全ARM的开发环境,以及全ARM的应用运行部署环境上,软件工程师会得到更高效率,以及更广阔的职业发展前景。





相关文章
Baidu
map