在接连甩出“大招”后,英伟达、英特尔、AMD在台北电脑展上一系列的重磅发布,让三雄之争愈加白热化。
除在AI重镇难以让英伟达“独美”的悍将AMD、英特尔相继发布了对标竞品MI300系列、Gaudi 3系列之外,围绕AI PC领域的擂台赛也再次开打,尤其是英伟达携深厚的生态积累染指AI PC的CPU市场,三强的全面战役也再次升级。
GPU对决激烈
在GPU界一骑绝尘的英伟达率先发布了一年升级一代GPU的蓝图,黄仁勋在演讲中宣布在3月GTC2024大会重磅发布的Blackwell架构现已开始投产,预计将于2024年晚些时候正式发货,而下一代Blackwell Ultra GPU将于2025年推出。
不止如此,再下一代AI平台名为“Rubin”,将于2026年发布,Rubin架构将首次支持8层HBM4高带宽存储。随后在2027年将推出Rubin Ultra GPU,将集成12颗HBM4版本。同时,英伟达也展示了代号“Vera”强大的新CPU,将与Rubin GPU同时推出,将组成Vera Rubin超级芯片,取代当前的Grace Hopper。
紧随之后,AMD也公布了新一代AI芯片。据AMD CEO苏姿丰介绍,其最新发布的AI芯片Instinct MI325X,计算性能是英伟达上一代H200的1.3倍,计划于2024年四季度上市。
英特尔CEO基辛格(Pat Gelsinger)在主题演讲中强调,英特尔将在AI扩张中发挥重要作用。Guadi 3作为英特尔今年4月推出的最新一代AI芯片,也计划于今年第三季度大范围上市。
在性能层面,相比英伟达H100,Gaudi 3的AI推理性能平均提高50%,能效平均提高40%。基准测试中,Gaudi 3可以在Llama2-7B、Llama2-13B模型中将训练时间缩短到英伟达H100的一半,同时推理吞吐量也比后者平均高出了50%。
基辛格认为,高性价比是Gaudi AI芯片的竞争优势。一套包含8个上一代Gaudi 2加速器的套件售价为6.5万美元,而包含8个Gaudi 3加速器的套装售价12.5万美元,按一台服务器配备8张芯片换算,每张Guadi3芯片约为1.5万美元。根据定制服务器供应商Thinkmate的数据,配备8颗英伟达H100 AI芯片的类似HGX服务器系统的成本可能超过30万美元。
Gartner此前预测,2024年全球AI芯片市场将增长33%达到713亿美元,2025年将再继续增长29%。有分析称,随着AMD、英特尔的追赶,AI芯片市场格局或将在未来两年内发生新的变化。
但要看到的是,英伟达在生成式AI时代一骑绝尘,绝不只是GPU的威力,而是积数年之功,打造的CUDA、NVlink、InfiniBand和以太网全平台体系,构建了无坚不摧的“全武行”。英特尔、AMD想要在这一市场撕开一道大口子,后续如何在生态、互联设计和能力上持续投入和优化将更是重中之重。
一年升级一代
尽管目前市场的厮杀声不绝于耳,但未来的竞夺则更是刀光剑影,为持续巩固战果,巨头们已着力将芯片迭代速率从“两年一迭代”升级到恐怖地一年一换血。
黄仁勋就着重说,英伟达将以“一年一代”的节奏推出新的AI芯片,目前这些芯片都处于100%的全面开发阶段。无论采用何种工艺、封装、内存、光学技术等等,英伟达将一切推向技术极限,所有芯片都100%兼容,丰富的软件也将持续扩容。
且不仅仅是GPU,而是构建整个平台,将整个平台集成到AI超级工厂中,以一年一个的节奏构建数据中心规模。
而在迭代节奏上,AMD也不甘示弱提出要保持“一年一迭代”的速度,与对手保持同频。
按照此规划,自从AMD于2023年6月首次推出MI300AI芯片后,每年都会推出一个新的产品系列,今年将推出采用第四代HBM3E的MI325X芯片,内存带宽提高一倍,效能提升1.3倍。2025年将推出基于新的CDNA 4架构的MI350系列,2026年再推出MI400系列。
相较之下,英特尔更是以实际行动来打擂台:除四年五个节点顺利推进之外,至强处理器甚至达到了半年一升级的程度,在去年7月推出全新的Gaudi2处理器之后,今年4月即升级到Gaudi3,惊人的速度背后也显现出半导体行业竞争的残酷程度只增不减。
无疑,这对巨头们架构、工艺、封装、软件和互联的考验也将全面升级。
AI PC开启新角逐
被称为AI PC元年的2024年,也让AI PC市场成为三强的新战场。
据Gartner最新发布的预测报告显示,2023 年全球AI芯片销售收入为536亿美元,2024年将同比增长33%至710亿美元,来自 AI PC、汽车和其他通用计算机设备的AI芯片收入将达334亿美元。AI PC将会引领2024年以后的AI芯片收入增长,预测2026年AI PC渗透率将达100%。
在这一领域最有话语权的英特尔自然大张旗鼓,在台北电脑展上高调发布了Lunar Lake处理器,相比上一代产品AI性能提升3倍,功耗降低了40%,将于今年第三季度正式亮相。其中一大亮点是,英特尔将两层LPDDR5X-8500内存直接封装集成,配置为16GB或32GB。这一设计变革能够使数据传输负载降低大约40%,从而大幅提升数据处理效率和速度。
英特尔还提到,对于有更多内存需求的客户来说,英特尔将于今年晚些时候发布Arrow Lake应对,并预计明年还将升级为Panther Lake。此外,英特尔还推出了AI PC开发套件,搭载Lunar Lake处理器、32GB LPDDR5内存、512GB存储等,这一套件后续也将升级支持未来的Panther Lake。
在PC CPU领域表现强劲的AMD,此番则带来全新AMD锐龙AI 300系列处理器,再一次树立了AI PC的新标杆。
此款处理器不仅升级Zen 5架构,还有升级版RDNA3.5架构的GPU和基于XDNA 2架构打造的全新NPU助阵,带来倍增的AI性能、大幅增强的传输效率和带宽以及快速的大模型响应速度,与同侪相比多项指标表现优异。此外,在2024年中将有150+的AI ISV提供商会对Ryzen AI引擎提供支持,这也意味着搭载锐龙AI 300移动处理器的笔记本将使用到这些强大的AI应用功能,这让AMD在AI PC这条竞争激烈的新赛道中,又向前迈了一大步。
尽管英伟达已接住“泼天的富贵”,但面临AI PC的巨大机遇当然不会错过这一趟新列车。英伟达以其在云端AI领域的统治地位,面对生成式AI开始从云端进入到边缘端的趋势,凭借其强大的GPU能力、近年来在自研Grace Arm CPU上积累的经验以及与产业链多年来的深度合作,也在全力挺进AI PC处理器领域。
有传言称,英伟达着手将推出将下一代 Arm Cortex CPU内核与其Blackwell GPU内核相结合的芯片,主要面向Windows on Arm的AI PC领域。
在AI PC这一赛道中,英特尔已然处于领先位置。有数据显示,到2024年第一季度,英特尔交付的AI PC处理器已超过所有竞争对手的总和。不过,在一年升级一代的指引下,未来的变数仍将丛生。