英特尔为中国市场定制了一张AI大型语言模型的“入场券”。英特尔
NVIDIA的AI GPU系列需求喷发,却因台积电CoWos先进封装产能严重不足,致使伺服器供应链订单不断涌入,至今却无法满足客户需求,遭美国封锁高阶AI晶片的中国,即使多家大厂倾全力加价下单 ,也抢不到足够的NVIDIA GPU。
近期出乎预期的是,伺服器供应链透露,英特尔(Intel)执行长Pat Gelsinger于7月前往中国访问期间,所推出的特供版AI处理器Habana Gaudi 2订单快速飙升,以往NVIDIA有多少拉多少的荣景,正複制在英特尔身上。
2022年9月,美国禁止先进AI晶片出口至中国及俄罗斯,受影响的是NVIDIA H100及A100晶片,及超微(AMD)MI250,NVIDIA为满足中国市场庞大需求,调整规格推出降规版的A800与H800晶片。
过去半年来,NVIDIA的AI GPU价量喷发,若非台积电CoWoS产能不足,NVIDIA与相关伺服器供应链成长爆发力将不仅于此。
值得注意的是,先前传出要连A800、H800一起入列封锁名单,更禁止NVIDIA的AI GPU系列销往中东国家,以防遭转销中国。虽然至今未获证实,但原本就拚命下单囤货的中国业者急寻替代方案,至少在未来2年能储备足够AI晶片。
供应链业者表示,不只是Meta、微软(Microsoft)、Google、AWS北美四大云端服务供应商(CSP)相当期待超微MI300系列面市抗衡NVIDIA独大地位,给予NVIDIA价格压力,中国业者亦期望超微推出降规版晶片。
MI300採用3D小晶片(Chiplet)设计,採用台积电5奈米制程,结合CDNA 3架构GPU、6奈米IO晶片和HBM小晶片,整体性价比不输NVIDIA,但在GPU串联与生态系仍远不及NVIDIA,最重要是盛传2024年上半才会放量,因此现阶段完全难以登板救援。
据供应链业者透露,由于NVIDIA未来出口中国全面遭禁的可能性不低,而超微MI300系列至未面市,也使得英特尔抢下好机会。 英特尔在中国市场推出的“特供版”Gaudi 2连月来订单不断急升。
Gaudi 2採用台积电7奈米制程,英特尔现已向台积电大追单,据了解,订单能见度已至2024年中,下一代採用台积电5/4奈米制程Gaudi 3也加速2024年上市时程。以此估算,Gaudi 2等系列可望助力英特尔在AI战局有所发挥,对于资料中心平台营收止跌功不可没。
以往业界普遍认为,生成式AI和大型语言模型(LLM)仅能在NVIDIA GPU上执行,对此英特尔也释出数据资料指出,英特尔的AI解决方案可为希望摆脱封闭生态系的客户,提供极具竞争力的选项。
以Habana Gaudi 2为基础的软体和系统,其训练成熟度在GPT-3上获得大规模的证实,相较NVIDIA H100而言,也为客户提供极具竞争力的伺服器和系统成本优势。
英特尔15年前就投入AI研发,2019年砸20亿美元收购以色列Habana Labs,Habana号称Gaudi晶片处理能力是GPU数倍,再加上既有资料中心平台优势,英特尔正全力加速追赶NVIDIA。
值得注意的是,NVIDIA、超微MI300,及英特尔Gaudi 2与下一代晶片,皆由台积电7/5奈米家族所代工,未来3/2奈米亦在洽淡中,三大厂亦与台伺服器供应链紧紧相依。
另外,英特尔的Gaudi 2/3延续过去Habana与世芯的合作,台积大联盟也成为此波AI平台大战受益者。