AI芯片将继续供不应求，全球布局引领AI风潮

2024-02-26 来源：贤集网

4379

英伟达近日发布2024财年第四财季及全年财报后，英伟达创始人、总裁兼首席执行官黄仁勋在回答分析师提问时表示，AI芯片供不应求的状况将贯穿全年。

黄仁勋称，总的来说我们的供应正在改善，供应链伙伴对英伟达的支持非常大，从晶圆，包装，存储，电源调节器，到收发器，网络和电缆等。

大家理解的英伟达GPU就是一个芯片，但其实Hopper架构GPU中有35000个零件，是非常复杂的东西，所以人们称它为人工智能超级计算机是有充分理由的。

我们预计供不应求的情况还将持续，并贯穿全年，但我们将尽最大努力缓解短缺问题。每当我们推出新产品的时候，是从零增长到非常大数字的过程，不可能在一夜之间做到这一点，增长是持续爬坡式的，不会一步到位，黄仁勋称。

目前我们正在努力实现H200的扩产，但不可能在短期内跟上需求，我们也在实现Spectrum-X的扩产，这款接入全球以太网的全新产品需求非常不错。

全新AI芯片横空出世

响应速度比英伟达快十倍以上

就在全世界还沉浸在Sora带来的视觉震撼时，AI圈又出了一个“王炸”产品，这一次是在芯片领域。

自从AI赛道大热以来，人们的关注点主要在各种大模型的竞争，OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面，似乎英伟达已经“一骑绝尘”，该公司生产的GPU芯片“一片难求”，全球AI厂商都争相求购。

不过就在当地时间20日，初创芯片企业Groq开放了免费试用，其芯片响应速度震撼了业界。搭载Groq芯片的大模型回复用户的速度极快，达到普通人打字速度的75倍，比英伟达芯片的响应速度快10倍以上。对于习惯了ChatGPT等AI产品“一个字一个字蹦出答案”的用户来说，如今看到AI模型生成文章的速度比“眨眼睛还快”，其震撼程度可想而知。

Groq在20日宣布对AI云服务平台进行免费开放体验，该公司官方账号还在社媒发文，鼓励粉丝积极参与互动。这次Groq在服务器上运行了Meta公司开发的Llama二代大模型等产品，因为和ChatGPT等闭源产品不同，Llama等模型是开源产品，允许其他厂商使用。

很快，体验了“无卡顿”状态的用户们对Groq发出了惊叹和赞美，“刷屏”了整个AI圈。比如，一位市场营销行业的用户截屏说明了自己的体验：Groq云服务平台针对他提出的专业领域问题，仅用4秒钟就生成了上千个英文单词的回答，而且这一回答真实可信，并附有注释和资料来源。

还有人用实验证明，Groq云服务平台搭配Llama2-70B模型，可以在7分钟之内打出和莎士比亚名篇《哈姆雷特》同样多单词量的文章，这一速度至少是普通人打字速度的75倍。有业界人士评论称，Groq芯片在响应速度上完全秒杀英伟达，给那些“喜欢低延迟体验”的用户带来了极大的惊喜。

在此之前，用户们已经普遍习惯了由英伟达芯片驱动下的AI大模型十分缓慢的答复速度，“就像看着对面打字的人一个字一个字地往外蹦出答案”。而在Groq云服务平台，用户可谓“目不暇接”，AI生成答案的速度远远超过肉眼阅读的速度。

专业测评显示，Groq芯片搭配Llama二代模型可以达到每秒近500个token，如果搭配其他小厂商的模型甚至能达到每秒700token的文字处理速度。而根据公开数据测算，英伟达旗下芯片驱动的GPT大模型的文字生成速度大约为每秒40个token。

众多科技巨头布局AI芯片

最近，全球最高市值的科技巨头微软宣布计划设计一款新的网卡芯片，意图替代英伟达在市场上的主流产品。外媒The information报道，微软的网卡芯片与英伟达的ConnectX-7卡类似，将其与GPU和 AI 芯片“捆绑”销售。

然而，微软并不是唯一一家自研AI芯片的科技巨头。亚马逊旗下的云计算部门AWS和社交媒体巨头Meta也在积极研发自家的AI芯片。

AWS推出的基于ARM架构的高性能计算服务器CPU芯片Graviton 3E和第五代Nitro网络芯片硬件，无疑是在增强其在云计算领域的竞争力。而Meta计划部署的第二代自研AI芯片Artemis，则显示了其在AI领域的野心。

此外，英伟达的另外一个重量级竞争对手华为，不仅积极部署AI芯片领域，而且还抢占了部分英伟达市场。英伟达CEO黄仁勋都表示，华为是英伟达AI芯片最大的竞争对手之一。

这些科技巨头纷纷入局AI芯片市场，无疑给英伟达带来了巨大的压力，这也引发了业界的广泛关注。

那么，面对如此多的竞争对手，英伟达的AI市场地位真的危险了吗？

当然，答案并非如此简单。英伟达在AI芯片领域的技术积累和市场份额仍然具有较大优势。其推出的DPU芯片和BlueField-3 SuperNIC等产品，在性能和功能上都有着不俗的表现。

而且，英伟达也在不断推出新的技术和产品，以满足市场需求并保持技术领先地位。此外，英伟达还拥有一批忠实的客户和合作伙伴，这些客户和合作伙伴对英伟达产品的信任和支持，也是英伟达在市场竞争中的重要优势。

然而，面对竞争对手的挑战和市场的变化，英伟达也需要不断调整自己的战略和产品线，以适应市场的需求和变化。

国内8家AI芯片厂商进展

近年在AI大势与国产替代东风下，国内AI芯片厂商抓住机遇加速发展，不仅百度、阿里巴巴、腾讯和华为等大厂加速自研AI芯片，而且AI芯片公司不断涌现，并深受资本市场青睐。

以下将盘点国内8家AI芯片厂商进展：

百度昆仑芯

百度对AI芯片的布局最早可以追溯到2011年，经过七年发展，2018年百度自研AI芯片——昆仑1正式亮相，采用14nm工艺与自研XPU架构，于2020年量产，主要应用于百度搜索引擎、小度等业务。2021年3月，百度昆仑芯片完成独立融资，同年8月，百度宣布第2代自研AI芯片——昆仑2正式量产，采用7nm制程，搭载自研的第二代XPU架构，相比1代性能提升2-3倍，通用性、易用性方面显著增强。

百度昆仑芯前两代的产品已有数万片部署，第三代产品有望在2024年4月举办的百度Create AI开发者大会上亮相。

阿里平头哥

阿里平头哥于2018年9月成立，是阿里巴巴全资半导体芯片业务主体，拥有端云一体全栈产品系列，涵盖数据中心芯片、IoT芯片、处理器IP授权等，实现芯片端到端设计链路全覆盖。

AI芯片布局上，阿里平头哥2019年9月推出了其首款高性能人工智能推理芯片——含光800，基于12nm工艺与自研架构，集成了170亿晶体管，性能峰值算力达820 TOPS。在业界标准的ResNet-50测试中，推理性能达到78563 IPS，能效比达500 IPS/W。

2023年8月，阿里平头哥发布了首个自研RISC-V AI平台，支持运行170余个主流AI模型，推动RISC-V进入高性能AI应用时代。同时，平头哥宣布玄铁处理器C920全新升级，C920执行GEMM（矩阵的矩阵乘法)计算较Vector方案可提速15倍。

2023年11月，阿里平头哥玄铁RISC-V上新了三款基于软硬协同新范式的处理器（C920、C907、R910），大幅提升了加速计算能力、安全性及实时性，有望加速推动RISC-V在自动驾驶、人工智能、企业级SSD、网络通信等场景和领域的大规模商用落地。

腾讯

2021年11月，腾讯宣布在三款芯片上已有实质性进展，分别为针对AI计算的紫霄、用于视频处理的沧海以及面向高性能网络的玄灵，其中紫霄已经流片成功并点亮。

据悉，紫霄采用自研存算架构和自研加速模块，可以提供高达3倍的计算加速性能和超过45%的整体成本节省。紫霄芯片为腾讯内部使用，不对外销售，腾讯通过其云服务出租算力获利。

近期，媒体报道知情人士称腾讯正考虑将紫霄V1作为英伟达A10芯片的替代品，用于AI图像和语音识别应用。此外，腾讯还将推出针对AI训练优化的紫霄V2 Pro芯片，以在未来取代英伟达L40S芯片。

华为

华为在2018全联接大会上提出了华为AI战略和全栈全场景AI解决方案，并发布了2颗全新的AI芯片：昇腾910（Ascend 910）和昇腾310（Ascend 310）。

两款AI芯片均基于华为自研达芬奇架构，其中Ascend 910（用于训练）采用7nm工艺，半精度达256TFOPs，功耗为350W，运算密度超越了英伟达Tesla V100和谷歌TPU v3。昇腾310属于Ascend-mini系列第一颗华为商用AI SoC芯片，面向边缘计算等低功耗领域。

基于昇腾910、昇腾310 AI芯片，华为还推出了Atlas AI计算解决方案。华为昇腾社区显示，目前 Atlas 300T 产品有三个型号，分别对应昇腾 910A、910B、910 Pro B，最大 300W 功耗，前两者 AI 算力均为 256 TFLOPS，而 910 Pro B 可达 280 TFLOPS（FP16）。据悉，华为昇腾芯片910B在2023年已经获得了大客户至少5000套的订单，预计会在2024年交付。业界认为，华为昇腾910B能力已经基本做到可对标英伟达A100。

由于国内对于华为昇腾910B等国产AI芯片的需求激增，路透社近期报道华为计划优先生产昇腾910B，而这可能将会影响到Mate 60系列所搭载的麒麟9000s芯片的产能。

寒武纪

寒武纪成立于2016年，专注于人工智能芯片产品的研发与技术创新，提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件，产品广泛应用于服务器厂商和产业公司。

成立以后，寒武纪推出多款芯片产品，覆盖终端、云端与边缘领域。其中终端芯片包括寒武纪1A、寒武纪1H、寒武纪1M 系列智能处理器；云端智能加速卡包括思元100、思元270、思元 290芯片和思元370；边缘智能加速卡包括思元220芯片。

其中，思元290智能芯片是寒武纪的首颗训练芯片，采用台积电7nm先进制程工艺，集成460亿个晶体管，支持MLUv02扩展架构，全面支持AI训练、推理或混合型人工智能计算加速任务。思元370则为该公司的主力产品，采用是7nm制程工艺，同时支持推理和训练任务。此外，思元370也是寒武纪首款采用chiplet(芯粒)技术的AI芯片，集成了390亿个晶体管，最大算力高达256TOPS(INT8)。

璧仞科技

壁仞科技创立于2019年，发展路径上，壁仞科技将首先聚焦云端通用智能计算，逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方案，实现国产高端通用智能计算芯片的突破。壁仞科技已完成B轮融资，总融资额超50亿元人民币，是国内成长势头最为迅猛的“独角兽”企业之一。

2021年，壁仞科技首款通用GPU芯片BR100系列正式交付开始流片，2022年3月BR100成功点亮，同年8月BR100正式发布。

据悉，BR100系列基于壁仞科技自主原创的芯片架构开发，采用成熟的7纳米工艺制程，集成770亿晶体管，16位浮点算力达到1000T以上、8位定点算力达到2000T以上，单芯片峰值算力达到PFLOPS级别。同时，BR100结合了包括Chiplet（芯粒技术）等在内的多项业内前沿芯片设计、制造与封装技术，具有高算力、高能效、高通用性等优势。

地平线

地平线是国内高效能智能驾驶计算方案提供商，于2015年7月成立，经过几年发展，陆续推出多款AI芯片，产品主要包含旭日与征程系列，其中旭日系列面向AIOT市场，征程系列面向智能驾驶领域。

目前旭日系列已经发展至第三代，旭日3M和旭日3E，分别对应高端和低端市场。性能方面，只需在 2.5W 的功耗下，旭日3能够达到等效 5TOPS 的标准算力，较前一代大幅升级。

征程系列目前已经迭代至第五代，征程5芯片于2021年发布，2022年9月全球首发量产，单颗芯片AI算力最高可达128 TOPS，支持16路摄像头，可满足车厂高级别自动驾驶的量产需求。

2023年11月，地平线宣布征程6系列将于2024年4月正式发布，并于2024年第四季度完成首批量产车型交付。据悉，已有多家车企与地平线达成意向合作，包括比亚迪、广汽集团、大众汽车集团旗下软件公司CARIAD、博世等汽车领域头部企业。

燧原科技

燧原科技于2018年3月成立，专注人工智能领域云端和边缘算力，成立5年多已建成云端训练和云端推理两条产品线，并开发出云燧®T10、云燧®T20/T21训练产品以及云燧®i10、云燧®i20等推理产品。

燧原科技已于2023年9月宣布完成D轮融资20亿元人民币，由上海国际集团旗下子公司及产业基金，包括国际资管、国鑫创投、国方创新、金浦投资旗下上海金融科技基金、国和投资联合领投，腾讯、美图公司、武岳峰科创、允泰资本、弘卓资本、红点中国、广发乾和、达泰资本、浦东投控等多家新老股东跟投。

另据媒体报道，燧原科技第三代AI芯片产品将于2024年初上市。

登入后，方可留言>>

行业动态

2024年终盘点丨这一年，我们推动政策落地见效

全球科研向“四极”前沿发展

2025年中国工业软件市场规模及国产化情况预测分析（图）

热读文章

苗圩出席统筹推进疫情防控和产业转型升级促进制造业通信业稳定发展发布会

一图读懂2020年《政府工作报告》

工业富联：拟7763万美元收购鸿海精密美国子公司相关资产