欢迎访问
AI芯片将继续供不应求,全球布局引领AI风潮
2024-02-26 来源:贤集网
3917

关键词: AI芯片 GPU

英伟达近日发布2024财年第四财季及全年财报后,英伟达创始人、总裁兼首席执行官黄仁勋在回答分析师提问时表示,AI芯片供不应求的状况将贯穿全年。

黄仁勋称,总的来说我们的供应正在改善,供应链伙伴对英伟达的支持非常大,从晶圆,包装,存储,电源调节器,到收发器,网络和电缆等。

大家理解的英伟达GPU就是一个芯片,但其实Hopper架构GPU中有35000个零件,是非常复杂的东西,所以人们称它为人工智能超级计算机是有充分理由的。



我们预计供不应求的情况还将持续,并贯穿全年,但我们将尽最大努力缓解短缺问题。每当我们推出新产品的时候,是从零增长到非常大数字的过程,不可能在一夜之间做到这一点,增长是持续爬坡式的,不会一步到位,黄仁勋称。

目前我们正在努力实现H200的扩产,但不可能在短期内跟上需求,我们也在实现Spectrum-X的扩产,这款接入全球以太网的全新产品需求非常不错。


全新AI芯片横空出世

响应速度比英伟达快十倍以上


就在全世界还沉浸在Sora带来的视觉震撼时,AI圈又出了一个“王炸”产品,这一次是在芯片领域。

自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。

不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速度震撼了业界。搭载Groq芯片的大模型回复用户的速度极快,达到普通人打字速度的75倍,比英伟达芯片的响应速度快10倍以上。对于习惯了ChatGPT等AI产品“一个字一个字蹦出答案”的用户来说,如今看到AI模型生成文章的速度比“眨眼睛还快”,其震撼程度可想而知。

Groq在20日宣布对AI云服务平台进行免费开放体验,该公司官方账号还在社媒发文,鼓励粉丝积极参与互动。这次Groq在服务器上运行了Meta公司开发的Llama二代大模型等产品,因为和ChatGPT等闭源产品不同,Llama等模型是开源产品,允许其他厂商使用。

很快,体验了“无卡顿”状态的用户们对Groq发出了惊叹和赞美,“刷屏”了整个AI圈。比如,一位市场营销行业的用户截屏说明了自己的体验:Groq云服务平台针对他提出的专业领域问题,仅用4秒钟就生成了上千个英文单词的回答,而且这一回答真实可信,并附有注释和资料来源。

还有人用实验证明,Groq云服务平台搭配Llama2-70B模型,可以在7分钟之内打出和莎士比亚名篇《哈姆雷特》同样多单词量的文章,这一速度至少是普通人打字速度的75倍。有业界人士评论称,Groq芯片在响应速度上完全秒杀英伟达,给那些“喜欢低延迟体验”的用户带来了极大的惊喜。

在此之前,用户们已经普遍习惯了由英伟达芯片驱动下的AI大模型十分缓慢的答复速度,“就像看着对面打字的人一个字一个字地往外蹦出答案”。而在Groq云服务平台,用户可谓“目不暇接”,AI生成答案的速度远远超过肉眼阅读的速度。

专业测评显示,Groq芯片搭配Llama二代模型可以达到每秒近500个token,如果搭配其他小厂商的模型甚至能达到每秒700token的文字处理速度。而根据公开数据测算,英伟达旗下芯片驱动的GPT大模型的文字生成速度大约为每秒40个token。



众多科技巨头布局AI芯片

最近,全球最高市值的科技巨头微软宣布计划设计一款新的网卡芯片,意图替代英伟达在市场上的主流产品。外媒The information报道,微软的网卡芯片与英伟达的ConnectX-7卡类似,将其与GPU和 AI 芯片“捆绑”销售。

然而,微软并不是唯一一家自研AI芯片的科技巨头。亚马逊旗下的云计算部门AWS和社交媒体巨头Meta也在积极研发自家的AI芯片。

AWS推出的基于ARM架构的高性能计算服务器CPU芯片Graviton 3E和第五代Nitro网络芯片硬件,无疑是在增强其在云计算领域的竞争力。而Meta计划部署的第二代自研AI芯片Artemis,则显示了其在AI领域的野心。

此外,英伟达的另外一个重量级竞争对手华为,不仅积极部署AI芯片领域,而且还抢占了部分英伟达市场。英伟达CEO黄仁勋都表示,华为是英伟达AI芯片最大的竞争对手之一。

这些科技巨头纷纷入局AI芯片市场,无疑给英伟达带来了巨大的压力,这也引发了业界的广泛关注。

那么,面对如此多的竞争对手,英伟达的AI市场地位真的危险了吗?

当然,答案并非如此简单。英伟达在AI芯片领域的技术积累和市场份额仍然具有较大优势。其推出的DPU芯片和BlueField-3 SuperNIC等产品,在性能和功能上都有着不俗的表现。

而且,英伟达也在不断推出新的技术和产品,以满足市场需求并保持技术领先地位。此外,英伟达还拥有一批忠实的客户和合作伙伴,这些客户和合作伙伴对英伟达产品的信任和支持,也是英伟达在市场竞争中的重要优势。

然而,面对竞争对手的挑战和市场的变化,英伟达也需要不断调整自己的战略和产品线,以适应市场的需求和变化。


国内8家AI芯片厂商进展

近年在AI大势与国产替代东风下,国内AI芯片厂商抓住机遇加速发展,不仅百度、阿里巴巴、腾讯和华为等大厂加速自研AI芯片,而且AI芯片公司不断涌现,并深受资本市场青睐。

以下将盘点国内8家AI芯片厂商进展:


百度昆仑芯

百度对AI芯片的布局最早可以追溯到2011年,经过七年发展,2018年百度自研AI芯片——昆仑1正式亮相,采用14nm工艺与自研XPU架构,于2020年量产,主要应用于百度搜索引擎、小度等业务。2021年3月,百度昆仑芯片完成独立融资,同年8月,百度宣布第2代自研AI芯片——昆仑2正式量产,采用7nm制程,搭载自研的第二代XPU架构,相比1代性能提升2-3倍,通用性、易用性方面显著增强。

百度昆仑芯前两代的产品已有数万片部署,第三代产品有望在2024年4月举办的百度Create AI开发者大会上亮相。


阿里平头哥

阿里平头哥于2018年9月成立,是阿里巴巴全资半导体芯片业务主体,拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT芯片、处理器IP授权等,实现芯片端到端设计链路全覆盖。

AI芯片布局上,阿里平头哥2019年9月推出了其首款高性能人工智能推理芯片——含光800,基于12nm工艺与自研架构,集成了170亿晶体管,性能峰值算力达820 TOPS。在业界标准的ResNet-50测试中,推理性能达到78563 IPS,能效比达500 IPS/W。

2023年8月,阿里平头哥发布了首个自研RISC-V AI平台,支持运行170余个主流AI模型,推动RISC-V进入高性能AI应用时代。同时,平头哥宣布玄铁处理器C920全新升级,C920执行GEMM(矩阵的矩阵乘法)计算较Vector方案可提速15倍。

2023年11月,阿里平头哥玄铁RISC-V上新了三款基于软硬协同新范式的处理器(C920、C907、R910),大幅提升了加速计算能力、安全性及实时性,有望加速推动RISC-V在自动驾驶、人工智能、企业级SSD、网络通信等场景和领域的大规模商用落地。



腾讯

2021年11月,腾讯宣布在三款芯片上已有实质性进展,分别为针对AI计算的紫霄、用于视频处理的沧海以及面向高性能网络的玄灵,其中紫霄已经流片成功并点亮。

据悉,紫霄采用自研存算架构和自研加速模块,可以提供高达3倍的计算加速性能和超过45%的整体成本节省。紫霄芯片为腾讯内部使用,不对外销售,腾讯通过其云服务出租算力获利。

近期,媒体报道知情人士称腾讯正考虑将紫霄V1作为英伟达A10芯片的替代品,用于AI图像和语音识别应用。此外,腾讯还将推出针对AI训练优化的紫霄V2 Pro芯片,以在未来取代英伟达L40S芯片。


华为

华为在2018全联接大会上提出了华为AI战略和全栈全场景AI解决方案,并发布了2颗全新的AI芯片:昇腾910(Ascend 910)和昇腾310(Ascend 310)。

两款AI芯片均基于华为自研达芬奇架构,其中Ascend 910(用于训练)采用7nm工艺,半精度达256TFOPs,功耗为350W,运算密度超越了英伟达Tesla V100和谷歌TPU v3。昇腾310属于Ascend-mini系列第一颗华为商用AI SoC芯片,面向边缘计算等低功耗领域。

基于昇腾910、昇腾310 AI芯片,华为还推出了Atlas AI计算解决方案。华为昇腾社区显示,目前 Atlas 300T 产品有三个型号,分别对应昇腾 910A、910B、910 Pro B,最大 300W 功耗,前两者 AI 算力均为 256 TFLOPS,而 910 Pro B 可达 280 TFLOPS(FP16)。据悉,华为昇腾芯片910B在2023年已经获得了大客户至少5000套的订单,预计会在2024年交付。业界认为,华为昇腾910B能力已经基本做到可对标英伟达A100。

由于国内对于华为昇腾910B等国产AI芯片的需求激增,路透社近期报道华为计划优先生产昇腾910B,而这可能将会影响到Mate 60系列所搭载的麒麟9000s芯片的产能。


寒武纪

寒武纪成立于2016年,专注于人工智能芯片产品的研发与技术创新,提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件,产品广泛应用于服务器厂商和产业公司。

成立以后,寒武纪推出多款芯片产品,覆盖终端、云端与边缘领域。其中终端芯片包括寒武纪1A、寒武纪1H、寒武纪1M 系列智能处理器;云端智能加速卡包括思元100、思元270、思元 290芯片和思元370;边缘智能加速卡包括思元220芯片。

其中,思元290智能芯片是寒武纪的首颗训练芯片,采用台积电7nm先进制程工艺,集成460亿个晶体管,支持MLUv02扩展架构,全面支持AI训练、推理或混合型人工智能计算加速任务。思元370则为该公司的主力产品,采用是7nm制程工艺,同时支持推理和训练任务。此外,思元370也是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8)。


璧仞科技

壁仞科技创立于2019年,发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理、图形渲染等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。壁仞科技已完成B轮融资,总融资额超50亿元人民币,是国内成长势头最为迅猛的“独角兽”企业之一。

2021年,壁仞科技首款通用GPU芯片BR100系列正式交付开始流片,2022年3月BR100成功点亮,同年8月BR100正式发布。

据悉,BR100系列基于壁仞科技自主原创的芯片架构开发,采用成熟的7纳米工艺制程,集成770亿晶体管,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。同时,BR100结合了包括Chiplet(芯粒技术)等在内的多项业内前沿芯片设计、制造与封装技术,具有高算力、高能效、高通用性等优势。


地平线

地平线是国内高效能智能驾驶计算方案提供商,于2015年7月成立,经过几年发展,陆续推出多款AI芯片,产品主要包含旭日与征程系列,其中旭日系列面向AIOT市场,征程系列面向智能驾驶领域。

目前旭日系列已经发展至第三代,旭日3M和旭日3E,分别对应高端和低端市场。性能方面,只需在 2.5W 的功耗下,旭日3能够达到等效 5TOPS 的标准算力,较前一代大幅升级。

征程系列目前已经迭代至第五代,征程5芯片于2021年发布,2022年9月全球首发量产,单颗芯片AI算力最高可达128 TOPS,支持16路摄像头,可满足车厂高级别自动驾驶的量产需求。

2023年11月,地平线宣布征程6系列将于2024年4月正式发布,并于2024年第四季度完成首批量产车型交付。据悉,已有多家车企与地平线达成意向合作,包括比亚迪、广汽集团、大众汽车集团旗下软件公司CARIAD、博世等汽车领域头部企业。


燧原科技

燧原科技于2018年3月成立,专注人工智能领域云端和边缘算力,成立5年多已建成云端训练和云端推理两条产品线,并开发出云燧®T10、云燧®T20/T21训练产品以及云燧®i10、云燧®i20等推理产品。

燧原科技已于2023年9月宣布完成D轮融资20亿元人民币,由上海国际集团旗下子公司及产业基金,包括国际资管、国鑫创投、国方创新、金浦投资旗下上海金融科技基金、国和投资联合领投,腾讯、美图公司、武岳峰科创、允泰资本、弘卓资本、红点中国、广发乾和、达泰资本、浦东投控等多家新老股东跟投。

另据媒体报道,燧原科技第三代AI芯片产品将于2024年初上市。



Baidu
map