看不下去英伟达的垄断,科技巨头们联合出手了。
据科技媒体TechCrunch最新消息,英特尔、谷歌、微软、Meta、AMD、惠普、博通、思科联合成立了一个新的行业组织——UALink促进会(the Ultra Accelerator Link Promoter Group,超级加速器链接促进会),该组织正在提议制定一项新的行业标准,应用于数据中心里AI芯片之间的互联。
提议标准的第一个版本UALink 1.0将通过单个计算“Pod(舱,服务器中的一个或者多个机架)”连接多达1024个AI芯片(仅限GPU)。据UALink促进会称,UALink 1.0基于包括AMD的Infinity Fabric在内的“开放标准” ,将允许在连接到的AI芯片的内存之间进行直接加载和存储,与现有互连规范相比,可以提高速度并降低数据传输延迟。
同时,该组织表示,将在今年第三季度成立“UALink联盟”,以监督UALink规范未来的发展;UALink 1.0将在同一时间向加入该联盟的公司提供,带宽更高的更新规范UALink 1.1则将于今年第四季度推出。
联合制定AI加速器连接标准,挑战英伟达
除以上公司外,该组织成员还包括AMD、惠普企业、博通和思科等,Arm尚未参加。UALink推广组正在提出一项新的行业标准,以连接日益增多的服务器中的AI加速器芯片。
“行业需要一个可以快速推进的开放标准,这种标准允许多家公司为整个生态系统增加价值,”AMD数据中心解决方案总经理Forrest Norrod表示。“行业需要一个允许创新快速进行且不受任何单一公司限制的标准。”
广义上讲,AI加速器是指GPU及其他定制设计的解决方案,用于加速AI模型的训练、微调和运行的芯片。UALink提议的标准版本一,UALink 1.0,将连接多达1024个GPU AI加速器,组成一个计算“集群”(pod),意指服务器中的一个或多个机架。根据UALink推广组的说法,基于包括AMD的Infinity Fabric在内的“开放标准”,UALink 1.0将允许AI加速器所附带的内存之间的直接加载和存储,并且与现有互连规范相比,总体上将提高速度,同时降低数据传输延迟,。
该组织表示,将在第三季度创建一个名为UALink的联盟,以监督UALink规范的发展。UALink 1.0将在同一时间段内向加入联盟的公司提供,而带有更高带宽的迭代版规范UALink 1.1,预计将在2024年第四季度推出。Norrod表示,第一批UALink产品将在“未来几年内”推出。
分析认为,由于明显缺少了当今最大的AI加速器生产商英伟达,该组织的成立就是为了挑战英伟达在AI领域一家独大的地位。目前,英伟达AI加速器的市场占有率估计在80%到95%。
目前英伟达对此事未予置评,但很明显,该公司并不热衷于支持UALink。分析认为,英伟达已经为数据中心服务器内的GPU链接提供了自己的专有互连技术,所以可能不太愿意支持基于竞争对手技术的规范。
英伟达被全世界眼红
目前全球的AI芯片巨头,不管是中国AI芯片巨头,还是美国AI芯片巨头,都在围攻英伟达,想要分一杯羹。
先说美国芯片巨头,有英特尔、meta、谷歌、AMD等。
谷歌(Google)之前发布了面向云端AI加速的TPU v5p ,能提供918 teraOPS(每秒可执行918万亿次整数运算)的Int8(执行8位整数)性能。
英特尔之前发布了芯片产品 Gaudi 3 AI 加速卡,据称其性能是英伟达H100的1.5倍左右,剑指英伟达。
而meta近日,重磅宣布推出第二代自研AI训练和推理芯片MTIA v2。稀疏算力达到708TFLOPS,也是剑指H100。
AMD就不用说了,本来就推出了各种AI芯片,是英伟达最强劲的对手之一,可见美国这些AI巨头们,纷纷下场,抢英伟达的市场和份额。
而在中国,AI芯片巨头们,也是同样在替代英伟达,并且中国和美国的情况还不一样,中国大陆买不到英伟达的高端芯片,像H100、A100、H200等都买不到。
现在能买到的最强的只有H20,它只有A100性能的50%,只有H100性能的20%。
于是像华为的昇腾芯片、海光的DCU等AI芯片,更是纷纷替代英伟达的芯片,特别是华为昇腾910,其性能达到了A100的性能,是H20的2倍。
这些国产AI芯片,同样受到了国内AI厂商的青睐,很多人用这些国产AI芯片来替代英伟达的AI芯片。
不过大家也清楚,替代英伟达的AI芯片容易,但要替代英伟达的CUDA生态较难,因为目前市面上90% AI应用,AI算法,大多是CUDA下训练出来的,离开CUDA啥都不是。
那么这又该怎么办呢?于是intel、谷歌、ARM、高通等,又想了一招,那就是成立了一个UXL联盟,剑指英伟达的CUDA,要搞一个统一的、开放的AI生态。
UXL联盟想的非常好,那就是搞一套可以运行在任何GPU芯片上的AI生态,不用GPU芯片的限制,这样就能打破英伟达的垄断了,以后只要谁推出了很强的AI芯片,就能不受生态限制,直接狂飙,受到市场的喜欢。
很明显,从现在的情况来看,AI芯片市场的竞争在接下来的几年,会愈演愈烈,参与的厂商也会越来越多,按照机构的预计,到2035年,AI将为全球贡献近90万亿元的经济价值。
英伟达又要被迫放弃一大市场
据报道,美国政府日前已放缓向英伟达、AMD、英特尔和Cerebras等4家美国公司向中东出口AI芯片的许可证,并对该地AI发展进行国家安全检查,主要原因是担心相关受限的AI芯片最终流向中国。
报道称,美国特别关注大量AI芯片销售的走向,因为阿联酋和沙特阿拉伯等国都希望大量进口AI数据中心芯片。目前,美国政府官员们正在对该地区的 AI 开发进行国家安全评估,但尚不清楚评估需要多长时间,怎样才算大批量出口也没有具体定义。
截至发稿前,上述提及的四家公司均不予置评。
据悉,英伟达所提出的 AI 加速计算芯片,是当前 AI 大模型和生成式 AI 技术领域的关键基础设施。去年10月,美国商务部将中国、以及中东大部分地区等纳入到芯片出口管制范围。因此相关美国AI芯片厂商需要获得美国政府的特别许可,才能出口先进的AI芯片和芯片制造设备给这些国家。
但是,过去几周,相关许可证申请都被延后或者不给回复。消息人士称,美国企业尝试向阿联酋、沙特阿拉伯和卡塔尔客户销售产品的公司都受到了影响。而美国目的是增加审查时间,以在海外部署先进芯片出口的全面策略,包括商讨谁来管理和保护用于训练AI模型的设施。
对此消息,美国商务部称,最优先考虑国家安全。对于最先进技术,将彻底调查先进技术运往世界各地的许可证申请,并致力于与中东乃至各国的伙伴合作,保护技术生态系统。
值得一提的是,美国商务部出口管理部门负责人 Thea Kendler本月初访问了阿联酋、沙特阿拉伯、卡塔尔和科威特。其中,在阿联酋,她表示在半导体出口管制方面的合作取得了关键进展。
目前,阿联酋和沙特一直在争夺AI领导地位,以减缓经济过度仰赖石油,两国都将美国视为重要合作伙伴,因此会满足美国要求。但是,沙特刚与中国联想集团达成协定,将在沙国首都利雅得建立研发中心,因此后续发展仍有待观察。
与此同时,微软也宣布向总部位于阿布扎比的AI公司G42投资15亿美元,能否顺利获得出口许可证将是关键问题。