英伟达禁令之后，中国AI计算何去何从？

2023-11-06 来源：脑极体

932

10月17日，美国加强了面向中国市场的AI芯片禁令。其中明确将性能、密度作为出口管制标准，将单芯片超过300teraflops算力，以及性能密度超过每平方毫米370 gigaflops的芯片都纳入了禁止出口行列。

虽然在这一禁令下，AMD、英特尔等公司提供的高端AI芯片也受到影响。但由于英伟达在全球AI芯片领域一家独大，本次禁令涉及A100、H100等主流AI训练用英伟达GPU，因此这次的芯片禁令也被称为“英伟达禁令”。

消息一出，立刻引起了AI产业的热议。但讨论大多集中在禁令何时施行，是否有缓冲地带，具体涉及哪些GPU型号，禁令期限是多久等。这就导致一个显而易见的宏观背景被忽略了：自贸易摩擦发生以来，中美经贸关系虽然时有波动，但面向中国的芯片管控却始终有增无减。尤其是高端AI芯片禁令，在诸多争议中依旧被坚定推行。

至此，AI行业似乎已经必须形成一个基本的共识：抛弃幻想，准备斗争。

与其斤斤计较哪些GPU被禁，是否有解禁可能。不如重新审视在芯片铁幕时代下，中国AI计算究竟何去何从？

本文希望从目前的产业局面出发，和大家一起思考AI计算的前行之路。

目前的局面

首先我们必须了解一个问题，那就是为什么这次英伟达禁令出台之后，大众舆论与AI行业的反应都没有18、19年芯片封锁刚开始时严重。似乎只有在消费级显卡RTX 4090是否被禁问题上，引发了游戏玩家和相关商家的一些争论。

这背后的宏观逻辑在于，行业是非常不愿意看到高端AI芯片被禁售的，但其实也对这种局面早有预料。一方面是美国对华芯片封锁推动多年，此前英伟达部分高端GPU已经被禁，产业界的反馈早就从惊愕调整为了泰然处之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看涨，随之而来的是美国方面屡次表态要推动对华整体性的高端AI芯片禁售。虚虚实实几个月之后，最终落下一锤也不外如是。

为了应对这次可预见的禁令，同时也有大模型发展的客观推动，去年年底到今年上半年大量中国科技、金融、汽车等领域的企业集中囤货英伟达高端GPU，已经造成了市面上一卡难求的局面。换句话说，对于很多中国中小型科技企业、AI创业公司来说，高端GPU本就买不到，禁售之后并没有太多改变。

另外一个真实情况是，高端AI芯片并非无法国产化。早在18、19年贸易摩擦开始之后，国内AI芯片产业加速发展。这就导致在AI训练需求上，英伟达高端GPU虽然很难被替代，但并非不可替代。

加上AI芯片并不像手机芯片那样事关大众消费者，且华为已经在手机芯片上完成了突破。种种迹象合在一起，导致无论是大众还是行业，都对这次禁令产生了一种坦然，甚至有点见怪不怪的心态。

但必须客观看到的是，这次禁令绝非对中国AI行业没有伤害。一方面短期内更换英伟达GPU，无论在芯片产能、生态兼容性等问题上都非常困难。并且禁令还将直接在AI服务器等领域，给大规模使用英伟达产品的厂商造成伤害。

而更关键的问题在于未来，如果禁令长期存在，中国AI计算将逐渐与全球高端芯片脱钩，那么可能带来的长期负面影响是非常复杂的，比如说：

1.英伟达高端GPU代表的AI芯片在更新迭代之后，是否会造成中国AI算力的发展脱节？

2.底层算力出现发展分歧后，中国AI产业是否会在大模型等软件技术发展中掉队？

3.本次AI芯片禁令，已经呈现出大规模封锁的特征。这种科技封锁真的只会停留在AI芯片领域吗？通用算力、存储、基础软件等数字化基础能力是否将成为接下来的打击目标？

总而言之，这次的AI芯片禁令，对中国来说是一次有准备的博弈，而非一场奇袭。想要成功度过这一关，也需要将手中的每一张牌都打好，打出配合，从而降低伤害烈度，提升长期发展的胜率。

而就目前来看，中国AI计算有三项必须同时发力的“突围方案”。

方案1：用好“买家”身份

有个简单的道理，商业市场的行为逻辑是由供需决定的。但在以芯片为代表的中美科技贸易中，我们经常会陷入一个思维误区：认为绝大部分游戏规则是由美国政府和企业制定的，他们想卖我们就买，他们不想买我们就无奈。

作为全球芯片市场的最大“买家”，中国企业却没有话语权，这是非常荒谬的。

事实上，针对中国市场的AI芯片禁令，最直接伤害的就是以英伟达为代表的美国科技巨头。目前，英伟达AI芯片方面最大市场需求来自中国。此前英伟达CEO黄仁勋就明确表示，“如果被剥夺了中国市场，我们是没有应急措施的，世界上没有另一个中国”。

在这种情况下，我们能看到追求商业利益的美国科技公司，与追求政治利益的美国政府之间有着鲜明的矛盾。美国科技企业总是想方设法寻求反对禁令和绕过禁令，比如英伟达就从去年开始推出了应对禁运政策的中国特供版GPU。

中国市场，消化了美国科技企业约三分之一的产能，二者之间的供需纽带是无法长期割裂的。面对美国愈发明显的整体性科技封禁，中国市场也应该积极用好“买家”身份，让自身的行为更具鲜明立场与可预测性。

避免造成一种“卖了就欢迎，不卖只能无奈”的表现和印象。

“买家身份”应该是一种有立场、有力量且会愤怒的身份。

方案2：以云代卡，算力集中

在可见的较长时间里，美国对中国的AI芯片封禁恐怕都只会加强，而这个时机恰好对应上AI大模型发展的关键阶段。很多业内人士认为，大模型发展虽快，但没有呈现出此前其他科技风口的迅猛局面，投资缺钱，计算缺卡是主要原因。

那么如何解决中国AI产业在禁令之下的算力缺口问题呢？首先的应急方案就是企业加大云端AI算力的配置和投入，推进以云代卡。

事实上，在高端AI芯片可能被禁的大趋势下，中国几大公有云厂商都做出了加强囤积英伟达高端GPU的动作。这一方面是因为云厂商自身要加大大模型投入，打开MaaS市场，所以对AI算力有直接需求。另一方面也是因为GPU转化为云资源池之后可以长期复用，对于云厂商来说是一个进可攻，退可守的局面。因此，今年上半年一度出现了市面上高端AI芯片全都流向云厂商，中小企业一卡难求的局面。

客观来看，这种高端AI芯片集中向云的举动，对整个中国市场统筹应对AI芯片禁令是有利的，并且也符合东数西算的战略思路。

另一个利好云端AI算力的趋势在于，随着大模型参数和使用数据量的不断加大。本地化的卡池训练已经愈发吃紧。必须在云端发生的千卡、万卡训练成为未来主要的发展方向，因此企业用户天然会更积极走向云端。

同时，云端AI算力也不会仅仅停留在囤积英伟达GPU的层面。接下来，国产的自主AI算力驶入云端是大势所趋。在相关政策的推动下，云厂商正在加大自主AI芯片的采购力度。根据IDC数据，2023年上半年中国AI服务器已经使用了50万块自主开发的AI加速器芯片。在自主AI算力的服务化方面，华为云已经推出了昇腾AI云服务。云端化与自主化结合的AI算力，将在AI芯片禁令背景下得到极大发展。

加上近些年在东数西算大背景下，各地陆续建立了大量采用自主AI算力的AI计算中心，整体来看中国的云端AI算力是供给稳定、保障可靠的。

而很多企业依旧倾向于采购本地AI算力。这一方面是因为英伟达GPU市场紧缺，保值性特别好，甚至能作为企业的核心资产。另一方面是因为云端AI算力往往会有排队、宕机、软件服务缺失等问题。

如何进一步提高开发者的云端AI算力使用体验，是公有云厂商接下来需要发力的方向。

方案3：让国产AI算力爆发式成长

面对新一轮AI芯片禁令，中国AI产业最大的底气是什么？是多年之后的习以为常，还是大量屯卡之后的家有余粮？都不是。最关键的节点在于经过多年发展，中国AI芯片产业已经得到了巨大发展。英伟达的高端GPU确实依旧重要，但已经不是毫无替代选项可言。

根据IDC此前发布的数据，2022年中国AI加速卡出货量约为109万张，其中英伟达市场份额达到了85%，华为昇腾实市场占有率10%，百度昆仑为2%，寒武纪和燧原科技均为1%。

从中可以看出，国产AI算力已经实现了一定程度的市场占比，而不仅仅是概念与理论中的“纸上谈兵”。同时也应该看到，国产AI芯片在核心性能、软件生态以及出货能力上依旧不理想，还有很长的路要走。在英伟达禁令的客观条件倒逼下，国产AI算力必须在短期内跨越这些困难，加速自身的成长与成熟周期。

为了实现这个目标，有几件事非常重要：

1.形成产业共识，避免概念混淆。

提起AI芯片，我们经常会说它有非常多的实现方式，有很多自主品牌参与这个市场，看上去一片繁荣。比如AI芯片有GPU、FPGA、ASIC、存算一体和类脑芯片等，国产AI加速芯片厂商有阿里、百度、华为、寒武纪、海光信息、燧原科技、天数智芯、壁仞科技、摩尔线程、龙芯中科等。

这种“繁荣”的表述，不仅在大众舆论和投资市场上具有迷惑性，还经常出现在一些行业报告与政策分析当中。但其中蕴藏的问题在于，普遍过分拓展了AI芯片的定义。比如说，类脑芯片在可见的未来中都仅仅是技术畅想，如果每次讨论国产AI芯片都把类脑加上，那只会浪费时间，分散精力。再比如，有些AI芯片厂商只能做自用芯片，无法面向市场出货。有些厂商目前还不具备商业化能力，处在早期建设阶段，他们短期内对于AI计算自主化的贡献也就非常之小。

为了应对英伟达高端GPU禁售问题，我们需要把目光集中在可行、有效的GPU替代品上，而不是进行过多联想和发散。只有形成了这一产业共识，才能聚集力量解决问题。

2.走向规模化商用，避免PPT造芯。

事实上，无论从AI加速芯片还是服务器整机来看，国内目前能够出货的AI芯片厂商都寥寥无几。主要集中在华为、百度两家，燧原科技、海光信息也有一定的出货。而大量半导体厂商与AI企业，更多还停留在打造芯片的计划与愿景上。这就导致大量受到政策支持与投资市场期待的国产AI芯片停滞不前，甚至有停留在这一阶段享受金融市场红利的嫌疑。

接下来的产业导向，应该从AI芯片的立项走向出货，帮助AI芯片厂商获得直接的商业回馈，产品与产能接受市场检验，逐步塑造正向的现金流。

3.加强软件生态，强化迁移能力。

英伟达GPU之所以重要，不仅在于硬件性能，更在以CUDA、PyTorch为核心的软件生态能力，因此发展国产AI芯片绝不能低估软件的能力。在强化自主软件生态建设的同时，也要重视基于英伟达生态打造AI模型的迁移能力与迁移成本。

为此，已经有大量厂商进行了探索，比如海光信息的DCU，就在生态、编程环境等方面与CUDA高度相似，CUDA用户可以以较低代价快速迁移至海光的ROCm平台。而在此前，PyTorch2.1 版本宣布支持华为昇腾。可见国产AI芯片已经具备了一定的规模化影响力，可以更多融入全球软件生态当中。

未来想要实现国产AI计算的爆发，是无法离开国产AI基础软件生态爆发的。

4、加大对“主品牌”支持，形成规模化效应。

对于美国AI芯片，除了英伟达GPU，你还知道哪些？这个问题即使是问一些AI开发者，答案也很大程度是不清楚，或者没试过。从中可见，AI计算就像通用计算、图形计算一样，极大概率是会最终出现一到两个“主品牌”的。这属于客观的市场规律，没有必要以揠苗助长的方式实现“百花齐放”的局面。

甚至就目前中国AI计算必须加速成熟，完成自主化替代的目标来说，尽快实现一超多强的局面是件好事。这可以避免生态割裂，避免产业在摇摆形成大量IT投资浪费。这个过程理应交给市场选择，慢慢成型。但在芯片禁令的大背景下，国产AI计算崛起已经时不我待，与其让100种AI芯片慢慢成熟，慢慢洗牌，比如加速形成“主品牌”快速替代的局面。