大模型竞争升温，AI芯片管制难以限制发展

2023-04-18 来源：天天IC

1163

知名研究机构国际战略研究所（IISS）日前发布报告，指出尽管美国限制高性能AI芯片对华出口，但这些控制措施可能会促使中国人工智能研究人员朝着“计算要求较低的领域”，并引导他们发展“新的竞争优势”。

报告称，近年来，大型语言模型的能力有了显著提升，OpenAI在2020年创建GPT-3是一个重要的里程碑。这些改进归因于更大、更通用的模型架构的创建以及数据集大小的增加以及技术公司为增加训练模型的计算能力所花费的金额。实证研究表明，给定模型的数据集大小、计算开销和参数计数之间存在密切关系，并且在实践中，计算开销是模型改进的最强约束。

此外，越来越多的参与者正在开发大型语言模型，并在多个维度上出现扩散。如大型语言模型的研究主要发生在美国，但其他国家的研究人员——尤其是中国，以及其他地方的特定研究机构，如英国的 DeepMind——已经投入了大量资源建立自己的模型。此外，开发语言模型的机构类型已经扩展到既包括谷歌和微软等大型科技公司，也包括分散的研究人员集体。

报告认为，大模型技术的扩散对安全有两个近期影响：这些模型可能会为虚假信息生产更高质量和更多的内容，而对大模型开发的竞争可能会加剧地缘z治紧张局势。

报告还分析了去年10月，美国政府宣布对流向中国的先进半导体芯片实行新的出口管制，部分原因是这些芯片对人工智能发展至关重要。虽然出口管制的既定意图是限制用于监视或军事应用的人工智能系统的发展，但语言模型也高度依赖于这些先进的半导体。实施出口管制的部分真实动机可能是为了保持美国在语言模型方面的优势，无论是作为更广泛的人工智能技术竞争战略的一部分，还是因为政府特别想抑制中国在语言模型方面的发展。

报告还怀疑这些措施是否有效。尽管由于计算能力的提高，大语言模型得到了改进，但它们不能以目前的速度继续这样做。研究人员正在积极寻求开发计算效率更高的方法来训练类似模型。一个国家试图限制另一个国家的计算能力作为竞争人工智能发展的一种手段，可能会激励目标国家在这些计算效率更高的人工智能方法中发展竞争优势。

此外，高质量文本如书籍和学术期刊文章可能很快成为语言模型发展的一个比计算能力可用性更紧迫的限制。

各国也可能越来越多地将大模型的开发视为一种民族自豪感，这种看法可能会加剧对其开发的竞争。报告担心，随着大模型越来越接近国家技术竞争的中心，政府可能会更积极地切断本国居民对竞争国家开发的语言模型的访问，从而进一步分裂互联网。

app江南