近年来,许多芯片企业破产。去年高达上万家芯片公司关门大吉,平均每天倒31家。而今年依旧惨不忍睹,中国IP设计新星华夏芯破产清算,砺算科技也因烧光3亿人民币,去年6月爆发欠薪,加上美元基金撤离,险些在流片前夕破产。
砺算科技成立于2021年,实际营运从2022年年初成立砺算上海开始。砺算上海是南京砺算科技的全资子公司,也是公司核心所在。三位创办人分别是宣以方、孔德海及牛一心,都在硅谷GPU公司S3拥有深厚的技术能力及工程经验。
官网信息显示,砺算科技坚持自研架构、自主知识产权,正在打造对标国际主流产品的国产GPU芯片,服务国内2000亿渲染GPU全方位市场,实现端、云、边的图形渲染,满足学习工作娱乐、元宇宙、游戏动漫、数字孪生、影视制作、ARVR、智能工厂、专业设计、智能座舱、智慧医疗等的芯片和算力的需要。
好在,东芯股份于近日发布公告,宣布拟使用自有资金或超募资金对砺算科技(上海)有限公司进行增资,占股比例不超过40%,金额上限为2亿元。砺算科技破产波澜背后折射的是GPU芯片赛道竞争加剧。
全球GPU呈三足鼎立寡头竞争格局
从全球GPU整体市场情况来看,全球GPU市场现已形成三足鼎立的寡头竞争格局,NVIDIA仍是全球独立GPU绝对领导者。Intel得益于在笔记本电脑及传统PC行业的优势,现已在集成GPU市场独占鳌头,独立GPU市场则主要由NVIDIA和AMD两家公司占据。
NVIDIA现在最大的独立显卡生产销售商,旗下有民用的Geforce系列,还有专业的Quadro系列。其GPU具有cuda通用运算,PureVideo高清视频技术,PhysX物理加速,Optimus智能显卡切换等。今年三月份,英伟达推出新一代AI图形处理器芯片(GPU)架构Blackwell,并重磅发布采用该架构的GPU——B200和GB200产品系列。据了解,Blackwell可以支持多达10万亿参数的模型进行AI训练和实时LLM推理。B200由两个超大型Die(裸片)封装组合而成,内含超过2080亿个晶体管,是前一代800亿个晶体管的两倍以上,整块芯片还封装有192GB高速HBM3e显存。
Intel是全球最大的集成GPU供应商。Intel的GPU主要是集成显卡,用于intel的主板和intel的笔记本。英特尔首代独立显卡于2022年发布,距今大致已有2年。近日,有媒体报道,英特尔向oneAPI DPC++ 编译器的 LLVM 文档添加了 bmg_g21(Battlemage G21、BMG-G21)核心相关代码。这也是首次有 Battlemage 架构独显相关代码现身该文档,暗示 Battlemage G21 GPU 有望成为英特尔下代独显首发型号。
AMD成立于1969年,是目前业内稀缺的可以提供高性能CPU、高性能独立显卡GPU、主板芯片组三大组件的半导体公司。2006年,AMD以54亿美元收购了ATI,成为了第一家可以同时设计高性能CPU和GPU的半导体公司。AMD旗下有民用的Radeon系列,还有专业的FireGL系列等。其GPU具有Stream通用运算,ATI Video Converter视频转码,UVD高清视频技术,Havok、Bullet和Pixelux DMM三种物理引擎等。AMD 的 GPU 分为两个截然不同的产品领域,一个是针对游戏的,另一个是用于超级计算机、大数据分析和机器学习系统的。
2023年,AMD正式发布了新一代AI/HPC加速器Instinct MI300X、Instinct MI300A,一个是传统GPU加速器,一个是独一无二的CPU+GPU融合加速器。MI300A 是面向 HPC 产品定位,因此产品形态是CPU+GPU/APU 合封 Chiplet 的方式(24个Zen4 core及其I/0,128G HBM3,封装了13个Chiplet) ; 并改造了底层IF高速互连和UMA内存架构。首批采购方也是美国国家超算 (EI Capitan Exascale)。对标英伟达的CUDA,AMD则开发了ROCm。
为什么GPU对人工智能如此重要?
人工智能模型,也称为神经网络,神经网络是一种典型的并行结构,AI计算就是以深度学习为代表的神经网络算法,深度学习是目前主流人工智能算法,包括训练和推理。在人工智能模型训练环节,通过投喂大量数据,训练出一个复杂的神经网络模型,在推理环节,利用训练好的模型,使用大量数据推理出各种结论。
训练环节由于涉及海量训练数据以及复杂深度神经网络结构,所以计算规模非常庞大,GPU的内部结构特别适合进行大规模、高度并行的计算任务。它拥有众多的计算核心,每个核心都能独立处理数据,在神经网络的训练中,GPU能够高效处理矩阵乘法和加法等运算,大大加速了训练过程。这使得GPU成为AI大模型训练平台的基石,为人工智能发展提供强大的算力支持。
从GPU的发展来看,GPU 架构迭代频繁,已从从专用图形处理器发展为高效的通用计算平台,向外拓展人工智能计算及高性能计算领域。2003年,GPGPU(General Purpose computing on GPU)的概念被首次提出来。GPU不再以图形的3D加速为唯一目的,而是能够用于任意并行的通用计算,例如科学计算、数据分析、基因、云游戏、AIGC等。
英伟达在 2008-2022 年内,其GPU的架构迭代调整了 9 次,在 2017 年 Volta 架构中首次推出 Tensor 内核以支持深度学习算法,在 2010 年推出具有完整 GPU架构的 Fermi,2022年的Hopper 架构的 GPU 已广泛的应用于 AI 大模型训练与推理环节。
在2023年10月的投资者会议上,英伟达再次展示了其全新的GPU发展蓝图。与以往两年一次的更新节奏不同,这次的路线图将演进周期缩短至一年。预计在2024年,英伟达将推出H200和B100 GPU;到2025年,X100 GPU也将面世。
GPU产业链及应用场景
GPU产业链主要包括三大环节:设计、制造和封装。GPU整体商业模式包括三种:IDM、Fabless和 Foundry。
IDM模式:指将GPU产业链的三个环节整体化,充分结合自主研发和外部代工,集设计、制造、封装为一体,公司垂直整合GPU整体产业链。
Fabless:充分发挥各企业比较优势,仅负责芯片电路设计,将产业链其他环节外包,分散了GPU研发和生产的风险。
Foundry:公司仅负责芯片制造环节,不负责上游设计和下游封装,可以同时为多家上游企业服务。
GUP产业链上游,GPU设计基本以英伟达、超威半导体、英特尔三强垄断,中下游台积电凭借先进的4nm、7nm工艺及 CoWoS 封装技术产能领先,三星电子、格罗方德半导体、英特尔产能落后,且在产品工艺上与台积电相比优势不大,此外,在封装测试环节,国内厂商日月光、江阴长电 、华天科技 、宏茂微、华虹宏力、通富微电等具有布局。
GPU市场主要应用场景可概括为:AI&数据中心、智能汽车、游戏。AI&数据中心:新一轮AI对算力需求远超以往,ChatGPT类语言大模型底层是2017年出现的Transformer架构,该架构相比传统的CNN/RNN为基础的AI模型,参数量达到数千亿,对算力消耗巨大,对算力硬件有大量需求。随着对商业数据和大数据处理要求算力的不断提高,GPU的通用计算能力正在越来越广泛地被应用于数据中心和国家超算中心的建设。
智能汽车:智能汽车方兴未艾,自动驾驶和智慧座舱是智能汽车发展的主要方向,均需大量使用GPU。
游戏:游戏业务是GPU应用的传统领域,对游戏画面进行3D渲染,英伟达的游戏业务稳中有进。
国产GPU成为不可忽视的力量
国内市场方面,我国厂商 GPU 市场份额较小,正处于技术追赶及国产替代环节,目前国产 GPU 在数据中心、人工智能以及通用计算型 GPU 领域均实现产品布局,未来随着国内数据中心、智能驾驶及终端侧 GPU 市场需求的提升,国产 GPU 市场份额有望实现渗透。
GPU应用场景不断扩大拉动GPU市场空间迅猛增长,根据Verified Market Research预测,2028年全球GPU市场规模将达到2465.1亿美元。
事实上,近些年国内也有不少GPU企业在逐步成长,虽然在大模型的训练和推理方面,与英伟达GPU差距极大,但是不可忽视的是,不少国产GPU企业也在AI的训练和推理应用上找到位置。