12月19日消息,摩尔线程官方发布通告称,摩尔线程首个全国产千卡千亿模型训练平台,摩尔线程KUAE智算中心揭幕仪式成功举办。此举也代表着,国内首个以国产全功能GPU为底座的大规模算力集群正式落地。
摩尔线程CEO张建中表示,摩尔线程构建了从芯片到显卡到集群的智算产品线,依托全功能GPU的多元计算优势,可以满足不断增长的大模型训练和推理需求。
据介绍,摩尔线程KUAE智算中心解决方案以全功能GPU为底座,旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。
该方案可实现开箱即用,大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本,实现快速投放市场开展商业化运营。
目前,摩尔线程支持包括LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各类主流大模型的训练和微调。基于摩尔线程KUAE千卡集群,70B到130B参数的大模型训练,线性加速比均可达到91%,算力利用率基本保持不变。以2000亿训练数据量为例,智源研究院700亿参数Aquila2可在33天完成训练;1300亿参数规模的模型可在56天完成训练。
这个号称要做“中国英伟达”的摩尔线程,能成为真正的“英伟达吗?
一、“英伟达”的团队基因
摩尔线程成立于2020年10月,是国产芯片替代呼声最高的时候,诞生于火热氛围之中,由于核心团队的“硬核”科技背景,很快获得巨额的融资。
如创始人兼CEO张建中,其是英伟达前全球副总裁兼中国区总经理;张建中从2005年加入英伟达,到2020年离职创办摩尔线程前,一度称其为英伟达创始人兼CEO黄仁勋的左膀右臂,为英伟达建立了赫赫战功。
此外摩尔线程还集聚了一批全球顶尖的GPU人才,在以NVIDIA有核心工作背景的人员为骨架基础上,召集了Microsoft,Intel,AMD,ARM等科技巨头中有研发背景的核心成员加入。
从创始人到核心技术人员“英伟达”基因在摩尔线程公司处处弥漫,这也注定了摩尔线程死磕英伟达的使命。
二、3年5轮65亿投资
由于ChatGPT彻底点燃人工智能这把火,而作为人工智能的水和电——通用GPU也被点燃了,再加上摩尔线程的超级团队,一成立就拿投资拿到手软。
截至目前,摩尔线程在3年内完成5轮融资,累计融资金额超过65亿元。
根据公开信息显示,2020年12月,成立仅2个月的摩尔线程获得了五源资本、红杉中国、闻名投资、和而泰金和一创创芯投资共同参与的天使轮融资。
2021年2月,摩尔线程完成了数十亿人民币的Pre-A轮融资,Pre-A轮融资由深创投、红杉资本中国基金、GGV联合领投,招商局创投、字节跳动、小马智行、阳光融汇资本、海松资本、闻名投资、第一创业、五源资本、和而泰、明浩等联合参投。
此后的摩尔线程,基本保持每年一轮的融资速度。
2021年11月,摩尔线程完成了A轮融资,投资方包括五源资本、联想创投、海松资本、腾讯投资等在内的12家投资机构。融资金额用于首颗GPU芯片的批量生产与制造、GPU SOC相关联的IP研发、以及国产GPU生态系统的拓展等。
2022年12月,摩尔线程宣布完成15亿B轮融资,此轮融资由中移数字新经济产业基金、和谐健康保险领投,典实资本跟投。此轮融资之后,摩尔线程的估值达到240亿人民币。
2023年11月,摩尔线程完成新一轮数亿元的融资,新增股东包括厚雪资本、中和资本、拓锋投资、策源资本和恒基浦业。
自此,国内GPU独角兽名副其实了!
三、产品生态基本成型,差距依然巨大
在芯片领域,技术领先至关重要。
2021年11月,摩尔线程首颗全功能GPU芯片正式发布。首颗芯片从设计到量产用时18个月,采用了台积电7nm工艺,是业界首款支持PCle5.0的GPU。
2022年4月,在摩尔线程2022春季发布会上,张建中正式对外发布了第一代摩尔线程全功能GPU芯片“苏堤”。“苏堤”的优势在于采用MUSA统一系统架构,内置了主流的四大引擎,即现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎和科学计算与物理仿真引擎。基于“苏堤”,摩尔线程推出了面向消费级市场的桌面级显卡MTT S60,以及面向数据中心的图形渲染和计算卡 MTT S2000。
继“苏堤”之后,去年9月,摩尔线程又发布了同样基于MUSA架构打造的第二代多功能GPU芯片“春晓”,并基于此推出首款游戏显卡 MTT S80 以及多功能服务器 GPU 产品 MTT S3000。其中,MTT S80 游戏显卡内置 4096 个 MUSA 流处理核心,在 1.8GHz 的主频下,能够提供 14.4TFLOPS 的单精度浮点算力。
自此摩尔线程GPU生态及产品架构基本成型了。
一个架构——MUSA,类似于英伟达CUDA,力图构建一个软硬件协同的生态。另外摩尔线程的MUSA架构,最大的亮点就是兼容英伟达的CUDA,实现 CUDA 代码零成本迁移到 MUSA 平台。
三大系列产品——“苏堤”和“春晓”两代全功能GPU芯片;面向数据计算的MTT s2000-4000系列产品;面向桌面消费的MTT S60-80系列产品。
一个模拟训练平台——首个全国产千卡千亿模型训练平台,国内首个以国产全功能 GPU 为底座的大规模算力集群正式落地。
据摩尔线程官方表示,“春晓”芯片相较于“苏堤”,在图形渲染、编解码能力、AI计算等方面都提升了2倍以上。从纸面数据上,搭载春晓芯片的MTT S3000和MTT S80的性能十分优秀。
例如MTT S3000的FP32算力为15.2TFLOPS,英伟达A100为19.5TFLOP,相当于达到了80%A100的性能;桌面级MTT S80显卡的纸面性能相当于英伟达RTX3060。
也就是说理论上,摩尔线程无论是在计算卡还是桌面级领域,其性能已经达到了英伟达中端水准,但实际表现可能并非如此。
例如MTT S80的表现也被网友们戏称为“养成系”显卡。强劲的硬件却难以发挥理论性能,这就是目前摩尔线程和英伟达的差距:软件适配。
说得直白些摩尔线程差距主要是底层技术和驱动经验的积累。据消息称摩尔线程的MUSA架构是来源于IMG的PowerVR。这也表明摩尔线程在GPU IP方面没有核心技术,这也是其产品能够快速量产的原因之一。
虽然,差距客观存在,但在国产GPU面临极限施压的情况下,摩尔线程站出来本身就是一种态度。
摩尔线程的横空出世,让业界看到了国产显卡的希望,未来的摩尔线程还能带来多少进步与惊喜?中国GPU还会在哪些领域共创精彩?