国内首个千卡千亿集群横空出世！要做“中国英伟达”的摩尔线程，差距还有多大？

2023-12-27 来源：贤集网

2096

12月19日消息，摩尔线程官方发布通告称，摩尔线程首个全国产千卡千亿模型训练平台，摩尔线程KUAE智算中心揭幕仪式成功举办。此举也代表着，国内首个以国产全功能GPU为底座的大规模算力集群正式落地。

摩尔线程CEO张建中表示，摩尔线程构建了从芯片到显卡到集群的智算产品线，依托全功能GPU的多元计算优势，可以满足不断增长的大模型训练和推理需求。

据介绍，摩尔线程KUAE智算中心解决方案以全功能GPU为底座，旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。

该方案可实现开箱即用，大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本，实现快速投放市场开展商业化运营。

目前，摩尔线程支持包括LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各类主流大模型的训练和微调。基于摩尔线程KUAE千卡集群，70B到130B参数的大模型训练，线性加速比均可达到91%，算力利用率基本保持不变。以2000亿训练数据量为例，智源研究院700亿参数Aquila2可在33天完成训练；1300亿参数规模的模型可在56天完成训练。

这个号称要做“中国英伟达”的摩尔线程，能成为真正的“英伟达吗？

一、“英伟达”的团队基因

摩尔线程成立于2020年10月，是国产芯片替代呼声最高的时候，诞生于火热氛围之中，由于核心团队的“硬核”科技背景，很快获得巨额的融资。

如创始人兼CEO张建中，其是英伟达前全球副总裁兼中国区总经理；张建中从2005年加入英伟达，到2020年离职创办摩尔线程前，一度称其为英伟达创始人兼CEO黄仁勋的左膀右臂，为英伟达建立了赫赫战功。

此外摩尔线程还集聚了一批全球顶尖的GPU人才，在以NVIDIA有核心工作背景的人员为骨架基础上，召集了Microsoft，Intel，AMD，ARM等科技巨头中有研发背景的核心成员加入。

从创始人到核心技术人员“英伟达”基因在摩尔线程公司处处弥漫，这也注定了摩尔线程死磕英伟达的使命。

二、3年5轮65亿投资

由于ChatGPT彻底点燃人工智能这把火，而作为人工智能的水和电——通用GPU也被点燃了，再加上摩尔线程的超级团队，一成立就拿投资拿到手软。

截至目前，摩尔线程在3年内完成5轮融资，累计融资金额超过65亿元。

根据公开信息显示，2020年12月，成立仅2个月的摩尔线程获得了五源资本、红杉中国、闻名投资、和而泰金和一创创芯投资共同参与的天使轮融资。

2021年2月，摩尔线程完成了数十亿人民币的Pre-A轮融资，Pre-A轮融资由深创投、红杉资本中国基金、GGV联合领投，招商局创投、字节跳动、小马智行、阳光融汇资本、海松资本、闻名投资、第一创业、五源资本、和而泰、明浩等联合参投。

此后的摩尔线程，基本保持每年一轮的融资速度。

2021年11月，摩尔线程完成了A轮融资，投资方包括五源资本、联想创投、海松资本、腾讯投资等在内的12家投资机构。融资金额用于首颗GPU芯片的批量生产与制造、GPU SOC相关联的IP研发、以及国产GPU生态系统的拓展等。

2022年12月，摩尔线程宣布完成15亿B轮融资，此轮融资由中移数字新经济产业基金、和谐健康保险领投，典实资本跟投。此轮融资之后，摩尔线程的估值达到240亿人民币。

2023年11月，摩尔线程完成新一轮数亿元的融资，新增股东包括厚雪资本、中和资本、拓锋投资、策源资本和恒基浦业。

自此，国内GPU独角兽名副其实了！

三、产品生态基本成型，差距依然巨大

在芯片领域，技术领先至关重要。

2021年11月，摩尔线程首颗全功能GPU芯片正式发布。首颗芯片从设计到量产用时18个月，采用了台积电7nm工艺，是业界首款支持PCle5.0的GPU。

2022年4月，在摩尔线程2022春季发布会上，张建中正式对外发布了第一代摩尔线程全功能GPU芯片“苏堤”。“苏堤”的优势在于采用MUSA统一系统架构，内置了主流的四大引擎，即现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎和科学计算与物理仿真引擎。基于“苏堤”，摩尔线程推出了面向消费级市场的桌面级显卡MTT S60，以及面向数据中心的图形渲染和计算卡 MTT S2000。

继“苏堤”之后，去年9月，摩尔线程又发布了同样基于MUSA架构打造的第二代多功能GPU芯片“春晓”，并基于此推出首款游戏显卡 MTT S80 以及多功能服务器 GPU 产品 MTT S3000。其中，MTT S80 游戏显卡内置 4096 个 MUSA 流处理核心,在 1.8GHz 的主频下，能够提供 14.4TFLOPS 的单精度浮点算力。

自此摩尔线程GPU生态及产品架构基本成型了。

一个架构——MUSA，类似于英伟达CUDA，力图构建一个软硬件协同的生态。另外摩尔线程的MUSA架构，最大的亮点就是兼容英伟达的CUDA，实现 CUDA 代码零成本迁移到 MUSA 平台。

三大系列产品——“苏堤”和“春晓”两代全功能GPU芯片；面向数据计算的MTT s2000-4000系列产品；面向桌面消费的MTT S60-80系列产品。

一个模拟训练平台——首个全国产千卡千亿模型训练平台，国内首个以国产全功能 GPU 为底座的大规模算力集群正式落地。

据摩尔线程官方表示，“春晓”芯片相较于“苏堤”，在图形渲染、编解码能力、AI计算等方面都提升了2倍以上。从纸面数据上，搭载春晓芯片的MTT S3000和MTT S80的性能十分优秀。

例如MTT S3000的FP32算力为15.2TFLOPS，英伟达A100为19.5TFLOP，相当于达到了80%A100的性能；桌面级MTT S80显卡的纸面性能相当于英伟达RTX3060。

也就是说理论上，摩尔线程无论是在计算卡还是桌面级领域，其性能已经达到了英伟达中端水准，但实际表现可能并非如此。

例如MTT S80的表现也被网友们戏称为“养成系”显卡。强劲的硬件却难以发挥理论性能，这就是目前摩尔线程和英伟达的差距：软件适配。

说得直白些摩尔线程差距主要是底层技术和驱动经验的积累。据消息称摩尔线程的MUSA架构是来源于IMG的PowerVR。这也表明摩尔线程在GPU IP方面没有核心技术，这也是其产品能够快速量产的原因之一。

虽然，差距客观存在，但在国产GPU面临极限施压的情况下，摩尔线程站出来本身就是一种态度。

摩尔线程的横空出世，让业界看到了国产显卡的希望，未来的摩尔线程还能带来多少进步与惊喜？中国GPU还会在哪些领域共创精彩？

登入后，方可留言>>

行业动态

山海智治数创未来——大鹏新区两个数字化场景成功入选2024深圳数字化应用成果优秀案例

死磕4年不如一个模块？宇凡微AI模块让代工厂“秒变科技公司”

瑞萨推出集成DRP-AI加速器的RZ/V2N，扩展中端AI处理器阵容，助力未来智能工厂与智慧城市发展

热读文章

苗圩出席统筹推进疫情防控和产业转型升级促进制造业通信业稳定发展发布会

一图读懂2020年《政府工作报告》

工业富联：拟7763万美元收购鸿海精密美国子公司相关资产