欢迎访问
全球半导体界达成共识:Chiplet技术将搭上这场AI潮流
2023-12-27 来源:贤集网
538

关键词: 半导体 芯片 人工智能

中国成立了自己的Chiplet(小芯片,或芯粒)联盟,由多家芯片设计,IP,以及封装、测试和组装服务公司组成,同时推出了相应的互连接口标准ACC 1.0。

在美国打压,中国寻求半导体产业链关键环节自主可控的当下,这一联盟的成立,颇有与由AMD、Arm、英特尔、台积电和ASE(日月光)主导的UCIe联盟分庭抗礼的意味。

从技术层面来看,Chiplet的价值和发展前景已经在全球半导体界达成普遍共识。



Chiplet并不是创新概念,它很早就被提出来了,只是市场应用需求没有发展到这一步,因此长期处于“隐身”状态。之所以在近几年火热起来,主要原因是先进制程(5nm及以下)的成本高的惊人,绝大多数芯片企业难以负担。Chiplet则可以在很大程度上解决这一问题。

Chiplet可以把传统的单芯片设计方案改成多芯片(Die)进行设计,并利用先进封装工艺进行集成。它的优势主要有以下几点:

1、提升芯片制造良率,由于良率和芯片的面积有关,面积越大,良率大概率会越低,因此,把一个大芯片分拆成多个小芯片(Die)设计并分别投片,就可以提高良率,良率提升,还可以降低制造成本。

2、以不同的工艺实现一颗芯片,用先进制程制造CPU等计算核心,用相对成熟的制程制造I/O之类的功能块,可以很好地控制整体成本。

3、设计更加灵活,设计出的Die,通过不同的组合方式,可设计出不同功能的芯片。

虽然有这么多好处,但Chiplet技术并不成熟,各种Die、接口I/O、总线等,与常规的SoC有很大区别,需要制定统一的标准,从而使产业链上的设计、制造、封装等厂商能按照标准操作,才能实现高效、规模化生产。


Chiplet将引发半导体行业新循环

在这个半导体行业正处于周期底部且需求向上切换之际,在生成式AI“智算一体”的需求与Chiplet技术“高密度、低成本”的夹击下,一场垂直性的行业新循环或将来临。

由于对数据中心、人工智能、高性能计算和 5G 基础设施等领域的更高性能和更专业的半导体解决方案的需求的增加,随着半导体行业寻求创新方法来克服传统单片芯片设计的局限性,Chiplet市场需求预计将持续增长。

与此同时,新的应用程序和用例也将随着Chiplet技术及市场的完善陆续出现,从而形成技术支持-市场需求-资金供给的优质循环。

随后,在其区域划分之下,报告显示:亚太地区的Chiplet市场预计将占据主要市场份额:该地区人工智能和数据中心的快速增长推动了对高性能、高能效计算解决方案的需求,使Chiplet成为有价值的组件。该地区是许多无晶圆厂半导体公司的所在地,这些公司设计芯片但外包制造,这些公司经常利用Chiplet来开发尖端产品。

另一方面,北美地区的Chiplet市场份额也将不断提升:北美的数据中心一直是 Chiplet 技术的重要推动力。云计算和数据分析应用对节能、高性能处理器的需求推动了基于 Chiplet 的服务器处理器的开发;北美在 HPC 领域拥有强大的影响力,机构、研究中心和企业都需要强大的计算解决方案。



Chiplet带来哪些挑战?

芯片设计的重大变化之一是关注数据如何在芯片中移动,随着需要处理的数据量持续增长,这一点非常重要。这引发了一系列变化,例如新材料和不同的设备组装方式。混合键合是人们高度关注的领域之一,而且在行业活动中几乎总是会引发问题。由于需要比标准互连允许的速度更快地传输视频和大图像,因此该技术首先在图像传感器中实现。例如,UMC 于 2023 年 2 月与 Cadence 签署了一项协议,提供一个可以加速这一过程的平台,特别是对于成熟节点,这是许多芯粒将被开发的地方。

例如,当今一些最快的计算机使用诸如市售 Arm 内核之类的组件。关键在于数据路径和与内存的物理连接、硬件-软件协同设计以及 AI/ML 的稀疏算法。随着计算变得更加分散,例如汽车和便携式设备与智能城市基础设施进行通信,真正的价值可能不再在于谁创造了最快的处理器,而更多地在于无缝连接。

更大的挑战可能在业务方面。“问题是这是否会转化为商业芯粒市场,您可以从第三方以低廉的价格采购它并将其集成到您的设计中,”Varas 说。“您需要的不仅仅是标准接口。这里有一个商业模式的问题。如何鉴定芯粒的资格?你如何测试它们?所以标准接口将会出现。但第二部分并不像IP模型的演变那么简单。情况要复杂得多。这项技术可能是可行的,但它还包括商业模式、供应链协调等等。”

此外,商业芯粒还存在数据共享的问题。大型芯片制造商的一大优势是能够在公司内部共享数据,以便可以针对最终应用或用例优化芯粒。不同公司之间交换数据要困难得多,因为公司非常担心数据泄露或被盗。

“有数据安全,也有数据共享,”Lam的Fried说。“这些并不相互排斥,人们必须消化这一点。我们开始打破使用云来完成,我们害怕使用云的事情的障碍。我们正在努力解决的是数据共享以获得更高的价值。飞机就是一个例子。这些飞机的所有者与飞机发动机制造商共享数字孪生和数字线程的维护记录和数据,并且他们可以对故障进行建模并进行预测性维护。航空航天行业的一些公司正在与所有这些不同的公司共享其产品的私密数据,这对所有这些公司都有好处。这种情况在我们的行业中并没有发生太多。这种情况发生在银行业,比如当你刷信用卡时,它会立即检查是否存在欺诈行为。这些模型建立在来自多个不同银行的数据之上,并且全部联合在一起。这就是我们作为一个行业失败的地方,因为我们在整个生态系统的数据共享方面落后于银行业和航空航天业 10 年。”

设计方面还存在其他挑战。将芯粒集成到封装中使设计问题远远超出了单个芯片的范围。现在它是需要协同工作的芯片的集合,并且不再由单个团队在一个地点开发。

“我们已经从设计芯片转向设计系统,”Synopsys 的 Varas 说。“我们正在处理三个主要问题。我们有新的复杂性向量,这需要系统设计的并行化。而且我们还缺乏人才。如今,60%的EDA用户是经典半导体公司。另外 40% 是超大规模企业、初创公司以及 ASIC 或 IP 供应商。2019 年至 2022 年间,先进芯片的设计启动数量增加了 44%,但不断扩大的生态系统也加剧了碎片化。有更多的选择和复杂性,这增加了设计的破坏性。”


Chiplet引领人工智能风潮

生成式AI模型拥有数百万或数十亿个参数才能做出推理,需要比SOC所能容纳的更多的存储空间和访问内存。由于GPT算力提升需求对芯片速度、容量都提出了更高要求,Chiplet技术应用于算力芯片领域有助于大面积芯片降低成本提升良率,便于引入HBM存储,允许更多计算核心的“堆料”。以Chiplet为首的先进封装技术被看作目前最佳方案与关键技术。



NVIDIA 是全球知名的AI计算先驱,凭借强悍的GPU牢牢统治着全球80%算力芯片市场。英伟达拥有与Chiplet相似的NVLink-C2C技术实现高速、低延迟、芯片到芯片的互连,可支持定制裸片间实现互连。2022 年发布的H100 GPU 芯片,将Chiplet技术与台积电4nm工艺融合,英伟达通过Chiplet技术将 HBM3 显存子系统集成到芯片里,超高显存带宽、性能和延迟比上一代都有巨大的提升;同代产品GH200架构采用CPU+GPU异构计算方式,NVLink-C2C技术方案通过Chiplet工艺将基于Arm的NVIDIA Grace CPU与H100 Tensor Core GPU整合在一起。

目前市面上的算力芯片Chiplet方案大多以CoWoS为主。CoWoS技术为台积电悠久的2.5D独家封装技术,适用高速运算产品,是目前HBM与GPU之间封装的主流方案。Nvidia通过Chiplet技术在GPU周围堆叠HBM方式提高缓存性能和容量。分析师指出,Nvidia H100下一代AI加速器将采用Chiplet设计。

如今以GPT带火的AI热潮有增无减,H100已经供不应求,台积电被英伟达堆积成山的AI GPU订单所拖累,这让Nvidia的死对头——AMD的AI芯片订单难以下咽,AMD只好寻求另一个可靠且一致的合作伙伴——三星。

AMD是先进封装技术的领导者,在封装领域的创新和投资已历时多年。为实现下一代技术AMD正在计划加快CPU及GPU规格迭代,具体的动作是全面导入Chiplet设计,以提高核心数及运算速度。

2019年起,AMD从Zen2架构开始采用Chiplet技术。2021年AMD实验性地发布基于3D Chiplet技术的3D V-Cache。该技术使用台积电的3D Fabric先进封装技术。AMD基于自己的建构chiplet生态系统,生产了Ryzen和Epycx86处理器。AMD Ryzen 9 5900X率先采用了这项技术,其中具有64MB L3缓存和堆叠式64MB SDRAM,将可用的L3缓存容量增加了三倍。

2022年AMD正式发布了采用RDNA3架构的新一代旗舰GPU,即RX 7900 XTX和RX 7900 XT。AMD表示,这是公司首度在GPU产品中采用Chiplet技术也是全球首个导入Chiplet技术的游戏GPU。



Baidu
map