欢迎访问
杀入光刻领域,押注生成式AI,英伟达要放大招了
2023-03-22 来源:集微网
541

关键词: ASML 台积电 英伟达

据外媒报道,英伟达公司日前在GTC大会上宣布,将与与ASML、Synopsys和台积电合作,推广使用其“cuLitho”软件库进行计算光刻,表示该库将使其合作伙伴能够以更高的效率设计和制造下一代芯片。

英伟达方面认为,通过在GPU而不是通用CPU上运行,复杂IC光刻图案背后的计算效率可以提高40倍。cuLitho软件用于将工作负载转换为可以利用GPU并行性的格式。这使500个 NVIDIA DGX H100 系统能够完成40000个CPU系统执行的工作。

使用cuLitho的晶圆厂每天可以使用九分之一的功率生产三到五倍的光掩模。该公司还表示,需要两周才能生产的光掩模可以使用cuLitho和GPU在一夜之间进行处理。从长远来看,cuLitho将实现更好的设计规则、更高的密度、更高的产量,并且是通向AI驱动的光刻技术的途径。

黄仁勋还透漏,Hopper架构GPU将使用cuLitho库进行设计和制造。台积电方面也回应称,“这一发展为台积电在芯片制造中更广泛地部署逆光刻技术和深度学习等光刻解决方案开辟了新的可能性,为半导体规模的持续发展做出了重要贡献”。

这次被黄仁勋称为“迄今为止最重要的一次GTC”有超过25万人参加。他在演讲中多次提到,AI的“iPhone”时刻已经到来,而英伟达将在生成式AI领域进行软硬件全面布局。同时,他还公布了英伟达在加速计算、量子计算、元宇宙等领域的技术和应用情况。




AI进入“iPhone”时刻,推出专用云服务


黄仁勋在演讲中数次提到生成式AI,称“ChatGPT是震惊世界的AI”。他认为,这意味着崭新的计算平台的诞生,AI的“iPhone”时刻已经到来,加速计算和AI技术已经走进现实。

在黄仁勋看来,ChatGPT、Stable Diffusion、DALL-E和Midjourney等生成式AI工具唤醒了世界对生成式AI的认知,尤其是ChatGPT作为迄今历史上用户数量增长最快的应用,生成的文本令人赞叹。

黄仁勋认为,生成式AI是一种新型计算机,一种可以用人类语言进行编程的计算机,每个人都可以命令计算机来解决问题,而这之前是只有程序员才能接触的领域,现在每个人都可以是程序员。

他同时还称,生成式AI是一种新型计算平台,与PC、互联网、移动设备和云类似。正如此前的互联网一样,生成式AI也将重塑每个行业。

不过,黄仁勋提到,一些专业领域的公司需要使用专有数据来定制模型,他们需要制定使用规范,并优化模型,契合公司安全、隐私和安保要求。“这个行业需要一个类似台积电的代工厂,来构建自定义的大型语言模型。”

为此英伟达宣布推出AI Foundations,黄仁勋将其称为云服务和代工厂,其可以让企业使用专有数据进行训练、处理特定领域的任务,构建自定义的语言模型和生成式AI。

英伟达AI Foundations包括语言、视觉和生物学模型三个方面服务,其中Nemo用于构建定制的语言文本生成模型,通过Nemo可以快速生成文本,最快捷的方法是从英伟达的某项先进的预训练基础模型入手,轻松自定义一个模型,并进行参数调优,如汇总财务文档、创建特定品牌内容、个性化写作风格撰写邮件等,将模型链接到专有数据库,可确保响应是准确和最新的,并可以通过指定区域放防止模型出现意外。

Picasso是一项视觉语言模型制作服务,可以用于生成式AI赋能的图像、视频和3D应用,企业可以使用自己的数据来部署和训练自己的模型,并可将生成的素材导入编辑工具或Omniverse,以构建逼真的虚拟世界、元宇宙应用和数字孪生仿真。Getty Images、Shutterstock和Adobe等企业已经开始使用该项服务。

黄仁勋还表示,英伟达将和Adobe共同构建一系列新一代AI功能,打造创意领域的未来,将生成式AI融入营销和创意专业人士的日常工作中,新的生成式AI模型将对图像、视频、3D和动画制作进行优化。同时,为保护艺术家的权利,Adobe正在开发以商业可行性和正确内容归属为重点的方案,由Adobe的“内容真实性倡议”提供支持。

第三个是面向的生物学的BioNeMo,其可帮助研究人员使用专有数据创建、微调和提供自定义模型,让研发人员轻松加速药物研发工作流,可以进行蛋白质预测、分子生成、分析连接等,节省药物研发时间和资金成本。

在应用方面,英伟达与三菱联合发布了将用于加速药物研发的日本第一台生成式AI超级计算机Tokyo-1。Tokyo-1通过使用BioNeMo软件,研究人员能运行高达数十亿参数的先进AI模型,可用于蛋白质结构预测、小分子生成、姿态估计等。


计算光刻技术提速40倍

黄仁勋带来的另一项革命性技术,也关乎英伟达自身的产品研发,是一项聚焦先进芯片设计制造的技术——NVIDIA cuLitho的计算光刻库。

NVIDIA cuLitho计算光刻库可以通过计算技术大幅优化芯片制造流程,利用GPU技术实现计算光刻,可以使传统光刻技术提速40倍以上,为2nm及更先进芯片的生产提供助力。

事实上,英伟达的计算光刻库在研发过程中,已经与3家全球顶尖的芯片制造厂商开展了长达4年的合作。包括晶圆制造巨头台积电、光刻机制造商阿斯麦,以及EDA巨头新思科技,目前3家厂商均已开始将该技术引入芯片设计和制造流程。

“计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。”黄仁勋介绍说,大型数据中心24x7全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。

NVIDIA H100需要89块掩膜板,在CPU上运算时,处理单个掩膜板,当前需要2周时间。如果在GPU上运行cuLitho则只需8小时即可处理完一个掩膜板。黄仁勋说:“台积电可以通过在500个DGX H100系统上使用cuLitho加速,将功率从35MW降至5MW,替代用于计算光刻的40000台CPU服务器。”




GPU&量子计算

除了AI和芯片以外,英伟达还在研究另一项前沿科技——量子计算。

本次GTC上宣布的第一个全新产品就是与Quantum Machines合作的NVIDIA DGX Quantum。该产品结合了通用量子控制系统Quantum Machines OPX+和NVIDIA Grace Hopper超级芯片,这个平台可以为高性能和低延迟量子经典计算的研究人员提供了一种革命性的新架构。

据黄仁勋介绍,NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟。这种组合使研究人员能够建立强大的应用,实现校准、控制、量子纠错和混合算法,将量子计算与最先进的经典计算相结合。

DGX Quantum还为开发人员配备了统一软件栈,混合GPU-Quantum编程模型NVIDIA CUDA Quantum,能够在同一系统中整合和编程 QPU、GPU 和 CPU,是一个混合型量子经典计算平台。目前,CUDA Quantum 已经开放了源代码,为开发者提供了更多的支持。



在英伟达这次GTC大会上,下手ASML、TSMC 和 Synopsys突破计算光刻,助力行业跨越物理极限是另一个值得关注的亮点。

NVIDIA 表示,将加速计算带入计算光刻领域,使 ASML、台积电和 Synopsys 等半导体领导者能够加速下一代芯片的设计和制造,正如当前的生产流程已接近物理学的极限一样使成为可能。

英伟达在新闻稿中指出,用于计算光刻的全新 NVIDIA cuLitho 软件库被世界领先的晶圆代工厂台积电和电子设计自动化领导者Synopsys集成到其最新一代 NVIDIA Hopper™ 架构 GPU 的软件、制造流程和系统中。设备制造商 ASML 在 GPU 和 cuLitho 方面与 NVIDIA 密切合作,并计划将对 GPU 的支持集成到其所有计算光刻软件产品中。

这一进步将使芯片具有比现在更细的晶体管和电线,同时加快上市时间并提高 24/7 全天候运行以驱动制造过程的大型数据中心的能源效率。

“芯片行业是世界上几乎所有其他行业的基础,”NVIDIA 创始人兼首席执行官黄仁勋表示。“随着光刻技术达到物理极限,NVIDIA 推出 cuLitho 并与我们的合作伙伴 TSMC、ASML 和 Synopsys 合作,使晶圆厂能够提高产量、减少碳足迹并为 2nm 及更高工艺奠定
在 GPU 上运行,cuLitho 比当前光刻技术(在硅晶圆上创建图案的过程)提供高达 40 倍的性能飞跃,加速目前每年消耗数百亿 CPU 小时的大量计算工作负载。

它使 500 个 NVIDIA DGX H100 系统能够完成 40,000 个 CPU 系统的工作,并行运行计算光刻过程的所有部分,有助于减少电力需求和潜在的环境影响。

在短期内,使用 cuLitho 的晶圆厂可以帮助每天多生产 3-5 倍的光掩模——芯片设计的模板——使用比当前配置低 9 倍的功率。需要两周才能完成的光掩模现在可以在一夜之间完成。
从长远来看,cuLitho 将实现更好的设计规则、更高的密度、更高的产量和 AI 驱动的光刻。

“cuLitho 团队通过将昂贵的操作转移到 GPU,在加速计算光刻方面取得了令人钦佩的进展,”台积电首席执行官 CC Wei 博士说。“这一发展为台积电在芯片制造中更广泛地部署逆光刻技术和深度学习等光刻解决方案开辟了新的可能性,为半导体规模的持续发展做出了重要贡献。”

“我们计划将对 GPU 的支持集成到我们所有的计算光刻软件产品中,”ASML 首席执行官 Peter Wennink 说。“我们与 NVIDIA 在 GPU 和 cuLitho 方面的合作应该会给计算光刻带来巨大好处,从而给半导体微缩带来好处。在High NA 极紫外光刻时代尤其如此。”

Synopsys 董事长兼首席执行官 Aart de Geus 表示:“计算光刻,特别是光学邻近校正 (OPC),正在突破最先进芯片的计算工作负载界限。“通过与我们的合作伙伴 NVIDIA 合作,在 cuLitho 平台上运行 Synopsys OPC 软件,我们将性能从数周大幅提升至数天!我们两家领先公司的合作将继续推动该行业取得惊人的进步。”


英伟达表示,近年来,由于较新节点中的晶体管数量更多以及更严格的精度要求,半导体制造中最大工作负载所需的计算时间成本已超过摩尔定律。未来的节点需要更详细的计算,并非所有这些都可以适用于当前平台提供的可用计算带宽,从而减缓了半导体创新的步伐。


晶圆厂流程变更通常需要 OPC 修订,从而造成瓶颈。cuLitho 有助于消除这些瓶颈,并使新颖的解决方案和创新技术成为可能,例如曲线掩模、High NA EUV 光刻和新技术节点所需的亚原子光刻胶建模。

总结

在昨天开幕的GTC上,英伟达还带来了多样化的产品,例如用于特定推理的的英伟达 L4 GPU。据报道,这款 GPU 可以提供比 CPU 高 120 倍的人工智能视频性能。它提供增强的视频解码和转码功能、视频流、增强现实和生成 AI 视频。

此外,英伟达还联合客户打造由 16 个 DGX H100 系统组成,每个系统配备八个 H100 GPU的生成式AI超级计算机Tokyo-1。根据 Nvidia 的 AI 触发器数学计算,这相当于大约一半的 exaflop AI 能力;由于每个 H100(一开始将有 128 个)提供 30 teraflops 的峰值 FP64 功率,因此它应该达到大约 3.84 petaflops 的峰值。

由此可见,黄仁勋正在带领英伟达走向一个新阶段。



Baidu
map