黄仁勋 COMPUTEX 主题演讲
文章语言:
简
繁
EN
分享
纪要
原文
会议摘要
NVIDIA创始人兼CEO黄仁勋详细阐述了AI及其基础设施如何重塑计算机行业和全球产业格局。NVIDIA从芯片公司转型为AI和机器人领域的领导者,通过推出CUDA、DGX1等关键技术和产品,推动了AI革命。AI数据中心作为AI工厂,通过应用能量产生高价值“令牌”,成为衡量公司生产力的重要指标。NVIDIA在加速计算、AI、图书馆和模拟科学等领域取得重要进展,如GForce、CUDA、专业库和Grace Hopper超级计算机,推动了多个领域的进步。此外,NVIDIA在通信、量子计算、AI推理和物理AI等方面也取得了最新进展,与全球合作伙伴共同构建AI基础设施和生态系统。NVIDIA通过技术创新,如envy link、Blackwell GPU和AI数据平台,以及与存储行业合作,将AI模型整合到故事堆栈和AI平台上,推动大规模数据处理和决策支持。AI Operations(AI Ops)的提出,预示着未来将有专门的AI运营团队负责数据管理、模型微调和安全保障,进一步强化AI在企业IT中的作用。
会议速览

在2025年,智慧工厂制造的Tokens作为人工智慧的基石,开拓了新领域,将图像转化为科学数据,助力探索宇宙、克服现实困难、提前发现疾病征兆、研究人体动作,以及连接现实与虚拟世界。这些技术不仅提升了生活质量,还为未来探索提供了无限可能。

NVIDIA的创办人兼执行长在2025年5月19日的演讲中,向观众介绍了公司即将推出的一系列令人兴奋的新产品。这些产品不仅将开拓新的市场,还将创造新的增长点。他强调了与珍贵的合作伙伴和朋友共同发展生态系统的重要性,并提到NVIDIA处于计算机生态系统的核心,是世界最重要的行业之一。他还预告了一些即将揭晓的惊喜。

自1993年以来,英伟达从一家芯片公司转型,致力于创建新的计算平台。2006年,英伟达推出了CUDA,彻底改变了计算方式。十年后,即2016年,公司意识到全新的计算方法已经到来,这需要重新发明整个技术栈的每一层。为此,英伟达发明了新的系统DGX One,首次将其捐赠给非营利组织OpenAI,从而启动了人工智能革命。

随着人工智能的发展,传统的软件运行方式被彻底改变,数据中心的架构也随之发生了根本性变化。新型应用需要大量处理器协同工作,以应对数百万用户的查询,这促使了东西向网络(East-West traffic)的重要性提升,特别是对于高性能计算和大规模分布式处理而言。五年前,即2020年,一家专注于此类网络的公司Melanotan被收购,以实现将整个数据中心转变为一个计算单元的目标。如今,数据中心被视为单一的计算单位,而非单一的PC或服务器,其操作系统也经历了变革。过去三年中,这一系列创新理念逐渐成形,重塑了公司的发展方向。

NVIDIA宣布其不再仅是一家科技公司,而是转型为AI基础设施公司,公开了未来五年的路线图,以帮助全球各行各业构建AI基础设施。这一转变类比于历史上的电力和互联网基础设施的建设,预示着AI将成为未来社会基础设施的关键部分。NVIDIA指出,新的AI数据中心,即AI工厂,将产生巨大价值,公司将以生产‘令牌’(token)的数量衡量其AI产能,这标志着AI在各行业中的全面集成和重要性。

自1993年公司成立以来,业务机会从最初的三百万美元增长到如今的万亿级市场,尤其是在AI基础设施领域。公司核心竞争力在于融合加速计算与AI,特别强调算法和库(cut x库)的重要性。即将展示的内容将涵盖模拟科学和人工智能的最新进展,所有展示的模拟成果均非艺术创作,而是基于技术的美丽呈现。

2025年,一款名为G Force RTX五十系列的全新图形处理器在实时计算机图形生成领域取得了重大突破。这款GPU由一家名为Emaciated的公司研发,并被集成在一款名为Emc Zed的新笔记本电脑中。通过人工智能技术,系统仅需计算十分之一的像素,其余部分由AI预测完成,实现了高分辨率和流畅帧率的实时图形渲染。这项技术,称为OSS New Reminding,历经十年研发,彻底革新了计算机图形领域。G Force RTX五十系列的成功发布,标志着AI与图形处理技术的深度融合,推动了PC游戏领域的发展。

加速计算和CUDA技术在全球范围内的推广至关重要。通过广泛安装CUDA GPU,更多开发者被吸引来创建强大的应用库,从而推动了更好的应用和用户受益,形成良性循环。加速计算不同于通用计算,需要特定的架构来针对应用中的关键部分进行加速,从而大幅提升运行效率。通过与各个领域的合作伙伴共同努力,CUDA技术已应用于计算机图形学、数值计算、医疗成像、量子计算等多个领域,并为5G、AI、天气预测等提供了强有力的加速支持。此技术的广泛应用为电信、数据中心等多个行业带来了革新性的变革。

对话深入探讨了量子计算和人工智能(AI)的未来前景。提到了量子计算正处于发展初期,但已有许多应用领域可开始实施。展望未来,所有超级计算机将配备量子加速器,形成集量子处理单元(QPU)、GPU和CPU于一体的现代计算机。此外,讨论了AI的发展,从感知AI到生成AI,再到具有推理能力的代理AI,最终达到能理解物理世界的物理AI。特别是在物理AI领域,通过生成视频来训练自动驾驶汽车等场景被提及,展示了AI技术的显著进步。

在2025年,介绍了一款名为Grace Blackwell的高性能计算系统,该系统旨在实现AI的快速推理和时间缩放能力,以处理更复杂、更高速的AI任务。Grace Blackwell系统不仅能够实现规模上的扩展,还能将多个计算机连接起来共同完成工作,克服了半导体物理的限制。系统自去年年底全面生产以来,已在各个领域得到广泛应用,其性能持续提升,最新版本gb300提供了更高的推理性能、内存和网络能力,显著提高了整体系统性能。

格雷斯·布莱克沃尔系统的计算节点已经升级,新版本GB300系统的性能提高了1.5倍,尤其是在推理方面。讨论中提到了一个40PFLOPS的系统,相当于2018年SIA超级计算机的性能,但只使用一个节点就取代了原有18000个GPU的系统。通过创新技术,如TF-C的CoaXl工艺和Envy Link高速开关,实现了GPU之间的高速通信。这种技术革新使得建设大规模AI工厂成为可能,如XAI Colosse工厂,占地四百万平方英尺,总电子设备投资达四十至五十亿美元。这些进展突显了在AI和视频领域计算能力的快速扩展,预示着AI工厂的未来发展趋势。

黑威尔芯片的制造始于一块空白的硅晶片,经过数百道工艺和紫外线光刻步骤,最终在一块十二英寸的晶圆上构建出两百亿个晶体管。经过测试和筛选,好的芯片被进一步加工,与HBM堆栈和定制的硅中间层连接,形成系统级封装单元。随后,组件经过高温测试和全球多个工厂的集成,最终在台湾技术生态系统的支持下,制造出集成了130万亿个晶体管的黑威尔超级芯片。这一过程展示了全球合作伙伴的精湛工艺和精密协作。

NVIDIA宣布与台湾政府和工业合作伙伴共同在台湾建立首台AI超级计算机,旨在推动台湾的AI基础设施和生态系统。此外,NVIDIA还推出了Envy Link Fusion,这是一种新的解决方案,允许企业和研究机构根据自己的需求定制AI基础设施,包括集成自定义CPU和GPU。同时,NVIDIA的DGX Spark超级计算机已经进入全面生产阶段,预计不久后即可提供给市场。

2025年,随着AI技术的快速发展,企业IT领域正在经历重大变革。AI原生计算机,专为现代AI应用设计,不再需要运行传统IT软件,而专注于AI应用的高效运行。同时,AI正在改变计算、存储和网络三层架构,以适应新的企业IT需求。未来,企业将利用数字员工,即AI代理,来执行多种工作,以弥补全球劳动力短缺的问题。这些数字员工将成为企业的新型人力资源,企业IT部门将负责管理和优化这些AI代理,以提升工作效率和生产力。为实现这一愿景,需要从根源上重新设计计算系统,以满足现代AI和企业IT的双重需求。

2025年,NVIDIA推出全新的RTX Pro企业级服务器,该服务器不仅能运行传统的高超视器和经典应用,还具备强大的企业AI代理处理能力,支持文本、图形和视频等多种AI代理形式。服务器采用创新的CX A芯片,提供高达800Gbps的网络带宽,显著提升了AI模型的推理速度和效率。与市场上其他顶级服务器相比,RTX Pro表现出更高的性能和更低的延迟,尤其在AI推理和大规模数据处理方面展现出巨大优势。此外,NVIDIA还介绍了其AI数据平台,旨在处理非结构化数据查询,以满足AI对语义和意义的查询需求。

在2025年,随着人工智能技术的不断发展,新的软件层AI Ops被提出,旨在通过数据处理、模型微调、评估和保护等操作,为企业IT部门提供人工智能支持。多家合作伙伴如CD Crowd Strike、Data IQ、Data Robots等将参与构建人工智能运维生态系统,为企业提供人工智能模型的集成与部署。此外,还通过与DeepMind、Disney Research等的合作,开发了高级物理引擎Newton,以加速机器人在虚拟世界中的学习,实现更真实、高效的机器人模拟。该平台不仅适用于虚拟世界,也支持在真实世界的机器人和自动驾驶汽车系统中应用。目前,Isaac Group平台的1.5版本已经开放源代码,并供全球下载使用。

随着机器人技术和人工智能(AI)的迅速发展,工业领域正经历重大变革。面对全球劳动短缺的问题,机器人,尤其是能够适应多种环境的通用机器人,成为了应对挑战的关键。通过利用AI放大人类示范系统,研究者们正在解决机器人学习数据的挑战,从而极大地提升了机器人的学习效率和适应能力。此外,通过数字孪生技术和大规模合成数据生成,机器人能在虚拟环境中学习和优化其行为,为真实世界的应用做准备。这种技术进步不仅加速了机器人技术的成熟,也预示着一个由机器人和AI主导的工业新时代的到来。

2025年05月19日,NVIDIA宣布在台湾建立一个名为“NVIDIA conStellation”的大型新办公大楼,以应对不断扩大的业务需求和工程师团队。这项建设得到了当地市长的支持,但需要公众的进一步认可。此外,NVIDIA强调了与合作伙伴共同创造AI工厂、企业代理和机器人等新行业的机会,显示出对未来的巨大期待和信心。
要点回答
Q:在各个领域中,代币的潜在应用是什么?
A:令牌可用于探索宇宙,帮助克服地球当前的挑战,推进物理定律,协助发现疾病,优化人类行动,给世界带来欢乐,让美好生活近在咫尺。
Q:NVIDIA的首席执行官Jenson Wong计划讨论哪些新产品和市场?
A:黄仁杰计划讨论针对英伟达开拓新市场的新产品和市场,以及英伟达将如何与伙伴共同发展生态系统。
Q:NVIDIA 近年来的重心发生了怎样的变化?
A:NVIDIA 最开始 是一家旨在创建新的计算平台的芯片公司,于2006年推出了CUDA,彻底改变了计算。随着时间的推移,他们意识到一种新的计算方法需要对技术堆栈进行重新发明,从而引发了类似 DGX one 这样的新系统的发明,开启了人工智能革命。
Q:NVIDIA实现的新计算理念的关键元素是什么?
A:新的计算方法需要重新设计技术栈的每一层,包括新的处理器、软件和系统。这种新的软件处理方式,现在被称为人工智能,需要许多处理器协同工作,为数百万人提供服务请求,与传统数据中心有根本区别。
Q:NVIDIA认为对于高性能计算至关重要的两种网络类型是什么?
A:英伟达认识到两种网络对于高性能计算至关重要:北向网络和东西网络。北向网络用于管理控制平面并连接到外部世界,而东西网络则用于计算机彼此交流以解决问题,强调处理单元之间高效通信的重要性。
Q:NVIDIA是如何将一个数据中心转变成一个计算单元的?
A:NVIDIA 将整个数据中心转化为一个计算单元,将整个数据中心作为一个计算单元运行一个作业,并将操作系统更改为 Nvidia 的 CUDA,从而在计算组织和管理方式上创建了重大转变。
Q:NVIDIA未来五年的详细路线图意味着公司的转型有何重大意义?
A:英伟达未来五年的详细路线图显示其转变为一家基础设施公司。这显露了公司的战略愿景和建立全球数据中心的意图,因为基础设施对未来至关重要,需要与全球基础设施规划保持一致。
Q:英伟达如何看待人工智能与互联网和电力的关系?
A:英伟达认为人工智能是一种新型基础设施,可媲美电力和互联网。就像互联网和电力成为不可或缺的社会和商业基础设施一样,英伟达预计人工智能将被整合到生活的每个方面,需要在每家公司、地区、行业和国家建立人工智能基础设施。
Q:NVIDIA首席执行官Jenson Wong承诺的AI基础设施未来发展是什么?
A:黄健昌承诺,人工智能基础设施的未来发展将从根本上改变数据中心的建设和利用方式。他建议这些人工智能数据中心将成为必不可少的工厂,生产对各个行业至关重要的有价值的令牌。
Q:人工智能如何融入NVIDIA当前和未来的产品?
A:人工智能通过引入AI加速GPU,正在革新计算机图形学,使其融入到NVIDIA目前和未来的产品中。同时,它也应用于物理模拟、5G射频信号处理等领域,并有望通过开发AI工厂或数据中心,将人工智能引入其他产业。
Q:CUDA是什么,它与人工智能和加速计算有什么关系?
A:CUDA 是由 NVIDIA 创建的并行计算平台和编程模型。它使开发人员能够利用 NVIDIA GPU 的强大计算能力进行通用计算,显著加速各个领域的应用程序,包括人工智能和其他计算密集型任务。
Q:图书馆生态系统如何彻底改变了计算机和信息技术?
A:图书馆生态系统通过提供深度学习和训练及推理所需的库,彻底改变了计算和信息技术,从而开启了这场革命。
Q:Coup TA Co DSS和Cool Space在稀疏结构模拟器中的应用是什么?
A:Coup TA卡和稀疏结构模拟器的冷却空间用于计算流体力学、元素分析,对于EDA和半导体行业非常重要。
Q:完全加速无线接入网堆栈的意义是什么?
A:全面加速的无线接入网络堆栈非常重要,因为它可以实现每MHz的数据速率达到令人难以置信的性能,并且与最先进的ASICs平齐,并且使得引入人工智能为5G成为可能。
Q:新的AI能力与传统AI有何不同?
A:新的人工智能能力更加先进,不仅可以理解模式,还可以从文本到文本、文本到图像、文本到视频等生成,展示出人工智能推理和解决之前未曾见过的问题的能力。
Q:物理AI的概念是什么,它与下一个AI时代有什么关联?
A:物理人工智能是指理解惯性和摩擦等物理特性的人工智能,使其能够推理物理世界并解决与之相关的问题,这对于下一个人工智能时代至关重要。
Q:格雷斯·布莱克沃尔的目的是什么,它如何增强人工智能的能力?
A:格雷斯·布莱克沃尔是一个新的计算机系统,旨在支持人工智能中的快速思考和推理,具有扩展能力,可以创建更大的系统并连接多台计算机,显著提高人工智能的能力。
Q:一击AI和思考AI之间有什么区别?
A:一次性AI是指AI基于学习到的数据生成响应,而思考型AI涉及在提供答案之前对不同选项及其益处进行推理和思考,表明具备像人类那样思考和推理的能力。
Q:新的AI基础设施构建的特点是什么?
A:新的AI基础设施包括高功率密度、令人难以置信的内存和网络带宽、能够扩展到大型系统,并被称为AI竞技场工厂。它利用整个机架,拥有120千瓦的功率,具有1吉字节的带宽,采用专门的AI技术构建。
Q:为什么新的数据中心被称为“AI工厂”?
A:新的数据中心被称为“AI工厂”,因为它们旨在支持大规模的人工智能操作,侧重于效率和广泛计算能力的容量。
Q:这个AI工厂的规模和财务投资是多少?
A:提到的人工智能工厂占地四百万平方英尺,预计造价在六百亿至八百亿美元之间。其中的计算部分,也就是电子设备,预计需要四百亿至五百亿美元的投资。
Q:人工智能工厂所使用的技术涉及哪些复杂性?
A:人工智能工厂所使用的技术非常复杂,涉及数百个芯片加工步骤、紫外光刻技术,以及包括GPU和中继器在内的多个组件的组装。这个过程需要仔细的整合和高精度,机器人全天候工作,众多合作伙伴共同努力。
Q:台湾正在建造的AI超级计算机的目的是什么?
A:在台湾建造的人工智能超级计算机旨在为人工智能研究和开发提供本地基础设施和生态系统,同时支持机器人和其他依赖先进人工智能能力的领域的科学工作。
Q:Envylink Fusion是什么,它能做什么?
A:Envylink Fusion是一个可以创建定制AI基础设施的产品。它集成了NVIDIA GPU、CPU、网络和其他必要组件,用于构建强大的AI超级计算机。它允许在系统中灵活整合不同类型的加速器和CPU,并连接到现有的AI生态系统。
Q:谁将能够使用Envylink Fusion,它如何满足他们的需求呢?
A:Envylink Fusion可以被任何希望搭建数据中心的人使用,包括NVIDIA、其他使用GPU的公司,以及个人可能想要将特定的ASICs或CPU集成到他们的人工智能基础设施中。它通过为将各种计算元素集成到大规模人工智能系统中提供灵活开放的生态系统来支持他们的需求。
Q:DG X Spark计算机的规格和优势是什么?
A:DG X Spark计算机具有一petaflop的计算能力和128GB的HBM内存。它还具有128GB的LPDDR5x内存。这台计算机的好处包括允许开发人员、学生和研究人员在本地进行AI工作,而不必依赖云服务,并预计在几周内可供使用。
Q:DG X Station在AI模型方面能处理什么?
A:DG X站是能够处理一万亿参数的人工智能模型的。
Q:新一代AI原生计算机的主要目的是什么?
A:新一代AI原生计算机的主要目的是运行现代AI原生应用程序,这些应用程序不一定要与传统的IT软件兼容,也不一定要通过虚拟机操作。
Q:人工智能原生计算机预计会如何影响传统企业计算?
A:人工智能原生计算机有望通过引入一种称为“代理AI”的新能力来重新定义传统企业计算,可执行数字营销、研究、客户服务等任务。
Q:什么是代理AI,它和传统工作有什么关系?
A:"代理AI"指的是数字代理,可以与人类一起执行各种任务,如数字营销的活动经理、研究人员、软件工程师、客户服务和芯片设计师。它们本质上是传统工作的数字化版本。
Q:为什么到2030年会出现劳动力短缺问题,数字代理可以如何帮助解决?
A:到2030年,由于各种因素限制世界的增长能力,劳动力预计会出现短缺。数字代理可以通过协助开发更好的代码,并更高效地工作,有效地充当数字员工。
Q:新RTX Pro企业服务器的关键组件是什么?
A:新RTX Pro Enterprise服务器的关键组件包括一个配备了交换网络和Cx A芯片的新主板,这些芯片是世界上最先进的网络芯片,能够让GPU之间以高速进行通信。该服务器支持广泛的工作负载,包括需要高吞吐量和低延迟的工作负载。
Q:新的人工智能模型的性能如何与之前的模型相比?
A:新的人工智能模型性能比之前的模型要高得多。例如,Deep Segar One 的性能是最先进模型的四倍,被认为是人工智能行业的重大突破。
Q:NVIDIA人工智能数据平台是什么,对于企业有什么好处?
A:NVIDIA AI数据平台是一种新型的存储平台,可在非结构化数据中嵌入意义,使其适合于AI查询。它由一种名为IQ的新查询系统支持,可以加快检索并改善查询结果。该平台使企业能够创建专门的AI代理,用于决策和数据分析。
Q:什么是AI运维,它与传统企业运营角色有何不同?
A:AI ops是一种新的软件层,类似于传统的供应链或人力资源管理角色,但是专门针对人工智能。它将管理、改进和评估公司内一系列AI代理,优化这些AI工具在企业环境中的使用和表现。
Q:人工智能模型融入企业IT的主要功能是什么?
A:人工智能模型集成到企业IT中的主要功能包括微调模型、评估模型和安全模型。这些人工智能模型旨在增强IT系统的能力,并部署在各种企业运营中。
Q:哪些公司正在与AI运营合作,将AI模型创建并集成到IT系统中?
A:像 CrowdStrike、Data IQ 和 Data Robots 这样的公司正在与 AI 运营合作,将 AI 模型创建和集成到 IT 系统中。另外,NVIDIA 与各种合作伙伴合作,包括那些创建 AI 代理人或“机器人”的合作伙伴,并与 DeepMind、Google DeepMind 和 Disney Research 合作建立先进的物理引擎来模拟机器人。
Q:NVIDIA及其合作伙伴开发的新物理引擎的重要意义是什么?
A:由NVIDIA及其合作伙伴开发的新物理引擎非常重要,因为它是世界上最先进的,将于7月开源。这个物理引擎具有处理刚性和软体模拟的高保真度能力,对于在模拟物理世界的虚拟世界中训练AI机器人至关重要。
Q:NVIDIA的仿真和人工智能集成平台是如何工作的?
A:NVIDIA的模拟和人工智能集成平台通过使用模拟环境、计算训练系统和ASIC运行时的组合来运作。该平台以一个名为“Isaac”的模拟环境开始,用于训练人工智能模型。经过训练的模型然后部署到人类或机器系统中,如自动驾驶汽车或机器人。NVIDIA通过GPU、一个名为“Isaac OS”的专门操作系统和预训练模型提供计算能力,使这些系统能够学习和有效运作。
Q:缺乏大规模数据给机器人制造商带来了什么挑战?在这种情况下,人工智能如何能够增强人类示范系统?
A:缺乏大规模数据对机器人制造商造成挑战,因为由于开发人员可用的时间有限,人类演示无法扩展。人工智能可以通过从单次演示泛化并利用人工智能来扩大从人类演示中收集的数据量,从而用最少的手动捕获训练更先进的机器人模型。
Q:人工智能如何促进机器人训练,而无需大量手动数据收集?
A:AI利用人类演示的大量数据来训练机器人。 这个过程包括使用远程操作员记录的人类演示数据对通用模型进行微调。 然后AI可以从图像和新指令中生成未来的世界状态(梦想),并选择最佳的用于训练。 这有助于机器人学习各种新动作,减少手动数据捕捉的需求。
Q:人工智能和机器人技术对制造业的潜在经济影响是什么?
A:人工智能和机器人技术对制造业的潜在经济影响是巨大的,全球预计在未来三年内计划投资五万亿美元用于建设新工厂。这是由于制造业过程的回流和再工业化,以及建造更加智能、高效的工厂的必要性,这些工厂利用数字双胞胎和人工智能技术。
Q:数字孪生在准备机器人未来方面扮演什么样的角色?
A:数字孪生在为机器人未来做准备中发挥着至关重要的作用,通过创建一个物理实体或系统的虚拟表示。这包括机器人、设备和整个工厂的数字孪生。它们有助于规划、测试和训练机器人,并对人工智能的发展至关重要,可以实现机器人在各种环境中高效、具有成本效益地部署。

英伟达公司
关注