黃仁勳 COMPUTEX 主題演講
文章語言:
简
繁
EN
分享
紀要
原文
會議摘要
NVIDIA創始人兼CEO黃仁勳詳細闡述了AI及其基礎設施如何重塑計算機行業和全球産業格局。NVIDIA從芯片公司轉型為AI和機器人領域的領導者,通過推出CUDA、DGX1等關鍵技術和産品,推動了AI革命。AI數據中心作為AI工廠,通過應用能量産生高價值“令牌”,成為衡量公司生産力的重要指標。NVIDIA在加速計算、AI、圖書館和模擬科學等領域取得重要進展,如GForce、CUDA、專業庫和Grace Hopper超級計算機,推動了多個領域的進步。此外,NVIDIA在通信、量子計算、AI推理和物理AI等方面也取得了最新進展,與全球合作夥伴共同構建AI基礎設施和生態系統。NVIDIA通過技術創新,如envy link、Blackwell GPU和AI數據平台,以及與存儲行業合作,將AI模型整合到故事堆棧和AI平台上,推動大規模數據處理和決策支持。AI Operations(AI Ops)的提出,預示着未來將有專門的AI運營團隊負責數據管理、模型微調和安全保障,進一步強化AI在企業IT中的作用。
會議速覽

在2025年,智慧工廠制造的Tokens作為人工智慧的基石,開拓了新領域,將圖像轉化為科學數據,助力探索宇宙、克服現實困難、提前發現疾病征兆、研究人體動作,以及連接現實與虛擬世界。這些技術不僅提升了生活質量,還為未來探索提供了無限可能。

NVIDIA的創辦人兼執行長在2025年5月19日的演講中,向觀衆介紹了公司即將推出的一系列令人興奮的新産品。這些産品不僅將開拓新的市場,還將創造新的增長點。他強調了與珍貴的合作夥伴和朋友共同發展生態系統的重要性,並提到NVIDIA處于計算機生態系統的核心,是世界最重要的行業之一。他還預告了一些即將揭曉的驚喜。

自1993年以來,英偉達從一家芯片公司轉型,致力于創建新的計算平台。2006年,英偉達推出了CUDA,徹底改變了計算方式。十年後,即2016年,公司意識到全新的計算方法已經到來,這需要重新發明整個技術棧的每一層。為此,英偉達發明了新的系統DGX One,首次將其捐贈給非營利組織OpenAI,從而啓動了人工智能革命。

隨着人工智能的發展,傳統的軟件運行方式被徹底改變,數據中心的架構也隨之發生了根本性變化。新型應用需要大量處理器協同工作,以應對數百萬用戶的查詢,這促使了東西向網絡(East-West traffic)的重要性提升,特別是對于高性能計算和大規模分佈式處理而言。五年前,即2020年,一家專注于此類網絡的公司Melanotan被收購,以實現將整個數據中心轉變為一個計算單元的目標。如今,數據中心被視為單一的計算單位,而非單一的PC或服務器,其操作系統也經曆了變革。過去三年中,這一系列創新理念逐漸成形,重塑了公司的發展方向。

NVIDIA宣佈其不再僅是一家科技公司,而是轉型為AI基礎設施公司,公開了未來五年的路線圖,以幫助全球各行各業構建AI基礎設施。這一轉變類比于曆史上的電力和互聯網基礎設施的建設,預示着AI將成為未來社會基礎設施的關鍵部分。NVIDIA指出,新的AI數據中心,即AI工廠,將産生巨大價值,公司將以生産‘令牌’(token)的數量衡量其AI産能,這標志着AI在各行業中的全面集成和重要性。

自1993年公司成立以來,業務機會從最初的三百萬美元增長到如今的萬億級市場,尤其是在AI基礎設施領域。公司核心競爭力在于融合加速計算與AI,特別強調算法和庫(cut x庫)的重要性。即將展示的內容將涵蓋模擬科學和人工智能的最新進展,所有展示的模擬成果均非藝術創作,而是基于技術的美麗呈現。

2025年,一款名為G Force RTX五十系列的全新圖形處理器在實時計算機圖形生成領域取得了重大突破。這款GPU由一家名為Emaciated的公司研發,並被集成在一款名為Emc Zed的新筆記本電腦中。通過人工智能技術,系統僅需計算十分之一的像素,其余部分由AI預測完成,實現了高分辨率和流暢幀率的實時圖形渲染。這項技術,稱為OSS New Reminding,曆經十年研發,徹底革新了計算機圖形領域。G Force RTX五十系列的成功發佈,標志着AI與圖形處理技術的深度融合,推動了PC遊戲領域的發展。

加速計算和CUDA技術在全球範圍內的推廣至關重要。通過廣泛安裝CUDA GPU,更多開發者被吸引來創建強大的應用庫,從而推動了更好的應用和用戶受益,形成良性循環。加速計算不同于通用計算,需要特定的架構來針對應用中的關鍵部分進行加速,從而大幅提升運行效率。通過與各個領域的合作夥伴共同努力,CUDA技術已應用于計算機圖形學、數值計算、醫療成像、量子計算等多個領域,並為5G、AI、天氣預測等提供了強有力的加速支持。此技術的廣泛應用為電信、數據中心等多個行業帶來了革新性的變革。

對話深入探討了量子計算和人工智能(AI)的未來前景。提到了量子計算正處于發展初期,但已有許多應用領域可開始實施。展望未來,所有超級計算機將配備量子加速器,形成集量子處理單元(QPU)、GPU和CPU于一體的現代計算機。此外,討論了AI的發展,從感知AI到生成AI,再到具有推理能力的代理AI,最終達到能理解物理世界的物理AI。特別是在物理AI領域,通過生成視頻來訓練自動駕駛汽車等場景被提及,展示了AI技術的顯著進步。

在2025年,介紹了一款名為Grace Blackwell的高性能計算系統,該系統旨在實現AI的快速推理和時間縮放能力,以處理更複雜、更高速的AI任務。Grace Blackwell系統不僅能夠實現規模上的擴展,還能將多個計算機連接起來共同完成工作,克服了半導體物理的限制。系統自去年年底全面生産以來,已在各個領域得到廣泛應用,其性能持續提升,最新版本gb300提供了更高的推理性能、內存和網絡能力,顯著提高了整體系統性能。

格雷斯·佈萊克沃爾系統的計算節點已經升級,新版本GB300系統的性能提高了1.5倍,尤其是在推理方面。討論中提到了一個40PFLOPS的系統,相當于2018年SIA超級計算機的性能,但只使用一個節點就取代了原有18000個GPU的系統。通過創新技術,如TF-C的CoaXl工藝和Envy Link高速開關,實現了GPU之間的高速通信。這種技術革新使得建設大規模AI工廠成為可能,如XAI Colosse工廠,占地四百萬平方英尺,總電子設備投資達四十至五十億美元。這些進展突顯了在AI和視頻領域計算能力的快速擴展,預示着AI工廠的未來發展趨勢。

黑威爾芯片的制造始于一塊空白的矽晶片,經過數百道工藝和紫外線光刻步驟,最終在一塊十二英寸的晶圓上構建出兩百億個晶體管。經過測試和篩選,好的芯片被進一步加工,與HBM堆棧和定制的矽中間層連接,形成系統級封裝單元。隨後,組件經過高溫測試和全球多個工廠的集成,最終在台灣技術生態系統的支持下,制造出集成了130萬億個晶體管的黑威爾超級芯片。這一過程展示了全球合作夥伴的精湛工藝和精密協作。

NVIDIA宣佈與台灣政府和工業合作夥伴共同在台灣建立首台AI超級計算機,旨在推動台灣的AI基礎設施和生態系統。此外,NVIDIA還推出了Envy Link Fusion,這是一種新的解決方案,允許企業和研究機構根據自己的需求定制AI基礎設施,包括集成自定義CPU和GPU。同時,NVIDIA的DGX Spark超級計算機已經進入全面生産階段,預計不久後即可提供給市場。

2025年,隨着AI技術的快速發展,企業IT領域正在經曆重大變革。AI原生計算機,專為現代AI應用設計,不再需要運行傳統IT軟件,而專注于AI應用的高效運行。同時,AI正在改變計算、存儲和網絡三層架構,以適應新的企業IT需求。未來,企業將利用數字員工,即AI代理,來執行多種工作,以彌補全球勞動力短缺的問題。這些數字員工將成為企業的新型人力資源,企業IT部門將負責管理和優化這些AI代理,以提升工作效率和生産力。為實現這一願景,需要從根源上重新設計計算系統,以滿足現代AI和企業IT的雙重需求。

2025年,NVIDIA推出全新的RTX Pro企業級服務器,該服務器不僅能運行傳統的高超視器和經典應用,還具備強大的企業AI代理處理能力,支持文本、圖形和視頻等多種AI代理形式。服務器采用創新的CX A芯片,提供高達800Gbps的網絡帶寬,顯著提升了AI模型的推理速度和效率。與市場上其他頂級服務器相比,RTX Pro表現出更高的性能和更低的延遲,尤其在AI推理和大規模數據處理方面展現出巨大優勢。此外,NVIDIA還介紹了其AI數據平台,旨在處理非結構化數據查詢,以滿足AI對語義和意義的查詢需求。

在2025年,隨着人工智能技術的不斷發展,新的軟件層AI Ops被提出,旨在通過數據處理、模型微調、評估和保護等操作,為企業IT部門提供人工智能支持。多家合作夥伴如CD Crowd Strike、Data IQ、Data Robots等將參與構建人工智能運維生態系統,為企業提供人工智能模型的集成與部署。此外,還通過與DeepMind、Disney Research等的合作,開發了高級物理引擎Newton,以加速機器人在虛擬世界中的學習,實現更真實、高效的機器人模擬。該平台不僅適用于虛擬世界,也支持在真實世界的機器人和自動駕駛汽車系統中應用。目前,Isaac Group平台的1.5版本已經開放源代碼,並供全球下載使用。

隨着機器人技術和人工智能(AI)的迅速發展,工業領域正經曆重大變革。面對全球勞動短缺的問題,機器人,尤其是能夠適應多種環境的通用機器人,成為了應對挑戰的關鍵。通過利用AI放大人類示範系統,研究者們正在解決機器人學習數據的挑戰,從而極大地提升了機器人的學習效率和適應能力。此外,通過數字孿生技術和大規模合成數據生成,機器人能在虛擬環境中學習和優化其行為,為真實世界的應用做准備。這種技術進步不僅加速了機器人技術的成熟,也預示着一個由機器人和AI主導的工業新時代的到來。

2025年05月19日,NVIDIA宣佈在台灣建立一個名為“NVIDIA conStellation”的大型新辦公大樓,以應對不斷擴大的業務需求和工程師團隊。這項建設得到了當地市長的支持,但需要公衆的進一步認可。此外,NVIDIA強調了與合作夥伴共同創造AI工廠、企業代理和機器人等新行業的機會,顯示出對未來的巨大期待和信心。
要點回答
Q:在各個領域中,代幣的潛在應用是什麽?
A:令牌可用于探索宇宙,幫助克服地球當前的挑戰,推進物理定律,協助發現疾病,優化人類行動,給世界帶來歡樂,讓美好生活近在咫尺。
Q:NVIDIA的首席執行官Jenson Wong計劃討論哪些新産品和市場?
A:黃仁傑計劃討論針對英偉達開拓新市場的新産品和市場,以及英偉達將如何與夥伴共同發展生態系統。
Q:NVIDIA 近年來的重心發生了怎樣的變化?
A:NVIDIA 最開始 是一家旨在創建新的計算平台的芯片公司,于2006年推出了CUDA,徹底改變了計算。隨着時間的推移,他們意識到一種新的計算方法需要對技術堆棧進行重新發明,從而引發了類似 DGX one 這樣的新系統的發明,開啓了人工智能革命。
Q:NVIDIA實現的新計算理念的關鍵元素是什麽?
A:新的計算方法需要重新設計技術棧的每一層,包括新的處理器、軟件和系統。這種新的軟件處理方式,現在被稱為人工智能,需要許多處理器協同工作,為數百萬人提供服務請求,與傳統數據中心有根本區別。
Q:NVIDIA認為對于高性能計算至關重要的兩種網絡類型是什麽?
A:英偉達認識到兩種網絡對于高性能計算至關重要:北向網絡和東西網絡。北向網絡用于管理控制平面並連接到外部世界,而東西網絡則用于計算機彼此交流以解決問題,強調處理單元之間高效通信的重要性。
Q:NVIDIA是如何將一個數據中心轉變成一個計算單元的?
A:NVIDIA 將整個數據中心轉化為一個計算單元,將整個數據中心作為一個計算單元運行一個作業,並將操作系統更改為 Nvidia 的 CUDA,從而在計算組織和管理方式上創建了重大轉變。
Q:NVIDIA未來五年的詳細路線圖意味着公司的轉型有何重大意義?
A:英偉達未來五年的詳細路線圖顯示其轉變為一家基礎設施公司。這顯露了公司的戰略願景和建立全球數據中心的意圖,因為基礎設施對未來至關重要,需要與全球基礎設施規劃保持一致。
Q:英偉達如何看待人工智能與互聯網和電力的關系?
A:英偉達認為人工智能是一種新型基礎設施,可媲美電力和互聯網。就像互聯網和電力成為不可或缺的社會和商業基礎設施一樣,英偉達預計人工智能將被整合到生活的每個方面,需要在每家公司、地區、行業和國家建立人工智能基礎設施。
Q:NVIDIA首席執行官Jenson Wong承諾的AI基礎設施未來發展是什麽?
A:黃健昌承諾,人工智能基礎設施的未來發展將從根本上改變數據中心的建設和利用方式。他建議這些人工智能數據中心將成為必不可少的工廠,生産對各個行業至關重要的有價值的令牌。
Q:人工智能如何融入NVIDIA當前和未來的産品?
A:人工智能通過引入AI加速GPU,正在革新計算機圖形學,使其融入到NVIDIA目前和未來的産品中。同時,它也應用于物理模擬、5G射頻信號處理等領域,並有望通過開發AI工廠或數據中心,將人工智能引入其他産業。
Q:CUDA是什麽,它與人工智能和加速計算有什麽關系?
A:CUDA 是由 NVIDIA 創建的並行計算平台和編程模型。它使開發人員能夠利用 NVIDIA GPU 的強大計算能力進行通用計算,顯著加速各個領域的應用程序,包括人工智能和其他計算密集型任務。
Q:圖書館生態系統如何徹底改變了計算機和信息技術?
A:圖書館生態系統通過提供深度學習和訓練及推理所需的庫,徹底改變了計算和信息技術,從而開啓了這場革命。
Q:Coup TA Co DSS和Cool Space在稀疏結構模擬器中的應用是什麽?
A:Coup TA卡和稀疏結構模擬器的冷卻空間用于計算流體力學、元素分析,對于EDA和半導體行業非常重要。
Q:完全加速無線接入網堆棧的意義是什麽?
A:全面加速的無線接入網絡堆棧非常重要,因為它可以實現每MHz的數據速率達到令人難以置信的性能,並且與最先進的ASICs平齊,並且使得引入人工智能為5G成為可能。
Q:新的AI能力與傳統AI有何不同?
A:新的人工智能能力更加先進,不僅可以理解模式,還可以從文本到文本、文本到圖像、文本到視頻等生成,展示出人工智能推理和解決之前未曾見過的問題的能力。
Q:物理AI的概念是什麽,它與下一個AI時代有什麽關聯?
A:物理人工智能是指理解慣性和摩擦等物理特性的人工智能,使其能夠推理物理世界並解決與之相關的問題,這對于下一個人工智能時代至關重要。
Q:格雷斯·佈萊克沃爾的目的是什麽,它如何增強人工智能的能力?
A:格雷斯·佈萊克沃爾是一個新的計算機系統,旨在支持人工智能中的快速思考和推理,具有擴展能力,可以創建更大的系統並連接多台計算機,顯著提高人工智能的能力。
Q:一擊AI和思考AI之間有什麽區別?
A:一次性AI是指AI基于學習到的數據生成響應,而思考型AI涉及在提供答案之前對不同選項及其益處進行推理和思考,表明具備像人類那樣思考和推理的能力。
Q:新的AI基礎設施構建的特點是什麽?
A:新的AI基礎設施包括高功率密度、令人難以置信的內存和網絡帶寬、能夠擴展到大型系統,並被稱為AI競技場工廠。它利用整個機架,擁有120千瓦的功率,具有1吉字節的帶寬,采用專門的AI技術構建。
Q:為什麽新的數據中心被稱為“AI工廠”?
A:新的數據中心被稱為“AI工廠”,因為它們旨在支持大規模的人工智能操作,側重于效率和廣泛計算能力的容量。
Q:這個AI工廠的規模和財務投資是多少?
A:提到的人工智能工廠占地四百萬平方英尺,預計造價在六百億至八百億美元之間。其中的計算部分,也就是電子設備,預計需要四百億至五百億美元的投資。
Q:人工智能工廠所使用的技術涉及哪些複雜性?
A:人工智能工廠所使用的技術非常複雜,涉及數百個芯片加工步驟、紫外光刻技術,以及包括GPU和中繼器在內的多個組件的組裝。這個過程需要仔細的整合和高精度,機器人全天候工作,衆多合作夥伴共同努力。
Q:台灣正在建造的AI超級計算機的目的是什麽?
A:在台灣建造的人工智能超級計算機旨在為人工智能研究和開發提供本地基礎設施和生態系統,同時支持機器人和其他依賴先進人工智能能力的領域的科學工作。
Q:Envylink Fusion是什麽,它能做什麽?
A:Envylink Fusion是一個可以創建定制AI基礎設施的産品。它集成了NVIDIA GPU、CPU、網絡和其他必要組件,用于構建強大的AI超級計算機。它允許在系統中靈活整合不同類型的加速器和CPU,並連接到現有的AI生態系統。
Q:誰將能夠使用Envylink Fusion,它如何滿足他們的需求呢?
A:Envylink Fusion可以被任何希望搭建數據中心的人使用,包括NVIDIA、其他使用GPU的公司,以及個人可能想要將特定的ASICs或CPU集成到他們的人工智能基礎設施中。它通過為將各種計算元素集成到大規模人工智能系統中提供靈活開放的生態系統來支持他們的需求。
Q:DG X Spark計算機的規格和優勢是什麽?
A:DG X Spark計算機具有一petaflop的計算能力和128GB的HBM內存。它還具有128GB的LPDDR5x內存。這台計算機的好處包括允許開發人員、學生和研究人員在本地進行AI工作,而不必依賴雲服務,並預計在幾周內可供使用。
Q:DG X Station在AI模型方面能處理什麽?
A:DG X站是能夠處理一萬億參數的人工智能模型的。
Q:新一代AI原生計算機的主要目的是什麽?
A:新一代AI原生計算機的主要目的是運行現代AI原生應用程序,這些應用程序不一定要與傳統的IT軟件兼容,也不一定要通過虛擬機操作。
Q:人工智能原生計算機預計會如何影響傳統企業計算?
A:人工智能原生計算機有望通過引入一種稱為“代理AI”的新能力來重新定義傳統企業計算,可執行數字營銷、研究、客戶服務等任務。
Q:什麽是代理AI,它和傳統工作有什麽關系?
A:"代理AI"指的是數字代理,可以與人類一起執行各種任務,如數字營銷的活動經理、研究人員、軟件工程師、客戶服務和芯片設計師。它們本質上是傳統工作的數字化版本。
Q:為什麽到2030年會出現勞動力短缺問題,數字代理可以如何幫助解決?
A:到2030年,由于各種因素限制世界的增長能力,勞動力預計會出現短缺。數字代理可以通過協助開發更好的代碼,並更高效地工作,有效地充當數字員工。
Q:新RTX Pro企業服務器的關鍵組件是什麽?
A:新RTX Pro Enterprise服務器的關鍵組件包括一個配備了交換網絡和Cx A芯片的新主板,這些芯片是世界上最先進的網絡芯片,能夠讓GPU之間以高速進行通信。該服務器支持廣泛的工作負載,包括需要高吞吐量和低延遲的工作負載。
Q:新的人工智能模型的性能如何與之前的模型相比?
A:新的人工智能模型性能比之前的模型要高得多。例如,Deep Segar One 的性能是最先進模型的四倍,被認為是人工智能行業的重大突破。
Q:NVIDIA人工智能數據平台是什麽,對于企業有什麽好處?
A:NVIDIA AI數據平台是一種新型的存儲平台,可在非結構化數據中嵌入意義,使其適合于AI查詢。它由一種名為IQ的新查詢系統支持,可以加快檢索並改善查詢結果。該平台使企業能夠創建專門的AI代理,用于決策和數據分析。
Q:什麽是AI運維,它與傳統企業運營角色有何不同?
A:AI ops是一種新的軟件層,類似于傳統的供應鏈或人力資源管理角色,但是專門針對人工智能。它將管理、改進和評估公司內一系列AI代理,優化這些AI工具在企業環境中的使用和表現。
Q:人工智能模型融入企業IT的主要功能是什麽?
A:人工智能模型集成到企業IT中的主要功能包括微調模型、評估模型和安全模型。這些人工智能模型旨在增強IT系統的能力,並部署在各種企業運營中。
Q:哪些公司正在與AI運營合作,將AI模型創建並集成到IT系統中?
A:像 CrowdStrike、Data IQ 和 Data Robots 這樣的公司正在與 AI 運營合作,將 AI 模型創建和集成到 IT 系統中。另外,NVIDIA 與各種合作夥伴合作,包括那些創建 AI 代理人或“機器人”的合作夥伴,並與 DeepMind、Google DeepMind 和 Disney Research 合作建立先進的物理引擎來模擬機器人。
Q:NVIDIA及其合作夥伴開發的新物理引擎的重要意義是什麽?
A:由NVIDIA及其合作夥伴開發的新物理引擎非常重要,因為它是世界上最先進的,將于7月開源。這個物理引擎具有處理剛性和軟體模擬的高保真度能力,對于在模擬物理世界的虛擬世界中訓練AI機器人至關重要。
Q:NVIDIA的仿真和人工智能集成平台是如何工作的?
A:NVIDIA的模擬和人工智能集成平台通過使用模擬環境、計算訓練系統和ASIC運行時的組合來運作。該平台以一個名為“Isaac”的模擬環境開始,用于訓練人工智能模型。經過訓練的模型然後部署到人類或機器系統中,如自動駕駛汽車或機器人。NVIDIA通過GPU、一個名為“Isaac OS”的專門操作系統和預訓練模型提供計算能力,使這些系統能夠學習和有效運作。
Q:缺乏大規模數據給機器人制造商帶來了什麽挑戰?在這種情況下,人工智能如何能夠增強人類示範系統?
A:缺乏大規模數據對機器人制造商造成挑戰,因為由于開發人員可用的時間有限,人類演示無法擴展。人工智能可以通過從單次演示泛化並利用人工智能來擴大從人類演示中收集的數據量,從而用最少的手動捕獲訓練更先進的機器人模型。
Q:人工智能如何促進機器人訓練,而無需大量手動數據收集?
A:AI利用人類演示的大量數據來訓練機器人。 這個過程包括使用遠程操作員記錄的人類演示數據對通用模型進行微調。 然後AI可以從圖像和新指令中生成未來的世界狀態(夢想),並選擇最佳的用于訓練。 這有助于機器人學習各種新動作,減少手動數據捕捉的需求。
Q:人工智能和機器人技術對制造業的潛在經濟影響是什麽?
A:人工智能和機器人技術對制造業的潛在經濟影響是巨大的,全球預計在未來三年內計劃投資五萬億美元用于建設新工廠。這是由于制造業過程的回流和再工業化,以及建造更加智能、高效的工廠的必要性,這些工廠利用數字雙胞胎和人工智能技術。
Q:數字孿生在准備機器人未來方面扮演什麽樣的角色?
A:數字孿生在為機器人未來做准備中發揮着至關重要的作用,通過創建一個物理實體或系統的虛擬表示。這包括機器人、設備和整個工廠的數字孿生。它們有助于規劃、測試和訓練機器人,並對人工智能的發展至關重要,可以實現機器人在各種環境中高效、具有成本效益地部署。

英偉達公司
關註