黃仁勳宣布 Vera Rubin 全面量產:七顆新晶片、五分鐘組裝,AI 工廠時代正式開跑
NVIDIA 在 GTC Taipei 2026 宣布 Vera Rubin 系統全面量產,供應鏈規模是 Grace Blackwell 的兩倍,機櫃組裝時間從兩小時壓縮到五分鐘。黃仁勳同步發表 DSX AI 工廠藍圖,瞄準十年內上線的 100 GW AI 算力基礎設施。

本文整理自 NVIDIA GTC Taipei 2026 主題演講,2026 年 5 月 28 日。
{{< youtube wSp6AiNIrsY >}}
「實用 AI 已經到來」
黃仁勳(Jensen Huang)站上 GTC Taipei 2026 的舞台,開場就拋出一組數字:GitHub 上的程式碼提交量從 2023 年的 3 億次,成長到 2024 年的 4 億次、2025 年的 5 億次,然後在 2026 年前幾個月直接翻了近三倍。這不是投影片上的願景圖,而是已經發生的事實。全球大約 3,000 到 4,000 萬名軟體工程師,年薪總額約 3 兆美元,現在實質產出的價值接近 9 兆美元。黃仁勳用這組數字回擊了「AI 會讓工程師失業」的說法:事實是軟體工程師的招聘量不減反增,因為每一位工程師搭配 AI agent 之後能創造的價值更高了。
這場演講的核心主張很明確:運算就是營收(compute is revenue),token 是有利潤的營收單位。當每生成一個 token 都能帶來利潤,整個產業的邏輯就翻轉了。AI 工廠不再是成本中心,而是印鈔機。這也是為什麼台灣供應鏈的產能壓力前所未有,為什麼台灣的 GDP 被預估將成長近 10%。黃仁勳在台北宣布這一切,不是巧合,而是策略:台灣是 NVIDIA AI 基礎設施的製造心臟。
黃仁勳接著定義了 agentic AI 的架構。傳統的電腦運算是「應用程式加作業系統」,使用者點擊、打字來操作。新的模式是一個大型語言模型坐在「harness」(協調框架)裡面,這個框架負責管理工作記憶和長期記憶、調度工具、進行推理和規劃。使用者不再下指令,而是描述意圖。他在台上展示了三個現場示範:用一句話生成動畫 GIF、用一張照片生成可 3D 列印的 CAD 檔案、用 Claude Code 和 Codex 從 prompt 產出完整的功能性程式碼。這不是概念驗證,而是已經在運作的工具鏈。
Vera Rubin 全面量產:史上最大規模的產品發布
這場演講最重要的一句話是:「Vera Rubin is in full production。」Vera Rubin 不只是一顆 GPU,而是一套完整的多機櫃規模超級電腦系統,專為 agentic AI 工作負載設計。它的供應鏈規模是前一代 Grace Blackwell 的兩倍,涵蓋台灣 150 家以上的合作夥伴、數百萬平方英尺的廠房面積、數百個生產據點。黃仁勳說這是 NVIDIA 創立以來訂單量最大、上量速度最快的產品發布。
從硬體規格來看,Vera Rubin 的核心是七顆全新的 TSMC 3 奈米製程晶片,採用 CoWoS-R 和 CoWoS-L 先進封裝技術。HBM4 記憶體來自美光(Micron)、SK 海力士和三星三家供應商。單一運算板上有 6 兆顆電晶體、超過 18,000 個元件。整個機櫃包含 130 萬個組件,液冷母線上流過的電流超過 5,000 安培,相當於 20 輛電動車同時全力加速的用電量。而過去組裝一個 Grace Blackwell 機櫃需要兩小時,Vera Rubin 只要五分鐘。這個改進來自一個關鍵的工程決策:用 PCB 中板取代所有線纜。前一代系統到處都是線,拆裝費時又影響可靠度。現在機櫃兩側的所有連接都透過中板完成,組裝變成插入式操作。
Vera Rubin 由五套機櫃級子系統組成。第一套是 NVLink 72 運算機櫃,包含 18 個運算托盤和 9 個可熱插拔的 NVLink 交換托盤,負責最大吞吐量的 token 生成。第二套是 Grok LPX 機櫃,配備 256 顆 Grok 3 LPU,分布在 16 個托盤上,SRAM 頻寬達到每秒 40 PB,專門處理對延遲極度敏感的即時推論任務。第三套是 Vera CPU 機櫃,256 顆液冷 CPU 負責 agent 的協調和調度。第四套是 Vera Bluefield 4 STX 儲存機櫃,黃仁勳稱它是「AI 存放記憶的地方」,也是目前最快的儲存系統。第五套是 Spectrum X 乙太網路光子交換機,號稱全球第一款採用 200 Gbps 共封裝光學元件的乙太網路交換機,使用 TSMC 的 CoOP 製程搭配磷化銦雷射二極體。黃仁勳順帶提到,NVIDIA 現在是全球最大的網路設備公司。
DSX:AI 工廠的建造藍圖
Vera Rubin 是硬體,DSX 則是讓這些硬體變成可運營事業的軟體藍圖。NVIDIA 將 DSX 定位為 AI 工廠的完整參考架構,從設計、部署到日常營運一手包辦。
DSX SIM 利用 Omniverse 建立 AI 工廠的數位孿生。在實體機櫃進場之前,營運商可以先在虛擬環境中驗證整座工廠的配置、電力、冷卻和網路。黃仁勳說這是他長久以來的夢想:用數位框架模擬巨型系統。DSX OS 負責基礎設施的配置、監控和修復。DSX MAX LPS 則解決了一個產業痛點:目前的 AI 工廠普遍過度配置電力,浪費幅度高達 40%。DSX MAX LPS 讓營運商在同一個電力預算內安全地部署更多 GPU,直接轉化為更多的營收。搭配 45°C 高溫液冷技術(用水量和能耗都更低)以及動態電力分配(在機櫃之間即時調度瓦數,回收閒置電力),AI 工廠的每瓦效率大幅提升。DSX Flex 則讓 AI 工廠能配合電網即時訊號調整用電,等於把 AI 工廠變成可調度的電網資產。
黃仁勳列出了一串正在快速成長的 AI 雲端公司:CoreWeave(估值 500 到 700 億美元)、Nebius、Nscale(為英國電信和 Google 提供服務)、Naver Cloud(韓國)、Yoda(印度)、Together AI(新加坡/澳洲)、Indosat(印尼)、GMI Cloud(台灣)。他預估在十年結束前,全球將有 100 GW 的 AI 工廠上線,而單一 1 GW 工廠的建造成本已經從 200 到 300 億美元攀升到 500 到 600 億美元,正朝 800 到 1,000 億美元邁進。在這種規模下,每一個百分點的效率差異都代表數十億美元的年營收差距。選擇便宜但每瓦 token 產出較低的晶片,在固定電力預算下反而是虧錢的決定。
我的觀察:台灣從「代工」到「共建 AI 基礎設施」
黃仁勳選擇在台北宣布 Vera Rubin 量產,這件事本身就是訊號。他不是在 CES 或美國的 GTC 上講這些,而是站在台灣的舞台上,對著 70 個同步收看的觀賞派對,說出「全面量產」四個字。150 家台灣供應鏈夥伴、兩倍於前代的供應鏈規模、台灣 GDP 成長近 10% 的預測,這些數字背後的意義是:台灣在全球 AI 基礎設施中的角色,已經不只是「幫忙做晶片」。
從 TSMC 的 3 奈米製程和先進封裝,到美光、SK 海力士和三星的 HBM4 記憶體整合,再到機櫃組裝從兩小時壓縮到五分鐘的製造工程突破,每一個環節都需要台灣供應鏈的深度參與。黃仁勳用「extreme co-design」(極端協同設計)來描述 NVIDIA 的工程哲學:晶片、封裝、系統、網路、電力、冷卻、軟體全部一起設計。這個概念背後的現實是,NVIDIA 不可能獨自完成這些,它需要一整個生態系和它一起做整合。
另一個值得注意的角度是「運算即營收」這個命題的經濟後果。如果每瓦 token 產出直接等於營收,那 AI 工廠的營運邏輯就跟傳統資料中心完全不同。傳統資料中心是成本中心,老闆想的是怎麼壓低支出。AI 工廠是營收中心,老闆想的是怎麼在固定電力下塞進更多 GPU、生成更多 token。這個思維轉變,會重新定義從晶片設計到電網規劃的整條價值鏈。台灣的科技產業如果理解這一點,就能從「接訂單」升級到「參與定義」這場人類史上最大規模基礎建設的每一個環節。