科技巨頭觀察

黃仁勳宣布 Vera Rubin 全面量產：七顆新晶片、五分鐘組裝，AI 工廠時代正式開跑

NVIDIA 在 GTC Taipei 2026 宣布 Vera Rubin 系統全面量產，供應鏈規模是 Grace Blackwell 的兩倍，機櫃組裝時間從兩小時壓縮到五分鐘。黃仁勳同步發表 DSX AI 工廠藍圖，瞄準十年內上線的 100 GW AI 算力基礎設施。

2026 年 6 月 1 日 · 來源： NVIDIA GTC Taipei 2026 Keynote

黃仁勳宣布 Vera Rubin 全面量產：七顆新晶片、五分鐘組裝，AI 工廠時代正式開跑

本文整理自 NVIDIA GTC Taipei 2026 主題演講，2026 年 5 月 28 日。

「實用 AI 已經到來」

黃仁勳（Jensen Huang）站上 GTC Taipei 2026 的舞台，開場就拋出一組數字：GitHub 上的程式碼提交量從 2023 年的 3 億次，成長到 2024 年的 4 億次、2025 年的 5 億次，然後在 2026 年前幾個月直接翻了近三倍。這不是投影片上的願景圖，而是已經發生的事實。全球大約 3,000 到 4,000 萬名軟體工程師，年薪總額約 3 兆美元，現在實質產出的價值接近 9 兆美元。黃仁勳用這組數字回擊了「AI 會讓工程師失業」的說法：事實是軟體工程師的招聘量不減反增，因為每一位工程師搭配 AI agent 之後能創造的價值更高了。

這場演講的核心主張很明確：運算就是營收（compute is revenue），token 是有利潤的營收單位。當每生成一個 token 都能帶來利潤，整個產業的邏輯就翻轉了。AI 工廠不再是成本中心，而是印鈔機。這也是為什麼台灣供應鏈的產能壓力前所未有，為什麼台灣的 GDP 被預估將成長近 10%。黃仁勳在台北宣布這一切，不是巧合，而是策略：台灣是 NVIDIA AI 基礎設施的製造心臟。

黃仁勳接著定義了 agentic AI 的架構。傳統的電腦運算是「應用程式加作業系統」，使用者點擊、打字來操作。新的模式是一個大型語言模型坐在「harness」（協調框架）裡面，這個框架負責管理工作記憶和長期記憶、調度工具、進行推理和規劃。使用者不再下指令，而是描述意圖。他在台上展示了三個現場示範：用一句話生成動畫 GIF、用一張照片生成可 3D 列印的 CAD 檔案、用 Claude Code 和 Codex 從 prompt 產出完整的功能性程式碼。這不是概念驗證，而是已經在運作的工具鏈。

Vera Rubin 全面量產：史上最大規模的產品發布

這場演講最重要的一句話是：「Vera Rubin is in full production。」Vera Rubin 不只是一顆 GPU，而是一套完整的多機櫃規模超級電腦系統，專為 agentic AI 工作負載設計。它的供應鏈規模是前一代 Grace Blackwell 的兩倍，涵蓋台灣 150 家以上的合作夥伴、數百萬平方英尺的廠房面積、數百個生產據點。黃仁勳說這是 NVIDIA 創立以來訂單量最大、上量速度最快的產品發布。

從硬體規格來看，Vera Rubin 的核心是七顆全新的 TSMC 3 奈米製程晶片，採用 CoWoS-R 和 CoWoS-L 先進封裝技術。HBM4 記憶體來自美光（Micron）、SK 海力士和三星三家供應商。單一運算板上有 6 兆顆電晶體、超過 18,000 個元件。整個機櫃包含 130 萬個組件，液冷母線上流過的電流超過 5,000 安培，相當於 20 輛電動車同時全力加速的用電量。而過去組裝一個 Grace Blackwell 機櫃需要兩小時，Vera Rubin 只要五分鐘。這個改進來自一個關鍵的工程決策：用 PCB 中板取代所有線纜。前一代系統到處都是線，拆裝費時又影響可靠度。現在機櫃兩側的所有連接都透過中板完成，組裝變成插入式操作。

Vera Rubin 由五套機櫃級子系統組成。第一套是 NVLink 72 運算機櫃，包含 18 個運算托盤和 9 個可熱插拔的 NVLink 交換托盤，負責最大吞吐量的 token 生成。第二套是 Grok LPX 機櫃，配備 256 顆 Grok 3 LPU，分布在 16 個托盤上，SRAM 頻寬達到每秒 40 PB，專門處理對延遲極度敏感的即時推論任務。第三套是 Vera CPU 機櫃，256 顆液冷 CPU 負責 agent 的協調和調度。第四套是 Vera Bluefield 4 STX 儲存機櫃，黃仁勳稱它是「AI 存放記憶的地方」，也是目前最快的儲存系統。第五套是 Spectrum X 乙太網路光子交換機，號稱全球第一款採用 200 Gbps 共封裝光學元件的乙太網路交換機，使用 TSMC 的 CoOP 製程搭配磷化銦雷射二極體。黃仁勳順帶提到，NVIDIA 現在是全球最大的網路設備公司。

DSX：AI 工廠的建造藍圖

Vera Rubin 是硬體，DSX 則是讓這些硬體變成可運營事業的軟體藍圖。NVIDIA 將 DSX 定位為 AI 工廠的完整參考架構，從設計、部署到日常營運一手包辦。

DSX SIM 利用 Omniverse 建立 AI 工廠的數位孿生。在實體機櫃進場之前，營運商可以先在虛擬環境中驗證整座工廠的配置、電力、冷卻和網路。黃仁勳說這是他長久以來的夢想：用數位框架模擬巨型系統。DSX OS 負責基礎設施的配置、監控和修復。DSX MAX LPS 則解決了一個產業痛點：目前的 AI 工廠普遍過度配置電力，浪費幅度高達 40%。DSX MAX LPS 讓營運商在同一個電力預算內安全地部署更多 GPU，直接轉化為更多的營收。搭配 45°C 高溫液冷技術（用水量和能耗都更低）以及動態電力分配（在機櫃之間即時調度瓦數，回收閒置電力），AI 工廠的每瓦效率大幅提升。DSX Flex 則讓 AI 工廠能配合電網即時訊號調整用電，等於把 AI 工廠變成可調度的電網資產。

黃仁勳列出了一串正在快速成長的 AI 雲端公司：CoreWeave（估值 500 到 700 億美元）、Nebius、Nscale（為英國電信和 Google 提供服務）、Naver Cloud（韓國）、Yoda（印度）、Together AI（新加坡/澳洲）、Indosat（印尼）、GMI Cloud（台灣）。他預估在十年結束前，全球將有 100 GW 的 AI 工廠上線，而單一 1 GW 工廠的建造成本已經從 200 到 300 億美元攀升到 500 到 600 億美元，正朝 800 到 1,000 億美元邁進。在這種規模下，每一個百分點的效率差異都代表數十億美元的年營收差距。選擇便宜但每瓦 token 產出較低的晶片，在固定電力預算下反而是虧錢的決定。

我的觀察：台灣從「代工」到「共建 AI 基礎設施」

黃仁勳選擇在台北宣布 Vera Rubin 量產，這件事本身就是訊號。他不是在 CES 或美國的 GTC 上講這些，而是站在台灣的舞台上，對著 70 個同步收看的觀賞派對，說出「全面量產」四個字。150 家台灣供應鏈夥伴、兩倍於前代的供應鏈規模、台灣 GDP 成長近 10% 的預測，這些數字背後的意義是：台灣在全球 AI 基礎設施中的角色，已經不只是「幫忙做晶片」。

從 TSMC 的 3 奈米製程和先進封裝，到美光、SK 海力士和三星的 HBM4 記憶體整合，再到機櫃組裝從兩小時壓縮到五分鐘的製造工程突破，每一個環節都需要台灣供應鏈的深度參與。黃仁勳用「extreme co-design」（極端協同設計）來描述 NVIDIA 的工程哲學：晶片、封裝、系統、網路、電力、冷卻、軟體全部一起設計。這個概念背後的現實是，NVIDIA 不可能獨自完成這些，它需要一整個生態系和它一起做整合。

另一個值得注意的角度是「運算即營收」這個命題的經濟後果。如果每瓦 token 產出直接等於營收，那 AI 工廠的營運邏輯就跟傳統資料中心完全不同。傳統資料中心是成本中心，老闆想的是怎麼壓低支出。AI 工廠是營收中心，老闆想的是怎麼在固定電力下塞進更多 GPU、生成更多 token。這個思維轉變，會重新定義從晶片設計到電網規劃的整條價值鏈。台灣的科技產業如果理解這一點，就能從「接訂單」升級到「參與定義」這場人類史上最大規模基礎建設的每一個環節。