黃仁勳台北連線 Build 2026:一 petaflop 開發機問世,PC 正在變成「個人 AI」

NVIDIA 執行長黃仁勳從台北連線 Build 2026,與納德拉對談 PC 從「個人電腦」演化為「個人 AI」的願景。微軟同場發表 Surface RTX Spark DevBox(一 petaflop、128GB 統一記憶體)、兩款本地 AI 模型 Ion Instruct 與 Ion Plan、Windows 開發工具大翻新,以及為 Agent 而生的 Vera Rubin 架構。

黃仁勳台北連線 Build 2026:一 petaflop 開發機問世,PC 正在變成「個人 AI」

本文整理自 Microsoft Build 2026 開場主題演講,2026 年 6 月 2 日。

{{< youtube FFMm454fxNA >}}


不計量的智慧:每張桌子、每個家庭

納德拉在 Build 2026 的邊緣運算段落開場就拋出一個宏大的目標:「如果我們能為每張桌子、每個家庭提供不計量的智慧?」這句話刻意呼應了微軟四十多年前的創業宣言「讓每張桌子上都有一台電腦」,但把「電腦」換成了「不計量的 AI」。不計量的意思是:本地運算,不需要雲端往返,不按 token 收費。

為了實現這個目標,微軟把 Windows ML 和 Windows AI 的涵蓋範圍擴展到所有 GPU 的安裝基數,不再只限於 NPU。這代表開發者可以假設每一台 Windows PC 都有本地 AI 推論能力,不管它裝的是什麼顯示卡。Outlook 的摘要功能、PowerPoint 的替代文字、Adobe After Effects 和 Premiere 的 AI 特效,現在都在本地跑。

更有意思的是兩款新的內建模型。Ion Instruct 是一個高效的推理小型語言模型,專為本地裝置最佳化。Ion Plan 則是一個規劃模型,能在本地建立完整的 agent 迴圈,包括工具存取能力。這兩個模型合在一起的意義是:你的 Windows PC 現在可以不連網就跑一個完整的 AI 代理人,從接收指令、規劃步驟、到呼叫本地工具執行任務。過去這種能力只存在於雲端,現在搬到了每一台桌機。

Surface RTX Spark DevBox:開發者的夢想機器

硬體方面最大的亮點是 Surface RTX Spark DevBox。這台機器建立在 NVIDIA 的 RTX Spark SoC 上,規格很猛:一 petaflop 的 AI 運算能力、20 個 CPU 核心、128GB 統一記憶體。統一記憶體是關鍵,因為 CPU 和 GPU 共享同一個記憶體池,大型語言模型可以直接存取所有 128GB,不需要在 CPU 記憶體和 GPU 記憶體之間來回搬資料。這台機器預計今年秋天出貨,現在已經開放候補名單。

微軟的 Kayla Cinnamon 在舞台上做了一段精彩的現場示範。她在 DevBox 上同時跑了三個本地模型,其中一個是 1200 億參數的大模型,GPU 記憶體用了 90GB,累計在本機處理了 340 萬個 token。整個過程不需要任何雲端連線。她還展示了 Ion Instruct 在背景主動分析 log 檔案、自動診斷開發問題的能力。這不是理論展示,而是一台實機在舞台上跑的真實 demo。

納德拉沒有就此停步。他宣布 Windows 即將登上 NVIDIA DGX Station GB300,一台桌上型的「資料中心」,能在本地跑一兆參數的模型。他說這大約等於當年訓練 GPT-2 或 GPT-3 時用的超級電腦的規模。五年前需要整座資料中心的運算量,現在放在你桌上。

Windows 開發者工具大翻新

開發者工具的更新清單很長,但有幾項特別值得注意。首先是 WSL Container,Windows 終於有了原生的容器支援,而且可以直接存取 GPU。過去在 Windows 上做容器開發總是要繞路,現在這個痛點被正面解決了。

其次是 75 個以上的 Unix 命令列工具,包括 grep、env、head、tail、touch、curl、sudo,現在都原生存在於 Windows 上。Starship、Z shell、Homebrew 也要原生支援。這些過去只有 Mac 和 Linux 才有的工具鏈,微軟一次補齊。對於長期因為命令列體驗而偏好 Mac 的開發者來說,這是微軟最有誠意的一次拉攏。

還有一個叫做 Intelligent Terminal 的新體驗。它在傳統終端機介面旁邊加了一個 agent 面板,內建 GitHub Copilot,能即時偵測終端機裡的錯誤並建議修正。直觀地說,就是你的終端機現在有一個 AI 助手隨時盯著你打的每一行指令,出錯的時候馬上幫你查。另外,File Explorer 現在也能識別 Git 狀態,顯示分支名稱、最後修改者和檔案狀態。這些看似小更新,加在一起就是一個完全不同的開發體驗。

黃仁勳:PC 從個人電腦變成個人 AI

NVIDIA 執行長黃仁勳(Jensen Huang)從台北連線加入了主題演講。他把時間軸拉回三年前跟納德拉的一次對話,當時他們討論如何打造一種新型態的 PC,專為設計師、創作者和 AI 應用服務。三年後,RTX Spark 就是那次對話的成果。

黃仁勳提出的核心觀點是:過去三四十年,PC 是一個人類親手操作的工具。但現在,PC 正在變成一個由 AI 助手自主使用的工具。你出門在外的時候可以傳訊息給你的 PC,請它幫你寫程式或做設計,它會自己啟動對應的工具、完成工作、跟你迭代。「PC 從個人電腦演化成個人 AI」,這不是行銷口號,而是一個具體的架構轉變。

讓這件事成為可能的技術基礎是 NVFP4 數值格式。黃仁勳說這是兩家公司共同開發的,讓 128GB 的統一記憶體可以裝進「兩千億參數以上」的前沿級模型。兩千億參數是當前最頂級模型的量級,代表你的桌機可以跑跟雲端一樣的模型,不需要花錢買 API token。

Vera Rubin:專為 Agent 設計的下一代架構

黃仁勳接著談到了 NVIDIA 的下一代系統 Vera Rubin。他把三代產品的定位講得很清楚:Hopper 是為預訓練設計的,Grace Blackwell 是為後訓練和推論設計的,Vera Rubin 則是專門為 agent 設計的。每一代對應一個不同的 AI 工作負載。

為什麼 agent 需要專門的硬體?因為 agent 的運算模式跟訓練和推論都不一樣。Agent 需要極低延遲(因為它在即時互動)、持續的讀寫存取(長期記憶和工作記憶)、以及大量並發的會話。黃仁勳說了一句很有畫面感的話:「過去的 CPU 是為人類設計的,而我們就是比 agent 更有耐心。Agent 要的是低延遲。」Vera 是一顆專為低延遲設計的革命性 CPU。

Vera Rubin 還有一個重要特性:端到端的機密運算。從儲存(長期記憶)到工作記憶,資料在傳輸中加密,在使用中也加密。這對企業客戶來說是關鍵需求,因為多個客戶和合作夥伴的 agent 會在同一套系統上同時運行。微軟是全球第一個把 Vera Rubin 系統上線驗證的雲端廠商,兩家的團隊在晶片還沒流片之前就開始共同設計資料中心。黃仁勳用一個數字總結兩家的合作成果:微軟目前部署了全球最大規模的 Grace Blackwell 系統。

Project Solara:Agent 走出螢幕,進入新裝置

另一個值得關注的發表是 Project Solara。微軟的 Stevie Bathiche 提出了一個觀點:「下一台電腦不是一個裝置,而是所有裝置作為一個系統協同運作。」Agent 不應該被困在 app 的框架裡,而應該出現在你需要它的地方和時刻。

Solara 是一個從晶片到雲端的平台,專為 agent 優先的裝置設計。微軟展示了兩種參考設計:一個是桌上型裝置,建在 MediaTek 晶片上,用 Windows Hello 臉部辨識登入,一開機就帶出 Microsoft 365 Copilot 的 WorkIQ context。另一個是可攜式數位名牌,建在高通晶片上,有指紋辨識、相機和麥克風,讓使用者可以用語音跟 agent 互動。

高通執行長艾蒙(Cristiano Amon)透過視訊現身,說了一句很值得記住的話:「今天智慧型手機是你數位生活的中心。但當 agent 出現之後,agent 就會變成你數位體驗的中心。」這等於是高通執行長親口承認,智慧型手機的時代正在被 agent 取代。已經在探索 Solara 的企業夥伴包括 AccuWeather、Best Buy、CVS Health、Levi's 和 Target。

我的觀察:運算裝置的定義正在被重寫

這場主題演講裡關於邊緣運算的段落,傳遞了一個比產品發表更深層的訊息。當你的桌機可以跑 2000 億參數的模型、你的 PC 在你出門時自己寫程式、你的名牌可以用語音呼叫 agent 處理文書,「電腦」這個詞的定義就正在被重寫。

黃仁勳從台北連線這件事本身也有象徵意義。台灣是全球半導體供應鏈的核心,NVIDIA 的晶片在台積電生產,而黃仁勳選擇在 Computex 期間從台北加入微軟的開發者大會,等於是在兩個生態系之間搭了一座橋。這場對話的訊息很明確:AI 時代的硬體創新,不是某一家公司能獨自完成的。

對開發者來說,「不計量智慧」的願景如果真的實現,對軟體架構會有根本性的影響。過去兩年,開發者在設計 AI 應用時,最大的考量之一就是 token 成本。每一次 API 呼叫都是錢。但如果本地模型的能力夠強、記憶體夠大、而且不按 token 收費,那麼很多原本因為成本而不划算的應用場景,突然就變得可行了。這可能是比任何單一產品發表都更深遠的改變。