黃仁勳:500 億美元的 AI 工廠,反而能產出最低成本的 token

NVIDIA 執行長黃仁勳在 All-In Podcast 上闡述 AI 工廠經濟學的核心邏輯:不要把工廠的價格等同於 token 的成本。一座 500 億美元的資料中心,因為擁有十倍的吞吐量,反而能產出業界最低成本的 token。他同時談到 NVIDIA 從 GPU 公司進化為全棧 AI 基礎設施公司的戰略,以及在中國市場失去 95% 份額後的重返計畫。

黃仁勳:500 億美元的 AI 工廠,反而能產出最低成本的 token

本文整理自《All-In Podcast》2026 年 3 月播出的單集,於 GTC 2026 期間錄製。

{{< youtube gwW8GKwHB3I >}}

{{< spotify "episode/2HCl49WohQeFtmlx2MoN85" >}}

{{< apple-podcast "tw/podcast/jensen-huang-live-nvidias-future-physical-ai-rise-of/id1502871393?i=1000756188610" >}}


不是 GPU 公司,是 AI 工廠公司

GTC 2026 的主題演講才剛結束,黃仁勳(Jensen Huang)就坐進了 All-In Podcast 的錄影棚,面對四位主持人的連番提問。開場不到三分鐘,他就拋出了一句定義 NVIDIA 當前身份的話:我們從一家 GPU 公司,進化成了一家 AI 工廠公司。

這不只是品牌論述的升級。NVIDIA 的運算能力現在橫跨 GPU、CPU、交換器、擴展交換器、網路處理器,GTC 上剛發布的 Grok 處理器整合,更是要把「正確的工作負載放在正確的晶片上」。這種分散式、異質運算的思維,可以追溯到兩年半前他在 GTC 上首次介紹的 Dynamo,也就是 NVIDIA AI 工廠的作業系統。

Dynamo 這個名字藏著隱喻。十九世紀末,西門子發明的 Dynamo 發電機把水力轉化成電力,驅動了上一次工業革命的工廠。黃仁勳認為 NVIDIA 的 Dynamo 扮演同樣的角色,是下一次工業革命的動力核心。只不過這次轉化的不是水力,而是分散式推理(disaggregated inference)的運算能力。

從大型語言模型到代理人處理

NVIDIA 為什麼要從「一張卡」擴展到「一整座工廠」?關鍵在於工作負載變了。Chamath Palihapitiya 在節目中追問這個轉變的意義,黃仁勳的回答很直接:我們從大型語言模型處理,進入了代理人處理的時代。

運行一個 AI 代理人,遠比生成一段文字複雜。它要存取工作記憶體、呼叫長期記憶、使用各種工具、跟其他代理人協作。有些代理人跑超大模型,有些跑小模型,有些是擴散模型,有些是自迴歸模型。NVIDIA 設計 Vera Rubin 平台的原因就在這裡:一座資料中心必須同時處理性質完全不同的運算任務。

這個轉變帶來的直接結果,是 NVIDIA 的可觸及市場大幅擴張。原本 NVIDIA 是「一個機架」的公司,現在加了四個機架。黃仁勳估算,光是這個擴張就讓 TAM(可觸及市場)增加了 33% 到 50%。新增的部分包括 BlueField 儲存處理器、Grok 處理器、CPU,以及大量的網路處理器。所有這些硬體共同運行的東西,黃仁勳給了它一個定義:代理人,現代產業的作業系統。

工廠的價格不等於 token 的成本

這是整場對話中最精彩的一段論述。Brad Gerstner(Altimeter Capital 創辦人)直接拋出市場上的質疑:NVIDIA 的推理工廠要價 400 到 500 億美元,客製化 ASIC 和 AMD 的替代方案只要 250 到 300 億美元,你們不是要丟市佔嗎?

黃仁勳的回應很簡潔:不要把工廠的價格等同於 token 的成本。他拆解了數字。一座 500 億美元的資料中心,大約 200 億美元花在土地、電力和建築外殼上,這跟你用誰的晶片無關。剩下的儲存、網路、CPU、伺服器、冷卻,也是必要開支。真正因為選擇 NVIDIA 而多出的成本,遠沒有表面數字看起來那麼大。但這座工廠的吞吐量,是替代方案的十倍。

「即使晶片是免費的,如果你跟不上技術的節奏和我們推進的速度,也不算便宜。」這句話聽起來像行銷話術,但背後的邏輯很冷靜:在 AI 推理的世界裡,效率的差距會以指數倍放大成本的差距。一座效率更高的工廠,即使初始投資更大,每產出一個 token 的邊際成本反而更低。

我的觀察:台積電的影子

黃仁勳這段「工廠成本 ≠ token 成本」的論述,讓我立刻想到台積電的先進製程投資邏輯。每次台積電宣布在亞利桑那或熊本建廠,動輒 400 億美元的投資數字總會引來「是否值得」的質疑。但台積電的商業邏輯從來不是用建廠成本來衡量晶片價格,而是用每個電晶體的成本、每瓦效能,以及良率帶來的整體經濟效益來計算。

NVIDIA 正在走同樣的路。當你從「賣晶片」的思維跳到「賣 token」的思維,評估標準就不再是單位硬體成本,而是單位產出成本。台積電的 3 奈米製程比 7 奈米建廠成本高出數倍,但每顆電晶體的成本反而更低。NVIDIA 的 500 億美元工廠,正是用同樣的邏輯在運作。在半導體產業鏈上深耕數十年的臺灣讀者,對這個邏輯應該再熟悉不過了。

全棧優勢:為什麼市佔率反而在成長

Chamath Palihapitiya 提了一個很多投資人心裡的疑問:Google 有 TPU、Amazon 有 Inferentia 和 Trainium,每家大客戶都在試著往下走、做自己的晶片,NVIDIA 怎麼看?

黃仁勳的回答意外地自信。他指出 NVIDIA 是世界上唯一一家跟所有 AI 公司都合作的 AI 公司。「他們從不讓我看他們在做什麼,但我永遠讓他們看我在做什麼。」這種開放姿態的信心來自兩點。第一,NVIDIA 是唯一能部署在所有雲端、所有地區、所有邊緣裝置的架構。第二,大約 40% 的客戶要的不是買晶片,而是買完整的 AI 基礎設施,需要全棧解決方案,而 NVIDIA 是唯一能提供的。

事實也在印證這個策略。AWS 剛宣布未來幾年要購買一百萬顆 NVIDIA 晶片。Anthropic 開始直接向 NVIDIA 採購。開源模型的爆發性成長幾乎全部跑在 NVIDIA 上。黃仁勳指出 NVIDIA 的市佔率其實在增長,不是萎縮。原因不只是技術領先,更是因為 AI 基礎設施的複雜度,已經遠超「做一顆晶片」能解決的範疇。

分析師看不懂的規模

Brad Gerstner 丟出了一個犀利的數據:華爾街分析師預估 NVIDIA 明年成長 30%、後年 20%、2029 年只剩 7%。如果把這些數字套到 NVIDIA 的可觸及市場上,等於暗示市佔率會暴跌。黃仁勳對此毫不客氣:他們就是不懂 AI 的規模和廣度。

Chamath Palihapitiya 補了一刀:這些分析師受限於「大數法則」的思維框架,他們的風控委員會不會相信一家 5 兆美元市值的公司還能長到 15 兆。David Sacks 則更直接:「以前沒發生過,所以你不能說它會發生。」

黃仁勳反擊的方式是重新定義 NVIDIA 在做什麼。「有人最近說,Jensen,你怎麼可能在伺服器市場上比 Intel 還大?」他的回答是:整個資料中心的 CPU 市場一年大約 250 億美元,而 NVIDIA 在「我們坐在這裡聊天的時間裡」就做了 250 億美元的生意。這當然是開玩笑,但重點很清楚:NVIDIA 做的早已不是傳統的「伺服器晶片」市場,而是在解決 AI 基礎設施這個複雜得多的問題。多數人以為 AI 只發生在前五大超大規模雲端服務商身上,但 GTC 現場的上萬家公司裡,99% 不是 OpenAI 也不是 Anthropic,它們都是 AI 的使用者和建設者。

從中國失去 95% 市佔,到重返計畫

談到全球 AI 擴散,黃仁勳罕見地給出了一個驚人數字:NVIDIA 在全球第二大市場(中國)的市佔率,從 95% 掉到了 0%。這是美國出口管制政策的直接後果。

但他話鋒一轉,表示川普總統希望美國科技業領先、希望美國技術擴散到全世界。目前 NVIDIA 已經為多家中國公司申請了出口許可,並獲得了商務部長盧特尼克(Howard Lutnick)的批准。部分中國公司已經下了採購訂單,NVIDIA 正在重新啟動供應鏈以準備出貨。

更值得注意的是黃仁勳怎麼定義國家安全。他列舉了一系列美國已經失去優勢的領域:稀土礦物、電信網路、永續能源,然後說:這些產業的每一個,都是「我不希望 AI 產業變成的樣子」。他的理想圖景是,美國的科技堆疊,從晶片到運算系統到平台,被全球 90% 的國家使用,各國在這個基礎上建立自己的 AI 應用。如果 AI 最終走上太陽能、稀土、電信的老路,讓其他國家掌控了關鍵環節,那才是真正的國安危機。

台灣:戰略夥伴,不是棋子

被問到台灣的地緣政治風險時,黃仁勳提出了三個原則。第一,盡快重新工業化美國,無論是晶片製造、電腦製造還是 AI 工廠。第二,分散製造供應鏈,擴展到南韓、日本、歐洲。第三,展現克制。

他特別強調台灣供應鏈的戰略價值:「透過獲得台灣供應鏈的戰略支持、贏得他們的友誼,我們才能以驚人的速度在亞利桑那、德州、加州建廠。他們是真正的戰略夥伴,值得我們的支持、友誼和慷慨。他們正在盡一切努力加速美國的製造進程。」

這段話的分量不小。在當前的地緣政治語境下,黃仁勳選擇用「友誼」和「慷慨」來描述與台灣的關係,沒有用「依賴」或「風險」這些詞。這既是對台灣半導體產業的肯定,也是一種策略性的定位。他很清楚,在美國推動晶片製造回流的過程中,台灣不是要被取代的對象,而是讓整件事成為可能的關鍵力量。