科技巨頭觀察

黃仁勳：500 億美元的 AI 工廠，反而能產出最低成本的 token

NVIDIA 執行長黃仁勳在 All-In Podcast 上闡述 AI 工廠經濟學的核心邏輯：不要把工廠的價格等同於 token 的成本。一座 500 億美元的資料中心，因為擁有十倍的吞吐量，反而能產出業界最低成本的 token。他同時談到 NVIDIA 從 GPU 公司進化為全棧 AI 基礎設施公司的戰略，以及在中國市場失去 95% 份額後的重返計畫。

2026 年 3 月 23 日 · 來源： All-In Podcast

本文整理自《All-In Podcast》2026 年 3 月播出的單集，於 GTC 2026 期間錄製。

{{< apple-podcast "tw/podcast/jensen-huang-live-nvidias-future-physical-ai-rise-of/id1502871393?i=1000756188610" >}}

不是 GPU 公司，是 AI 工廠公司

GTC 2026 的主題演講才剛結束，黃仁勳（Jensen Huang）就坐進了 All-In Podcast 的錄影棚，面對四位主持人的連番提問。開場不到三分鐘，他就拋出了一句定義 NVIDIA 當前身份的話：我們從一家 GPU 公司，進化成了一家 AI 工廠公司。

這不只是品牌論述的升級。NVIDIA 的運算能力現在橫跨 GPU、CPU、交換器、擴展交換器、網路處理器，GTC 上剛發布的 Grok 處理器整合，更是要把「正確的工作負載放在正確的晶片上」。這種分散式、異質運算的思維，可以追溯到兩年半前他在 GTC 上首次介紹的 Dynamo，也就是 NVIDIA AI 工廠的作業系統。

Dynamo 這個名字藏著隱喻。十九世紀末，西門子發明的 Dynamo 發電機把水力轉化成電力，驅動了上一次工業革命的工廠。黃仁勳認為 NVIDIA 的 Dynamo 扮演同樣的角色，是下一次工業革命的動力核心。只不過這次轉化的不是水力，而是分散式推理（disaggregated inference）的運算能力。

從大型語言模型到代理人處理

NVIDIA 為什麼要從「一張卡」擴展到「一整座工廠」？關鍵在於工作負載變了。Chamath Palihapitiya 在節目中追問這個轉變的意義，黃仁勳的回答很直接：我們從大型語言模型處理，進入了代理人處理的時代。

運行一個 AI 代理人，遠比生成一段文字複雜。它要存取工作記憶體、呼叫長期記憶、使用各種工具、跟其他代理人協作。有些代理人跑超大模型，有些跑小模型，有些是擴散模型，有些是自迴歸模型。NVIDIA 設計 Vera Rubin 平台的原因就在這裡：一座資料中心必須同時處理性質完全不同的運算任務。

這個轉變帶來的直接結果，是 NVIDIA 的可觸及市場大幅擴張。原本 NVIDIA 是「一個機架」的公司，現在加了四個機架。黃仁勳估算，光是這個擴張就讓 TAM（可觸及市場）增加了 33% 到 50%。新增的部分包括 BlueField 儲存處理器、Grok 處理器、CPU，以及大量的網路處理器。所有這些硬體共同運行的東西，黃仁勳給了它一個定義：代理人，現代產業的作業系統。

工廠的價格不等於 token 的成本

這是整場對話中最精彩的一段論述。Brad Gerstner（Altimeter Capital 創辦人）直接拋出市場上的質疑：NVIDIA 的推理工廠要價 400 到 500 億美元，客製化 ASIC 和 AMD 的替代方案只要 250 到 300 億美元，你們不是要丟市佔嗎？

黃仁勳的回應很簡潔：不要把工廠的價格等同於 token 的成本。他拆解了數字。一座 500 億美元的資料中心，大約 200 億美元花在土地、電力和建築外殼上，這跟你用誰的晶片無關。剩下的儲存、網路、CPU、伺服器、冷卻，也是必要開支。真正因為選擇 NVIDIA 而多出的成本，遠沒有表面數字看起來那麼大。但這座工廠的吞吐量，是替代方案的十倍。

「即使晶片是免費的，如果你跟不上技術的節奏和我們推進的速度，也不算便宜。」這句話聽起來像行銷話術，但背後的邏輯很冷靜：在 AI 推理的世界裡，效率的差距會以指數倍放大成本的差距。一座效率更高的工廠，即使初始投資更大，每產出一個 token 的邊際成本反而更低。

我的觀察：台積電的影子

黃仁勳這段「工廠成本 ≠ token 成本」的論述，讓我立刻想到台積電的先進製程投資邏輯。每次台積電宣布在亞利桑那或熊本建廠，動輒 400 億美元的投資數字總會引來「是否值得」的質疑。但台積電的商業邏輯從來不是用建廠成本來衡量晶片價格，而是用每個電晶體的成本、每瓦效能，以及良率帶來的整體經濟效益來計算。

NVIDIA 正在走同樣的路。當你從「賣晶片」的思維跳到「賣 token」的思維，評估標準就不再是單位硬體成本，而是單位產出成本。台積電的 3 奈米製程比 7 奈米建廠成本高出數倍，但每顆電晶體的成本反而更低。NVIDIA 的 500 億美元工廠，正是用同樣的邏輯在運作。在半導體產業鏈上深耕數十年的臺灣讀者，對這個邏輯應該再熟悉不過了。

全棧優勢：為什麼市佔率反而在成長

Chamath Palihapitiya 提了一個很多投資人心裡的疑問：Google 有 TPU、Amazon 有 Inferentia 和 Trainium，每家大客戶都在試著往下走、做自己的晶片，NVIDIA 怎麼看？

黃仁勳的回答意外地自信。他指出 NVIDIA 是世界上唯一一家跟所有 AI 公司都合作的 AI 公司。「他們從不讓我看他們在做什麼，但我永遠讓他們看我在做什麼。」這種開放姿態的信心來自兩點。第一，NVIDIA 是唯一能部署在所有雲端、所有地區、所有邊緣裝置的架構。第二，大約 40% 的客戶要的不是買晶片，而是買完整的 AI 基礎設施，需要全棧解決方案，而 NVIDIA 是唯一能提供的。

事實也在印證這個策略。AWS 剛宣布未來幾年要購買一百萬顆 NVIDIA 晶片。Anthropic 開始直接向 NVIDIA 採購。開源模型的爆發性成長幾乎全部跑在 NVIDIA 上。黃仁勳指出 NVIDIA 的市佔率其實在增長，不是萎縮。原因不只是技術領先，更是因為 AI 基礎設施的複雜度，已經遠超「做一顆晶片」能解決的範疇。

分析師看不懂的規模

Brad Gerstner 丟出了一個犀利的數據：華爾街分析師預估 NVIDIA 明年成長 30%、後年 20%、2029 年只剩 7%。如果把這些數字套到 NVIDIA 的可觸及市場上，等於暗示市佔率會暴跌。黃仁勳對此毫不客氣：他們就是不懂 AI 的規模和廣度。

Chamath Palihapitiya 補了一刀：這些分析師受限於「大數法則」的思維框架，他們的風控委員會不會相信一家 5 兆美元市值的公司還能長到 15 兆。David Sacks 則更直接：「以前沒發生過，所以你不能說它會發生。」

黃仁勳反擊的方式是重新定義 NVIDIA 在做什麼。「有人最近說，Jensen，你怎麼可能在伺服器市場上比 Intel 還大？」他的回答是：整個資料中心的 CPU 市場一年大約 250 億美元，而 NVIDIA 在「我們坐在這裡聊天的時間裡」就做了 250 億美元的生意。這當然是開玩笑，但重點很清楚：NVIDIA 做的早已不是傳統的「伺服器晶片」市場，而是在解決 AI 基礎設施這個複雜得多的問題。多數人以為 AI 只發生在前五大超大規模雲端服務商身上，但 GTC 現場的上萬家公司裡，99% 不是 OpenAI 也不是 Anthropic，它們都是 AI 的使用者和建設者。

從中國失去 95% 市佔，到重返計畫

談到全球 AI 擴散，黃仁勳罕見地給出了一個驚人數字：NVIDIA 在全球第二大市場（中國）的市佔率，從 95% 掉到了 0%。這是美國出口管制政策的直接後果。

但他話鋒一轉，表示川普總統希望美國科技業領先、希望美國技術擴散到全世界。目前 NVIDIA 已經為多家中國公司申請了出口許可，並獲得了商務部長盧特尼克（Howard Lutnick）的批准。部分中國公司已經下了採購訂單，NVIDIA 正在重新啟動供應鏈以準備出貨。

更值得注意的是黃仁勳怎麼定義國家安全。他列舉了一系列美國已經失去優勢的領域：稀土礦物、電信網路、永續能源，然後說：這些產業的每一個，都是「我不希望 AI 產業變成的樣子」。他的理想圖景是，美國的科技堆疊，從晶片到運算系統到平台，被全球 90% 的國家使用，各國在這個基礎上建立自己的 AI 應用。如果 AI 最終走上太陽能、稀土、電信的老路，讓其他國家掌控了關鍵環節，那才是真正的國安危機。

台灣：戰略夥伴，不是棋子

被問到台灣的地緣政治風險時，黃仁勳提出了三個原則。第一，盡快重新工業化美國，無論是晶片製造、電腦製造還是 AI 工廠。第二，分散製造供應鏈，擴展到南韓、日本、歐洲。第三，展現克制。

他特別強調台灣供應鏈的戰略價值：「透過獲得台灣供應鏈的戰略支持、贏得他們的友誼，我們才能以驚人的速度在亞利桑那、德州、加州建廠。他們是真正的戰略夥伴，值得我們的支持、友誼和慷慨。他們正在盡一切努力加速美國的製造進程。」

這段話的分量不小。在當前的地緣政治語境下，黃仁勳選擇用「友誼」和「慷慨」來描述與台灣的關係，沒有用「依賴」或「風險」這些詞。這既是對台灣半導體產業的肯定，也是一種策略性的定位。他很清楚，在美國推動晶片製造回流的過程中，台灣不是要被取代的對象，而是讓整件事成為可能的關鍵力量。