從 GeForce 的豪賭到 AI 工廠:NVIDIA 護城河的真正本質
黃仁勳在 Lex Fridman 訪談中首次完整剖析 NVIDIA 的核心競爭力。不是晶片設計,不是演算法,而是花了 20 年建立的 CUDA 安裝基礎,加上每年十倍效能提升的執行速度。這個護城河的本質,跟台積電驚人地相似。

本文整理自《Lex Fridman Podcast》2026 年 3 月播出的單集。
{{< youtube vif8NQcjVf0 >}}
一個差點殺死公司的決定
2000 年代中期,NVIDIA 做了一個在當時看來接近自殺的決定:把 CUDA 放上 GeForce 消費級顯示卡。
這個決定的背景是這樣的。NVIDIA 發明了 CUDA 這個平行運算平台,希望讓 GPU 不只是畫遊戲畫面的工具,而是一個通用的運算加速器。問題在於,一個運算平台要成功,關鍵不在於技術多漂亮,而在於有多少開發者願意在上面寫程式。而開發者願不願意投入,取決於一件事:安裝基礎有多大。黃仁勳在訪談中直言,安裝基礎是一個架構「最重要的特質」,其重要性超過優雅的設計。他舉了 x86 的例子來說明這一點:x86 是一個公認不優雅的架構,「attracted enormous amounts of criticism」,但它活了下來,打敗了所有設計精美的 RISC 架構。原因只有一個,就是安裝基礎。
把 CUDA 放上 GeForce 意味著每一張消費級顯示卡都得額外承擔 CUDA 的成本,但遊戲玩家不會為此多付一分錢。NVIDIA 當時是一家毛利率只有 35% 的公司,這個決定直接吃掉了幾乎所有利潤。公司市值從約 70 億美元跌到 15 億美元左右,在低谷徘徊了好幾年。但黃仁勳堅持這條路,因為他看到一個別人沒看到的未來:如果把 CUDA 送到數百萬台 PC 裡,大學實驗室的研究者、打造自己叢集的工程學生、甚至業餘玩家,都會在某天「發現」自己手上其實有一台超級電腦。那個「某天」,後來就是深度學習革命。
護城河不是技術,是信任
當 Lex Fridman 直接問「NVIDIA 最大的護城河是什麼」時,黃仁勳的答案毫不猶豫:CUDA 的安裝基礎。但他接著說了一段更深層的分析,點出了為什麼這個護城河幾乎不可能被複製。
CUDA 的成功從來不是三個人、十個人的事,而是 43,000 名 NVIDIA 員工持續投入,加上數百萬開發者相信 NVIDIA 會繼續做下去,從 CUDA 1 做到 CUDA 13,所以才願意把自己的軟體堆疊建構在上面。對開發者來說,CUDA 的價值主張極為清楚:如果我支持 CUDA,平均每六個月效能就會提升十倍;如果我在 CUDA 上開發,我的軟體可以跑在數億台電腦上,存在於每一個雲端、每一家電腦公司、每一個產業、每一個國家。更重要的是,開發者「百分之百信任 NVIDIA 會一直維護和改進 CUDA」。
這讓我想到台積電。黃仁勳在同一場訪談中談到台積電時說:「我們做了不知道幾百億美元的生意,而我們之間沒有合約。」台積電的護城河也不只是 3 奈米製程技術,而是能夠同時協調數百家客戶不斷變動的需求,準時交貨,從不食言的「信任」。NVIDIA 和台積電的護城河本質上是同一件事:當你花了二十年、三十年建立信任,當整個產業的軟體堆疊和供應鏈都已經長在你的平台上,這種鎖定效應是任何單一技術突破都無法撼動的。
從晶片到工廠:心智模型的根本轉變
訪談中最讓我印象深刻的段落之一,是黃仁勳描述自己的「心智模型」如何改變。過去發布新產品時,他會拿起一顆晶片,那就是他腦中的 NVIDIA。現在,他腦中浮現的是一個巨大的吉瓦級基礎設施,有電力系統連接電網,有巨型冷卻裝置,有一萬個人在裡面安裝設備。他說啟動一座 AI 工廠不是某個人去按一個開關,而是需要幾千人花好幾週才能讓它跑起來。
這不只是物理規模的變化,而是電腦這個東西在世界上扮演角色的根本改變。黃仁勳的核心論點是:電腦不再是倉庫,而是工廠。過去的電腦本質上是儲存和檢索系統,我們預先錄製內容、把它放進檔案、再用推薦系統幫你找出來。這是一個「人類預先錄製,電腦幫你撈」的模型。但 AI 電腦是即時生成的:它理解你的情境,根據最新的洞察,為你量身產出答案。這是從「檢索式運算」到「生成式運算」的典範轉移,後者需要的運算量比前者多出不知道多少個數量級。
更關鍵的是,既然電腦變成了工廠,它就直接跟公司的營收掛鉤。倉庫本身不賺錢,但工廠的產出就是商品。黃仁勳觀察到,AI 工廠產出的「token」已經開始分級定價,就像 iPhone 有不同價位的機型:有免費的 token、有中階的 token、也有人願意付每百萬 token 一千美元的高階推理 token。智慧本身正在成為一種可以定價的商品,而這意味著全世界的 GDP 會加速成長,其中用於運算的比例會比過去高出一百倍。
四大擴展定律:為什麼不會停下來
黃仁勳在訪談中提出了一個框架,把 AI 的擴展分成四個層次,每一層都代表更多的運算需求。第一是預訓練擴展定律,這是最早被觀察到的:模型越大、資料越多、算力越高,AI 就越聰明。當伊利亞.蘇茨克維(Ilya Sutskever)說「我們的資料用完了」時,業界一度恐慌,但黃仁勳認為這個擔憂早就過時了。合成資料已經解決了這個問題,訓練的瓶頸從資料轉移到了算力本身。
第二是後訓練擴展定律,透過精煉和微調持續提升模型能力。第三是測試時擴展定律,也就是推理階段的運算。黃仁勳記得很多人跟他說「推理很簡單,預訓練才難」,但這在他看來一直是不合邏輯的。推理就是思考,思考比閱讀難得多。預訓練只是記憶和歸納,但推理需要規劃、搜索、分解未知問題,這怎麼可能比較省算力?事實證明他是對的,測試時擴展是極度運算密集的。
第四是 Agent 擴展定律。當一個 AI 系統可以生出一群子代理來做事,就像一家公司不是靠 CEO 一個人做所有事,而是透過招聘來擴張產能。Agent 能以極快的速度繁殖更多的 Agent,而這些 Agent 運作時會產生大量新資料和經驗,其中優質的部分會回流到預訓練階段被記憶下來,形成一個正循環。最終,這四個擴展定律匯聚成一個結論:智慧的擴展,歸根結底就是算力的擴展。對 NVIDIA 來說,這代表需求沒有天花板。
這對我們意味著什麼
聽完這場兩個半小時的訪談,我最深的感受是:黃仁勳不是在描述 NVIDIA 的未來,他是在描述整個運算產業的結構性轉變。當電腦從倉庫變成工廠,「買電腦」這件事的經濟邏輯就完全不同了。過去 IT 是成本中心,是為了讓營運更有效率;未來 AI 基礎建設是利潤中心,是直接生產營收的機器。
對臺灣來說,這場轉變有雙重意涵。一方面,臺灣站在這條供應鏈的核心位置,台積電、日月光、聯發科都是受益者。但另一方面,臺灣的企業如果只把 AI 當成「提升效率的工具」而非「產出商品的工廠」,就會錯過黃仁勳所描述的那個更大的機會。Token 就是新時代的產品,而你的 AI 投資報酬率應該用「產出了多少有價值的 token」來衡量,不是用「省下了多少人力」。