科技巨頭觀察

從 GeForce 的豪賭到 AI 工廠：NVIDIA 護城河的真正本質

黃仁勳在 Lex Fridman 訪談中首次完整剖析 NVIDIA 的核心競爭力。不是晶片設計，不是演算法，而是花了 20 年建立的 CUDA 安裝基礎，加上每年十倍效能提升的執行速度。這個護城河的本質，跟台積電驚人地相似。

2026 年 5 月 17 日 · 來源： Lex Fridman Podcast

本文整理自《Lex Fridman Podcast》2026 年 3 月播出的單集。

一個差點殺死公司的決定

2000 年代中期，NVIDIA 做了一個在當時看來接近自殺的決定：把 CUDA 放上 GeForce 消費級顯示卡。

這個決定的背景是這樣的。NVIDIA 發明了 CUDA 這個平行運算平台，希望讓 GPU 不只是畫遊戲畫面的工具，而是一個通用的運算加速器。問題在於，一個運算平台要成功，關鍵不在於技術多漂亮，而在於有多少開發者願意在上面寫程式。而開發者願不願意投入，取決於一件事：安裝基礎有多大。黃仁勳在訪談中直言，安裝基礎是一個架構「最重要的特質」，其重要性超過優雅的設計。他舉了 x86 的例子來說明這一點：x86 是一個公認不優雅的架構，「attracted enormous amounts of criticism」，但它活了下來，打敗了所有設計精美的 RISC 架構。原因只有一個，就是安裝基礎。

把 CUDA 放上 GeForce 意味著每一張消費級顯示卡都得額外承擔 CUDA 的成本，但遊戲玩家不會為此多付一分錢。NVIDIA 當時是一家毛利率只有 35% 的公司，這個決定直接吃掉了幾乎所有利潤。公司市值從約 70 億美元跌到 15 億美元左右，在低谷徘徊了好幾年。但黃仁勳堅持這條路，因為他看到一個別人沒看到的未來：如果把 CUDA 送到數百萬台 PC 裡，大學實驗室的研究者、打造自己叢集的工程學生、甚至業餘玩家，都會在某天「發現」自己手上其實有一台超級電腦。那個「某天」，後來就是深度學習革命。

護城河不是技術，是信任

當 Lex Fridman 直接問「NVIDIA 最大的護城河是什麼」時，黃仁勳的答案毫不猶豫：CUDA 的安裝基礎。但他接著說了一段更深層的分析，點出了為什麼這個護城河幾乎不可能被複製。

CUDA 的成功從來不是三個人、十個人的事，而是 43,000 名 NVIDIA 員工持續投入，加上數百萬開發者相信 NVIDIA 會繼續做下去，從 CUDA 1 做到 CUDA 13，所以才願意把自己的軟體堆疊建構在上面。對開發者來說，CUDA 的價值主張極為清楚：如果我支持 CUDA，平均每六個月效能就會提升十倍；如果我在 CUDA 上開發，我的軟體可以跑在數億台電腦上，存在於每一個雲端、每一家電腦公司、每一個產業、每一個國家。更重要的是，開發者「百分之百信任 NVIDIA 會一直維護和改進 CUDA」。

這讓我想到台積電。黃仁勳在同一場訪談中談到台積電時說：「我們做了不知道幾百億美元的生意，而我們之間沒有合約。」台積電的護城河也不只是 3 奈米製程技術，而是能夠同時協調數百家客戶不斷變動的需求，準時交貨，從不食言的「信任」。NVIDIA 和台積電的護城河本質上是同一件事：當你花了二十年、三十年建立信任，當整個產業的軟體堆疊和供應鏈都已經長在你的平台上，這種鎖定效應是任何單一技術突破都無法撼動的。

從晶片到工廠：心智模型的根本轉變

訪談中最讓我印象深刻的段落之一，是黃仁勳描述自己的「心智模型」如何改變。過去發布新產品時，他會拿起一顆晶片，那就是他腦中的 NVIDIA。現在，他腦中浮現的是一個巨大的吉瓦級基礎設施，有電力系統連接電網，有巨型冷卻裝置，有一萬個人在裡面安裝設備。他說啟動一座 AI 工廠不是某個人去按一個開關，而是需要幾千人花好幾週才能讓它跑起來。

這不只是物理規模的變化，而是電腦這個東西在世界上扮演角色的根本改變。黃仁勳的核心論點是：電腦不再是倉庫，而是工廠。過去的電腦本質上是儲存和檢索系統，我們預先錄製內容、把它放進檔案、再用推薦系統幫你找出來。這是一個「人類預先錄製，電腦幫你撈」的模型。但 AI 電腦是即時生成的：它理解你的情境，根據最新的洞察，為你量身產出答案。這是從「檢索式運算」到「生成式運算」的典範轉移，後者需要的運算量比前者多出不知道多少個數量級。

更關鍵的是，既然電腦變成了工廠，它就直接跟公司的營收掛鉤。倉庫本身不賺錢，但工廠的產出就是商品。黃仁勳觀察到，AI 工廠產出的「token」已經開始分級定價，就像 iPhone 有不同價位的機型：有免費的 token、有中階的 token、也有人願意付每百萬 token 一千美元的高階推理 token。智慧本身正在成為一種可以定價的商品，而這意味著全世界的 GDP 會加速成長，其中用於運算的比例會比過去高出一百倍。

四大擴展定律：為什麼不會停下來

黃仁勳在訪談中提出了一個框架，把 AI 的擴展分成四個層次，每一層都代表更多的運算需求。第一是預訓練擴展定律，這是最早被觀察到的：模型越大、資料越多、算力越高，AI 就越聰明。當伊利亞．蘇茨克維（Ilya Sutskever）說「我們的資料用完了」時，業界一度恐慌，但黃仁勳認為這個擔憂早就過時了。合成資料已經解決了這個問題，訓練的瓶頸從資料轉移到了算力本身。

第二是後訓練擴展定律，透過精煉和微調持續提升模型能力。第三是測試時擴展定律，也就是推理階段的運算。黃仁勳記得很多人跟他說「推理很簡單，預訓練才難」，但這在他看來一直是不合邏輯的。推理就是思考，思考比閱讀難得多。預訓練只是記憶和歸納，但推理需要規劃、搜索、分解未知問題，這怎麼可能比較省算力？事實證明他是對的，測試時擴展是極度運算密集的。

第四是 Agent 擴展定律。當一個 AI 系統可以生出一群子代理來做事，就像一家公司不是靠 CEO 一個人做所有事，而是透過招聘來擴張產能。Agent 能以極快的速度繁殖更多的 Agent，而這些 Agent 運作時會產生大量新資料和經驗，其中優質的部分會回流到預訓練階段被記憶下來，形成一個正循環。最終，這四個擴展定律匯聚成一個結論：智慧的擴展，歸根結底就是算力的擴展。對 NVIDIA 來說，這代表需求沒有天花板。

這對我們意味著什麼

聽完這場兩個半小時的訪談，我最深的感受是：黃仁勳不是在描述 NVIDIA 的未來，他是在描述整個運算產業的結構性轉變。當電腦從倉庫變成工廠，「買電腦」這件事的經濟邏輯就完全不同了。過去 IT 是成本中心，是為了讓營運更有效率；未來 AI 基礎建設是利潤中心，是直接生產營收的機器。

對臺灣來說，這場轉變有雙重意涵。一方面，臺灣站在這條供應鏈的核心位置，台積電、日月光、聯發科都是受益者。但另一方面，臺灣的企業如果只把 AI 當成「提升效率的工具」而非「產出商品的工廠」，就會錯過黃仁勳所描述的那個更大的機會。Token 就是新時代的產品，而你的 AI 投資報酬率應該用「產出了多少有價值的 token」來衡量，不是用「省下了多少人力」。