NVIDIA 的頭號勁敵不是 AMD,是 Google

在多數人認為 AMD 是 NVIDIA 最大對手時,Atreides Management 投資長 Gavin Baker 指出真正的威脅是 Google TPU。他分析了 NVIDIA 的四階段進化、Broadcom 與 AMD 的反 NVIDIA 聯盟,並預測多數客製化 ASIC 計畫將在三年內被取消。

NVIDIA 的頭號勁敵不是 AMD,是 Google

本文整理自 a16z Podcast 2025 年 10 月在 Runtime 大會播出的單集。

{{< youtube 5ze3ZNvOdRY >}}

{{< apple-podcast "tw/podcast/is-there-an-ai-bubble-gavin-baker-and-david-george/id842818711?i=1000734192167" >}}


問 AI 投資人「NVIDIA 的最大競爭對手是誰」,十個裡大概有八個會回答 AMD。少數人可能會提到 Broadcom 或 Intel。但 Atreides Management 創辦人暨投資長 Gavin Baker 的答案不一樣:Google。

Baker 在創辦 Atreides 之前,曾在 Fidelity Investments 管理 170 億美元的科技基金長達 18 年,是華爾街最受關注的科技投資人之一。在 a16z 的 Runtime 大會上,他和 a16z 成長基金負責人 David George 對談時,毫不猶豫地重新定義了 AI 晶片的競爭版圖:「NVIDIA 最大的競爭對手不是 AMD,不是 Broadcom,當然不是 Marvell,也不是 Intel。是 Google。」

Google:晶片、模型、流量三位一體

Baker 認為 Google 之所以是 NVIDIA 的真正威脅,不只因為它有 TPU 這顆晶片,而是因為它同時擁有三個別人很難複製的東西。

首先是 TPU(Tensor Processing Unit)本身。Baker 認為這可能是目前 NVIDIA GPU 之外唯一經過驗證的大規模 AI 訓練硬體,在推論方面甚至可能是最好的選擇。Google 花了三代 TPU 才真正把它做對,這個時間投入本身就是一道護城河。想要從零開始設計一顆能跟 TPU 匹敵的晶片,光是試錯的週期就要好幾年。

其次是 DeepMind 和 Gemini。Google 不只賣晶片(事實上它目前不對外賣 TPU),它自己就是 TPU 最大的消費者,用來訓練和運行自家的 AI 模型。這意味著 TPU 的優化方向完全由 Google 自己的 AI 研究需求來驅動,晶片和模型之間形成了緊密的共同進化關係,其他純硬體廠商很難複製這種回饋迴路。

第三是流量。Baker 估計 Gemini 在短短兩三個月內搶下了 15 到 20 個百分點的 AI 流量份額,而且這還不包括 Google 搜尋中的 AI 摘要功能。「我懷疑,如果把所有管道加在一起,Google 的實際 AI 流量已經超過 OpenAI 和 Anthropic。」加上 Chrome 瀏覽器的 50 億使用者,Google 手上握有其他 AI 公司難以企及的分發能力。

這三者加在一起,意味著 Google 同時在三條戰線上和 NVIDIA 交火:用 TPU 取代客戶對 NVIDIA GPU 的需求,用 Gemini 搶走 AI 模型的市場份額,用 Chrome 和搜尋鎖住使用者的入口。單看任何一條,威脅都有限;三條一起看,就理解了為什麼 Baker 認為這才是 NVIDIA 真正要擔心的對手。

NVIDIA 的四次進化

面對 Google 這種三位一體的對手,NVIDIA 靠什麼守住地位?Baker 的回答是:NVIDIA 早就不只是一家晶片公司了。

他把 NVIDIA 的進化分成四個階段。第一階段是半導體公司,做 GPU 晶片,這是大多數人對 NVIDIA 的認知。第二階段是軟體公司,靠 CUDA 平台建立了龐大的開發者生態系。CUDA 讓寫 GPU 程式變得相對容易,幾乎所有 AI 研究框架都預設在 CUDA 上運行,這個軟體鎖定效應比晶片本身的效能優勢更難打破。第三階段是系統公司,提供機架級(rack-level)的整合解決方案,不再只是賣一張張的顯示卡。第四階段是資料中心架構師。NVIDIA 現在做的事情是幫客戶設計整個資料中心的網路拓撲,包括向上擴展(scale-up)、橫向擴展(scale-across)和向外擴展(scale-out)的多層網路架構。

這種垂直整合讓競爭對手很難只靠一個環節來挑戰。你可以做出一顆效能接近的晶片,但你沒有 CUDA 的開發者生態;你可以建一套 Ethernet 網路,但效能追不上 NVLink 的超低延遲。NVIDIA 的護城河不是任何單一技術,而是從晶片到軟體到網路到資料中心的全堆疊深度整合。Baker 對黃仁勳(Jensen Huang)的評價極高,稱他是自己認識的兩位最優秀執行長之一(另一位是伊隆·馬斯克),「拿著一手好牌打得非常漂亮。」

反 NVIDIA 聯盟:Broadcom 和 AMD 的合縱策略

不過,並非所有超大規模企業都甘心被 NVIDIA 綁定。Baker 觀察到一個不太被關注的趨勢:Broadcom 和 AMD 實際上正在聯手,對 Meta 等大客戶推銷一套完整的「非 NVIDIA 方案」。

策略是這樣的。Broadcom 對大客戶說:我們幫你打造一套以 Ethernet 為基礎的開放網路架構,可以跟 NVIDIA 的 NVLink 加 InfiniBand 封閉堆疊競爭。然後我們再幫你設計一顆屬於你自己的客製化 AI 晶片(ASIC)。如果你的 ASIC 效果不好?沒關係,AMD 的 GPU 直接插上去就能用,當作備案。兩家合在一起,提供了一個完整的替代路線:Broadcom 負責網路和晶片設計,AMD 負責當通用 GPU 備胎。

Baker 承認這是一個聰明的組合策略,但他個人對大多數 ASIC 計畫的前景相當悲觀。「未來三年內,你會看到一堆高調的 ASIC 專案被取消。」原因很實際:Google 花了三代 TPU 才做對,大多數公司沒有這種耐心和技術積累。如果 Google 某天決定對外銷售 TPU(這個傳言在 X 上流傳已久),那更多客製化 ASIC 計畫就直接失去了存在的意義。何必自己花好幾年做一顆不確定能不能用的晶片,不如直接買 Google 已經驗證過的 TPU?

Baker 唯一給予正面評價的例外是 Amazon 的 Annapurna 團隊和它們開發的 Trainium 晶片。他認為 Annapurna 可能是所有超大規模企業中最有天賦的矽晶設計團隊,Trainium 3 應該會比 Trainium 2 好很多。但即便如此,他也提醒:Google TPU 花了三代才成熟,Amazon 的自研晶片之路同樣不會是一帆風順的。

四大實驗室,各自的晶片歸宿

Baker 的晶片分析帶出了一個更宏觀的圖景:四大前沿 AI 實驗室,最終會跑在誰的晶片上?

Google 的 Gemini 跑在自家 TPU 上,這沒有懸念。Anthropic 的情況比較特殊。Baker 用了一個很直白的詞來描述:Anthropic 是 Amazon 和 Google 的「附庸」(captive)。它的運算主力會是 TPU 和 Amazon 的 Trainium,而不是 NVIDIA 的 GPU。有傳言指出 Anthropic 想購買價值數百億美元的 TPU,顯示它和 Google 晶片生態系的綁定程度。

這意味著,真正仍然綁在 NVIDIA 硬體上的前沿實驗室,只剩下 xAI 和 OpenAI。這就是為什麼 NVIDIA 投資 OpenAI 和 xAI 不是什麼奇怪的行為,而是一種防禦性的戰略必要。如果 Google 能用 TPU 和資金把 Anthropic 拉進自己的生態圈,NVIDIA 就必須用類似的手段保住僅存的兩個前沿客戶。黃仁勳自己也說過,他認為這些投資會有好的回報。

Baker 對 Google 的整體 AI 地位評價很高。他把 ChatGPT 推出的那一天比喻為 Google 的「珍珠港事件」,一記突如其來的重擊。但他也觀察到 Google 正在認真地回應,Gemini 的流量增長速度就是證據。如果 Google 真的是今天最大的 AI 公司(按流量計算),那 NVIDIA 面對的就不只是一個晶片對手,而是一個在模型、晶片、分發三個維度都在壯大的超級競爭者。

我的觀察

Baker 的晶片分析對臺灣讀者有一層特別的意義。

如果 AI 晶片的真正戰場是 NVIDIA vs Google TPU,那台積電的角色就更加關鍵。NVIDIA 的 GPU、Google 的 TPU、AMD 的 MI 系列、Broadcom 設計的各種 ASIC,幾乎全部由台積電代工。不管這場晶片大戰的結局如何,臺灣的半導體製造能力都是所有參賽者共同依賴的基礎設施。某種意義上,AI 晶片戰爭對台積電來說幾乎是純粹的利多,至少在晶圓代工這一層是如此。

但 Baker 預測大多數 ASIC 計畫會失敗,這一點值得留意。如果他說對了,原本分散在各種客製化 ASIC 上的需求會回流到 NVIDIA 和 Google 兩大陣營,形成更集中的雙寡頭格局。對台積電來說,客戶集中度上升是一把雙面刃:短期內大單更穩定,長期來看議價空間可能受限。

最後值得一提的是 Baker 用來表達謙遜的那個類比。他把 ChatGPT 比喻成 AI 時代的 Netscape Navigator,然後指出在網路時代的同一個時間點,Google 還沒成立,馬克·祖克柏(Mark Zuckerberg)還在讀中學,Uber 創辦人 Travis Kalanick 還在上幼稚園。換句話說,AI 晶片的最終贏家,搞不好今天根本還不存在。在一個連十年後的世界長什麼樣都很難預測的產業裡,對任何確定性判斷都保持一點懷疑,可能是最合理的投資態度。