AI 的資本飛輪:為什麼前沿模型公司可能吞噬整個產業鏈
a16z 合夥人 Martin Casado 與 Sarah Wang 剖析 AI 產業前所未見的資本飛輪機制:前沿模型公司如何把錢直接轉換成能力突破,為什麼它們可能吞噬所有建在 API 之上的公司,以及這個產業最終會走向碎片化還是寡頭壟斷。

本文整理自 a16z Podcast 2026 年 2 月播出的單集,原始對談在 Latent Space Podcast 錄製。
{{< youtube p1k7TiAFqdE >}}
{{< spotify "episode/6R2angrD8d4lW3ODbGavkW" >}}
{{< apple-podcast "tw/podcast/the-a16z-show/id842818711?i=1000750518807" >}}

錢進去,模型出來,再募三倍
過去十年的科技業有一條鐵律:工程不能靠砸錢加速。Fred Brooks 在 1975 年寫下的「人月神話」至今適用,加人不會讓專案更快完成,很多時候反而更慢。但 a16z 普通合夥人 Martin Casado 在這場對談中指出,AI 模型公司打破了這條鐵律。一家模型公司可以募資、把錢投入算力、在一年內用十到二十人的團隊產出一個新模型,而這個模型立刻就有市場需求。用這個需求和營收成長去募下一輪,金額是上一輪的三倍。
這不是傳統創投熟悉的節奏。傳統軟體公司募完資之後,得花時間招人、建團隊、開發產品、找到產品市場契合,每一步都有摩擦力。但 AI 模型公司的瓶頸不在工程,而在算力。算力可以直接用錢買。Casado 形容這是一種「前所未見的資本飛輪」:資本直接轉換成能力突破,能力突破立刻產生需求,需求驅動更大規模的募資,然後循環再來一次。
a16z 另一位普通合夥人 Sarah Wang 補充了這個飛輪更精確的運作方式。她觀察到一個新興策略正在成形:募資買算力,用算力達成能力突破,把突破灌進垂直整合的應用產品(像 ChatGPT 或 Claude Code),藉此大量獲取使用者,在動能最高點再募一輪,然後重複。她說這個策略甚至在兩年前都還不存在,是最近才浮現的新融資模式。
這裡有一個關鍵的前提假設:scaling laws 繼續成立。Wang 直言,只要你能把錢轉換成能力提升,而能力提升又能對應到真實需求,這個飛輪就會持續轉動。但如果 scaling laws 在某個節點失效,整個邏輯就會斷裂。
沒有閒置的 GPU
每次有人質疑 AI 投資是不是泡沫,必然會被拿來類比的就是 2000 年的網路泡沫。Casado 認為這個類比站不住腳。網路時代的問題是把光纖鋪到地下,但沒有人用。供給遠遠超前需求,多出來的頻寬變成「暗光纖」(dark fiber),供給過剩持續了大約四年才消化完。
但 AI 不一樣。Casado 說得很直接:沒有「閒置 GPU」這回事。每一塊錢投入 AI 算力,另一端都有客戶在等著用。不管資金來源是不是循環的(戰略投資者投資模型公司,模型公司再把錢花在戰略投資者的雲端服務上),只要 GPU 的另一端有真實的客戶在付費使用,這個循環就不是空轉。
Wang 更進一步點出為什麼這次和過去不同:這是第一次你可以直接把「投入的美元」追蹤到「產出的結果」。以前投錢到行銷和業務,轉換率是模糊的。現在投錢到算力,產出的是可量化的能力提升,而能力提升後面就是付費需求。這個因果鏈條比過去任何一個科技週期都清晰。
吞噬應用層的可能性
Casado 在這場對談中提出了一個讓人不安的假設。假設 Anthropic 有一個市占率很高的最先進模型,很多公司在它的 API 之上建立應用。如果 Anthropic 每一輪都能募到上一輪三倍的資金,它募到的錢可能比所有 API 客戶加起來還多。而且,因為這些公司都在用 Anthropic 的 API,Anthropic 完全知道它們在做什麼。
這意味著前沿模型公司不只是基礎設施提供者,它們有能力、有資金、有情報去擴展到任何一個建在它們之上的應用領域。Casado 用了一個很有畫面感的比喻:想像一顆不斷膨脹的恆星,把周圍所有東西都吞進去。而且,不像過去的科技平台受制於工程瓶頸無法快速擴張,模型公司只需要投入更多算力去訓練,就能進入新領域。
這在科技史上沒有先例。過去的平台公司(AWS、iOS)也會和自己的生態系競爭,但它們的擴張速度受限於工程團隊的規模和能力。你不可能靠砸錢讓工程師寫程式寫得更快。但 AI 模型公司可以靠砸錢讓模型變得更強,而更強的模型就能覆蓋更多應用場景。
每個任務都是 AGI 完備的
這個討論帶出了另一個被低估的觀察。Casado 每天都在寫程式,他發現和 AI 模型互動時,真正在「寫程式」的部分其實佔不到一半。他會要模型理解法規遵循問題,幫他搜尋網路資料,討論歷史脈絡,當他的腦力激盪夥伴。每一個看似單純的「coding」任務,實際上都需要模型具備廣泛的通用智能。
這解釋了為什麼專門的 coding 模型幾乎都失敗了。像 Magic.dev 這樣的公司,主打建立專用的程式碼模型,結果大多沒有成功,有些甚至沒有發布產品。Casado 的結論是:「不存在所謂的 coding 模型這種東西。你是在和另一個人類對話,它碰巧很會寫程式,但它得什麼都行才行。」
如果這個觀察是對的,後果很嚴重:最好的通用模型會在所有任務上佔優勢,不管那個任務表面上看起來多「專業」。專門化模型的價值就會大幅縮水。這進一步強化了前沿模型公司吞噬一切的可能性,因為它們正好就是在建立最強的通用模型。
兩條路,沒有人知道答案
Casado 把整個產業的未來歸結為一個根本性的分岔。
第一條路是碎片化。市場無限大,模型一推出就會被競爭對手追上,軟體到處被重寫,價值歸屬於離終端使用者最近的公司。在這個世界裡,專門化有意義,像 ElevenLabs 在語音領域、Cursor 在開發工具領域,都能建立持久的優勢。
第二條路是寡頭壟斷。通用模型真的什麼都能做,你只需要投入三倍的錢去訓練,它就會變得更強。在這個世界裡,三到五家前沿模型實驗室會主宰所有垂直領域,資本優勢壓過一切專門化的努力。
Casado 坦承沒有人知道哪條路會贏。但他提出了一個值得注意的財務觀察:目前的模型公司在上一代模型上是毛利為正的,但如果把訓練下一代模型的成本算進去,毛利就是負的。它們本質上是在「向未來借錢」來補貼當前的成長。這種做法可以持續一段時間,但最終市場會要求合理化。到那個時候,產業結構才會真正定型。
我的觀察
對臺灣的 AI 應用層團隊來說,這場對談指向一個不舒服的問題:如果你的整個商業模式建立在某家前沿模型的 API 之上,而那家公司募到的錢比你整個市場的所有公司加起來還多,你的護城河在哪裡?
答案可能不在技術層面,而在市場層面。前沿模型公司再強,短期內也不可能理解每一個垂直產業的合規需求、在地化需求、和客戶關係。臺灣團隊如果能在特定領域建立足夠深的客戶關係和產業知識,即便底層模型被取代,這些資產依然有價值。但如果你做的事情只是「把 API 包一層 UI」,那確實要擔心了。
另一個值得思考的方向是 Casado 說的「每個任務都是 AGI 完備的」。這對臺灣很多正在做「垂直 AI 解決方案」的團隊是個警訊。如果你的差異化只是在某個領域微調了一個模型,而通用模型在下一次升級後就能做到同樣的事,那這個差異化是暫時的。真正持久的差異化,來自於模型做不到的東西:和客戶的信任關係、對法規的深入理解、以及把 AI 能力轉化為具體工作流程的能力。