AI 的「補貼時代」結束了:Uber 四個月燒光年度預算,Token 短缺正在重塑整個產業

Uber 四個月燒光整年 AI 預算、GitHub Copilot 宣布改為按量計費、Anthropic 年化營收從 30 億飆到 470 億美元。2026 年 5 月,AI 產業正式從「補貼時代」邁入「Token 短缺時代」,企業的 AI 成本管理能力將成為新的競爭分水嶺。

AI 的「補貼時代」結束了:Uber 四個月燒光年度預算,Token 短缺正在重塑整個產業

本文整理自 Podcast 節目《The AI Daily Brief》2026 年 6 月播出的月度回顧單集。


Uber 的預算崩潰,拉開了序幕

Uber 在四個月內燒光一整年的 AI 預算。這個數字在 5 月引爆了整個科技圈的集體焦慮。

先是 Uber 技術長在 4 月披露了這個消息,接著營運長在訪談中直言質疑 AI 的投資報酬率,被《The Information》精簡成一個更扎心的標題:「Uber 營運長說 AI 缺乏 ROI。」Axios 隨後跟進一篇「AI 價格衝擊席捲美國企業」的報導,把這股焦慮推向高點。

但 Uber 的故事只是表面。AI Podcast《The AI Daily Brief》主持人 Nathaniel Whittemore 在 6 月初的回顧中指出,Uber 的預算之所以爆掉,根本原因是預算規劃的時間點在 Opus 4.5 等級的代理式模型全面上線之前。企業用「舊時代的框架」去預估「新時代的用量」,崩潰幾乎是注定的。而 Uber 的故事揭開的,是一個更大的結構性轉折:AI 產業正從「補貼時代」走進「Token 短缺時代」。

從「座位」到「Token」:經濟單位的根本轉換

要理解這場轉折,得先看清一件事:AI 公司的營收引擎已經從「賣座位」變成了「賣 Token」。

過去,OpenAI 和 Anthropic 的收入主要取決於能把多少使用者轉換成付費訂閱戶,每月固定收 200 美元,營收有自然的天花板。但代理式 AI 興起後,軟體工程師開始讓 AI 跑數小時的自主開發任務,原本只是聊天問答的簡單互動變成了長時間、高運算的作業,API 的 Token 消費量開始爆炸式成長。

Whittemore 用自己的經歷說明這個落差有多驚人。他開發的 Context Portfolio Builder 上線六週,累積了大約 5,000 美元的 API 帳單。對照他一直在付的 Claude Max 月費 200 美元,一個六週的專案花掉了超過兩年的訂閱費。這就是「座位」和「Token」之間的巨大鴻溝。

這種新經濟邏輯推動了令人瞠目的營收數字。OpenAI 的年化營收衝到 300 億美元,Anthropic 更驚人,從 2025 年初的 30 億美元,一路飆升到 470 億美元的年化營收,一年成長近 15 倍。Anthropic 在 5 月底完成新一輪募資,估值逼近一兆美元,並預計將迎來所有大型基礎模型實驗室中的第一個獲利季度。RAMP 的資料也顯示,Anthropic 在企業採用率上已經超越 OpenAI。《大西洋月刊》刊出了一篇「所以,關於那個 AI 泡沫……」的文章,為 2025 年第四季鋪天蓋地的泡沫論調做了某種程度的反思。

補貼時代有多甜?每月 200 美元享受上萬美元的價值

所謂「AI 補貼時代」,是指各大實驗室長期透過固定月費方案,大幅補貼重度使用者的實際運算成本。

Whittemore 估計,最活躍的 Max 方案使用者每月只付 200 美元,卻可能消耗了價值 2,000 到 10,000 美元的 Token,等於享受了 10 到 20 倍的隱性補貼。這段時期對開發者來說像天堂。不管腦子裡冒出什麼想法,打開 Claude Code 就開始做,完全不用考慮帳單。Whittemore 也坦言,過去六個月他在嘗試任何新想法時,「沒有停下來想過財務影響哪怕一秒鐘」。

但這種模式注定不可持續。對實驗室來說,長期以 10 到 20 倍的比率補貼使用者是在燒錢。對企業客戶來說,一旦補貼結束、轉為按量計費,帳單會瞬間暴增到難以承受的程度。而 5 月份,這個轉折正式來了。

三大平台同時轉向:按量計費的時代正式到來

GitHub Copilot 率先出手。在 4 月底的公告中,GitHub 直白地寫道:「如今一個簡單的聊天問題和一個長達數小時的自主開發任務,對使用者的收費是一樣的。GitHub 一直在吸收不斷攀升的推論成本,但目前的高級請求模式已經不可持續。」這段話等於官方承認,代理式 AI 的高運算需求讓固定費率模型徹底崩潰。

Google 在 I/O 大會上做了類似調整。表面上看,Gemini Ultra 方案降到每月 200 美元,還推出了新的 100 美元方案,但兩個方案都加上了用量上限和超額計費機制。對重度使用者來說,這其實是變相漲價。分析機構 Artificial Analysis 的測算顯示,Gemini 3.5 Flash 的實際使用成本大約是 Gemini 3 Flash 的五倍,原因是 Token 單價和消耗量同時上升。

Anthropic 則聚焦第三方工具的計費。在 Anthropic 自家的 Claude Code 環境中,補貼仍然存在。但一旦切換到其他開發環境或第三方工具,就會立刻觸發按 Token 計費,帳單差距巨大。這個政策在 5 月引發了開發者社群的強烈反彈。

能力落差催生新生意:兩大實驗室轉做企業服務

Token 短缺帶來的不只是帳單問題,還暴露了一個更深層的矛盾:代理式 AI 的能力已經遠超多數企業實際能運用的範圍。

這個「能力落差」(capabilities overhang)從年初就已存在,但隨著代理式 AI 從寫程式擴展到所有知識工作領域,落差急速擴大。多數企業知道 AI 可以做很多事,卻不知道怎麼整合進業務流程,更不知道如何在 Token 變貴的新環境下有效控制成本。

兩大實驗室的回應幾乎同步。OpenAI 宣布成立一家由自己控股的「部署公司」,直接派工程師進駐大型企業客戶的辦公室。Anthropic 選擇了外部合作路線,與黑石集團(Blackstone)、海爾曼弗里德曼(Hellman & Friedman)和高盛(Goldman Sachs)聯手成立獨立的 AI 企業服務公司,核心團隊來自 Fractional。兩種模式不同,但傳遞的訊號一致:光賣模型不夠了,企業需要有人帶著他們把 AI 真正用起來。

Token 管理能力,就是下一個競爭分水嶺

企業的 AI 消費風向也在急轉彎。那些之前鼓勵員工大量使用 AI 的公司,紛紛開始踩煞車。Amazon 是最近一個取消內部 AI 使用排行榜的大公司。這類排行榜原本想鼓勵實驗,但問題在於它衡量的是「投入」而非「產出」。當 Token 便宜時,這種實驗文化還能容忍,但在按量計費的新時代,無節制地消耗 Token 就是在燒錢。

Whittemore 在回顧最後提出了一個值得深思的觀點:Token 短缺不是暫時現象,而是結構性的。市場上的 AI 運算供給,根本追不上需求的增長速度,這意味著 AI 的使用成本在可見的未來都會維持高檔。

在這個新常態下,最大的競爭優勢將落在那些最快弄清楚如何有效管理 Token 支出的企業身上。這不只是 IT 部門的成本控管問題,而是攸關企業戰略的核心能力。就像十年前的雲端遷移一樣,早想通的公司吃到紅利,慢半拍的被甩在後面。差別在於,這次的節奏更快,留給猶豫的時間更少。