AI 產業動態

AI 的「補貼時代」結束了：Uber 四個月燒光年度預算，Token 短缺正在重塑整個產業

Uber 四個月燒光整年 AI 預算、GitHub Copilot 宣布改為按量計費、Anthropic 年化營收從 30 億飆到 470 億美元。2026 年 5 月，AI 產業正式從「補貼時代」邁入「Token 短缺時代」，企業的 AI 成本管理能力將成為新的競爭分水嶺。

2026 年 6 月 3 日 · 來源： The AI Daily Brief

AI 的「補貼時代」結束了：Uber 四個月燒光年度預算，Token 短缺正在重塑整個產業

本文整理自 Podcast 節目《The AI Daily Brief》2026 年 6 月播出的月度回顧單集。

Uber 的預算崩潰，拉開了序幕

Uber 在四個月內燒光一整年的 AI 預算。這個數字在 5 月引爆了整個科技圈的集體焦慮。

先是 Uber 技術長在 4 月披露了這個消息，接著營運長在訪談中直言質疑 AI 的投資報酬率，被《The Information》精簡成一個更扎心的標題：「Uber 營運長說 AI 缺乏 ROI。」Axios 隨後跟進一篇「AI 價格衝擊席捲美國企業」的報導，把這股焦慮推向高點。

但 Uber 的故事只是表面。AI Podcast《The AI Daily Brief》主持人 Nathaniel Whittemore 在 6 月初的回顧中指出，Uber 的預算之所以爆掉，根本原因是預算規劃的時間點在 Opus 4.5 等級的代理式模型全面上線之前。企業用「舊時代的框架」去預估「新時代的用量」，崩潰幾乎是注定的。而 Uber 的故事揭開的，是一個更大的結構性轉折：AI 產業正從「補貼時代」走進「Token 短缺時代」。

從「座位」到「Token」：經濟單位的根本轉換

要理解這場轉折，得先看清一件事：AI 公司的營收引擎已經從「賣座位」變成了「賣 Token」。

過去，OpenAI 和 Anthropic 的收入主要取決於能把多少使用者轉換成付費訂閱戶，每月固定收 200 美元，營收有自然的天花板。但代理式 AI 興起後，軟體工程師開始讓 AI 跑數小時的自主開發任務，原本只是聊天問答的簡單互動變成了長時間、高運算的作業，API 的 Token 消費量開始爆炸式成長。

Whittemore 用自己的經歷說明這個落差有多驚人。他開發的 Context Portfolio Builder 上線六週，累積了大約 5,000 美元的 API 帳單。對照他一直在付的 Claude Max 月費 200 美元，一個六週的專案花掉了超過兩年的訂閱費。這就是「座位」和「Token」之間的巨大鴻溝。

這種新經濟邏輯推動了令人瞠目的營收數字。OpenAI 的年化營收衝到 300 億美元，Anthropic 更驚人，從 2025 年初的 30 億美元，一路飆升到 470 億美元的年化營收，一年成長近 15 倍。Anthropic 在 5 月底完成新一輪募資，估值逼近一兆美元，並預計將迎來所有大型基礎模型實驗室中的第一個獲利季度。RAMP 的資料也顯示，Anthropic 在企業採用率上已經超越 OpenAI。《大西洋月刊》刊出了一篇「所以，關於那個 AI 泡沫……」的文章，為 2025 年第四季鋪天蓋地的泡沫論調做了某種程度的反思。

補貼時代有多甜？每月 200 美元享受上萬美元的價值

所謂「AI 補貼時代」，是指各大實驗室長期透過固定月費方案，大幅補貼重度使用者的實際運算成本。

Whittemore 估計，最活躍的 Max 方案使用者每月只付 200 美元，卻可能消耗了價值 2,000 到 10,000 美元的 Token，等於享受了 10 到 20 倍的隱性補貼。這段時期對開發者來說像天堂。不管腦子裡冒出什麼想法，打開 Claude Code 就開始做，完全不用考慮帳單。Whittemore 也坦言，過去六個月他在嘗試任何新想法時，「沒有停下來想過財務影響哪怕一秒鐘」。

但這種模式注定不可持續。對實驗室來說，長期以 10 到 20 倍的比率補貼使用者是在燒錢。對企業客戶來說，一旦補貼結束、轉為按量計費，帳單會瞬間暴增到難以承受的程度。而 5 月份，這個轉折正式來了。

三大平台同時轉向：按量計費的時代正式到來

GitHub Copilot 率先出手。在 4 月底的公告中，GitHub 直白地寫道：「如今一個簡單的聊天問題和一個長達數小時的自主開發任務，對使用者的收費是一樣的。GitHub 一直在吸收不斷攀升的推論成本，但目前的高級請求模式已經不可持續。」這段話等於官方承認，代理式 AI 的高運算需求讓固定費率模型徹底崩潰。

Google 在 I/O 大會上做了類似調整。表面上看，Gemini Ultra 方案降到每月 200 美元，還推出了新的 100 美元方案，但兩個方案都加上了用量上限和超額計費機制。對重度使用者來說，這其實是變相漲價。分析機構 Artificial Analysis 的測算顯示，Gemini 3.5 Flash 的實際使用成本大約是 Gemini 3 Flash 的五倍，原因是 Token 單價和消耗量同時上升。

Anthropic 則聚焦第三方工具的計費。在 Anthropic 自家的 Claude Code 環境中，補貼仍然存在。但一旦切換到其他開發環境或第三方工具，就會立刻觸發按 Token 計費，帳單差距巨大。這個政策在 5 月引發了開發者社群的強烈反彈。

能力落差催生新生意：兩大實驗室轉做企業服務

Token 短缺帶來的不只是帳單問題，還暴露了一個更深層的矛盾：代理式 AI 的能力已經遠超多數企業實際能運用的範圍。

這個「能力落差」（capabilities overhang）從年初就已存在，但隨著代理式 AI 從寫程式擴展到所有知識工作領域，落差急速擴大。多數企業知道 AI 可以做很多事，卻不知道怎麼整合進業務流程，更不知道如何在 Token 變貴的新環境下有效控制成本。

兩大實驗室的回應幾乎同步。OpenAI 宣布成立一家由自己控股的「部署公司」，直接派工程師進駐大型企業客戶的辦公室。Anthropic 選擇了外部合作路線，與黑石集團（Blackstone）、海爾曼弗里德曼（Hellman & Friedman）和高盛（Goldman Sachs）聯手成立獨立的 AI 企業服務公司，核心團隊來自 Fractional。兩種模式不同，但傳遞的訊號一致：光賣模型不夠了，企業需要有人帶著他們把 AI 真正用起來。

Token 管理能力，就是下一個競爭分水嶺

企業的 AI 消費風向也在急轉彎。那些之前鼓勵員工大量使用 AI 的公司，紛紛開始踩煞車。Amazon 是最近一個取消內部 AI 使用排行榜的大公司。這類排行榜原本想鼓勵實驗，但問題在於它衡量的是「投入」而非「產出」。當 Token 便宜時，這種實驗文化還能容忍，但在按量計費的新時代，無節制地消耗 Token 就是在燒錢。

Whittemore 在回顧最後提出了一個值得深思的觀點：Token 短缺不是暫時現象，而是結構性的。市場上的 AI 運算供給，根本追不上需求的增長速度，這意味著 AI 的使用成本在可見的未來都會維持高檔。

在這個新常態下，最大的競爭優勢將落在那些最快弄清楚如何有效管理 Token 支出的企業身上。這不只是 IT 部門的成本控管問題，而是攸關企業戰略的核心能力。就像十年前的雲端遷移一樣，早想通的公司吃到紅利，慢半拍的被甩在後面。差別在於，這次的節奏更快，留給猶豫的時間更少。