Uber 四個月燒完全年 AI 預算:企業 AI 投資的 ROI 危機到底出在哪?
Uber 營運長公開坦承 AI 支出「越來越難合理化」,四個月燒完全年預算,每位工程師月均 API 成本飆到 500 至 2,000 美元。但問題不在 AI 沒用,而在企業的衡量框架、激勵結構和基礎設施都跟不上。當 85% 企業想導入 AI Agent,卻有 76% 缺乏基礎設施,真正的瓶頸已經浮現。

本文整理自《Last Week in AI》2026 年 5 月播出的單集,並綜合 Fortune、Quartz 等媒體報導。
四個月,一整年的預算就沒了
2026 年才過了三分之一,Uber 的全年 AI 預算就已經見底。Uber 營運長 Andrew Macdonald 在一場公開活動上,用「腦袋爆炸的瞬間」(head-exploding moment)來形容他得知這個消息時的反應。他坦言 AI 支出正變得「越來越難合理化」,公司花了大把鈔票,卻無法清楚證明這筆錢帶來了什麼具體成果。這番話從一家每年砸 34 億美元在研發上的科技公司高層口中說出來,分量不輕。
這不是小公司的抱怨。Uber 2025 年的研發支出高達 34 億美元,比前一年成長 9%。其中一個主要的成本驅動來源是 Anthropic 的 Claude Code。Uber 在 2025 年底將這項工具部署給約 5,000 名工程師使用,結果每位工程師的月均 API 成本飆到 500 至 2,000 美元。Macdonald 用了一個新詞來描述這種現象:「tokenmaxxing」,意思是 token 消費量不斷攀升,但沒有人能說清楚產出是不是也在等比成長。
更耐人尋味的是 Uber 高層自己透露的另一組數字:95% 的工程師每月都在使用 AI 工具,70% 提交的程式碼是 AI 生成的。乍聽之下,這像是一個 AI 全面滲透的成功故事。但 Macdonald 隨即潑了冷水,他說要在 token 消耗量和實際交付成果之間畫一條因果線,是「不可能的任務」。
數字都在成長,就是沒辦法證明因果
Uber 執行長 Dara Khosrowshahi 也沒有迴避這個問題。他承認公司在 AI 投資的同時,確實在減少人力招聘,用 AI 來抵銷人事成本的成長。他還提到,Uber 的消費者功能產出增加了 25%。
這些數字放在一起看其實很有趣:工程師變少了,功能產出反而增加了,token 消耗在飆升,但管理層說「無法衡量 ROI」。換個角度想,這不正是 ROI 的體現嗎?只是 Uber 的會計系統還沒有能力追蹤到這個層次。當你用 AI 取代了本來要招的 50 個工程師,省下的薪資、福利、管理成本就是回報。問題在於,傳統的財務報表裡沒有一個叫做「因為用了 AI 所以沒花的錢」的欄位。
Uber 不是唯一公開質疑的公司。微軟和 Duolingo 近期也提出了類似的問題:AI 工具的 token 使用量和企業實際成果之間的關聯,到底該怎麼衡量?這股「CFO 懷疑論」正在企業界蔓延。Uber 的公開表態等於給了其他公司的財務長一個現成的理由去質疑自家的 AI 支出。更深層的問題是時間差,AI 輔助開發的專案從啟動到上線本來就有落差,今年第一季投入的 token 成本,對應的功能可能要到第三季甚至明年才會上線。如果用四月份的帳單來衡量一月份開始的開發工作,結論當然是「看不到回報」。
Amazon 的荒謬警示:用機器人刷 AI 程式碼指標
如果說 Uber 的問題是「花了錢但不知道怎麼衡量成效」,Amazon 的案例就是「衡量方法本身製造了問題」,而且更荒謬。
Amazon 在內部設定了一個看似合理的目標:要求一定比例的程式碼必須由 AI 工具生成。邏輯很直覺,如果 AI 真的能提升生產力,那使用率應該自然上升。但當這個使用率變成 KPI,事情就變了味。部分開發團隊為了達標,直接跑機器人產生隨機的、毫無意義的程式碼片段,然後提交到系統裡。Token 消耗量上去了,指標達標了,但產出的價值是零。Anthropic 的營收當然因此受益,但 Amazon 本身什麼都沒得到。
這是經典的「古德哈特定律」(Goodhart's Law):當一個衡量指標變成目標,它就不再是一個好的衡量指標。把「AI 生成程式碼比例」當成 KPI,就像把「打字速度」當成作家的 KPI 一樣荒謬。真正該衡量的是功能交付速度、Bug 修復率、使用者滿意度這些結果指標,而不是中間過程的工具使用率。這個教訓適用於所有正在導入 AI 的企業,激勵結構設計錯了,再好的工具也會被扭曲成浪費資源的遊戲。
85% 企業想要 AI Agent,76% 根本沒準備好
把視角拉開來看,Uber 和 Amazon 的困境其實是整個企業 AI 市場的縮影。一份最新的產業報告指出,85% 的企業計畫在 2029 年之前導入 AI Agent,但 76% 的企業坦承自己根本沒有部署所需的基礎設施。
問題出在哪裡?報告的診斷很直白:多數企業只是「把 AI 黏在舊系統上面」。他們拿現有的、可能已經用了十年的 ERP 系統、CRM 系統、內部工具,然後在上面接一個聊天機器人,就宣稱自己在「導入 AI」。這就像在一棟地基已經歪掉的房子上面裝智慧家居系統,系統再聰明也救不了歪掉的牆。
真正從 AI Agent 獲益的企業,做法完全不同。報告指出,那些大規模部署 AI Agent 的組織,流程加速了 30% 到 50%,低價值工作時間減少了 25% 到 40%。但前提是他們重新設計了整個工作流程,而不只是在舊流程上貼了一層 AI。這個差別就是 Uber 那個「無法衡量 ROI」的答案:把 Claude Code 交給 5,000 個工程師是一回事,把整個軟體開發流程從零開始用 AI 原生的方式重建,是另一回事。
2030 年,四分之三的工作需要重新設計
如果覺得這些只是短期的調整陣痛,McKinsey 的最新預測可能會改變你的想法。根據這份報告,到 2030 年,現有四分之三的工作崗位都需要重新設計、員工需要重新培訓或調整職務。原因是 AI Agent 會壓平傳統的管理層級結構,取代大量以執行為主的工作角色。
這裡說的不只是藍領工作。想想一個典型的行銷部門:初階行銷人員負責從 CRM 撈資料、整理成報表、寄給主管審核、主管再寄給上級。這條鏈上的每一個「撈資料、整理、審核、轉發」動作,AI Agent 都能做,而且做得更快更準。當這些執行層的工作消失,中間管理層存在的理由也跟著動搖。
回到 Uber 的故事。那些只會把 AI 工具交給員工,然後用舊的 KPI 來衡量成效的企業,注定會得到「ROI 不明」的結論。真正的贏家會是那些願意從零開始重建的組織,重新定義工作流程、重新設計職位、重新建立衡量體系。競爭護城河已經在形成了,特別是在軟體開發和知識工作領域,全面擁抱 AI 的個人和團隊,產出正在大幅拉開與傳統工作方式的差距。Uber 營運長的那句「越來越難合理化」,與其說是對 AI 投資的否定,不如說是一面鏡子,照出了大型企業在 AI 轉型中最核心的矛盾:工具已經到位了,但組織還沒有。