Token Maxing 是假繁榮?Claude Code 之父用 90 年代的教訓,拆解 AI 生產力的真假命題

Amazon 員工每天跑垃圾自動化衝 token KPI,Claude Code 負責人 Boris Cherny 用 90 年代《哈佛商業評論》的生產力悖論來解讀:企業沒看到 AI 生產力提升,不是工具不好用,而是沒有圍繞 AI 重建流程。他也分享了讓 Anthropic 工程師產出量成長 250% 的三步走建議。

Token Maxing 是假繁榮?Claude Code 之父用 90 年代的教訓,拆解 AI 生產力的真假命題

本文整理自 Big Technology Podcast 2026 年 5 月播出的單集,主持人 Alex Kantrowitz 與 Anthropic Claude Code 負責人 Boris Cherny 的對談。

{{< spotify "episode/0y0QyIMFjvofd6oGRPlXij" >}}

{{< apple-podcast "tw/podcast/claude-code-head-boris-cherny-insane-growth-tokenmaxxing/id1522960417?i=1000768721139" >}}


每天早上,一位 Amazon 員工會啟動一個自動化腳本。這個腳本會跑好幾個小時,製造出大量的 AI token 消耗紀錄。然後在下班前,他把結果刪掉。隔天,同樣的事再來一次。

這不是惡作劇,是生存策略。Amazon 對超過 80% 的開發者設定了每週 AI 使用率指標,並且用排行榜追蹤各人的 token 消耗量。員工為了達標,只好製造無意義的 AI 活動來灌數字。這個現象有個名字叫 token maxing,《金融時報》(Financial Times)率先報導了這個趨勢。Big Technology Podcast 主持人 Alex Kantrowitz 向 Amazon 員工求證後確認:這就是公司內部正在發生的事。

Kantrowitz 拿著這份報導,直接質問 Anthropic Claude Code 負責人 Boris Cherny:你們的爆發性成長,有多少是這種灌水的假需求?Cherny 在 Meta 時期負責過 Facebook、Instagram、WhatsApp 三大產品的程式碼健康度,對企業工程生產力的衡量不算外行。他的回應方式很特別:沒有正面反駁,而是翻出一篇 90 年代的《哈佛商業評論》文章,把整個討論拉到另一個層次。

Token Maxing 不是重點,問錯問題才是

Token maxing 的邏輯很直覺:管理層相信 AI 能提升生產力,所以要求所有人都用起來。但「用起來」該怎麼衡量?最容易量化的指標就是 token 消耗量。於是,排行榜出現了,KPI 出現了。員工的回應也很人性:上有政策,下有對策。如果 KPI 衡量的是 token 消耗量而不是產出品質,那就生產 token 消耗量。至於有沒有實際產出,指標不在意,員工也就不在意了。

Kantrowitz 在節目中把《金融時報》的細節攤開來講。Amazon 員工坦言,同事們會啟動不必要的 AI 自動化任務來灌高消耗數字。一位員工的原話很直接:「我每天啟動一個跑好幾小時的自動化,然後刪掉,就為了達成指標。」Amazon 設定的目標是 80% 以上的開發者每週都必須使用 AI,而消耗排行榜讓這件事從「鼓勵嘗試」變成了「壓力競賽」。當採用率變成一個數字遊戲,你衡量到的就不再是真實需求,而是員工對考績壓力的應對策略。

但 Cherny 認為,把注意力聚焦在 token maxing 上,是看錯了重點。他反問了一個更根本的問題:Claude Code 有非常多不同類型的客戶,沒有任何單一企業在主導使用量。即使某些公司的員工在灌水,這在整體用量中佔的比例很小。他說得很直接:「Claude Code 有太多太多客戶了,不是某一家公司在驅動這些數字。」Anthropic 執行長 Dario Amodei 在近期活動中提到,公司需求量年增 80 倍,年經常性營收據報從約 40 億美元成長到約 450 億美元。這種量級的成長,不是幾家企業的 KPI 遊戲能製造出來的。

90 年代的既視感:電腦來了,為什麼沒變快?

Cherny 接著提到了一篇他非常喜歡的《哈佛商業評論》文章。那是 90 年代的事:個人電腦正在快速普及,價格從百萬級的大型主機降到一般公司都買得起的水準。按照常理推斷,有了電腦,企業應該更有效率才對。但現實完全相反。經濟學家到處找數據,發現企業買了大量電腦,生產力數字卻紋風不動。這個矛盾被稱為「生產力悖論」(productivity paradox),困惑了整個經濟學界好幾年。

那篇文章的結論後來被反覆驗證,而且答案出乎意料地簡單:問題不在電腦,在於企業怎麼用電腦。Cherny 在節目中用了一個很有畫面感的描述:如果辦公室的核心流程還是紙本、手寫、實體歸檔,檔案櫃裡塞滿了紙,桌上的抽屜裡堆著各種文件,那旁邊多了一台電腦也只是裝飾品。只有當企業痛下決心,把整個工作流程圍繞電腦重新設計,丟掉紙本檔案櫃、把所有流程數位化、讓電腦成為日常工作的中心,而不是邊緣的輔助工具,生產力才真正起飛。這不是漸進式的改善,是一次痛苦的組織手術。做了的公司受益,沒做的繼續停滯。

Cherny 認為 AI 正處在完全一樣的歷史階段。很多企業買了 token、開了帳號、甚至設了使用率 KPI,但核心工作流程還是「人類做事,AI 在旁邊幫忙」。這種用法帶不來根本性的改變。他在 Anthropic 看到的是截然不同的情況:Claude Code 導入後,每位工程師的程式碼產出量成長了大約 250%,而且程式碼品質和系統穩定性都沒有下降。這個數字之所以驚人,是因為 Cherny 在 Meta 時期負責工程生產力,那時候花很大力氣,每年能提升 1% 到 3% 就算是重大成就了。從 1% 到 250%,差距不是量變,是質變。

他也很坦白地補充了一句:Anthropic 之所以看到這個成果,是因為整個公司的工作方式已經圍繞 AI 徹底重建了。Claude Code 的程式碼 100% 由 Claude Code 自己撰寫,這在 YC 的演講中也得到了呼應:現場幾百位創辦人中,大約一半舉手表示自己的程式碼 100% 是用 AI 寫的。如果只是在舊流程上貼一層 AI,效果不會好到哪裡去。Token maxing 的真正問題不是浪費 token,而是它暴露了企業還沒有完成那場「圍繞 AI 重建流程」的組織手術。

三步走:Cherny 給企業的具體建議

既然 token maxing 不是正確的做法,企業該怎麼從 AI 獲得真實的生產力提升?Cherny 在節目中給出了三個具體建議,都不複雜,但每一個都需要管理層的觀念轉變。

第一步,給每個人 token,不要設審批流程。很多企業的做法是讓員工每次使用 AI 都要申請,或者只開放給特定團隊。Cherny 認為這完全搞反了。你不知道突破會從哪裡來,所以應該讓所有人都能自由取用,降低實驗的門檻。重點是「讓人試」,不是「管人用」。

第二步,給心理安全感。當員工在探索 AI 的新用法時,很多嘗試會失敗。如果公司文化不允許失敗,如果用了 token 但沒產出明確成果就會被追問,大家就只會用 AI 做最安全、最無聊的事。Cherny 觀察到,真正的創新往往來自員工的自發實驗,但實驗需要容錯空間。

第三步是 Cherny 認為最出乎意料的一點,也是他在節目中講得最有感染力的部分:最大的生產力突破,往往不是來自你預期的人。不是最資深的工程師,不是技術最強的團隊。他在 Anthropic 看到的情況是,有時候一個角落裡的會計人員用 AI 把整套會計流程自動化了,方式是任何工程師都不會想到的。有時候一個行銷人員用 AI 建出了自己的工作流工具。有時候是一個剛畢業的工程師做出了讓人驚豔的東西。你沒辦法事先預測這些人是誰,所以唯一的策略就是讓所有人都有機會嘗試,然後等到某個用例真正開始規模化了,再投入資源去優化它。不要提前優化,那只會扼殺還沒來得及長大的創新。

我的觀察

Cherny 用 90 年代的生產力悖論來解讀 token maxing,我覺得這個框架特別有價值,因為它暗示了一件很多企業主管不想面對的事:你的 AI 導入策略可能從根本上就走錯了方向。

用排行榜衝 token 消耗量,跟 90 年代在紙本流程旁邊擺一台電腦裝飾,本質上是同一件事。問題不在工具好不好用,而在組織願不願意拆掉舊流程重來。Cherny 在 Anthropic 內部看到 250% 的生產力提升,不是因為他們的模型比外界更好。他自己在之前的訪談中也說過,Anthropic 內外部用的是完全一樣的模型。真正的差距來自整個公司的工作方式已經重建了。但「拆掉流程重建」五個字說起來容易,做起來需要巨大的組織勇氣和高層的決心,而且過程一定不舒服。

對台灣企業來說,這裡面有一個很實際的啟示。與其追著 token 消耗量的 KPI 跑,不如先問一個更基本的問題:我們組織裡有沒有給每個人自由實驗 AI 的空間?那個角落裡的會計、那個不起眼的行政人員、那個剛加入的菜鳥,他們手上有沒有 token 可以用?有沒有「用了沒成果也不會被追究」的安全感?如果答案是沒有,那你可能不是缺工具,而是缺一場組織手術的決心。