AI 產業動態

Token Maxing 是假繁榮？Claude Code 之父用 90 年代的教訓，拆解 AI 生產力的真假命題

Amazon 員工每天跑垃圾自動化衝 token KPI，Claude Code 負責人 Boris Cherny 用 90 年代《哈佛商業評論》的生產力悖論來解讀：企業沒看到 AI 生產力提升，不是工具不好用，而是沒有圍繞 AI 重建流程。他也分享了讓 Anthropic 工程師產出量成長 250% 的三步走建議。

2026 年 5 月 20 日 · 來源： Big Technology Podcast

Token Maxing 是假繁榮？Claude Code 之父用 90 年代的教訓，拆解 AI 生產力的真假命題

本文整理自 Big Technology Podcast 2026 年 5 月播出的單集，主持人 Alex Kantrowitz 與 Anthropic Claude Code 負責人 Boris Cherny 的對談。

{{< apple-podcast "tw/podcast/claude-code-head-boris-cherny-insane-growth-tokenmaxxing/id1522960417?i=1000768721139" >}}

每天早上，一位 Amazon 員工會啟動一個自動化腳本。這個腳本會跑好幾個小時，製造出大量的 AI token 消耗紀錄。然後在下班前，他把結果刪掉。隔天，同樣的事再來一次。

這不是惡作劇，是生存策略。Amazon 對超過 80% 的開發者設定了每週 AI 使用率指標，並且用排行榜追蹤各人的 token 消耗量。員工為了達標，只好製造無意義的 AI 活動來灌數字。這個現象有個名字叫 token maxing，《金融時報》（Financial Times）率先報導了這個趨勢。Big Technology Podcast 主持人 Alex Kantrowitz 向 Amazon 員工求證後確認：這就是公司內部正在發生的事。

Kantrowitz 拿著這份報導，直接質問 Anthropic Claude Code 負責人 Boris Cherny：你們的爆發性成長，有多少是這種灌水的假需求？Cherny 在 Meta 時期負責過 Facebook、Instagram、WhatsApp 三大產品的程式碼健康度，對企業工程生產力的衡量不算外行。他的回應方式很特別：沒有正面反駁，而是翻出一篇 90 年代的《哈佛商業評論》文章，把整個討論拉到另一個層次。

Token Maxing 不是重點，問錯問題才是

Token maxing 的邏輯很直覺：管理層相信 AI 能提升生產力，所以要求所有人都用起來。但「用起來」該怎麼衡量？最容易量化的指標就是 token 消耗量。於是，排行榜出現了，KPI 出現了。員工的回應也很人性：上有政策，下有對策。如果 KPI 衡量的是 token 消耗量而不是產出品質，那就生產 token 消耗量。至於有沒有實際產出，指標不在意，員工也就不在意了。

Kantrowitz 在節目中把《金融時報》的細節攤開來講。Amazon 員工坦言，同事們會啟動不必要的 AI 自動化任務來灌高消耗數字。一位員工的原話很直接：「我每天啟動一個跑好幾小時的自動化，然後刪掉，就為了達成指標。」Amazon 設定的目標是 80% 以上的開發者每週都必須使用 AI，而消耗排行榜讓這件事從「鼓勵嘗試」變成了「壓力競賽」。當採用率變成一個數字遊戲，你衡量到的就不再是真實需求，而是員工對考績壓力的應對策略。

但 Cherny 認為，把注意力聚焦在 token maxing 上，是看錯了重點。他反問了一個更根本的問題：Claude Code 有非常多不同類型的客戶，沒有任何單一企業在主導使用量。即使某些公司的員工在灌水，這在整體用量中佔的比例很小。他說得很直接：「Claude Code 有太多太多客戶了，不是某一家公司在驅動這些數字。」Anthropic 執行長 Dario Amodei 在近期活動中提到，公司需求量年增 80 倍，年經常性營收據報從約 40 億美元成長到約 450 億美元。這種量級的成長，不是幾家企業的 KPI 遊戲能製造出來的。

90 年代的既視感：電腦來了，為什麼沒變快？

Cherny 接著提到了一篇他非常喜歡的《哈佛商業評論》文章。那是 90 年代的事：個人電腦正在快速普及，價格從百萬級的大型主機降到一般公司都買得起的水準。按照常理推斷，有了電腦，企業應該更有效率才對。但現實完全相反。經濟學家到處找數據，發現企業買了大量電腦，生產力數字卻紋風不動。這個矛盾被稱為「生產力悖論」（productivity paradox），困惑了整個經濟學界好幾年。

那篇文章的結論後來被反覆驗證，而且答案出乎意料地簡單：問題不在電腦，在於企業怎麼用電腦。Cherny 在節目中用了一個很有畫面感的描述：如果辦公室的核心流程還是紙本、手寫、實體歸檔，檔案櫃裡塞滿了紙，桌上的抽屜裡堆著各種文件，那旁邊多了一台電腦也只是裝飾品。只有當企業痛下決心，把整個工作流程圍繞電腦重新設計，丟掉紙本檔案櫃、把所有流程數位化、讓電腦成為日常工作的中心，而不是邊緣的輔助工具，生產力才真正起飛。這不是漸進式的改善，是一次痛苦的組織手術。做了的公司受益，沒做的繼續停滯。

Cherny 認為 AI 正處在完全一樣的歷史階段。很多企業買了 token、開了帳號、甚至設了使用率 KPI，但核心工作流程還是「人類做事，AI 在旁邊幫忙」。這種用法帶不來根本性的改變。他在 Anthropic 看到的是截然不同的情況：Claude Code 導入後，每位工程師的程式碼產出量成長了大約 250%，而且程式碼品質和系統穩定性都沒有下降。這個數字之所以驚人，是因為 Cherny 在 Meta 時期負責工程生產力，那時候花很大力氣，每年能提升 1% 到 3% 就算是重大成就了。從 1% 到 250%，差距不是量變，是質變。

他也很坦白地補充了一句：Anthropic 之所以看到這個成果，是因為整個公司的工作方式已經圍繞 AI 徹底重建了。Claude Code 的程式碼 100% 由 Claude Code 自己撰寫，這在 YC 的演講中也得到了呼應：現場幾百位創辦人中，大約一半舉手表示自己的程式碼 100% 是用 AI 寫的。如果只是在舊流程上貼一層 AI，效果不會好到哪裡去。Token maxing 的真正問題不是浪費 token，而是它暴露了企業還沒有完成那場「圍繞 AI 重建流程」的組織手術。

三步走：Cherny 給企業的具體建議

既然 token maxing 不是正確的做法，企業該怎麼從 AI 獲得真實的生產力提升？Cherny 在節目中給出了三個具體建議，都不複雜，但每一個都需要管理層的觀念轉變。

第一步，給每個人 token，不要設審批流程。很多企業的做法是讓員工每次使用 AI 都要申請，或者只開放給特定團隊。Cherny 認為這完全搞反了。你不知道突破會從哪裡來，所以應該讓所有人都能自由取用，降低實驗的門檻。重點是「讓人試」，不是「管人用」。

第二步，給心理安全感。當員工在探索 AI 的新用法時，很多嘗試會失敗。如果公司文化不允許失敗，如果用了 token 但沒產出明確成果就會被追問，大家就只會用 AI 做最安全、最無聊的事。Cherny 觀察到，真正的創新往往來自員工的自發實驗，但實驗需要容錯空間。

第三步是 Cherny 認為最出乎意料的一點，也是他在節目中講得最有感染力的部分：最大的生產力突破，往往不是來自你預期的人。不是最資深的工程師，不是技術最強的團隊。他在 Anthropic 看到的情況是，有時候一個角落裡的會計人員用 AI 把整套會計流程自動化了，方式是任何工程師都不會想到的。有時候一個行銷人員用 AI 建出了自己的工作流工具。有時候是一個剛畢業的工程師做出了讓人驚豔的東西。你沒辦法事先預測這些人是誰，所以唯一的策略就是讓所有人都有機會嘗試，然後等到某個用例真正開始規模化了，再投入資源去優化它。不要提前優化，那只會扼殺還沒來得及長大的創新。

我的觀察

Cherny 用 90 年代的生產力悖論來解讀 token maxing，我覺得這個框架特別有價值，因為它暗示了一件很多企業主管不想面對的事：你的 AI 導入策略可能從根本上就走錯了方向。

用排行榜衝 token 消耗量，跟 90 年代在紙本流程旁邊擺一台電腦裝飾，本質上是同一件事。問題不在工具好不好用，而在組織願不願意拆掉舊流程重來。Cherny 在 Anthropic 內部看到 250% 的生產力提升，不是因為他們的模型比外界更好。他自己在之前的訪談中也說過，Anthropic 內外部用的是完全一樣的模型。真正的差距來自整個公司的工作方式已經重建了。但「拆掉流程重建」五個字說起來容易，做起來需要巨大的組織勇氣和高層的決心，而且過程一定不舒服。

對台灣企業來說，這裡面有一個很實際的啟示。與其追著 token 消耗量的 KPI 跑，不如先問一個更基本的問題：我們組織裡有沒有給每個人自由實驗 AI 的空間？那個角落裡的會計、那個不起眼的行政人員、那個剛加入的菜鳥，他們手上有沒有 token 可以用？有沒有「用了沒成果也不會被追究」的安全感？如果答案是沒有，那你可能不是缺工具，而是缺一場組織手術的決心。