AI 產業動態

Karpathy 加入 Anthropic：用 Claude 加速下一代 Claude 的訓練

AI 領域最具影響力的研究者之一 Andrej Karpathy 宣布加入 Anthropic 預訓練團隊，他在三月開源的 autoresearch 專案已證明 AI 能自動完成 700 次實驗、將訓練速度提升 11%。這是繼 Jan Leike 和 John Schulman 之後，又一位 OpenAI 核心人物轉投 Anthropic。同日 KPMG 也宣布與 Anthropic 合作，將 Claude 嵌入全球 27.6 萬名員工的稅務與顧問平台。

2026 年 5 月 20 日 · 來源： Techmeme Ride Home

Karpathy 加入 Anthropic：用 Claude 加速下一代 Claude 的訓練

本文整理自《Techmeme Ride Home》2026 年 5 月 19 日播出的單集，並綜合 Axios、TechCrunch、《華爾街日報》及 Anthropic 官方資訊補充。

AI 圈最搶手的自由球員，落腳了

如果 AI 研究圈有自由球員市場的話，Andrej Karpathy 大概是過去兩年身價最高的那一位。5 月 19 日，他在 X 上發文宣布加入 Anthropic，貼文在一小時內就累積了將近三百萬次瀏覽。他寫道：「我認為未來幾年 LLM 的前沿發展會特別關鍵。我非常興奮能加入這裡的團隊，重新回到研發工作。我對教育仍然充滿熱情，計劃在適當的時候恢復那方面的工作。」

Karpathy 的頭銜是「Member of Technical Staff」，隸屬 Anthropic 的預訓練團隊，直屬主管是預訓練負責人 Nick Joseph，距離執行長 Dario Amodei 兩個層級。在外界看來，一位在業界有如此地位的研究者，進入一家公司卻不拿高管頭銜、而是以個人貢獻者的身份加入，本身就很說明問題。Nick Joseph 對這個任命的評價是：「我想不到有比他更適合做這件事的人。」

Karpathy 的經歷橫跨了 AI 產業最核心的幾個節點。他是 OpenAI 2015 年成立時的 11 位創始成員之一，早期專注深度學習和電腦視覺研究。2017 年離開 OpenAI 加入 Tesla，擔任 AI 資深總監，從零建構了 Autopilot 和全自動駕駛（FSD）的神經網路系統。2022 年離開 Tesla 後短暫回到 OpenAI 做中期訓練和合成資料管線，待了大約一年又離開。2024 年 7 月宣布創辦 Eureka Labs，目標是打造「AI 原生學校」。

但 Eureka Labs 的進展有限。公司在 2025 年初拿到了大約 2000 萬美元的種子輪（投資者包括 Conviction 的 Sarah Guo 和奧特曼本人），但除了 LLM101n 課程的預覽之外，沒有太多公開的產品產出。Karpathy 在加入 Anthropic 時表示 Eureka Labs 是「暫停而非關閉」，他為自己保留了未來回去的選項。這個措辭很微妙，但了解他的人不會太意外。Karpathy 的整個職涯軌跡就是在研究的最前線和自己的興趣之間來回跳躍。

在業界之外，Karpathy 的影響力可能更大。他的 YouTube 頻道定期發布 LLM 和 AI 的技術講座，「Neural Networks: Zero to Hero」課程教了無數開發者從零開始建構神經網路。2025 年 2 月他創造了「vibe coding」這個詞，被柯林斯辭典選為 2025 年度詞彙。但到了 2026 年 3 月，他自己公開表示 vibe coding 「已經過時了」，新的典範是「agentic engineering」，而且他從 2025 年 12 月之後就沒有親手寫過一行程式碼。

從開源實驗到機構級作戰：用 AI 加速 AI

Karpathy 在 Anthropic 的核心任務是：用 Claude 來加速 Claude 的預訓練研究。這聽起來有點遞迴，但他已經用行動證明了這個概念是可行的。

2026 年 3 月，Karpathy 開源了一個叫做「autoresearch」的專案。概念很簡單：給 Claude 一個訓練腳本、一個固定的評估指標、和每次實驗五分鐘的算力預算，讓它自己去提出程式碼修改、跑實驗、只保留通過驗證的改進。在一次為期兩天的測試中，這個 AI 代理人完成了大約 700 次實驗，找到了約 20 個可以疊加的改進（包括一個人類團隊忽略的 bug），最終達到了 11% 的訓練速度提升。

這個專案的程式碼只有 630 行，但在幾週內就在 GitHub 上累積了超過八萬顆星。Vector Institute、Red Hat、Shopify 等機構都開始採用這個模式。一個 630 行的腳本能引發這麼大的迴響，說明 Karpathy 觸及了一個產業普遍存在的痛點：預訓練研究中大量的超參數調整和實驗設計工作，其實可以交給 AI 來做得更快、更系統化。

把這個開源實驗升級為機構級的正式團隊，就是 Karpathy 在 Anthropic 要做的事。預訓練是大型語言模型開發中最燒錢、最吃算力的階段。一次大規模訓練可能需要在數萬張 GPU 上跑好幾天，選錯方向就是數百萬美元的沉沒成本。如果 AI 能幫助研究人員更快找到正確的訓練策略、更聰明地分配實驗資源，每提升一個百分點的效率都意味著巨大的成本節省。

這個方向透露了 Anthropic 在 AI 軍備競賽中的定位思考。跟 OpenAI 和 Google 比算力，Anthropic 沒有優勢。OpenAI 有 Microsoft 的雲端基礎設施做後盾，Google DeepMind 坐擁自家 TPU 叢集。Anthropic 雖然也拿到了 Google 和 Amazon 的大額投資，但在純算力規模上還是排在後面。所以策略很清楚：不在算力競賽中硬拼，而是提升每一個 GPU 小時的研究產出。請 Karpathy 來領軍，是把這個策略從概念升級為核心競爭力的明確信號。從 Anthropic 的財務數字來看，它有資源認真執行這個策略。公司的年化營收在 2026 年 4 月已經達到約 300 億美元（2025 年底還只有 90 億），今年 2 月以 3800 億美元估值完成了 300 億美元的 G 輪融資，目前據報正在洽談以超過 9000 億美元估值的新一輪募資。

人才單向流動：OpenAI 到 Anthropic 的路越走越寬

Karpathy 的加入不是孤立事件，而是一個持續了兩年的人才遷移趨勢中最新、也最高調的一筆。2024 年，OpenAI 的超級對齊團隊負責人 Jan Leike 離開加入 Anthropic。同年，OpenAI 的強化學習核心人物 John Schulman 也轉投 Anthropic。現在輪到了 Karpathy，一位 OpenAI 的共同創辦人。這個單向流動沒有出現過反向的案例。

但這不只是個別事件，背後有一個更廣泛的趨勢：過去一年，多家科技公司的技術長主動降級為個人貢獻者加入 Anthropic。名單包括 Instagram 技術長（2026 年 1 月）、Workday 技術長和 You.com 技術長（2026 年 3 月），以及更早的 Box 技術長（2025 年 12 月）和 Super.com 技術長（2025 年 7 月）。這些人放棄了高管頭銜，自願進入一家公司當工程師，這在矽谷是非常罕見的現象，說明 Anthropic 的技術工作本身對頂尖人才有極強的吸引力。

Anthropic 同一週還宣布 Chris Rohlf 加入 Frontier Red Team。這是專門對前沿 AI 模型進行壓力測試的團隊，測試範圍包括嚴重的安全威脅場景。Rohlf 在網路安全領域有超過 20 年經驗，從 2003 年入行至今歷任 Yahoo 的滲透測試團隊和紅隊負責人（Yahoo 的資安單位綽號「The Paranoids」）、Meta 資安部門六年資歷，以及 Georgetown 大學安全與新興技術中心（CSET）的 Cyber AI 計畫研究員。他在 X 上寫道：「AI 進步的速度令人驚嘆。我們眼前有一個真正的機會，可以用 AI 大幅改善網路安全。我想不到有比 Anthropic 更適合在這個關鍵時刻加入的公司和團隊。」技術端補進 Karpathy，安全端補進 Rohlf，Anthropic 這一週的人才佈局相當完整。

Anthropic 的企業版圖：KPMG 和 PwC 一週內先後簽約

在人才佈局之外，Anthropic 的企業市場攻勢同樣密集。5 月 19 日，四大會計師事務所之一的 KPMG 宣布與 Anthropic 達成全球聯盟，推出「KPMG Digital Gateway Powered by Claude」。這不是小規模的試點。KPMG 2025 財年全球營收達 398 億美元，稅務與法律服務部門成長 7.5%，而公司已經承諾未來五年投入 20 億美元在 AI 開發和部署上。

具體來說，KPMG 在其 Azure 架構的客戶交付平台「Digital Gateway」上嵌入了兩個核心的 Claude 產品：Claude Cowork（協作式 AI 工作空間）和 Managed Agents（可即時針對客戶工作流程建立的自主 AI 代理人）。KPMG 美國稅務副總裁 Rema Serafi 舉了一個具體例子：過去建立一個幫助客戶因應新稅法的 AI 工具，需要團隊花好幾週、在多個工具和聊天視窗之間切換。現在同樣的能力，幾分鐘就能完成。KPMG 計劃在今年 9 月底前開始將顧問業務也遷移到這個平台，最終讓 Claude 橫跨稅務法律和顧問兩大服務線。唯一的例外是審計，審計師不會在核心工作流程中使用 Claude，但 27.6 萬名全球員工都能獲得 Claude 套件的存取權限。

Anthropic 總裁 Daniela Amodei 在聲明中說：「KPMG 服務的產業裡，準確性、問責和信任不是可選項。他們正在以同樣的標準來部署 AI。」這筆交易還有一個有趣的對價安排：Anthropic 選定 KPMG 為「首選顧問」，由 KPMG 協助 Anthropic 向私募股權公司和其投資組合公司推廣 AI 導入。Anthropic 也推出了名為「KPMG Blaze」的新方案，嵌入 Claude Code 來加速 PE 投資組合公司的 IT 現代化。KPMG 幫 Anthropic 打開大型企業的大門，Anthropic 幫 KPMG 拿到 AI 諮詢生意的入場券，雙方各取所需。

時間點也很有意思。KPMG 的公告是 5 月 19 日，而就在五天前的 5 月 14 日，另一家四大事務所 PwC 才剛宣布擴大與 Anthropic 的合作，包括為 3 萬名員工部署 Claude Code、建立以 Claude 為核心的 CFO 辦公室業務單元，並宣稱交付時間縮短了 70%。五天之內拿下兩家四大，Anthropic 在專業服務領域的企業佈局速度令人側目。

對比四大的 AI 策略，差異很明顯。KPMG 和 PwC 都選了 Anthropic，EY 走自建路線（150 個專業 AI 代理人服務 8 萬名稅務專業人員），Deloitte 則與 NVIDIA 合作打造「Zora AI」系統。四大過去幾年在 AI 上的投資合計至少 90 億美元。但這些投資的另一面是：四大在 2024 年的畢業生招聘人數年減 44%，EY 甚至直接砍了 30% 的新人名額。AI 正在改變這些公司的營運方式，也在重塑它們的勞動力結構。

KPMG 和 Anthropic 還在與德州大學奧斯汀分校 McCombs 商學院進行聯合研究，探討「人在迴路中」（human-in-the-loop）的部署模式在什麼情況下能真正發揮價值。這個研究方向本身就很有意思，因為它在問一個所有導入 AI 的企業最終都要面對的問題：哪些環節還需要人類把關，哪些可以完全交給 AI？