Karpathy 加入 Anthropic:用 Claude 加速下一代 Claude 的訓練
AI 領域最具影響力的研究者之一 Andrej Karpathy 宣布加入 Anthropic 預訓練團隊,他在三月開源的 autoresearch 專案已證明 AI 能自動完成 700 次實驗、將訓練速度提升 11%。這是繼 Jan Leike 和 John Schulman 之後,又一位 OpenAI 核心人物轉投 Anthropic。同日 KPMG 也宣布與 Anthropic 合作,將 Claude 嵌入全球 27.6 萬名員工的稅務與顧問平台。

本文整理自《Techmeme Ride Home》2026 年 5 月 19 日播出的單集,並綜合 Axios、TechCrunch、《華爾街日報》及 Anthropic 官方資訊補充。
AI 圈最搶手的自由球員,落腳了
如果 AI 研究圈有自由球員市場的話,Andrej Karpathy 大概是過去兩年身價最高的那一位。5 月 19 日,他在 X 上發文宣布加入 Anthropic,貼文在一小時內就累積了將近三百萬次瀏覽。他寫道:「我認為未來幾年 LLM 的前沿發展會特別關鍵。我非常興奮能加入這裡的團隊,重新回到研發工作。我對教育仍然充滿熱情,計劃在適當的時候恢復那方面的工作。」
Karpathy 的頭銜是「Member of Technical Staff」,隸屬 Anthropic 的預訓練團隊,直屬主管是預訓練負責人 Nick Joseph,距離執行長 Dario Amodei 兩個層級。在外界看來,一位在業界有如此地位的研究者,進入一家公司卻不拿高管頭銜、而是以個人貢獻者的身份加入,本身就很說明問題。Nick Joseph 對這個任命的評價是:「我想不到有比他更適合做這件事的人。」
Karpathy 的經歷橫跨了 AI 產業最核心的幾個節點。他是 OpenAI 2015 年成立時的 11 位創始成員之一,早期專注深度學習和電腦視覺研究。2017 年離開 OpenAI 加入 Tesla,擔任 AI 資深總監,從零建構了 Autopilot 和全自動駕駛(FSD)的神經網路系統。2022 年離開 Tesla 後短暫回到 OpenAI 做中期訓練和合成資料管線,待了大約一年又離開。2024 年 7 月宣布創辦 Eureka Labs,目標是打造「AI 原生學校」。
但 Eureka Labs 的進展有限。公司在 2025 年初拿到了大約 2000 萬美元的種子輪(投資者包括 Conviction 的 Sarah Guo 和奧特曼本人),但除了 LLM101n 課程的預覽之外,沒有太多公開的產品產出。Karpathy 在加入 Anthropic 時表示 Eureka Labs 是「暫停而非關閉」,他為自己保留了未來回去的選項。這個措辭很微妙,但了解他的人不會太意外。Karpathy 的整個職涯軌跡就是在研究的最前線和自己的興趣之間來回跳躍。
在業界之外,Karpathy 的影響力可能更大。他的 YouTube 頻道定期發布 LLM 和 AI 的技術講座,「Neural Networks: Zero to Hero」課程教了無數開發者從零開始建構神經網路。2025 年 2 月他創造了「vibe coding」這個詞,被柯林斯辭典選為 2025 年度詞彙。但到了 2026 年 3 月,他自己公開表示 vibe coding 「已經過時了」,新的典範是「agentic engineering」,而且他從 2025 年 12 月之後就沒有親手寫過一行程式碼。
從開源實驗到機構級作戰:用 AI 加速 AI
Karpathy 在 Anthropic 的核心任務是:用 Claude 來加速 Claude 的預訓練研究。這聽起來有點遞迴,但他已經用行動證明了這個概念是可行的。
2026 年 3 月,Karpathy 開源了一個叫做「autoresearch」的專案。概念很簡單:給 Claude 一個訓練腳本、一個固定的評估指標、和每次實驗五分鐘的算力預算,讓它自己去提出程式碼修改、跑實驗、只保留通過驗證的改進。在一次為期兩天的測試中,這個 AI 代理人完成了大約 700 次實驗,找到了約 20 個可以疊加的改進(包括一個人類團隊忽略的 bug),最終達到了 11% 的訓練速度提升。
這個專案的程式碼只有 630 行,但在幾週內就在 GitHub 上累積了超過八萬顆星。Vector Institute、Red Hat、Shopify 等機構都開始採用這個模式。一個 630 行的腳本能引發這麼大的迴響,說明 Karpathy 觸及了一個產業普遍存在的痛點:預訓練研究中大量的超參數調整和實驗設計工作,其實可以交給 AI 來做得更快、更系統化。
把這個開源實驗升級為機構級的正式團隊,就是 Karpathy 在 Anthropic 要做的事。預訓練是大型語言模型開發中最燒錢、最吃算力的階段。一次大規模訓練可能需要在數萬張 GPU 上跑好幾天,選錯方向就是數百萬美元的沉沒成本。如果 AI 能幫助研究人員更快找到正確的訓練策略、更聰明地分配實驗資源,每提升一個百分點的效率都意味著巨大的成本節省。
這個方向透露了 Anthropic 在 AI 軍備競賽中的定位思考。跟 OpenAI 和 Google 比算力,Anthropic 沒有優勢。OpenAI 有 Microsoft 的雲端基礎設施做後盾,Google DeepMind 坐擁自家 TPU 叢集。Anthropic 雖然也拿到了 Google 和 Amazon 的大額投資,但在純算力規模上還是排在後面。所以策略很清楚:不在算力競賽中硬拼,而是提升每一個 GPU 小時的研究產出。請 Karpathy 來領軍,是把這個策略從概念升級為核心競爭力的明確信號。從 Anthropic 的財務數字來看,它有資源認真執行這個策略。公司的年化營收在 2026 年 4 月已經達到約 300 億美元(2025 年底還只有 90 億),今年 2 月以 3800 億美元估值完成了 300 億美元的 G 輪融資,目前據報正在洽談以超過 9000 億美元估值的新一輪募資。
人才單向流動:OpenAI 到 Anthropic 的路越走越寬
Karpathy 的加入不是孤立事件,而是一個持續了兩年的人才遷移趨勢中最新、也最高調的一筆。2024 年,OpenAI 的超級對齊團隊負責人 Jan Leike 離開加入 Anthropic。同年,OpenAI 的強化學習核心人物 John Schulman 也轉投 Anthropic。現在輪到了 Karpathy,一位 OpenAI 的共同創辦人。這個單向流動沒有出現過反向的案例。
但這不只是個別事件,背後有一個更廣泛的趨勢:過去一年,多家科技公司的技術長主動降級為個人貢獻者加入 Anthropic。名單包括 Instagram 技術長(2026 年 1 月)、Workday 技術長和 You.com 技術長(2026 年 3 月),以及更早的 Box 技術長(2025 年 12 月)和 Super.com 技術長(2025 年 7 月)。這些人放棄了高管頭銜,自願進入一家公司當工程師,這在矽谷是非常罕見的現象,說明 Anthropic 的技術工作本身對頂尖人才有極強的吸引力。
Anthropic 同一週還宣布 Chris Rohlf 加入 Frontier Red Team。這是專門對前沿 AI 模型進行壓力測試的團隊,測試範圍包括嚴重的安全威脅場景。Rohlf 在網路安全領域有超過 20 年經驗,從 2003 年入行至今歷任 Yahoo 的滲透測試團隊和紅隊負責人(Yahoo 的資安單位綽號「The Paranoids」)、Meta 資安部門六年資歷,以及 Georgetown 大學安全與新興技術中心(CSET)的 Cyber AI 計畫研究員。他在 X 上寫道:「AI 進步的速度令人驚嘆。我們眼前有一個真正的機會,可以用 AI 大幅改善網路安全。我想不到有比 Anthropic 更適合在這個關鍵時刻加入的公司和團隊。」技術端補進 Karpathy,安全端補進 Rohlf,Anthropic 這一週的人才佈局相當完整。
Anthropic 的企業版圖:KPMG 和 PwC 一週內先後簽約
在人才佈局之外,Anthropic 的企業市場攻勢同樣密集。5 月 19 日,四大會計師事務所之一的 KPMG 宣布與 Anthropic 達成全球聯盟,推出「KPMG Digital Gateway Powered by Claude」。這不是小規模的試點。KPMG 2025 財年全球營收達 398 億美元,稅務與法律服務部門成長 7.5%,而公司已經承諾未來五年投入 20 億美元在 AI 開發和部署上。
具體來說,KPMG 在其 Azure 架構的客戶交付平台「Digital Gateway」上嵌入了兩個核心的 Claude 產品:Claude Cowork(協作式 AI 工作空間)和 Managed Agents(可即時針對客戶工作流程建立的自主 AI 代理人)。KPMG 美國稅務副總裁 Rema Serafi 舉了一個具體例子:過去建立一個幫助客戶因應新稅法的 AI 工具,需要團隊花好幾週、在多個工具和聊天視窗之間切換。現在同樣的能力,幾分鐘就能完成。KPMG 計劃在今年 9 月底前開始將顧問業務也遷移到這個平台,最終讓 Claude 橫跨稅務法律和顧問兩大服務線。唯一的例外是審計,審計師不會在核心工作流程中使用 Claude,但 27.6 萬名全球員工都能獲得 Claude 套件的存取權限。
Anthropic 總裁 Daniela Amodei 在聲明中說:「KPMG 服務的產業裡,準確性、問責和信任不是可選項。他們正在以同樣的標準來部署 AI。」這筆交易還有一個有趣的對價安排:Anthropic 選定 KPMG 為「首選顧問」,由 KPMG 協助 Anthropic 向私募股權公司和其投資組合公司推廣 AI 導入。Anthropic 也推出了名為「KPMG Blaze」的新方案,嵌入 Claude Code 來加速 PE 投資組合公司的 IT 現代化。KPMG 幫 Anthropic 打開大型企業的大門,Anthropic 幫 KPMG 拿到 AI 諮詢生意的入場券,雙方各取所需。
時間點也很有意思。KPMG 的公告是 5 月 19 日,而就在五天前的 5 月 14 日,另一家四大事務所 PwC 才剛宣布擴大與 Anthropic 的合作,包括為 3 萬名員工部署 Claude Code、建立以 Claude 為核心的 CFO 辦公室業務單元,並宣稱交付時間縮短了 70%。五天之內拿下兩家四大,Anthropic 在專業服務領域的企業佈局速度令人側目。
對比四大的 AI 策略,差異很明顯。KPMG 和 PwC 都選了 Anthropic,EY 走自建路線(150 個專業 AI 代理人服務 8 萬名稅務專業人員),Deloitte 則與 NVIDIA 合作打造「Zora AI」系統。四大過去幾年在 AI 上的投資合計至少 90 億美元。但這些投資的另一面是:四大在 2024 年的畢業生招聘人數年減 44%,EY 甚至直接砍了 30% 的新人名額。AI 正在改變這些公司的營運方式,也在重塑它們的勞動力結構。
KPMG 和 Anthropic 還在與德州大學奧斯汀分校 McCombs 商學院進行聯合研究,探討「人在迴路中」(human-in-the-loop)的部署模式在什麼情況下能真正發揮價值。這個研究方向本身就很有意思,因為它在問一個所有導入 AI 的企業最終都要面對的問題:哪些環節還需要人類把關,哪些可以完全交給 AI?