AI 開發實戰

Karpathy：Vibe Coding 只是入門票，真正的專業叫「Agentic Engineering」

Andrej Karpathy 在 Sequoia AI Ascent 2026 首度正式區分 vibe coding 與 agentic engineering：前者拉高地板讓所有人都能寫軟體，後者維持天花板確保專業品質不打折。他認為 AI 時代的工程師需要的不是更快的手速，而是品味、架構判斷力，以及指揮 agent 的能力。

2026 年 5 月 12 日 · 來源： Sequoia Capital

Karpathy：Vibe Coding 只是入門票，真正的專業叫「Agentic Engineering」

本文整理自 Sequoia Capital《AI Ascent 2026》2026 年 4 月播出的單集。

{{< apple-podcast "tw/podcast/andrej-karpathy-at-sequoia-ai-ascent-2026-from-vibe/id1799918505?i=1000765806763" >}}

封面圖

當你的 Agent 用 Email 配對付款帳戶

OpenAI 共同創辦人、前 Tesla AI 總監 Andrej Karpathy 做了一個叫 MenuGen 的副專案：拍一張餐廳菜單的照片，AI 自動辨識菜名並生成每道菜的圖片。這個 app 是他用 vibe coding 的方式打造的，部署在 Vercel 上，功能完整，一切看起來很美好。

直到他發現了一個荒謬的 bug。MenuGen 的使用者用 Google 帳號登入，但購買點數時走的是 Stripe 付款。兩邊都有 email 地址，而他的 AI agent 在實作時，居然用 email 去交叉比對兩個系統的使用者身份。問題是，你的 Google 帳號和 Stripe 帳號完全可以用不同的 email。結果就是：有人付了錢，系統卻沒把點數加到他的帳號上。Karpathy 在 Sequoia Capital 的 AI Ascent 2026 活動上分享這個故事時，語氣帶著苦笑。任何有經驗的工程師都知道應該用唯一的 user ID 來串接不同服務，但 agent 就是做出了這種決定。

這個故事完美說明了一件事：AI agent 已經強大到能幫你從零建出一個完整的 app，但它在高階設計決策上仍然會犯低級錯誤。而這正是 Karpathy 要區分 vibe coding 和 agentic engineering 的原因。

地板和天花板：兩種完全不同的事

Karpathy 給出了一個簡潔的框架。Vibe coding 關注的是「拉高地板」：讓原本不會寫程式的人也能打造軟體，讓進入門檻大幅降低。這件事已經在發生，而且效果驚人。但 agentic engineering 關注的是「維持天花板」：你的軟體品質不能因為用了 AI 就打折。你不能因為 vibe coding 方便就引入安全漏洞，你仍然要對你的程式碼負全部責任，就跟以前一模一樣。

他把 agentic engineering 定義為一種工程紀律。你手上有這些 agent，它們非常強大，但本質上是「帶刺的」（spiky）實體：有點不可靠、有點隨機、偶爾會做出莫名其妙的事。如何協調這些 agent 來加快開發速度，同時不犧牲品質，就是 agentic engineering 的核心挑戰。Karpathy 認為這不只是一組技巧，而是一門新的工程學科，就像過去的系統工程或軟體工程一樣，會有自己的原則和最佳實踐。

過去業界常說「10 倍工程師」（10x engineer），形容那些產出遠超同儕的頂尖開發者。Karpathy 觀察到，在 agentic engineering 的框架下，10 倍已經不是正確的衡量尺度了。那些真正擅長這套工作流的人，產出的提升遠遠超過 10 倍。差距不在手速，在於你能不能有效地指揮和監督多個 agent 同時運作，在於你能不能設計出讓 agent 高效運轉的任務架構。

人類還剩下什麼？品味、架構、和那些 Agent 不在乎的事

Karpathy 的答案很明確：人類負責品味、判斷和高階設計，agent 負責執行細節。他用自己的工作經驗舉例。以前寫 PyTorch 或 NumPy 的時候，你得記住一堆 API 細節，像是到底是 keepdims 還是 keepdim，參數叫 dim 還是 axis，要用 reshape 還是 permute 還是 transpose。他說他現在完全不記得這些了，因為不需要了。Agent 在這種細節上的記憶力比人類強得多，交給它就好。

但你不能不知道的是底層原理。比如，tensor 在記憶體中怎麼存放，view 和 storage 的關係是什麼，什麼操作會觸發不必要的記憶體複製。如果你連這些基礎概念都不懂，你就沒辦法判斷 agent 給你的程式碼是否高效，甚至不知道該問什麼問題。Karpathy 形容這種關係像是一個主管帶著能力很強但缺乏全局觀的實習生：你得負責 spec、架構、以及確保整體系統合理，實習生則負責填入細節。

還有一個 AI 目前做不好的事：簡化。Karpathy 提到他有一個叫 MicroGPT 的專案，目標是把 LLM 訓練的程式碼精簡到極致。他反覆要求 AI 幫他簡化，但 AI 就是做不到。他形容那種感覺像是「明顯跑出了 RL 的電路之外」，因為簡化程式碼這件事不在模型的獎勵函數裡。模型被訓練成能寫出「正確且能運作」的程式碼，但不擅長寫出「優雅且精簡」的程式碼。他甚至有點被 agent 寫出來的東西嚇到：能跑，但很臃腫，到處是複製貼上，抽象層設計很脆弱。程式碼的美學標準，目前仍然是人類的領地。

招募方式也該改了

如果 agentic engineering 是一門新的工程學科，那招人的方式也得跟著變。Karpathy 直言，多數公司的面試流程還停留在舊時代：出一道演算法題，看你在白板上怎麼解。這在 AI agent 已經能輕鬆解決大部分程式題的時代，已經不太能測出真正重要的能力了。

他提出了一個新的面試思路：給候選人一個大型專案，比如「用 agent 打造一個 Twitter 的克隆版，然後把它部署上線，做到真正安全」。接著，用十幾個 Codex agent 去嘗試攻破這個網站。如果你部署的服務能扛住這些 agent 的攻擊，那你就展現了真正的 agentic engineering 能力。這個測試衡量的不是你能不能手寫某個演算法，而是你能不能架構一個完整的系統、利用 agent 高效開發、同時確保安全性和可靠性。

Karpathy 觀察到的現實是，大部分組織還沒做這個轉變。他們仍然在用解小題目的方式來篩選人才，而真正的 agentic engineering 高手可能在這種面試中表現平平，因為他們的優勢在於統籌和系統設計，不在於手寫快排。這是一個整個產業都需要面對的結構性錯配。

不能外包的那件事

在訪談的最後，Karpathy 引用了一句讓他反覆思考的話：「你可以外包你的思考，但不能外包你的理解。」這句話精準地劃出了人機協作的邊界。AI agent 可以幫你執行、幫你查資料、幫你寫程式碼、幫你跑測試。但如果你自己不理解系統的基本原理，不理解你要解決的問題的本質，你就沒辦法有效地指揮這些 agent。

Karpathy 說他現在花很多時間用 LLM 來建構自己的知識庫。每讀一篇文章，他就把它加進自己的 wiki，然後從不同角度去提問、去探索。每一次對資訊的「重新投影」，都讓他產生新的洞見。但他也坦言，真正的瓶頸還是自己的理解力。LLM 可以無限地產出資訊，但人類消化和綜合資訊的頻寬是有限的。

這或許是對 agentic engineering 最根本的定義：它不是學會用哪些工具，而是在 agent 越來越強大的時代，持續深化自己對技術和問題的理解。工具會換，框架會變，但理解力是你唯一帶得走的東西。最終，好的 agentic engineer 不靠工具取勝，靠的是真正理解自己在建造什麼、以及為什麼要建造。