Swyx 的 2026 大論:寫程式 Agent 會破籠、吃掉所有軟體,連帶吃掉整個世界

Swyx 在 Latent Space 與 Unsupervised Learning 的跨刀單集裡,把他追了一年的核心 thesis 講到最完整:軟體吃掉世界、寫程式 Agent 吃掉軟體,所以寫程式 Agent 吃掉世界。從 AIE Europe 三大主題(OpenClaw、harness engineering、context engineering)出發,再走到 agent lab playbook、Cerebras/Talos 等客製晶片、最後落到「賣產品給 Agent」這個全新的 GTM 命題:Vercel 60% 後台流量是 bot、Resend 在 Claude 推薦清單裡佔 70%。本系列共三篇,這是第二篇。

Swyx 的 2026 大論:寫程式 Agent 會破籠、吃掉所有軟體,連帶吃掉整個世界

本文整理自《Latent Space》與《Unsupervised Learning》2026 年 4 月 23 日的跨刀單集《AIE Europe Debrief + Agent Labs Thesis》,主持人是 Redpoint 投資合夥人 Jacob Effron,受訪者是 Latent Space 主持人、AI Engineer 大會策展人、現任 Cognition 員工 Swyx(Shawn Wang)。本系列共三篇,這是第二篇談 Swyx 的 2026 核心 thesis、agent lab playbook 與賣產品給 Agent 的 GTM 變革;第一篇談 AI 寫程式戰爭的市場結構,第三篇談 Swyx 公開承認的兩個轉念。

{{< youtube A_7WafI9bhE >}}

{{< spotify "episode/3KJuOAQa6S9hyaRnAoC2IH" >}}

{{< apple-podcast "tw/podcast/aie-europe-debrief-agent-labs-thesis-unsupervised-learning/id1674008350?i=1000763306891" >}}


倫敦 AIE Europe 的三個議題:OpenClaw、Harness、Context

Swyx 從倫敦回來的時候,把 AIE Europe 的場控筆記直接攤給聽眾看。他的角色比任何人都適合做這個盤點,因為他自己策展這個會議的所有議程,從邀講者到分軌主題都親手挑。他的判斷是,這幾個月 AI 工程社群最熱的三個主題是 OpenClaw、harness engineering、context engineering,後面跟著一條長長的「常青議題」尾巴:evals、observability、GPU、LM 基礎設施、多模態與生成式媒體。

OpenClaw 之所以排在第一,是因為它在過去四到五個月幾乎是所有 AI 工程師都在討論的故事。這個產品類型把瀏覽器代理、桌面代理、長任務執行打包成一個全新的代理範式。它本身的影響力已經夠大,但 Swyx 在訪談裡說的更深一層是:「OpenClaw 是未來的一個縮影。」這句話是這集 thesis 的伏筆,後面我們會看到它怎麼接到「寫程式 Agent 破籠吃掉世界」的核心命題。

Harness engineering 跟 context engineering 是 Swyx 自己創造的兩個分軌名字,現在已經被社群普遍接受。Harness 指的是把 LLM 包裝成可運作代理人的「骨架」,包含 loop、工具、檔案系統、子代理人、記憶。Context engineering 是它的姊妹學門,討論在每一個推論步驟要餵什麼脈絡進去(RAG、檢索、漸進揭露)。Jacob 在訪談裡引述 LangChain 執行長 Harrison Chase 的一則推文:「AI 基礎設施終於有種穩定下來的感覺了」,問 Swyx 買不買單。

Swyx 的回答有兩層。第一層,他同意 skill 已經跑出來當「最小可行的代理整合格式」,一份 markdown 加上幾個 script,他說「我看不出怎麼比這個更簡單」。第二層,他婉拒「基礎設施已經穩定」這個結論性的論斷,「不要把名譽押在這個 thesis 上,如果它變了,就跟著變」。Harrison Chase 自己過去三年每年都在重新發明公司:LangChain、LangGraph、deep agents,路線一直變。這是一個謹慎但坦誠的判斷,也凸顯這個產業的變動速度。

Agent Lab Playbook:「反向 bitter lesson」如何成立

Jacob 把問題拉到應用層公司該不該訓練自己的模型,Swyx 把這個討論用一個名字蓋住:agent lab playbook。這個 playbook 的核心步驟很乾淨:先用大實驗室的前沿模型把你的產品跑起來,等你累積到足夠的工作流資料,再把資料蒸餾(distill)成你自己的小模型,省成本、省延遲、解鎖領域客製。Cognition 的 SWE-1.6、Cursor 的 Composer 2 都是走這條路的案例,兩個模型在開放的「模型切換器」裡都能進前五,而且不靠補貼。

這跟 Rich Sutton 那篇有名的《The Bitter Lesson》是相反方向。Bitter Lesson 警告大家不要做領域客製,最後總是「更大的模型 + 更多運算」勝出。Swyx 的觀察是這個邏輯在 2026 年要倒過來看:你先用大模型把領域跑通,再從這個大模型蒸餾下來,這時候你拿到的是兩邊好處:大模型的通用能力打底,加上你的工作流資料專一化,成本只有大模型的零頭。Swyx 把這個叫 reversal of the bitter lesson,意思是 bitter lesson 並沒有錯,只是要把它跑兩次。

Cognition 跟 Cursor 都做這件事還有兩個推手讓門檻變低。一個是 Thinking Machines(OpenAI 共同創辦人 Mira Murati 創辦)推出的 Tinker,把模型微調包成一個比 OpenAI fine-tuning API 更友善的服務。另一個是 Prime Intellect 的開放實驗室,把分散式訓練的基礎設施開源。Swyx 的總結是:「兩年前要訓自己的模型是工程地獄,現在是地獄的入口已經有人鋪好水泥地。」對 Cognition、Cursor 這個量級的公司來說,做一個內部小模型不再需要三十人的研究團隊,五個工程師加上一筆中等規模的算力就能跑起來。

Cerebras、Talos 與「每 10 倍速度解鎖一個新用法」

Swyx 在訪談裡花了一段時間講算力市場上「非 NVIDIA 推論」的崛起。Cerebras 跟 Talos 是兩個被點名的代表,Cognition 自己就跑在 Cerebras 上,OpenAI 也在用。這個趨勢看似只是換一張卡,背後其實是另一件事在發生:每多一倍的推論速度,會解鎖一個新的使用範式。Swyx 自己之前是這個論點的懷疑者,「100 token/sec 變 200 token/sec 只快兩倍,有差嗎」,但實際看到 Cerebras 跑出每秒幾千個 token 的水準後,他改口了。

「每 10 倍解鎖一種新用法」這句話是 Swyx 從硬體史總結出來的經驗法則。看一下我們自己用 LLM 的歷史就知道:當推論從每秒幾個 token 加速到幾十個 token,聊天介面才變得實用;從幾十加到幾百,coding agent 才能在你想得到的時間內把整個檔案重寫;從幾百加到幾千,會解鎖什麼?Swyx 自己也不敢預測,但他認為這個「不知道會解鎖什麼」本身就是值得投資的訊號。「整套應用會在某個時間點集體出現,這種事很難從現在的曲線外推。」

這個非 NVIDIA 推論的故事不只是 Cerebras 跟 Talos。AMD 的 Instinct 系列、Groq、SambaNova、加上一票還沒上市的初創,都在搶這個市場。Swyx 看到 AMD 居然也開始拿單,「對我這個十年前在華爾街看 AMD 股價的人來說,這太有畫面感了」。這個多年的投資週期不會在 2026 看完,他建議大家別太快下「NVIDIA 一統江湖」的結論。臺灣讀者特別應該注意的是,這個賽道對台積電的訂單結構有直接影響:晶圓代工的客戶從一家獨大變成多家分食,對毛利、製程節點安排都是新的變數。

賣產品給 Agent:60% Vercel 後台流量是 bot

Jacob 把問題拉到 GTM 端:當代理人成為基礎設施的主要使用者,賣產品的玩法該怎麼改?Swyx 的答案讓會議現場一片騷動。Vercel 的技術長 Malte Ubl 在 AIE Europe 的舞台上丟了一個數字:Vercel 後台管理介面(admin app architecture)的流量目前 60% 來自 bot,不是人。這 60% 裡絕大多數是寫程式代理人,透過 CLI、MCP 在跟 Vercel 互動,在替使用者開新專案、設環境變數、部署應用。

這個數字比所有「代理人時代來了」的口號都更有說服力。如果你正在賣一個給工程師用的 SaaS,你的主要使用者已經悄悄變成 bot,可是你的產品決策會議上沒有 bot 的代表。Swyx 用一句話總結:「如果你的東西不是 API 可達,對代理人來說它就不存在。」對 SaaS 公司的意義是,每一個原本只在 UI 上能完成的操作,都要評估能不能搬上 API 跟 CLI。如果不能,這個產品在六個月內會看到使用情境快速萎縮。

但 Swyx 進一步澄清,新的「Agent Experience」(AX,Netlify 創辦人 Matt Biilmann 創造的詞)大半其實只是把開發者體驗(DX)做好的另一個說法:好的 API 文件、無狀態的呼叫、CLI 介面、漸進式揭露的功能曲線。這些事情你本來就該為人類工程師做,現在因為代理人變成主要使用者,這些工作有了新的能量。「能量」這個詞 Swyx 用得很準。他的意思是,過去公司內想推這些「應該做但不緊急」的事情很難拿到資源,現在可以用「我們要服務代理人」當理由把預算要出來。對 PM 來說這是一個現成的提案模板。

Resend 的 70% 推薦率:擠進 LLM 提名清單的新 SEO

賣給代理人之外,更隱蔽的賣法是把自己「賣進」LLM 的推薦回覆裡。Swyx 提到一份近期調查:當開發者問 Claude「請推薦一個 email 寄送服務」、不給其他提示,Claude 大約 70% 的回覆會推薦 Resend。Resend 是 2023 年才成立的後起之秀,在傳統 SEO 的邏輯下,它要把 SendGrid、Mailgun 這些十幾年老牌打贏幾乎不可能,但在 LLM 推薦這個新管道裡它變成第一順位。

更殘酷的是這個推薦清單的容量。傳統 SEO 第一頁有十個位置,下面還有第二頁第三頁;LLM 的推薦清單只有大約三個名字。「能擠進這三個名字之內就是新版的金字塔頂端」,Swyx 的說法是。對行銷與 GTM 團隊來說,這意味著兩件事。第一,過去把 SEO 排名做到第八都還有點水流進來,現在一旦掉出 LLM 的前三名就直接歸零。第二,能擠進前三名的方式跟傳統 SEO 不同,比的不是反向連結數量,比的是 LLM 訓練時看到你的次數、看到你跟「email」這個語意的關聯強度。

擠進去的具體技巧 Swyx 講了兩個。一個是 combo articles,寫一些「用 X 配 Resend」的搭配文,把你的品牌跟其他工具的語意關聯打進去。LLM 在訓練語料裡如果看到你跟某個熱門工具一起出現的頻率夠高,做相關推薦時就會把你想起來。另一個是「能進到 2023 年的訓練資料切點」這件事,當時被收進預訓練語料的品牌,現在還在吃補貼,未來幾年內這個優勢還會持續。Swyx 補充,等到記憶與個人化系統成熟(這是下一篇要談的下一個 frontier),整個推薦邏輯會再變一次,現在的 AEO(AI Engine Optimization)紅利會被洗牌。

2026 大論:軟體吃掉世界,代理人吃掉軟體,代理人吃掉世界

把這些零散觀察兜起來,是 Swyx 追了一年的核心 thesis,他在這集說得最完整。「2025 是寫程式 Agent 之年;2026 是寫程式 Agent 破籠(break containment)、去做所有其他事情之年。」Swyx 用了一個傳遞律的說法把這個論點打到極簡:軟體吃掉世界(Marc Andreessen 2011 年那句經典)、寫程式 Agent 吃掉軟體(過去一年市場確認的事實)、所以寫程式 Agent 吃掉世界。

「破籠」是核心動詞。Swyx 對它的定義是這樣的:寫程式 Agent 過去一年的工作大致還困在「給 IDE 用」「給工程師用」「在某個沙盒裡跑」的範圍裡。但這些代理人本質上是會生產軟體的軟體。一旦放出來,它們不只生 IDE 裡的 patch,會生瀏覽器擴充、生內部工具、生整個 SaaS 取代品、生一次性的個人腳本。當軟體可以被任何人在幾分鐘內讓代理人寫出來,原本所有「不夠重要、所以沒人寫」的軟體都會被寫出來。這就是「吃掉世界」的具體形式。

Jacob 在這段給了一個很細的補充:「破籠」這個詞在消費端比在企業端更容易解釋。消費端使用者已經在自己生活中跑出很多瘋狂實驗,把家裡冰箱的條碼掃出購物清單、把 Slack 聊天記錄變成個人化備忘錄、把家庭財務管理用 Claude Code 做成自家儀表板。企業端反而保守,每一個破籠的場景都要過合規、過安全、過資料治理。Swyx 同意這個觀察,並補了一句他預期的「氣氛回歸」(vibes reversion):目前一家公司獨大的敘事不會永遠維持,全世界太多生態行動者都在押注「不能只剩兩三家強模型公司」這個情境,未來六到十二個月會看到敘事比現在更平均一點。

Neolab 與 Neocloud:為什麼「新模型實驗室」這個物種長不出來

Swyx 在這段順勢回應了一個被問了一年的問題:為什麼 2025 年沒有任何 Neolab(新興模型實驗室)真的突圍?xAI 算成功進場,但它已經是 Elon Musk 帶資源進來的特例。剩下的 Mistral、Reka、AI21、Inflection、Adept、Character、ZAI/GLM,每一個都做得很好,但沒有一個真正擠進「跟 OpenAI、Anthropic、Google 同等量級」的位置。Swyx 的判斷是,這是結構性的,不是巧合。

對比之下 Neocloud(新興 GPU 雲端服務商)相對容易長。CoreWeave 已經 IPO,Lambda、Crusoe、Nebius、Together 都各自吃下一塊市場。原因很現實:NVIDIA 自己很努力幫這些 Neocloud 站起來,因為多一家 Neocloud 就多一個願意買 GPU 的客戶。NVIDIA 的最大利益是 GPU 銷量,而 Neocloud 的興起直接把 GPU 銷量推高,所以 NVIDIA 的內部團隊會分配資源、優先供貨、做技術整合協助這些 Neocloud 起飛。

Neolab 的情況反過來。NVIDIA 對 Neolab 站起來的興趣比 Neocloud 小很多,因為 Neolab 不一定會多買 GPU,反而可能搶 OpenAI 跟 Anthropic 的訂單。Swyx 的金句是:「你沒辦法用意志力強迫 Neolab 出現。」Neolab 需要研究人才、訓練資料、長週期的耐心、外加一個產品市場契合,這些東西都沒辦法靠 NVIDIA 的供應鏈安排來解。對臺灣讀者來說這個觀察很重要:當談到「臺灣需要自己的模型實驗室」這種戰略性議題時,要先理解 Neolab 不是設備跟資金的問題,是生態與人才的問題,砸錢砸不出來。

結尾:這集的話只聽一句,記住「破籠」兩個字

要從這集帶走一句話,就是「2026 是寫程式 Agent 破籠之年」。其他的細節,三家 20 億美元公司、60% Vercel 後台流量、Resend 70% 推薦率、agent lab playbook,都是支撐這個 thesis 的證據。如果你接下來六個月在做產品決策、技術選型、招募方向,把「破籠」兩個字當成濾鏡放進去:你做的這件事,能不能讓寫程式 Agent 從你的領域走出來、生出新的軟體?如果答案是不能,那你可能在做一個正在被破籠對象吃掉的東西。

下一篇會接著拆 Swyx 公開承認的兩個轉念,開源模型回升、post-training 值得做,以及他認為下一個真正重要的 frontier:記憶、個人化、世界模型。為什麼李飛飛(Fei-Fei Li)今年寫的那篇 spatial intelligence 論文是 Swyx 心目中的年度必讀?這個問題的答案藏在 Matt Damon 的《心靈捕手》裡。