AI 開發實戰

每個 AI 工具都在變成每個 AI 工具:為什麼 2026 年該停止挑工具,開始建你的 AgentOS

The AI Daily Brief 主持人 Nathaniel Whittemore 訪談 AgentOS 創建者 Nufar Gaspar,提出「每個 AI 代理工具都在變成每個 AI 代理工具」。Cursor、Claude Code、Codex 朝同一組能力收斂,真正決定價值的不是工具,而是底下那套人人能用文字檔蓋的 AgentOS。本系列共兩篇,第一篇拆解工具收斂證據與七層框架的前兩層 Identity 與 Context。

2026 年 5 月 4 日 · 來源： The AI Daily Brief

每個 AI 工具都在變成每個 AI 工具:為什麼 2026 年該停止挑工具,開始建你的 AgentOS

本文整理自《The AI Daily Brief》2026 年 4 月播出的 Operators Bonus 單集,受訪者為 AgentOS 訓練計畫創建者 Nufar Gaspar。本系列共兩篇,這是第一篇談工具收斂與七層框架的前兩層 Identity 與 Context。

封面圖

為什麼 NLW 第三度找 Nufar Gaspar 做免費訓練計畫

The AI Daily Brief 主持人 Nathaniel Whittemore(NLW)今年連續推了三個免費 AI 訓練計畫:年初的 AIDB New Year、春天的 Clawcamp、最新一檔叫 AgentOS。他在 Operators Bonus 這集裡邀回 Clawcamp 的合作講師 Nufar Gaspar 介紹 AgentOS 的內容,開場就點出這三個計畫的演化軌跡:AIDB New Year 是十個彼此沒關係的入門專案、Clawcamp 完全聚焦在 OpenClaw 一個工具上,到了 AgentOS 已經跳到工具之外。NLW 講得很直白:「現在已經不是工具的事、不是模型的事、不是 harness 的事,未來會是底下這套系統,讓你可以隨時換 harness、換模型,產業怎麼變都不怕。」

這個轉折很有意思,因為它代表 NLW 對自己這一年內容主軸的修正。從「教你各種專案」到「教你一個工具」再到「教你一個底層系統」,他在 podcast 裡不斷重複的觀察是:Cursor 加了 agents 跟 automations、Claude Code 加了新的記憶系統、OpenClaw 已經能讀檔案、Codex 跑在背景,加上 Hermes、Windsurf、Antigravity 一票工具,全部都在朝同一組能力收斂。Nufar 把這個現象壓縮成一句話:「Every agentic tool is becoming every agentic tool」(每個 AI 代理工具都在變成每個 AI 代理工具)。

她接著做出一個對所有寫過 prompt、用過 AI 工具的知識工作者都有意義的判斷:既然工具都長得越來越像,那真正決定你能從這些工具裡擠出多少價值的,就不再是「你選哪一家」,而是「你在這些工具底下放了什麼」。她把那個底層東西命名為 AI 代理作業系統(AgentOS),整個概念可以用她的另一句話總結:「If you can write a document, you can build an agentic operating system」(你會寫文件,就能建一個 AI 代理作業系統)。

工具收斂的具體證據:每家都在抄每家

Nufar 講「工具收斂」的論點不是抽象哲學,她直接點名 2026 年第一季發生的事。Cursor 過去幾個月加了 agent 模式跟 automations,這個過去是 OpenClaw 的招牌;Claude Code 剛剛上了一套自動記憶(auto memory),這個過去是 Cursor 跟 Claude Desktop 才有的功能;OpenClaw 開始能讀任意檔案,這個過去是 Cursor 的優勢;Codex 可以跑在背景,這個過去是 OpenClaw 的 cron job 才能做的事。她說再加上開源新秀 Hermes(來自 Nous Research)、Windsurf、Antigravity,「他們的架構都長得很像」。

這個收斂不是巧合,是因為每家工具背後都在處理同一組問題:怎麼讀使用者的身分檔案、怎麼讀使用者的知識庫、怎麼定義可重複用的技能、怎麼跨 session 記憶、怎麼接外部系統、怎麼驗證、怎麼自動化。當所有人都在解同一組題目、又在彼此的產品上看到對方的解法,幾個月內互相抄完是必然的結果。Nufar 說這代表一件事:「你今天在某個工具裡看到的限制,下一次你打開新版的時候大概就被解掉了。」

對使用者的意義很實際。如果工具差距會被市場壓縮到只剩細節,那麼「我該選 Cursor 還是 Claude Code」這個問題的答案會越來越接近「都差不多,挑你順手的就好」。NLW 在訪談裡明確補了一句:「going forward, these systems that sit underneath, that allow you to swap in harnesses, swap out harnesses, swap in models, swap out models」 — 未來真正重要的,是底下那套讓你能自由換工具與模型的系統。

為什麼 portable 的關鍵是「文字檔」

Nufar 之所以敢說 AgentOS 可以從一個工具搬到另一個工具,理由在於現在的 AI 代理工具底層有一個共同點:它們大多都是讀使用者目錄裡的純文字檔(plain text files)。OpenClaw 讀的設定叫 Soul、Cursor 讀 Agents.md、Claude Code 讀 CLAUDE.md、GitHub Copilot 讀 Copilot Instructions。檔名都不一樣,但格式都是 markdown,內容都在描述「我是誰、我怎麼工作、我有哪些工具」。這意味著如果你今天把這些檔案組織得當,明天換個工具,你只要把新工具指向同一個資料夾,它就能讀同樣的設定。

Nufar 用 portability 這個概念說得很重:「你做的工作是 portable 的,雖然工具公司可能不希望你這樣想,但這就是『每個工具都變成每個工具』的真實後果。」她還補了一句設計觀察:「你只要把新工具指到同一個資料夾,它就讀到同樣的檔案,沒有遷移、沒有重建。」對任何已經在 Cursor 或 Claude Code 裡建過大量設定的人來說,這個承諾的價值很高,因為你過去最大的恐懼就是「換工具等於從零開始」。

更實用的是,因為核心是文字檔,AgentOS 的門檻就被拉到很低。Nufar 反覆強調這件事:「會寫文件就能蓋」。她整個七層框架沒有一層需要寫程式,全部都是用 markdown 描述自己的身分、知識、技能、規則。這跟過去那種「想用 AI 自動化必須先學 Python、學 LangChain、學工程」的門檻是完全不同的世代。把工具門檻拉低之後,AI 代理就從工程師玩具,變成所有知識工作者都能蓋的個人系統。

七層框架:身分、知識、技能、記憶、連結、驗證、自動化

Nufar 把 AgentOS 拆成七層,順序是有講究的:Identity(身分)→ Context(知識)→ Skills(技能)→ Memory(記憶)→ Connections(連結)→ Verification(驗證)→ Automations(自動化)。她特別強調這個順序代表優先級,不是隨便排的。先處理身分跟知識,因為沒有這兩層其他都白做;先處理技能跟記憶,再處理連結跟驗證;最後才碰自動化,因為自動化是風險最大、最容易失控的一層。

這七層還有一個關鍵性質:每個你蓋出來的 agent 都會繼承全部七層。Nufar 用她自己的「幕僚長 agent」Chloe 當例子,這是她蓋的第一個 agent,跑在 OpenClaw 上,幫她過信箱、準備會議、追蹤她答應別人的事、起草週報。但 Chloe 蓋好之後,她接著蓋了負責內容、技術專案、平台事務的多個 specialist agents。後面這些 agents 不需要重新建身分檔、不需要重新寫知識庫、不需要重新教風格,因為它們從一開始就建在同一個 AgentOS 上面。她形容這是 AgentOS 真正的回報:第一個 agent 很難,但從第二個開始,你只要寫一份工作描述加上幾個專屬 skill,一個下午就蓋好。

她也提醒了一個 framing:這集不是在講寫程式的 AI 代理。坊間談 AI 代理的內容有八成在講 Cursor 跟 Claude Code 怎麼幫你寫程式碼,但 AgentOS 是專門針對知識工作者設計的,涵蓋策略、溝通、營運、研究、決策這些工作。她認為這才是 AI 代理對多數職場人帶來最大改變的地方,但目前公開資源最少。下面用她推薦的「幕僚長 agent」當運行範例,逐層拆開頭兩層。

Layer 1 Identity:你的 agent 第一個讀的檔案

Identity 是七層裡最基礎的一層,它回答的問題只有兩個:你是誰、你要 agent 強制執行哪些規則。Nufar 強調這份檔案是工具讀的「第一個」檔案,比你輸入的問題還早讀、比記憶系統還早讀。OpenClaw 把它叫 Soul、Cursor 叫 Agents.md、Claude Code 叫 CLAUDE.md、Copilot 叫 Copilot Instructions。如果你從來沒有刻意寫過這份檔案,你的 agent 等於是從零開始猜你是誰、或是亂湊一些它從對話裡偷偷收集的片段在用。

一份夠用的 Identity 檔案要包含三類資訊。第一類是「你怎麼溝通」,你要直接還是外交辭令、要條列還是散文、要簡短還是詳細。第二類是「你重視什麼」,你要 agent 挑戰你的想法還是執行你的指令、要它把推理過程寫出來還是直接給答案。第三類是「不准做的事」,Nufar 給的範例是「不准在我先看草稿之前送出任何外部 email」、「不准奉承我」、「永遠告訴我我看不到的盲點」。第三類最關鍵,因為這些規則一旦寫進 Identity,就是被工具強制執行的硬約束,不會因為某次對話被滑掉。

但這層最有價值的不是「該寫什麼」,而是「怎麼寫」。Nufar 給的方法非常具體,幾乎可以直接抄:不要自己從頭寫,你會討厭、你會放棄。改成打開一個已經對你有大量記憶的 AI 工具,跟它說「我要建一份 identity 檔案,請問我 15 個問題,了解我怎麼工作、我要什麼、我討厭什麼、我希望你執行哪些硬規則」。然後你用嘴巴回答(口說比打字快很多),讓 AI 起草、你修、把第一版做到「七成對」就上線,剩下三成在接下來三週內邊用邊補。她說這套「腦力傾倒 → AI 訪談 → 七成上線 → 三週內補」的方法,會是 AgentOS 每一層都通用的建檔模式。

Layer 2 Context:你的處境,模型永遠不會自己知道

如果說 Identity 講「你是誰」,Context 講的就是「你知道什麼」。Nufar 把這層形容為「決定 AI 給你套話還是真有用」的單一最重要因素。理由是 AI 通用的建議網路上一搜就有,但你的處境、你公司的路線圖、你的組織圖、你的客戶分群、你這一季的優先順序,這些是任何模型都不可能自己知道的。她特別強調一個關鍵差異:「Your specific context will always be yours. And no model improvements will ever, ever know what you're shipping next quarter or who your key stakeholders, unless you tell it.」(你的專屬處境永遠是你的,不管模型怎麼進步,除非你告訴它,不然它永遠不會知道你下一季要出貨什麼、你的關鍵利害關係人是誰。)

這層最常見的失敗是「一次寫一個 40 頁的鉅作」,幾週之後發現過期、不再更新,整份變成擺著沒人用的死檔。Nufar 推薦的形態是相反的:拆成三到五個各自一頁的單一主題檔案,每個檔案專心講一件事,例如我的團隊、我的產品、我的客戶、我這一季、我的關鍵利害關係人。每份檔案要有日期,事情變了就更新。她把這個習慣稱為 context curation(情境策展),強調這是一個「持續的實踐」,不是一個「有開始有結束的專案」。

實作上的觸發點很簡單:每次你發現自己又在跟 AI 重複解釋同一件事的時候,那件事就應該被寫進 context 檔案。Nufar 認為這是分辨「真的在用 AI」跟「只是在跟 AI 聊」的最快指標。她說每次她在工作坊看到有人「get it」,對話就會從「我該選哪個 AI 工具」轉成「我擁有哪些知識,是還沒有被寫下來的」。這個 reframing 的實際後果是:使用者開始把 AI 體驗的優化責任收回到自己手上,而不是把希望寄託在某個工具公司下次更新會解掉問題。

對「幕僚長 agent」這個運行範例,Nufar 列出三份最起碼要建的 context 檔案。第一份是 stakeholder file:誰跟你報告、你跟誰報告、你的關鍵跨部門夥伴、每個人在意什麼。第二份是 strategy & priorities file:你今年想達成什麼、組織當前的焦點是什麼。第三份是 operating principles file:決策怎麼下、你會推回什麼、你會把什麼往上呈報。這三份加起來,就讓 agent 從「會講話的搜尋引擎」變成「真的懂你公司情境的助理」。

我的觀察:臺灣 AI 重度使用者的決策疲勞,可能是花在錯地方的焦慮

Nufar 這集講的內容裡,對臺灣讀者最有實用價值的是工具收斂這個論點。過去半年我在臺灣 AI 圈聊天的時候,一個高頻問題是「你現在主要用什麼,Cursor、Claude Code、Codex、還是 Cline」。這個問題本身代表一種隱性的決策焦慮,好像挑錯工具就會落後別人。但 Nufar 跟 NLW 兩個人在 podcast 裡反覆指出的事實是,這幾個工具的能力差距正在以季為單位被抹平。你今天因為 Claude Code 沒有某個功能而轉去 Cursor,下一次 Anthropic 更新時功能補齊,你又要不要轉回來?這個反覆切換的時間,遠比你把它花在底下的 AgentOS 上要不划算。

換個角度看,Nufar 提的「七成上線、三週補完」的建檔方法論,對臺灣多數知識工作者其實是個低估的解放。我在跟編輯部、產品、行銷團隊聊個人 AI 設定的時候,最常聽到的卡點是「我不知道怎麼開始寫那份 prompt」,大家都被 prompt engineering 的廣告宣傳嚇到,覺得不寫到完美就不要動手。Nufar 這套「不要從頭寫,直接讓 AI 訪談你」的做法,把寫 identity 跟 context 檔案的門檻從「需要文字功力」降到「會說話就行」,這對華語使用者特別友善,因為很多人其實口語表達遠比書面表達順,而 OpenAI、Anthropic 的中文語音轉文字現在都已經夠堪用了。

最後一個值得臺灣讀者警覺的訊號是 NLW 自己對內容路線的修正。AIDB New Year、Clawcamp、AgentOS 這三檔免費計畫的演化,對應的是市場上「個人 AI 怎麼用」這個議題的成熟曲線:從「教你做十個小專案」到「教你深掘一個工具」到「教你蓋一個能撐十年的底層系統」。臺灣科技媒體目前主流的 AI 內容還停留在第一階段(介紹某個新模型、某個新功能、某個新工具),但對於已經把 Claude Code 或 Cursor 用熟的重度使用者,下一步的真正成長空間在第三階段。我接下來打算把自己的 CLAUDE.md、agents 目錄、hooks 配置、MCP 接點全部按 Nufar 這套七層拆解一遍,看看哪幾層其實沒做好。第二篇會接著拆 Skills 之後的五層。