不只是更大的 prompt:OpenAI 和 Anthropic 同時押注的 AI 新原語

OpenAI 在 Codex 推出 /goal 指令幾週後,Anthropic 的 Claude Code 就用完全相同的名稱推出了同樣的功能。當競爭對手選擇共用一個名字而非各自發明,這件事本身就值得注意。

不只是更大的 prompt:OpenAI 和 Anthropic 同時押注的 AI 新原語

本文整理自《The AI Daily Brief》2026 年 5 月播出的單集。


當競爭對手選擇共用一個名字

AI 產業的競爭通常表現在命名上。每家公司都想讓自己的產品名稱成為品類代名詞:OpenAI 有 ChatGPT、Google 有 Gemini、Anthropic 有 Claude。但在 2026 年 5 月,一件不太尋常的事情發生了:OpenAI 的 Codex 推出了一個叫做 /goal 的新指令,幾週之後,Anthropic 的 Claude Code 用完全相同的名稱推出了相同的功能。

AI Daily Brief 主持人 NLW(Nathaniel Whittemore)注意到了這件事,並稱之為「非常聰明和成熟的決定」。他的理由是:Anthropic 選擇加入一個正在成形的新原語(primitive),而不是試圖用不同的名字來搶奪擁有權。微軟工程師 Nicholas Bustamante 也表達了相同的看法:「我很高興看到 /goal 正在成為長時間運行任務的新標準原語。」

這不是技術討論,這是產業訊號。當兩家激烈競爭的公司在同一個介面設計上達成共識,通常意味著他們都認為這個設計方向夠重要、夠基礎,值得讓它變成整個產業的共同語言而非差異化的武器。就像 Unix 的管道符號 | 或 HTTP 的動詞 GET/POST,有些東西一旦被證明有用,就不該各自發明不同的寫法。

/goal 為什麼值得被當成產業標準

要理解為什麼 /goal 值得成為共同標準,首先要理解它解決了什麼問題。Codex 團隊的 Tebow 在 5 月初宣稱:「/goal 可能是我們在 Codex 中推出過最具影響力的功能。」Pavel Huren 則解釋了核心機制:「你描述想要的結果,模型開始迴圈、自我評估,完成後自動停止。」

這解決的是 AI 代理工具(agent)的一個根本問題:模型本身不具備跨越對話輪次的持續性。微軟的 Bustamante 精確地指出:「模型不會自然地持續存在於多輪對話、上下文視窗、沙盒環境、程序崩潰、或數天的工作週期之中,所以它需要框架(harness)的幫助。」換句話說,讓 AI 能夠持續朝一個目標推進、記住之前做了什麼、判斷接下來該做什麼,這不是模型本身能解決的問題,而是外層框架必須提供的能力。

/goal 就是這個框架層能力的標準化介面。它定義了一種人機互動的新模式:人類負責定義「終點線合約」(finish line contract),描述什麼狀態應該為真、怎麼驗證成功、什麼不能被破壞;AI 則在這個合約之下自主迴圈執行,每一步之後自我評估進度,判斷是繼續、完成、還是停止。

前 OpenAI 共同創辦人、目前任職於 Anthropic 的卡帕西(Andrej Karpathy)的研究也印證了這個方向的價值。他的「自動研究迴圈」實驗證明了大型語言模型在朝特定目標迴圈執行時表現極佳。他的結論是:「不要告訴它該做什麼,給它成功標準,然後看著它跑。」這已經不是某一家公司的產品哲學,而是整個產業正在收斂的共識。

自主程度的光譜:從 /skill 到 /goal

開發者兼評論者 Sean Wang(Swix)提出了一個框架來理解 /goal 在 AI 互動演進中的位置。他描述了一個自主程度遞增的階梯:/skill 是預設的 prompt 模板,自主程度最低,人類寫好完整指令,AI 照著做就好;/plan 是人類精煉過的輸入,AI 有一些彈性但主要方向由人類控制;/goal 則是 AI 自我評估的產出,人類只定義終點線,AI 自己判斷路徑和完成度。

這個階梯不只是技術演進,更是商業模式的演進。在 /skill 層級,AI 只是一個比較聰明的自動完成工具,價值主要來自節省打字時間。在 /plan 層級,AI 開始能夠處理需要一些判斷力的結構化任務,但人類仍然緊密參與。在 /goal 層級,AI 可以獨立完成需要多步探索、反覆驗證的複雜工作,人類的角色從「操作者」變成「定義者」。

這個演進方向對兩家公司都有利。對 OpenAI 來說,Codex 想要成為開發者的「AI 隊友」,而不只是一個比較快的程式碼補全工具。如果開發者還是得每一步都手動確認,那效率的提升是有天花板的。/goal 讓 Codex 能真正代替使用者去探索、嘗試、修正,把人力從機械性的監督中釋放出來。

對 Anthropic 來說,Claude Code 面臨的競爭壓力更大,因為 Codex 在開發者社群已經有了先發優勢。選擇直接採用 /goal 這個名稱和概念,是一個務實的策略:不在命名上浪費認知成本,而是把競爭焦點放在執行品質上。你的 /goal 跑得比較快、比較準、比較不容易偏離目標?那就是你贏的地方。

/goal 背後的技術共識

/goal 之所以能快速被兩家公司接受,是因為它反映了一個已經在開發者社群形成的技術共識。OpenAI 的 Jason Liu 早前就寫過一篇關於「Codex 極限使用法」的文章,提出了多種提升效率的互動模式:持久對話串(durable monothreads)讓脈絡不會因為開新對話而丟失、側邊面板讓使用者可以即時檢視 AI 正在產出的東西、語音輸入讓回饋更自由更豐富、中途介入(steering)讓使用者不必等到 AI 完成才能調整方向。

這些模式都指向同一個結論:一問一答的聊天模式已經不夠用了。使用者需要一種更平行、更非同步的工作方式,讓 AI 可以在背景持續跑,而人類只在關鍵節點介入。/goal 正是這個方向的最自然延伸。

而 Codex 團隊在推出 /goal 的同時,也發布了一份官方指南文件,定義了六個構成要素:結果(outcome)、驗證面(verification surface)、約束條件(constraints)、邊界(boundaries)、迭代策略(iteration policy)、阻斷停止條件(block-stop condition)。這份文件本身就是一種標準化的努力。當 Claude Code 選擇接受這個標準而非自己重新定義一套,競爭就從「誰的規格定義比較好」轉移到「誰的實作比較強」。

超越程式開發的野心

NLW 在節目中特別強調了 /goal 在知識工作領域的潛力。他列出了十個可能適用的非程式開發場景:文獻回顧、市場版圖分析、供應商評估、盡職調查、聲明稽核、政策研究、訪談綜合整理、時間線重建、試算表稽核、以及策略備忘錄。他的判斷標準是:當產出物不只是一個答案,而是一份完整的稽核報告時,/goal 就是好的選擇。

這代表兩家公司看到的機會不只是程式開發市場。如果 /goal 能擴展到知識工作,它觸及的潛在受眾就從幾百萬開發者擴大到數以千萬計的知識工作者。顧問做盡職調查、分析師做市場研究、編輯做事實查核、法務做合約審閱,這些工作的共同特點都是:需要多步驟的系統性檢查、有明確的完成標準(即使標準是使用者自己定義的)、最終產出物是結構化的紀錄而非一段文字。

Pavel Huren 的觀察總結了這個方向的意義:「贏的技能是工程化你的意圖。為什麼這件事重要、策略脈絡是什麼、成功如何被衡量,讓 agent 能做出更好的自主決策。」如果 /goal 確實成為標準,那「定義好的 goal」這件事本身就會成為一種值得學習的專業技能。

我的觀察:標準化是 AI Agent 起飛的前提

/goal 這件事讓我想到的是,AI agent 要從「展示型」進入「生產型」,標準化是繞不過去的前提。過去兩年,每家公司都在用不同的方式讓 AI 做更複雜的事:有人用 function calling、有人用 tool use、有人用 multi-step reasoning。但使用者的認知成本很高,學了 A 家的做法不一定能搬到 B 家。

/goal 的有趣之處在於它是「從使用者端發起的標準化」。不是底層技術的統一(每家的模型架構還是不同),而是互動介面的統一。使用者不管底下跑的是 GPT 還是 Claude,/goal 這個指令的含義和使用方式是一樣的。這讓知識和經驗可以跨平台累積,而不是被鎖在某一個生態系裡面。

NLW 說得對:Anthropic 選擇直接用 /goal 這個名字是「聰明且成熟」的決定。在 AI 產業的早期階段,很多公司會為了品牌差異化而刻意用不同的名字來稱呼同樣的東西。但當一個概念夠好、夠基礎時,試圖擁有它的命名權反而會拖慢整個產業的發展。/goal 能不能最終像 HTTPS 或 JSON 一樣成為所有 AI agent 工具的共同語言,現在判斷還太早。但兩家最重要的玩家願意在這個層面合作而非競爭,這本身就是一個值得注意的訊號。