AI 開發實戰

從一問一答到並行協作：OpenAI 工程師的九個 Codex 進階技巧

OpenAI Codex 團隊成員 Jason Liu 發表〈Codex Maxxing〉一文，分享九個進階使用技巧。從持久對話串、語音輸入到心跳排程，核心原則只有一個：讓人與 AI Agent 並行工作，不要打斷協作循環。

2026 年 6 月 2 日 · 來源： Jason Liu's Blog

本文整理自 OpenAI Codex 團隊成員 Jason Liu 發表的〈Codex Maxxing〉一文，以及 The AI Daily Brief 節目 2026 年 5 月的討論。

2026 年的 AI 工具圈出現了一個有趣的共識：真正決定生產力的不是模型本身有多強，而是你用什麼「框架」來管理和驅動 AI Agent。Anthropic 的 Claude Code、OpenAI 的 Codex、開源的 OpenClaw，這些被稱為 harness 的代理工作環境，已經成為進階開發者和知識工作者的核心工具。The AI Daily Brief 節目主持人 Nathaniel Whittemore 甚至直接把 2026 稱為「harness 之年」，而 Codex 的成長數字確實支持這個說法：年初幾乎沒有使用者，到了五月已經衝到每週四百萬活躍使用者。

五月初，Codex 團隊成員 Jason Liu 在個人部落格發表了一篇名為〈Codex Maxxing〉的文章，整理出九個進階使用技巧。Liu 在加入 OpenAI 之前，是知名開源專案 instructor（用於 LLM 結構化輸出的 Python 函式庫）的作者，在 AI 開發社群有相當的知名度。文章發表後迅速擴散，Whittemore 也在節目中用了一整個主題段落來拆解這些技巧。九個技巧看似各自獨立，但它們的背後只有一個核心原則：不要打斷人與 Agent 之間的協作循環。

這個原則聽起來抽象，但對應到的是一個非常具體的行為轉變。多數人跟 AI 的互動還停留在回合制模式：打一段 prompt，等回覆，看完結果，再打下一段。這在簡單任務上沒什麼問題，但當你要處理持續數小時甚至數天的複雜專案時，每一次等待和重新開始都在打斷你的思路和 Agent 的動能。Liu 的九個技巧，就是在系統性地消除這些斷裂點。

持久對話串、語音輸入、即時引導：重新定義互動方式

Liu 的前三個技巧直接針對「每次都開新對話」這個最常見的使用習慣。第一個技巧是「持久對話串」（durable monothread）。Codex 最近大幅改善了上下文壓縮機制，能夠把漫長的對話歷史濃縮成關鍵要素，騰出上下文視窗的空間讓對話繼續。這代表你可以為每個重要的工作流程維持一條專屬的對話串，讓它像一本不斷更新的工作日誌一樣持續運作。Liu 最具代表性的例子是他的「幕僚長」（Chief of Staff）對話串，專門處理排程、信件、訊息分類這類日常事務。這條對話串從未中斷，持續累積對他工作模式和偏好的理解。

持久對話串解決的問題不只是上下文流失。當你有幾十條零散的對話，光是找「我到底跟 AI 在哪條對話裡討論過那件事」就要花時間。而 Codex 的 Project 功能雖然可以把檔案加進專案讓每次新對話參考，但它終究需要主動去「檢索」那些檔案內容，不見得總是準確或即時。Liu 建議的做法是，不要每個任務都開新對話，而是為每條關鍵工作流程維持一條長對話串，靠壓縮機制讓它持久運作。不是每件事都值得這樣做，但對於你持續投入的重要專案，這個模式的效率差距很明顯。

第二個技巧是語音輸入。這不只是為了更快地把指令送出去。Liu 認為語音開啟了一種質性不同的互動方式，他把這稱為「漫談的藝術」（the art of the ramble）。用說的時候，你自然會帶進更多背景脈絡，會表達「我不太確定，但可能是這樣」的灰色地帶，會提到你正在考量的取捨。這些模糊但珍貴的資訊，在打字時往往會被你自己過濾掉，因為打字的行為會推你去精煉和簡化。「很多計畫在模型拿到我思考的原始版本時，會比拿到精修版來得更好，」Liu 寫道。Whittemore 在節目中強烈附議，並指出 Codex 內建的語音轉文字品質已經是業界頂尖，不需要額外安裝 Whisperflow 之類的第三方工具。

第三個技巧是 Steer 功能：在 Agent 工作的過程中即時注入新指令或調整方向，不用先停下來等它做完。這徹底改變了「先想好完美 prompt 再按送出」的舊模式。你可以先給出大方向和目標，讓 Agent 開始動手，然後在觀察它的產出時隨時補充修正。語音和 Steer 搭配效果最好：你一邊看 Agent 的結果，一邊用說的把觀察和調整丟進去，做到人和 Agent 真正同步並行。Whittemore 對此的評論很精準：你不用再坐在那裡刷社群媒體等 AI 做完了。

結構化記憶與工具存取：讓 Agent 成為真正的工作者

第四個技巧是九個當中資訊密度最高的，談的是結構化記憶。Codex 有內建的記憶功能（Settings → Personalization → Memories），可以儲存穩定的偏好和工作慣例，但 Liu 的觀點很明確：這些內建功能不是替代方案。他的核心論點是，每次工作不只要產出結果，更要留下「可以被檢視、編輯、重複使用的知識產物」。對話紀錄再長，那些知識還是被困在對話串裡面，如果對話串意外中斷或壓縮效果不好，那些累積的理解就跟著消失了。

Liu 的做法是用 Obsidian 建立一個檔案式知識庫，放在 GitHub repo 上以便跨裝置存取。知識庫最上層有一個 agents.md 檔案，寫著給 Agent 的指令：「當你認識了新的人、在專案上有進展、或關閉了一個待辦事項，就更新知識庫裡對應的頁面。」裡面存放的內容包括人物資訊、決策紀錄、待處理事項、每日筆記和專案狀態。「檔案迫使 Agent 把經驗壓縮成一種能活過對話串的形式，」Liu 寫道。「如果對話串死了、壓縮得很差、或者維護成本太高，有用的知識還在那裡。到了這個階段，固定的對話串開始感覺不像聊天室，更像是不同的工作者在讀同一本共用筆記本。」

Liu 也特別提到，他會刻意去看 Agent 選擇記錄了什麼。這個回顧步驟本身就有價值，因為它讓你知道 Agent 認為哪些資訊重要到值得寫下來。如果 Agent 的判斷跟你的預期不同，那正好是一個校準的機會。這種外化的記憶系統不限於 Codex：Claude Code 的使用者可以用 CLAUDE.md 檔案達到類似效果，任何 AI 開發工具的使用者都能從「讓工作留下結構化產物」這個原則中受益。

第五個技巧是工具存取。當你把電腦操作、瀏覽器使用、以及各種第三方連接器（Slack、Gmail、GitHub、Notion、Vercel）都開放給 Codex，它就從一個純粹的文字處理器變成了「證據蒐集者」。關鍵在於判斷哪種工具適合哪種場景：本機的檔案、日誌、CSV 需要電腦操作能力；線上的文件和網頁需要瀏覽器；跨平台的協作則需要連接器。這些設定確實需要前期投入，但如果你打算把 Codex 當成一個完整的工作系統來用，而不只是一個進階版 ChatGPT，工具存取就是不可省略的基礎建設。

心跳排程、遠端控制、目標與側面板：讓工作循環永不中斷

第六個技巧是遠端控制。Codex 已經是 ChatGPT 行動 App 中的完整功能，你可以從手機上啟動對話串、下達指令、或調整正在執行中的工作方向。重點不是要你在手機上完成所有工作，而是讓你在離開電腦時不會跟進行中的專案完全斷線。當 AI 專案的執行時間從幾分鐘延長到幾小時，能隨時從手機上「輕推」一下方向，就成了非常實用的能力。這和前面提到的 Steer 功能邏輯相同，只是把時間尺度從「幾分鐘內的即時調整」拉長到「跨越數小時的遠端引導」。

第七個技巧是心跳排程（heartbeat），這可能是九個當中最接近「自動化」的一個。心跳是一種定時或觸發式的檢查機制，讓休眠中的對話串定期醒來執行特定任務。Liu 的幕僚長對話串每三十分鐘自動檢查一次 Slack 和 Gmail，找出需要回覆的訊息並排優先順序。但更能展現心跳威力的是他分享的動畫專案案例：他在 Slack 上發了一段影片請同事審閱，然後告訴 Codex 每十五分鐘檢查一次 Slack 對話串，看到回饋就用 Remotion 重新渲染影片，再把新版本回傳到 Slack 並標記審閱者。當 Slack 的 MCP 連接器缺少上傳檔案的功能時，Agent 直接用電腦操作去按「新增檔案」按鈕手動上傳。Liu 指出，這個案例的關鍵在於它跨越了工具邊界：Slack 負責接收回饋、Remotion 負責渲染、電腦操作負責上傳，三個原本不相干的工具串在一起，形成了一個不需要人在旁邊的回饋循環。

第八個技巧是 /goal 功能，目前在 Codex 和 Claude Code 中都已經可用。它讓你設定一個具體、可驗證的成功標準，Agent 會持續朝目標推進，不會像一般 prompt 那樣在遇到困難時就停下來等你給下一步指示。Liu 坦承他自己還在摸索最佳使用方式，Whittemore 也表示會在之後的節目中單獨深入討論，因為目標驅動的互動模式是一個值得完整探討的主題。

第九個技巧是側面板（side panel），Liu 說這是他對 Codex 最興奮的部分，但也是最容易被低估的。很多人把側面板當成預覽視窗，但 Liu 的定位完全不同：「側面板是 Codex 從聊天應用程式轉變為工作發生地點的關鍵。」它做三件事：檢視產出的成品、操作網頁服務、審閱變更。核心價值在於你可以在側面板裡檢查和標註 Agent 的產出，而不用中斷 Agent 正在進行的工作。人在審閱，Agent 在繼續做，兩邊同步進行。這正是整篇文章的核心精神在介面層面的具體實現。

不要打斷循環

Whittemore 在節目最後做了一個精準的總結：這九個技巧加起來，就是一個思維轉變。從回合制的「prompt、等待、審閱、修正、重複」，轉向持續性的「人與 Agent 並行工作，各自在自己的軌道上推進，需要時交會、同步、再各自繼續」。

這個轉變的意義超越了 Codex 本身。持久對話串的概念可以映射到 Claude Code 的 session 管理，結構化記憶可以用任何檔案系統實現，心跳排程在各種自動化工具中都有對應的功能。Liu 真正在傳達的不是某個特定產品的使用手冊，而是一種跟 AI Agent 協作的新心態。你不需要二十四小時盯著 Agent 跑，但你需要確保你跟它之間的協作迴路始終暢通，隨時可以介入、引導、或從它的工作成果中接手。對於任何一個還在用「打一段 prompt、等一個結果」模式跟 AI 互動的人來說，這九個技巧指出了一個明確的演化方向。