從一問一答到並行協作:OpenAI 工程師的九個 Codex 進階技巧
OpenAI Codex 團隊成員 Jason Liu 發表〈Codex Maxxing〉一文,分享九個進階使用技巧。從持久對話串、語音輸入到心跳排程,核心原則只有一個:讓人與 AI Agent 並行工作,不要打斷協作循環。

本文整理自 OpenAI Codex 團隊成員 Jason Liu 發表的〈Codex Maxxing〉一文,以及 The AI Daily Brief 節目 2026 年 5 月的討論。
2026 年的 AI 工具圈出現了一個有趣的共識:真正決定生產力的不是模型本身有多強,而是你用什麼「框架」來管理和驅動 AI Agent。Anthropic 的 Claude Code、OpenAI 的 Codex、開源的 OpenClaw,這些被稱為 harness 的代理工作環境,已經成為進階開發者和知識工作者的核心工具。The AI Daily Brief 節目主持人 Nathaniel Whittemore 甚至直接把 2026 稱為「harness 之年」,而 Codex 的成長數字確實支持這個說法:年初幾乎沒有使用者,到了五月已經衝到每週四百萬活躍使用者。
五月初,Codex 團隊成員 Jason Liu 在個人部落格發表了一篇名為〈Codex Maxxing〉的文章,整理出九個進階使用技巧。Liu 在加入 OpenAI 之前,是知名開源專案 instructor(用於 LLM 結構化輸出的 Python 函式庫)的作者,在 AI 開發社群有相當的知名度。文章發表後迅速擴散,Whittemore 也在節目中用了一整個主題段落來拆解這些技巧。九個技巧看似各自獨立,但它們的背後只有一個核心原則:不要打斷人與 Agent 之間的協作循環。
這個原則聽起來抽象,但對應到的是一個非常具體的行為轉變。多數人跟 AI 的互動還停留在回合制模式:打一段 prompt,等回覆,看完結果,再打下一段。這在簡單任務上沒什麼問題,但當你要處理持續數小時甚至數天的複雜專案時,每一次等待和重新開始都在打斷你的思路和 Agent 的動能。Liu 的九個技巧,就是在系統性地消除這些斷裂點。
持久對話串、語音輸入、即時引導:重新定義互動方式
Liu 的前三個技巧直接針對「每次都開新對話」這個最常見的使用習慣。第一個技巧是「持久對話串」(durable monothread)。Codex 最近大幅改善了上下文壓縮機制,能夠把漫長的對話歷史濃縮成關鍵要素,騰出上下文視窗的空間讓對話繼續。這代表你可以為每個重要的工作流程維持一條專屬的對話串,讓它像一本不斷更新的工作日誌一樣持續運作。Liu 最具代表性的例子是他的「幕僚長」(Chief of Staff)對話串,專門處理排程、信件、訊息分類這類日常事務。這條對話串從未中斷,持續累積對他工作模式和偏好的理解。
持久對話串解決的問題不只是上下文流失。當你有幾十條零散的對話,光是找「我到底跟 AI 在哪條對話裡討論過那件事」就要花時間。而 Codex 的 Project 功能雖然可以把檔案加進專案讓每次新對話參考,但它終究需要主動去「檢索」那些檔案內容,不見得總是準確或即時。Liu 建議的做法是,不要每個任務都開新對話,而是為每條關鍵工作流程維持一條長對話串,靠壓縮機制讓它持久運作。不是每件事都值得這樣做,但對於你持續投入的重要專案,這個模式的效率差距很明顯。
第二個技巧是語音輸入。這不只是為了更快地把指令送出去。Liu 認為語音開啟了一種質性不同的互動方式,他把這稱為「漫談的藝術」(the art of the ramble)。用說的時候,你自然會帶進更多背景脈絡,會表達「我不太確定,但可能是這樣」的灰色地帶,會提到你正在考量的取捨。這些模糊但珍貴的資訊,在打字時往往會被你自己過濾掉,因為打字的行為會推你去精煉和簡化。「很多計畫在模型拿到我思考的原始版本時,會比拿到精修版來得更好,」Liu 寫道。Whittemore 在節目中強烈附議,並指出 Codex 內建的語音轉文字品質已經是業界頂尖,不需要額外安裝 Whisperflow 之類的第三方工具。
第三個技巧是 Steer 功能:在 Agent 工作的過程中即時注入新指令或調整方向,不用先停下來等它做完。這徹底改變了「先想好完美 prompt 再按送出」的舊模式。你可以先給出大方向和目標,讓 Agent 開始動手,然後在觀察它的產出時隨時補充修正。語音和 Steer 搭配效果最好:你一邊看 Agent 的結果,一邊用說的把觀察和調整丟進去,做到人和 Agent 真正同步並行。Whittemore 對此的評論很精準:你不用再坐在那裡刷社群媒體等 AI 做完了。
結構化記憶與工具存取:讓 Agent 成為真正的工作者
第四個技巧是九個當中資訊密度最高的,談的是結構化記憶。Codex 有內建的記憶功能(Settings → Personalization → Memories),可以儲存穩定的偏好和工作慣例,但 Liu 的觀點很明確:這些內建功能不是替代方案。他的核心論點是,每次工作不只要產出結果,更要留下「可以被檢視、編輯、重複使用的知識產物」。對話紀錄再長,那些知識還是被困在對話串裡面,如果對話串意外中斷或壓縮效果不好,那些累積的理解就跟著消失了。
Liu 的做法是用 Obsidian 建立一個檔案式知識庫,放在 GitHub repo 上以便跨裝置存取。知識庫最上層有一個 agents.md 檔案,寫著給 Agent 的指令:「當你認識了新的人、在專案上有進展、或關閉了一個待辦事項,就更新知識庫裡對應的頁面。」裡面存放的內容包括人物資訊、決策紀錄、待處理事項、每日筆記和專案狀態。「檔案迫使 Agent 把經驗壓縮成一種能活過對話串的形式,」Liu 寫道。「如果對話串死了、壓縮得很差、或者維護成本太高,有用的知識還在那裡。到了這個階段,固定的對話串開始感覺不像聊天室,更像是不同的工作者在讀同一本共用筆記本。」
Liu 也特別提到,他會刻意去看 Agent 選擇記錄了什麼。這個回顧步驟本身就有價值,因為它讓你知道 Agent 認為哪些資訊重要到值得寫下來。如果 Agent 的判斷跟你的預期不同,那正好是一個校準的機會。這種外化的記憶系統不限於 Codex:Claude Code 的使用者可以用 CLAUDE.md 檔案達到類似效果,任何 AI 開發工具的使用者都能從「讓工作留下結構化產物」這個原則中受益。
第五個技巧是工具存取。當你把電腦操作、瀏覽器使用、以及各種第三方連接器(Slack、Gmail、GitHub、Notion、Vercel)都開放給 Codex,它就從一個純粹的文字處理器變成了「證據蒐集者」。關鍵在於判斷哪種工具適合哪種場景:本機的檔案、日誌、CSV 需要電腦操作能力;線上的文件和網頁需要瀏覽器;跨平台的協作則需要連接器。這些設定確實需要前期投入,但如果你打算把 Codex 當成一個完整的工作系統來用,而不只是一個進階版 ChatGPT,工具存取就是不可省略的基礎建設。
心跳排程、遠端控制、目標與側面板:讓工作循環永不中斷
第六個技巧是遠端控制。Codex 已經是 ChatGPT 行動 App 中的完整功能,你可以從手機上啟動對話串、下達指令、或調整正在執行中的工作方向。重點不是要你在手機上完成所有工作,而是讓你在離開電腦時不會跟進行中的專案完全斷線。當 AI 專案的執行時間從幾分鐘延長到幾小時,能隨時從手機上「輕推」一下方向,就成了非常實用的能力。這和前面提到的 Steer 功能邏輯相同,只是把時間尺度從「幾分鐘內的即時調整」拉長到「跨越數小時的遠端引導」。
第七個技巧是心跳排程(heartbeat),這可能是九個當中最接近「自動化」的一個。心跳是一種定時或觸發式的檢查機制,讓休眠中的對話串定期醒來執行特定任務。Liu 的幕僚長對話串每三十分鐘自動檢查一次 Slack 和 Gmail,找出需要回覆的訊息並排優先順序。但更能展現心跳威力的是他分享的動畫專案案例:他在 Slack 上發了一段影片請同事審閱,然後告訴 Codex 每十五分鐘檢查一次 Slack 對話串,看到回饋就用 Remotion 重新渲染影片,再把新版本回傳到 Slack 並標記審閱者。當 Slack 的 MCP 連接器缺少上傳檔案的功能時,Agent 直接用電腦操作去按「新增檔案」按鈕手動上傳。Liu 指出,這個案例的關鍵在於它跨越了工具邊界:Slack 負責接收回饋、Remotion 負責渲染、電腦操作負責上傳,三個原本不相干的工具串在一起,形成了一個不需要人在旁邊的回饋循環。
第八個技巧是 /goal 功能,目前在 Codex 和 Claude Code 中都已經可用。它讓你設定一個具體、可驗證的成功標準,Agent 會持續朝目標推進,不會像一般 prompt 那樣在遇到困難時就停下來等你給下一步指示。Liu 坦承他自己還在摸索最佳使用方式,Whittemore 也表示會在之後的節目中單獨深入討論,因為目標驅動的互動模式是一個值得完整探討的主題。
第九個技巧是側面板(side panel),Liu 說這是他對 Codex 最興奮的部分,但也是最容易被低估的。很多人把側面板當成預覽視窗,但 Liu 的定位完全不同:「側面板是 Codex 從聊天應用程式轉變為工作發生地點的關鍵。」它做三件事:檢視產出的成品、操作網頁服務、審閱變更。核心價值在於你可以在側面板裡檢查和標註 Agent 的產出,而不用中斷 Agent 正在進行的工作。人在審閱,Agent 在繼續做,兩邊同步進行。這正是整篇文章的核心精神在介面層面的具體實現。
不要打斷循環
Whittemore 在節目最後做了一個精準的總結:這九個技巧加起來,就是一個思維轉變。從回合制的「prompt、等待、審閱、修正、重複」,轉向持續性的「人與 Agent 並行工作,各自在自己的軌道上推進,需要時交會、同步、再各自繼續」。
這個轉變的意義超越了 Codex 本身。持久對話串的概念可以映射到 Claude Code 的 session 管理,結構化記憶可以用任何檔案系統實現,心跳排程在各種自動化工具中都有對應的功能。Liu 真正在傳達的不是某個特定產品的使用手冊,而是一種跟 AI Agent 協作的新心態。你不需要二十四小時盯著 Agent 跑,但你需要確保你跟它之間的協作迴路始終暢通,隨時可以介入、引導、或從它的工作成果中接手。對於任何一個還在用「打一段 prompt、等一個結果」模式跟 AI 互動的人來說,這九個技巧指出了一個明確的演化方向。