職涯與學習

Anthropic 產品總監 Cat Wu：6 個月變 1 天，PM 角色被徹底重寫

Anthropic 產品總監 Cat Wu 在 Lenny's Podcast 上拆解他們把產品功能週期從 6 個月壓縮到 1 天的方法論：研究預覽品牌化、Evergreen 發布室、團隊原則文件三招出貨系統，加上招聘有產品品味的工程師而不是擴編 PM。當程式碼變便宜，「決定寫什麼」就變稀缺，這篇談 AI 時代 PM 應該怎麼練品味。

2026 年 5 月 3 日 · 來源： Lenny's Podcast

Anthropic 產品總監 Cat Wu：6 個月變 1 天，PM 角色被徹底重寫

本文整理自《Lenny's Podcast》2026 年 4 月 23 日播出的單集，受訪者為 Anthropic 產品總監 Cat Wu，主管 Claude Code 與 Cowork 兩條產品線。本系列共三篇，這是第一篇談 PM 角色重塑與產品品味，第二篇談使命作為決策仲裁機制，第三篇談「為下一代模型造產品」的工程哲學。

{{< apple-podcast "tw/podcast/how-anthropics-product-team-moves-faster-than-anyone/id1627920305?i=1000763270413" >}}

半年到一天：當 PM 的時間軸整個塌陷

Cat Wu 在訪談一開始就拋出一個讓所有產品經理坐立難安的數字：「我們很多產品功能的時程，已經從六個月降到一個月，有時候甚至是一天。」這句話不是行銷話術，而是 Anthropic 過去幾季的真實節奏。Lenny Rachitsky 在訪談中提到，他從來沒見過任何公司能用這種速度出貨，甚至有人做了一張 Anthropic 的發布行事曆，幾乎每天都有新的功能或產品上線。在這樣的節奏下，傳統 PM 一年規劃兩三個版本、跨季對齊路線圖的做法，從優勢變成負擔。

這個變化的根源在於程式碼成本的崩塌。Cat 解釋，AI 出現之前，因為寫程式碼很貴，PM 才需要花大量時間和夥伴團隊對齊多季度的路線圖，確保彼此的功能能互相銜接。但當模型開始幫工程師寫大部分的程式，產品功能的實作成本掉了一個量級，原本支撐「長計畫」的前提就消失了。她在 Anthropic 觀察到的轉變是，PM 的工作重心應該從「協調多季度路線圖」全面移到「想辦法把點子最快送到使用者手上」。

更尖銳的是 Cat 對 PM 求職市場的觀察。她過去面試過上百位 PM，看到很多人還在用前 AI 時代的方式回答問題：六到十二個月的規劃、跨團隊對齊、roadmap 的優先級權衡。她說這個時代真正成功的 AI native PM，是那些能夠回答「我怎麼把『有想法』到『使用者拿到產品』的時間縮短到一週、甚至一天」的人。她特別強調，這不只是速度的問題，更是定義「哪些任務必須在第一天就能正常運作」這種產品判斷力的問題。

Lenny 在這段對話中拋出了一個更尖銳的問題：很多人以為 AI 時代不再需要 PM，因為工程師可以直接出貨。Cat 的回答耐人尋味。她認為 PM 不會消失，但 PM 的角色、技能、甚至背景組成都會被徹底改寫。整集訪談接下來的內容，幾乎都是在回答這個問題：在這個時間軸塌陷的世界裡，PM 到底還剩下什麼價值？

Anthropic 的三招出貨系統：研究預覽、Evergreen 發布室、團隊原則

要理解 Anthropic 怎麼把六個月壓縮成一天，得先看他們刻意設計的三個出貨機制。Cat 在訪談中很具體地拆解了這套系統，每一招都對應到一個傳統 PM 流程中的「卡點」，目的就是讓任何工程師都能在沒有 PM 介入的情況下，從想法到上線一氣呵成。

第一招是「研究預覽」（research preview）品牌化。Anthropic 幾乎所有新功能都以研究預覽的名義出貨，並且明確標註「這是早期產品、可能不會永遠支援」。Cat 解釋，這個動作看似只是文字遊戲，實際上大幅降低了團隊內部對「正式發布」的承諾門檻。「我們可以一兩週就把東西丟出去」，她說，因為使用者一開始就被告知這是實驗性的，團隊不必為長期維護或破壞性改動負無限責任，反而能用真實使用者的回饋來決定哪些值得留下、哪些直接砍掉。

第二招是 Evergreen 發布室。這是一個常駐的 Slack 頻道，工程師覺得功能準備好了、內部 dogfooding 也通過後，就直接 po 到這個頻道。負責文件的 Sarah、負責產品行銷的 Alex、負責開發者關係的 Tarek 與 Lydia 都駐守在那裡，看到新功能就立刻接手撰寫宣傳文案、更新文件、在隔天就把 marketing announcement 推出去。Cat 強調，因為這個流程被預先設計好，工程師不需要再去問「這個要不要走 launch 流程」、「文件什麼時候更新」，所有跨職能的摩擦在發布的那一刻就已經被預先消化掉。

第三招是團隊原則文件（team principles document），這份文件明確寫下「我們的關鍵使用者是誰、為什麼是他們、我們願意做什麼樣的取捨」。Cat 解釋，這份文件的功能不是給 PM 自己看的，而是讓團隊裡的每個人都能憑藉同一份內部一致的判準自行做決策，不必任何時候都來等 PM 拍板。她形容這是 Anthropic「分散式決策」的核心：每週還有一次嚴格的指標 readout 讓全員理解業務脈絡，搭配這份原則文件，工程師就能跳過大量的對齊會議。

那 PRD 還寫嗎？Cat 的回答是「偶爾」。對於目標明確、可以一兩週做完的功能，PRD 完全是多餘的；但對於目標模糊、或者需要好幾個月基礎設施投入的大型專案，他們還是會寫一頁的 PRD，講清楚目標、令人驚喜的使用案例、目前已知的失敗模式。她特別補充，這種選擇性的 PRD 比「樣樣都寫 PRD」更有價值，因為它避免了 PM 把時間花在文件上而不是產品上。

工程師會 PM、PM 會寫程式：當角色開始合而為一

訪談中，Lenny 引用了 Anthropic 成長負責人 Amol Avasare 的觀察：因為工程師現在出貨太快，PM 和設計師反而趕不上節奏，所以應該招更多 PM 來分擔。但 Cat 給了一個截然不同的答案，這個答案某種程度上揭露了 Anthropic 整個組織設計的賭注。

「我覺得所有角色都在合併，」Cat 直言。在她的團隊裡，PM 在做工程師的事，工程師在做 PM 的事，設計師既在 PM 也在交付程式碼。她解釋，公司面對 AI 時代的選擇有兩種：一種是工程師團隊維持原狀，多招 PM 來引導他們；另一種是維持 PM 編制、改去招有強烈產品品味的工程師。Anthropic 的賭注選擇了後者。「我們團隊裡有很多工程師完全有能力從在 Twitter 上看到使用者回饋、一路走到週末就把產品出貨，整個過程幾乎不需要任何 PM 介入。我認為這是出貨最有效率的方式。」

Cat 自己的背景也呼應了這個邏輯。她當了多年的工程師，後來短暫做過創投，然後加入 Anthropic。她團隊上的 PM 幾乎都當過工程師，或者現在也會直接在 Claude Code 上交付程式碼，連設計師也都是前端工程師出身。在她的觀察裡，這種交叉背景帶來的不只是溝通效率，更是一種共同信任：當每個人都知道對方理解技術成本，許多冗長的對齊就被省下來了。

她也補充了一個工程背景之所以重要的具體理由：成本判斷。「如果你有工程背景，你會更知道一件事到底有多難。如果某個東西很容易做，你不會花時間去爭論該不該做，你就花一個小時做出來。但如果某個東西很難，你事先就知道這要花團隊多少資源，這對於排優先級非常有幫助。」她特別強調這只是「未來幾個月內」的判斷，因為模型每隔幾個月就會把工程能力推到一個新台階，整個技能價值座標也會跟著重洗。

不過 Cat 也提醒，工程背景並不是絕對必要。她反覆把話題拉回「產品品味」這個核心。「我覺得這個技能可以來自任何背景，但這是最重要的一件事。」她形容 Claude Code 每天收到上萬個 GitHub issue 在要求各種功能，能從這海量的請求裡挑出哪些值得做、用什麼方式做，這需要的不是技術能力，而是判斷力。

程式碼變便宜，「決定寫什麼」就變稀缺

Cat 在整集訪談中最常被引用的一句話是：「當程式碼變得很便宜，更值錢的就變成『決定寫什麼』。」這句話的力量不只在於它精準描述了 PM 角色的轉變，更在於它揭示了整個 AI 時代知識工作的價值重分配。當執行的邊際成本趨近於零，判斷力的稀缺性就被放大到極致。

她舉了一個具體的例子來說明這個張力。AGI-pilled 在 Anthropic 內部是一個常用的概念，意思是「相信強 AGI 即將到來」。她說，要當「剛剛好 AGI-pilled」的人非常難。一個極端是完全為未來那個無敵聰明的模型設計產品。那很簡單，就是一個輸入框，叫使用者打字、模型自動拉出所有需要的工具、自動問澄清問題、自動完成任務。這種設計很性感，但對今天的使用者沒有用。另一個極端是完全只服務當下，但這樣會被下一代模型瞬間淘汰。「真正困難的是搞清楚，對於『現在這個』模型，你怎麼把它的能力拉到最大？怎麼把使用者引導到黃金路徑上？怎麼讓使用者去碰模型的強項，避開它的弱點？」

這個判斷力的稀缺性，也直接決定了 Anthropic 的招募邏輯。Cat 強調，產品品味是「非常稀有的技能」，他們幾乎會錄取任何能展現出強烈產品品味的人，不管那個人原本的職稱是什麼。她也提醒聽眾，現在的環境特別獎勵那些「願意戴很多頂帽子、能夠快速切換、自我意識不重」的人。當工作內容本身變得越來越模糊、團隊需求每週都在變動，最值錢的不是某個固定的技能，而是「看出哪裡有缺口、跳進去補上」的能力。

她順勢給了一個容易被忽略的建議：人類在這場轉變中還能提供什麼？她認為是「常識」與 EQ。模型不太理解一個產品發布裡有上千個移動部件，不太理解誰是利害關係人、彼此關係如何、該用什麼管道溝通才不會踩雷。這些隱性的、社會性的知識仍然只有人類能輸出，至少在這一兩年內是這樣。Cat 自己當然希望模型在這個面向也能變強，但她坦承目前還有相當大的落差。對 PM 來說，這意味著「跨人協調」的能力不會快速貶值，反而是少數能夠暫時抵抗 AI 替代的技能之一。

怎麼練出產品品味：跟模型講話、找五位信任的人、寫十個犀利的 eval

如果產品品味是新時代最稀缺的技能，那要怎麼練？Cat 在訪談裡給了一個三步驟的具體方法，這套方法本身就是 Anthropic 內部 PM 的真實工作日常。

第一步是花大量時間和模型對話。Cat 說自己每天大約有三成時間在「測試 Claude Code 和 Cowork 的能力邊界」，目的是建立非常強烈的「我們不擅長什麼」的直覺。她特別推薦一個技巧：當模型做出意料之外的行為時，直接叫它自我反省為什麼這樣做。她舉例，有時候模型會修改前端、跑測試，但不去實際操作 UI；當你叫它解釋原因，它可能會回答「我覺得 system prompt 裡某段令我困惑」、「我沒意識到前端驗證是這個任務的一部分」、或者「我把驗證委派給子代理，但沒檢查它的工作」。這些自我描述往往會直接告訴你應該怎麼修 harness、怎麼補上缺口。

第二步是找出最值得信任的五個審核者。Cat 觀察到，使用者的回饋並不平等。有一小群人特別會表達「為什麼這個模型或 harness 組合好」、「為什麼那個不好」，而大多數人的回饋雖然真誠，但訊號雜訊比偏低。她把這群高訊號審核者形容為「快速回饋的關鍵基礎設施」。在 Anthropic 內部，她特別點名兩個對象。一個是塑造 Claude 性格的 Amanda，這個工作極度模糊，因為連寫程式都比較容易，至少寫程式可以驗證對錯，但塑造性格需要極強的信念與表達能力。另一個是 Claude Code 整個團隊，他們透過團隊午餐互相詢問新模型的「氛圍」（vibe），就能很快收斂出值得進一步驗證的假設。

第三步是寫 eval，但只寫十個。這是這集訪談裡最容易讓 PM 跌破眼鏡的建議之一。Cat 觀察到很多 PM 一聽到「未來 PM 要寫 eval」就嚇到，覺得要寫上百個測試。她直白地說：「不需要。十個犀利的 eval 就夠了。」這十個 eval 的價值不在於覆蓋率，而在於它幫團隊把「好」這件事量化下來。讓所有人對「我們在追什麼」有共識，並且可以衡量「我們離目標還差多遠、缺什麼」。她認為這個能力是 PM 行業裡「被嚴重低估」的技能之一，未來會越來越多 PM、工程師都需要會寫。

訪談裡 Lenny 順帶提到，這幾乎是這檔節目這幾年訪談 AI PM 都會浮現的共識：寫 eval 就是新時代的 PRD，因為它具體定義了「成功長什麼樣子」。Cat 自己會在哪些情境跳下去寫 eval？她說當某個功能的產品定義還不夠清晰時，她會做出五個 eval、跑出哪些通過、哪些失敗、然後給出一個能提升通過率的 prompt 版本。這個產出本身就同時定義了功能與成功標準。

我的觀察一：當「做什麼」比「怎麼做」更值錢

Cat 整集訪談最有衝擊力的論點，其實是一句容易被當成口號的話：「當程式碼變得很便宜，更值錢的就變成『決定寫什麼』。」這句話聽起來像箴言，但它真正帶出的是一個結構性的轉變。當執行成本崩塌，原本被執行能力遮蔽的判斷力差距就會被放大成決定性的競爭優勢。對臺灣的工程師、PM、創業者來說，這個轉變的意義非常具體：你過去靠「能寫程式」、「能管專案」建立的相對優勢，正在被快速折舊；你接下來要靠的，是能否在每天上千個訊號裡挑出對的方向。

這也解釋了為什麼 Anthropic 招人的方式看起來那麼「不講章法」。工程師會 PM、PM 寫程式、設計師也跨界，全部都繞著「產品品味」這一個核心轉。對臺灣的科技公司而言，這套打法挑戰的是非常根深柢固的「分工至上」文化：JD 要寫得清楚、職等要分得乾淨、職涯路徑要畫成階梯。Cat 反覆強調的「願意戴很多頂帽子、自我意識不重、能跨團隊邊界做事」，在臺灣很多組織裡其實會被視為「定位不明」的負面評價。但 AI 時代正在重新定義這些標籤的價值。

如果你現在是 PM，Cat 給的三步驟訓練法值得認真當作下個月的工作清單來執行。每週撥兩個小時不做別的，就跟你常用的 AI 工具對話、追問它為什麼做出某個決定；同時去找出你身邊那五個最會給你模型回饋的人，把他們當成你私人的品質感測器；最後挑一個你最在乎的功能，老老實實寫十個 eval 出來。這三件事不會立刻幫你升職，但它們會讓你在六個月後成為一個截然不同的人。

Cat 在訪談裡反覆提到，模型每隔幾個月就會推出一次重大的能力跳躍，每一次跳躍都會重洗哪些技能值錢。這意味著「現在很值錢的技能」這句話本身就有保鮮期。真正能穿越這場轉變的，不是某個特定的技能，而是那種「看出環境變了、跳進去補上缺口」的能力。這也是 Cat 給整個 PM 行業最重要的提醒。

我的觀察二：那套出貨方法論，臺灣團隊複製得了多少

但寫到這裡也得潑一盆冷水。Anthropic 那三招出貨系統聽起來像是流程設計，可以拆下來直接搬到任何團隊用，實際上每一招背後都有一個臺灣團隊普遍欠缺的前提條件，一旦少了那個條件，工具就只是裝飾。先談「研究預覽」品牌化。這套之所以管用，是因為 Anthropic 內部有一個共同信念：產品出貨後不完美，是迭代的起點，不是團隊的失敗。但臺灣很多公司的高層仍習慣把「未完成」直接等同於「不專業」，PMM 的 KPI 是「順利發布的功能數」、PM 的考核是「上線後沒被客戶投訴」。一個只能慶祝完美發布的組織，不論它的 Slack 頻道叫什麼名字，都做不到一兩週就丟一個東西出去。

接著看 Evergreen 發布室。這個機制的前提是 PMM、文件、DevRel 三個職能在團隊內已經足夠成熟、有獨立預算、而且能 day-one 待命。Cat 在訪談裡點名 Sarah、Alex、Tarek、Lydia 四個人駐守在那個 Slack 頻道，意味著 Anthropic 願意把這四個人的時間「保留」給隨時可能來的發布。對絕大多數臺灣中小型公司而言，PMM 一個人兼五條產品線是常態，根本沒辦法把人留下來等。至於團隊原則文件那一招看起來最便宜，但它的真正前提是組織夠相信「使命優先於 KPI」這件事，否則寫下來的原則只會變成又一份吃灰的 wiki，每週指標 readout 會退化成各部門各自報喜的儀式。

所以這套方法論能複製的部分，其實是「最不需要文化改造」的那一招——把團隊原則文件當作日常工作工具來寫。即使你的公司還沒 budget 養 PMM、還沒願意承擔出貨後不完美的風險，你還是可以坐下來問三個問題：「我們的關鍵使用者是誰？為什麼是他們？我們願意做什麼樣的取捨？」把這份答案寫成一頁的內部文件，逼整個團隊每月用它檢視一次決策。你會立刻發現團隊內部對「我們在為誰做什麼」的共識，遠比想像中破碎。這個練習本身省下的不是時間，而是「PM 不在場時整個團隊就停擺」的隱形成本——這才是 Anthropic 高速出貨真正的引擎，也是任何想要學這套方法論的團隊應該從這裡開始的原因。