Anthropic 產品總監 Cat Wu:6 個月變 1 天,PM 角色被徹底重寫
Anthropic 產品總監 Cat Wu 在 Lenny's Podcast 上拆解他們把產品功能週期從 6 個月壓縮到 1 天的方法論:研究預覽品牌化、Evergreen 發布室、團隊原則文件三招出貨系統,加上招聘有產品品味的工程師而不是擴編 PM。當程式碼變便宜,「決定寫什麼」就變稀缺,這篇談 AI 時代 PM 應該怎麼練品味。

本文整理自《Lenny's Podcast》2026 年 4 月 23 日播出的單集,受訪者為 Anthropic 產品總監 Cat Wu,主管 Claude Code 與 Cowork 兩條產品線。本系列共三篇,這是第一篇談 PM 角色重塑與產品品味,第二篇談使命作為決策仲裁機制,第三篇談「為下一代模型造產品」的工程哲學。
{{< youtube PplmzlgE0kg >}}
{{< spotify "episode/7wTqD5zwl8ZitUeplapvBG" >}}
{{< apple-podcast "tw/podcast/how-anthropics-product-team-moves-faster-than-anyone/id1627920305?i=1000763270413" >}}
半年到一天:當 PM 的時間軸整個塌陷
Cat Wu 在訪談一開始就拋出一個讓所有產品經理坐立難安的數字:「我們很多產品功能的時程,已經從六個月降到一個月,有時候甚至是一天。」這句話不是行銷話術,而是 Anthropic 過去幾季的真實節奏。Lenny Rachitsky 在訪談中提到,他從來沒見過任何公司能用這種速度出貨,甚至有人做了一張 Anthropic 的發布行事曆,幾乎每天都有新的功能或產品上線。在這樣的節奏下,傳統 PM 一年規劃兩三個版本、跨季對齊路線圖的做法,從優勢變成負擔。
這個變化的根源在於程式碼成本的崩塌。Cat 解釋,AI 出現之前,因為寫程式碼很貴,PM 才需要花大量時間和夥伴團隊對齊多季度的路線圖,確保彼此的功能能互相銜接。但當模型開始幫工程師寫大部分的程式,產品功能的實作成本掉了一個量級,原本支撐「長計畫」的前提就消失了。她在 Anthropic 觀察到的轉變是,PM 的工作重心應該從「協調多季度路線圖」全面移到「想辦法把點子最快送到使用者手上」。
更尖銳的是 Cat 對 PM 求職市場的觀察。她過去面試過上百位 PM,看到很多人還在用前 AI 時代的方式回答問題:六到十二個月的規劃、跨團隊對齊、roadmap 的優先級權衡。她說這個時代真正成功的 AI native PM,是那些能夠回答「我怎麼把『有想法』到『使用者拿到產品』的時間縮短到一週、甚至一天」的人。她特別強調,這不只是速度的問題,更是定義「哪些任務必須在第一天就能正常運作」這種產品判斷力的問題。
Lenny 在這段對話中拋出了一個更尖銳的問題:很多人以為 AI 時代不再需要 PM,因為工程師可以直接出貨。Cat 的回答耐人尋味。她認為 PM 不會消失,但 PM 的角色、技能、甚至背景組成都會被徹底改寫。整集訪談接下來的內容,幾乎都是在回答這個問題:在這個時間軸塌陷的世界裡,PM 到底還剩下什麼價值?
Anthropic 的三招出貨系統:研究預覽、Evergreen 發布室、團隊原則
要理解 Anthropic 怎麼把六個月壓縮成一天,得先看他們刻意設計的三個出貨機制。Cat 在訪談中很具體地拆解了這套系統,每一招都對應到一個傳統 PM 流程中的「卡點」,目的就是讓任何工程師都能在沒有 PM 介入的情況下,從想法到上線一氣呵成。
第一招是「研究預覽」(research preview)品牌化。Anthropic 幾乎所有新功能都以研究預覽的名義出貨,並且明確標註「這是早期產品、可能不會永遠支援」。Cat 解釋,這個動作看似只是文字遊戲,實際上大幅降低了團隊內部對「正式發布」的承諾門檻。「我們可以一兩週就把東西丟出去」,她說,因為使用者一開始就被告知這是實驗性的,團隊不必為長期維護或破壞性改動負無限責任,反而能用真實使用者的回饋來決定哪些值得留下、哪些直接砍掉。
第二招是 Evergreen 發布室。這是一個常駐的 Slack 頻道,工程師覺得功能準備好了、內部 dogfooding 也通過後,就直接 po 到這個頻道。負責文件的 Sarah、負責產品行銷的 Alex、負責開發者關係的 Tarek 與 Lydia 都駐守在那裡,看到新功能就立刻接手撰寫宣傳文案、更新文件、在隔天就把 marketing announcement 推出去。Cat 強調,因為這個流程被預先設計好,工程師不需要再去問「這個要不要走 launch 流程」、「文件什麼時候更新」,所有跨職能的摩擦在發布的那一刻就已經被預先消化掉。
第三招是團隊原則文件(team principles document),這份文件明確寫下「我們的關鍵使用者是誰、為什麼是他們、我們願意做什麼樣的取捨」。Cat 解釋,這份文件的功能不是給 PM 自己看的,而是讓團隊裡的每個人都能憑藉同一份內部一致的判準自行做決策,不必任何時候都來等 PM 拍板。她形容這是 Anthropic「分散式決策」的核心:每週還有一次嚴格的指標 readout 讓全員理解業務脈絡,搭配這份原則文件,工程師就能跳過大量的對齊會議。
那 PRD 還寫嗎?Cat 的回答是「偶爾」。對於目標明確、可以一兩週做完的功能,PRD 完全是多餘的;但對於目標模糊、或者需要好幾個月基礎設施投入的大型專案,他們還是會寫一頁的 PRD,講清楚目標、令人驚喜的使用案例、目前已知的失敗模式。她特別補充,這種選擇性的 PRD 比「樣樣都寫 PRD」更有價值,因為它避免了 PM 把時間花在文件上而不是產品上。
工程師會 PM、PM 會寫程式:當角色開始合而為一
訪談中,Lenny 引用了 Anthropic 成長負責人 Amol Avasare 的觀察:因為工程師現在出貨太快,PM 和設計師反而趕不上節奏,所以應該招更多 PM 來分擔。但 Cat 給了一個截然不同的答案,這個答案某種程度上揭露了 Anthropic 整個組織設計的賭注。
「我覺得所有角色都在合併,」Cat 直言。在她的團隊裡,PM 在做工程師的事,工程師在做 PM 的事,設計師既在 PM 也在交付程式碼。她解釋,公司面對 AI 時代的選擇有兩種:一種是工程師團隊維持原狀,多招 PM 來引導他們;另一種是維持 PM 編制、改去招有強烈產品品味的工程師。Anthropic 的賭注選擇了後者。「我們團隊裡有很多工程師完全有能力從在 Twitter 上看到使用者回饋、一路走到週末就把產品出貨,整個過程幾乎不需要任何 PM 介入。我認為這是出貨最有效率的方式。」
Cat 自己的背景也呼應了這個邏輯。她當了多年的工程師,後來短暫做過創投,然後加入 Anthropic。她團隊上的 PM 幾乎都當過工程師,或者現在也會直接在 Claude Code 上交付程式碼,連設計師也都是前端工程師出身。在她的觀察裡,這種交叉背景帶來的不只是溝通效率,更是一種共同信任:當每個人都知道對方理解技術成本,許多冗長的對齊就被省下來了。
她也補充了一個工程背景之所以重要的具體理由:成本判斷。「如果你有工程背景,你會更知道一件事到底有多難。如果某個東西很容易做,你不會花時間去爭論該不該做,你就花一個小時做出來。但如果某個東西很難,你事先就知道這要花團隊多少資源,這對於排優先級非常有幫助。」她特別強調這只是「未來幾個月內」的判斷,因為模型每隔幾個月就會把工程能力推到一個新台階,整個技能價值座標也會跟著重洗。
不過 Cat 也提醒,工程背景並不是絕對必要。她反覆把話題拉回「產品品味」這個核心。「我覺得這個技能可以來自任何背景,但這是最重要的一件事。」她形容 Claude Code 每天收到上萬個 GitHub issue 在要求各種功能,能從這海量的請求裡挑出哪些值得做、用什麼方式做,這需要的不是技術能力,而是判斷力。
程式碼變便宜,「決定寫什麼」就變稀缺
Cat 在整集訪談中最常被引用的一句話是:「當程式碼變得很便宜,更值錢的就變成『決定寫什麼』。」這句話的力量不只在於它精準描述了 PM 角色的轉變,更在於它揭示了整個 AI 時代知識工作的價值重分配。當執行的邊際成本趨近於零,判斷力的稀缺性就被放大到極致。
她舉了一個具體的例子來說明這個張力。AGI-pilled 在 Anthropic 內部是一個常用的概念,意思是「相信強 AGI 即將到來」。她說,要當「剛剛好 AGI-pilled」的人非常難。一個極端是完全為未來那個無敵聰明的模型設計產品。那很簡單,就是一個輸入框,叫使用者打字、模型自動拉出所有需要的工具、自動問澄清問題、自動完成任務。這種設計很性感,但對今天的使用者沒有用。另一個極端是完全只服務當下,但這樣會被下一代模型瞬間淘汰。「真正困難的是搞清楚,對於『現在這個』模型,你怎麼把它的能力拉到最大?怎麼把使用者引導到黃金路徑上?怎麼讓使用者去碰模型的強項,避開它的弱點?」
這個判斷力的稀缺性,也直接決定了 Anthropic 的招募邏輯。Cat 強調,產品品味是「非常稀有的技能」,他們幾乎會錄取任何能展現出強烈產品品味的人,不管那個人原本的職稱是什麼。她也提醒聽眾,現在的環境特別獎勵那些「願意戴很多頂帽子、能夠快速切換、自我意識不重」的人。當工作內容本身變得越來越模糊、團隊需求每週都在變動,最值錢的不是某個固定的技能,而是「看出哪裡有缺口、跳進去補上」的能力。
她順勢給了一個容易被忽略的建議:人類在這場轉變中還能提供什麼?她認為是「常識」與 EQ。模型不太理解一個產品發布裡有上千個移動部件,不太理解誰是利害關係人、彼此關係如何、該用什麼管道溝通才不會踩雷。這些隱性的、社會性的知識仍然只有人類能輸出,至少在這一兩年內是這樣。Cat 自己當然希望模型在這個面向也能變強,但她坦承目前還有相當大的落差。對 PM 來說,這意味著「跨人協調」的能力不會快速貶值,反而是少數能夠暫時抵抗 AI 替代的技能之一。
怎麼練出產品品味:跟模型講話、找五位信任的人、寫十個犀利的 eval
如果產品品味是新時代最稀缺的技能,那要怎麼練?Cat 在訪談裡給了一個三步驟的具體方法,這套方法本身就是 Anthropic 內部 PM 的真實工作日常。
第一步是花大量時間和模型對話。Cat 說自己每天大約有三成時間在「測試 Claude Code 和 Cowork 的能力邊界」,目的是建立非常強烈的「我們不擅長什麼」的直覺。她特別推薦一個技巧:當模型做出意料之外的行為時,直接叫它自我反省為什麼這樣做。她舉例,有時候模型會修改前端、跑測試,但不去實際操作 UI;當你叫它解釋原因,它可能會回答「我覺得 system prompt 裡某段令我困惑」、「我沒意識到前端驗證是這個任務的一部分」、或者「我把驗證委派給子代理,但沒檢查它的工作」。這些自我描述往往會直接告訴你應該怎麼修 harness、怎麼補上缺口。
第二步是找出最值得信任的五個審核者。Cat 觀察到,使用者的回饋並不平等。有一小群人特別會表達「為什麼這個模型或 harness 組合好」、「為什麼那個不好」,而大多數人的回饋雖然真誠,但訊號雜訊比偏低。她把這群高訊號審核者形容為「快速回饋的關鍵基礎設施」。在 Anthropic 內部,她特別點名兩個對象。一個是塑造 Claude 性格的 Amanda,這個工作極度模糊,因為連寫程式都比較容易,至少寫程式可以驗證對錯,但塑造性格需要極強的信念與表達能力。另一個是 Claude Code 整個團隊,他們透過團隊午餐互相詢問新模型的「氛圍」(vibe),就能很快收斂出值得進一步驗證的假設。
第三步是寫 eval,但只寫十個。這是這集訪談裡最容易讓 PM 跌破眼鏡的建議之一。Cat 觀察到很多 PM 一聽到「未來 PM 要寫 eval」就嚇到,覺得要寫上百個測試。她直白地說:「不需要。十個犀利的 eval 就夠了。」這十個 eval 的價值不在於覆蓋率,而在於它幫團隊把「好」這件事量化下來。讓所有人對「我們在追什麼」有共識,並且可以衡量「我們離目標還差多遠、缺什麼」。她認為這個能力是 PM 行業裡「被嚴重低估」的技能之一,未來會越來越多 PM、工程師都需要會寫。
訪談裡 Lenny 順帶提到,這幾乎是這檔節目這幾年訪談 AI PM 都會浮現的共識:寫 eval 就是新時代的 PRD,因為它具體定義了「成功長什麼樣子」。Cat 自己會在哪些情境跳下去寫 eval?她說當某個功能的產品定義還不夠清晰時,她會做出五個 eval、跑出哪些通過、哪些失敗、然後給出一個能提升通過率的 prompt 版本。這個產出本身就同時定義了功能與成功標準。
我的觀察一:當「做什麼」比「怎麼做」更值錢
Cat 整集訪談最有衝擊力的論點,其實是一句容易被當成口號的話:「當程式碼變得很便宜,更值錢的就變成『決定寫什麼』。」這句話聽起來像箴言,但它真正帶出的是一個結構性的轉變。當執行成本崩塌,原本被執行能力遮蔽的判斷力差距就會被放大成決定性的競爭優勢。對臺灣的工程師、PM、創業者來說,這個轉變的意義非常具體:你過去靠「能寫程式」、「能管專案」建立的相對優勢,正在被快速折舊;你接下來要靠的,是能否在每天上千個訊號裡挑出對的方向。
這也解釋了為什麼 Anthropic 招人的方式看起來那麼「不講章法」。工程師會 PM、PM 寫程式、設計師也跨界,全部都繞著「產品品味」這一個核心轉。對臺灣的科技公司而言,這套打法挑戰的是非常根深柢固的「分工至上」文化:JD 要寫得清楚、職等要分得乾淨、職涯路徑要畫成階梯。Cat 反覆強調的「願意戴很多頂帽子、自我意識不重、能跨團隊邊界做事」,在臺灣很多組織裡其實會被視為「定位不明」的負面評價。但 AI 時代正在重新定義這些標籤的價值。
如果你現在是 PM,Cat 給的三步驟訓練法值得認真當作下個月的工作清單來執行。每週撥兩個小時不做別的,就跟你常用的 AI 工具對話、追問它為什麼做出某個決定;同時去找出你身邊那五個最會給你模型回饋的人,把他們當成你私人的品質感測器;最後挑一個你最在乎的功能,老老實實寫十個 eval 出來。這三件事不會立刻幫你升職,但它們會讓你在六個月後成為一個截然不同的人。
Cat 在訪談裡反覆提到,模型每隔幾個月就會推出一次重大的能力跳躍,每一次跳躍都會重洗哪些技能值錢。這意味著「現在很值錢的技能」這句話本身就有保鮮期。真正能穿越這場轉變的,不是某個特定的技能,而是那種「看出環境變了、跳進去補上缺口」的能力。這也是 Cat 給整個 PM 行業最重要的提醒。
我的觀察二:那套出貨方法論,臺灣團隊複製得了多少
但寫到這裡也得潑一盆冷水。Anthropic 那三招出貨系統聽起來像是流程設計,可以拆下來直接搬到任何團隊用,實際上每一招背後都有一個臺灣團隊普遍欠缺的前提條件,一旦少了那個條件,工具就只是裝飾。先談「研究預覽」品牌化。這套之所以管用,是因為 Anthropic 內部有一個共同信念:產品出貨後不完美,是迭代的起點,不是團隊的失敗。但臺灣很多公司的高層仍習慣把「未完成」直接等同於「不專業」,PMM 的 KPI 是「順利發布的功能數」、PM 的考核是「上線後沒被客戶投訴」。一個只能慶祝完美發布的組織,不論它的 Slack 頻道叫什麼名字,都做不到一兩週就丟一個東西出去。
接著看 Evergreen 發布室。這個機制的前提是 PMM、文件、DevRel 三個職能在團隊內已經足夠成熟、有獨立預算、而且能 day-one 待命。Cat 在訪談裡點名 Sarah、Alex、Tarek、Lydia 四個人駐守在那個 Slack 頻道,意味著 Anthropic 願意把這四個人的時間「保留」給隨時可能來的發布。對絕大多數臺灣中小型公司而言,PMM 一個人兼五條產品線是常態,根本沒辦法把人留下來等。至於團隊原則文件那一招看起來最便宜,但它的真正前提是組織夠相信「使命優先於 KPI」這件事,否則寫下來的原則只會變成又一份吃灰的 wiki,每週指標 readout 會退化成各部門各自報喜的儀式。
所以這套方法論能複製的部分,其實是「最不需要文化改造」的那一招——把團隊原則文件當作日常工作工具來寫。即使你的公司還沒 budget 養 PMM、還沒願意承擔出貨後不完美的風險,你還是可以坐下來問三個問題:「我們的關鍵使用者是誰?為什麼是他們?我們願意做什麼樣的取捨?」把這份答案寫成一頁的內部文件,逼整個團隊每月用它檢視一次決策。你會立刻發現團隊內部對「我們在為誰做什麼」的共識,遠比想像中破碎。這個練習本身省下的不是時間,而是「PM 不在場時整個團隊就停擺」的隱形成本——這才是 Anthropic 高速出貨真正的引擎,也是任何想要學這套方法論的團隊應該從這裡開始的原因。