22 歲獨角獸創辦人的預言:未來知識工作者不做事,只教 AI 做事
Mercor 創辦人 Brendan Foody 認為,五年內多數高端知識工作者的工作將從「親自執行」轉變為「訓練 AI Agent」。他的公司已經證明這門生意年營收可以超過 10 億美元。

本文整理自《Conversations with Tyler》2026 年 1 月播出的單集。
{{< youtube zld39xD4sus >}}
{{< spotify "episode/2JMkbacFBEJSSyS9sZQ4wR" >}}
{{< apple-podcast "tw/podcast/brendan-foody-on-teaching-ai-and-the-future/id983795625?i=1000744127576" >}}
付詩人 150 美元時薪的公司
一家公司願意付詩人每小時 150 美元,不是請他們寫詩,而是請他們幫 AI 打分數。這件事本身就說明了某種深刻的產業轉變正在發生。Mercor 這家 2023 年初才成立的公司,商業模式就是替前沿 AI 實驗室找到各領域的頂尖專家,讓這些專家去「教」AI 模型做事。詩人教 AI 寫詩、律師教 AI 做法律分析、投資銀行家教 AI 做財務盡職調查。
Mercor 的共同創辦人兼執行長是年僅 22 歲的布蘭登.弗迪(Brendan Foody)。他和兩位高中辯論隊隊友在 2023 年創辦了這家公司,三年後估值已達 100 億美元,年化營收突破 10 億美元,創下從零到十億最快的紀錄。他也是有史以來最年輕的獨角獸創辦人,以及全球最年輕的白手起家億萬富翁。
弗迪最近上了經濟學家泰勒.柯文(Tyler Cowen)主持的知名 Podcast《Conversations with Tyler》,談論他對知識工作未來的看法。他的核心論點很簡單:未來你不會被 AI 取代,但你的工作內容會徹底改變。你不再「做事」,而是「教 AI 做事」。
AI 每年進步 25-30%,而且是在真正有經濟價值的事情上
弗迪的判斷不是空口說白話,而是基於他自己開發的衡量工具。Mercor 與前美國財政部長賴瑞.薩默斯(Larry Summers)、哈佛法學教授凱斯.桑斯坦(Cass Sunstein)、醫學 AI 權威艾瑞克.托波(Eric Topol)等人合作,開發了名為 APEX(AI Productivity Index)的基準測試。APEX 和傳統的學術評測不同,它不測 AI 能不能解奧數題或回答 PhD 等級的冷僻問題,而是測 AI 能不能做「真正有經濟價值的工作」。
APEX 的做法是這樣的:先找數百位各產業的頂尖專家(前麥肯錫顧問、大型律所合夥人、投資銀行分析師),問他們每天的時間怎麼分配,花多少比例在客戶會議、線上研究、分析、準備交付物上。然後在每個工作類別中,請這些專家寫出對應的 prompt 和評分標準。換句話說,APEX 用「專家的時間分配」來近似「經濟價值」,因為你花越多時間做的事,通常代表你或你的客戶願意為此付越多錢。
結果很驚人。GPT-5 在 APEX 上的得分是 64%,而一年前的 GPT-4 大約只有 40% 左右。這代表前沿模型在「有經濟價值的任務」上,每年進步約 25-30%。弗迪自己也承認,以 GPT-5 現在 64% 的水準,要繼續維持同樣的進步速度會越來越難。但即使進步速度減緩,這個趨勢的意涵已經很清楚了:AI 正在快速逼近「能夠獨立完成多數知識工作」的門檻。
模型的短板:不是不夠聰明,是還不會「串起來做」
弗迪也承認,目前 AI 模型還有明顯的能力缺口。在一個聊天視窗裡,模型已經「在某些方面超越人類」。但真正的知識工作不是在聊天視窗裡完成的。投資銀行分析師的工作是打開多個工具、切換不同系統、花好幾天做完整的盡職調查。顧問的工作是跟客戶開會、做研究、寫分析、準備簡報,這些步驟環環相扣。
模型目前最大的瓶頸有兩個:第一是「長時間範圍的任務」,不是幾小時內能做完的事,而是需要 50 或 100 小時才能完成的複雜工作流。第二是「整合多種工具」,模型需要同時操作電子郵件、試算表、資料庫、內部系統,甚至跟人互動。弗迪說,這兩個瓶頸在 6 到 12 個月內會出現「巨大的進步」,因為 APEX 正在推出新版本,專門測量模型在這兩個維度上的能力。一旦有了精確的衡量方式,研究人員就能快速優化。
這個邏輯很關鍵:測量驅動進步。弗迪反覆強調,當你有了好的評測標準,研究人員「攀爬」這些標準的速度驚人。所以「如何衡量 AI 做得好不好」本身就是推動 AI 進步最重要的一環。
新工作:從「做分析」到「教 AI 做分析」
那麼,當 AI 真的能獨立完成大部分知識工作時,人類做什麼?弗迪的答案很明確:你會從「執行者」變成「教練」。
他用投資銀行家舉例。現在一個分析師每隔幾週就要為新客戶、新案件重複做資料室分析。未來,他只需要做一次:建立一套 RL(強化學習)環境,教 AI Agent 怎麼做這類分析。一旦教會了,Agent 就能無限次重複執行,而人類的價值在於持續找到 Agent 犯錯的地方,然後修正它。
同樣的轉變會發生在顧問、軟體工程師、客服、以及幾乎所有知識工作垂直領域。弗迪認為五年內,「多數高端知識工作者」的工作內容,無論是在全職工作中或透過像 Mercor 這樣的平台,都會涉及「訓練模型」。這不是他的浪漫想像,這就是 Mercor 現在每天在做的事。他們平台上有超過三萬名承包商,每天支付超過 150 萬美元的薪資,做的就是教 AI 做各種事情。
弗迪把這個轉變比喻成「從可變成本變成固定成本」。以前,每一次顧問幫客戶做分析都是一筆人力投入(可變成本)。未來,你投入一次心力建立 RL 環境(固定成本),之後 Agent 可以無限次使用。這很像寫軟體的經濟學:寫一次,用無數次。
你不需要懂 AI 技術,你只需要「找到模型哪裡錯了」
這裡最令人安心的一點是:弗迪認為這些「新工作」不需要深厚的 AI 技術背景。你不需要懂 transformer 架構,不需要會寫 Python,不需要理解反向傳播。你需要的是你原本的專業知識,加上一個新技能:找到模型犯錯的地方。
他說得很具體:只要你能找到模型在哪裡犯了錯,能理解模型目前能力的邊界,能把它推到極限,那麼「要創造某種衡量標準或方式來測量那個錯誤,讓模型能從中學習,其實相對容易。」換句話說,最關鍵的技術能力不是「會 coding」,而是「有品味」。你知道什麼是好的法律文書、什麼是好的財務分析、什麼是好的醫療診斷。這種判斷力就是你最有價值的資產。
這也解釋了為什麼 Mercor 願意付詩人 150 美元時薪。不是因為詩人會寫程式,而是因為詩人知道什麼是好詩。他們能創造出「評分標準」(rubric),告訴模型:如果你的回應喚起了這個意象,加分;如果用了這種風格,加分;如果說了某些不該說的東西,扣分。這些rubric 一旦建立,就能應用在數十億使用者的互動上,所以 150 美元的時薪對模型的改進效益來說其實非常便宜。
軟體工程師不會變少,只會變更多
很多人擔心 AI 會讓工程師失業。弗迪的看法恰好相反。他認為軟體需求的價格彈性極高,意思是:當軟體的「生產成本」下降時,市場對軟體的需求量會大幅增加。如果 AI 讓軟體工程師的效率提升十倍,結果不是只需要十分之一的工程師,而是可能出現十倍的工程師數量、打造出一百倍的軟體產出。
這個邏輯在歷史上有先例。電子試算表的發明沒有消滅會計師,而是創造了更多需要會計技能的工作。網路的普及沒有消滅記者,而是創造了海量的內容需求。弗迪認為軟體也是同樣的邏輯:當打造軟體的成本大幅下降,所有原本「值得做但太貴所以沒做」的軟體專案都會變得可行。
但他也承認,不是所有領域都有這麼高的需求彈性。會計和客服可能就不是。我們「只需要那麼多」會計工作和客服互動。所以每個領域的就業前景取決於一個關鍵問題:這個領域的需求是否會因為成本下降而大幅擴張?如果答案是肯定的,那 AI 帶來的是更多機會而非失業。
我的觀察
弗迪的故事本身就是他論點的最佳驗證。一個 22 歲的年輕人,三年內把一家公司從零做到年營收十億美元、估值百億美元。他賣的不是 AI 模型,不是軟體,而是「教 AI 做事的人類」。這件事的發生速度說明了一個殘酷的現實:未來知識工作者的市場價值,很可能不取決於你「能做什麼事」,而取決於你「能教 AI 做什麼事」。
當然,弗迪的觀點帶有明顯的利益立場。Mercor 的整個商業模式就建立在「人類教 AI」這件事的持續需求上。如果 AI 很快就能自我改進、不再需要人類回饋,Mercor 的生意就會受到威脅。但至少在目前這個階段,他的判斷似乎是對的:模型能做到 75% 的知識工作已經很驚人了,但最後那 25% 仍然需要人類的專業判斷,而且這最後 25% 很可能會持續很長一段時間。
對臺灣的知識工作者來說,這裡有一個很實際的啟示:與其焦慮 AI 會不會取代你,不如現在就開始練習「找到模型哪裡錯了」。把 ChatGPT 當成你的新同事,每天測試它在你專業領域的極限,記錄它犯的錯。這個能力,很可能就是你未來最值錢的技能。