從「給任務」到「給責任」:Fable 5 真正改變的不是能力,而是我們對 AI 的想像

Claude Fable 5 的跑分令人印象深刻,但早期使用者的回饋揭示了一個更深層的轉變:最強模型的價值不在於做更好的舊事,而在於做過去根本不可能的事。Anthropic 的 Felix Reisberg 稱之為「第三紀元」,從問問題到給任務再到給責任。

從「給任務」到「給責任」:Fable 5 真正改變的不是能力,而是我們對 AI 的想像

本文整理自 The AI Daily Brief 2026 年 6 月播出的單集。

{{< youtube it7VUqfVorw >}}

{{< spotify "episode/6GLKGqmY6Yd3lkMS3vmG5x" >}}

{{< apple-podcast "tw/podcast/fable-5-raises-the-bar-for-ai-ambition/id1680633614?i=1000772078854" >}}


多數人覺得沒什麼不同

Claude Fable 5 上線的頭 24 小時,社群上的反應形成了一條清晰的鐘形曲線。拿 Fable 5 做日常對話、寫信、翻譯的人,普遍覺得跟前幾代差異不大。拿它做複雜的長時間任務的人,則彷彿見到了新世界。中間那群人看到了某些面向確實更好,但焦慮於它並不是「所有事情都更好」。

Citrini Research 的一段話精準抓住了這個分化:「我覺得我們已經到了一般人分不出新模型是否更好的階段。Fable 對我來說沒有好很多,但我認識的每一個聰明人都說:哇,奇點比我想的來得更早。」

AI Daily Brief 主持人 Whittemore 認為,這正是前沿模型進入新階段的特徵。最強模型的進步不再均勻地分布在所有任務上,而是集中體現在過去根本做不到的事情上。如果你還在用最新模型做去年就能做的事,你當然感覺不出差別。真正的能力躍進,藏在那些你從來沒試過的任務裡。


Stripe 一天完成兩個月的工程

那些把 Fable 5 推到極限的人,看到了什麼?

Anthropic 官方公告中,Stripe 的案例最為搶眼。這家金融科技巨頭在早期測試中,用 Fable 5 對一個五千萬行的 Ruby 程式碼庫執行了整庫遷移。如果由一整個工程團隊手動完成,這項工作估計需要超過兩個月。Fable 5 在一天之內就做完了。這不只是「寫程式變快」,而是把一個原本需要協調大量工程師、安排數週衝刺的專案,壓縮成一個人對一個模型下指令的過程。

設計公司老闆 Asad Mahmoud 的評價同樣值得注意。他說 Fable 5 做出來的網站展現出「真正的層次感、有意為之的留白、克制,這種判斷力通常只有做過真實專案的設計師才有。沒有任何模型接近過這個水準」。對一個每天看 AI 生成設計、看到想關掉公司的人來說,這句評語份量不輕。

更極端的案例來自 Todd Saunders。他在一通客戶電話中,讓 Claude 在背景即時轉錄對話內容。客戶每說出一個期望的功能,Claude 就同步開始建造。通話結束時,他直接展示了一個完整運作的產品,包含客戶 15 分鐘前剛描述的工作流程。這已經不是「AI 輔助開發」,而是 AI 在聽完需求後即時完成開發。


「踢掉」然後去吃午餐

Ali K. Miller 的經驗或許最能說明 Fable 5 帶來的質變。她說這是她第一次啟動一個 Anthropic 模型後,直接出門跟朋友吃了一頓長午餐,手機放在一旁,完全不需要介入引導。回來時發現工作已經完成了。模型不只解對了一道 MBA 級別的棘手文字數學題(之前所有模型都答錯),還自動驗證了自己的答案,並標註出假設條件可能需要調整的地方。

她的結論很直接:「你的工作不再是朝九晚五了。我們現在有高效能模型可以連續運行超過 100 小時。問題是:你怎麼決定要啟動什麼?你怎麼給這些系統複雜的、目標導向的提示?」重點已經從「模型能不能做」轉移到「你知不知道要叫它做什麼」。

Riley Brown 的測試展現了另一種可能性。他用極少的提示語就讓 Fable 5 一次生成了一個完整的 Replit Mobile 複製品,一個能在手機上建造網頁應用程式的 Swift 應用,包含沙箱環境和資料庫。後來他又用總共四個提示語造出了一個 Lovable 的複製品,還加上 Swift 應用程式預覽功能。Jake Fitzgerald 花了兩小時、消耗 140 萬個 token,拿到了一個人形機器人的完整設計。Every 的 Dan Schipper 在早上通勤的步行途中,用一句提示語讓模型把一段 2007 年的模糊哲學講座音訊重新增強、調平、變清晰,同時建成一個附帶同步字幕的手機網頁應用。這些都是單次提示就完成的成果。


Felix Reisberg 的三個紀元

Anthropic 內部對這個轉變有一套清晰的框架。Claude Code 負責人 Felix Reisberg 認為,Fable 5 標誌著 AI 使用進入了「第三紀元」。

第一紀元是「問問題」。使用者把 AI 當成更聰明的搜尋引擎或程式碼自動完成工具,問一個問題、拿一個答案。第二紀元是「給任務」。使用者把整個問題交給模型處理,修一個 bug、寫一份文件,人類在頭尾介入。這是目前多數進階使用者的工作模式,每一個任務都從人開始、由人結束。

Fable 5 開啟的是第三紀元:「給責任」。Reisberg 舉了自己的例子:他不再告訴 Claude 去調查某一個特定的當機報告。現在他讓 Claude 跑一個持續的迴圈,監控所有進來的當機報告。Claude 的工作不再是「幫我修一個當機」,而是「讓我們的應用程式不要當機」。

聽起來差別微妙,但背後的邏輯完全不同。給任務是一次性的、離散的,有明確的起點和終點。給責任是持續的、開放性的,模型需要自己判斷什麼時候該行動、怎麼行動。Anthropic 的 Alex Albert 把 Fable 5 跟 Opus 3、Sonnet 3.5、Opus 4.5 並列為他經歷過的「階段性跳躍」,形容為:「模型不再像是我指揮的工具,更像我協作的對象。」

Reisberg 做了一個大膽的預測:2027 年的 AI 應用程式會跟 2026 年的「非常、非常不一樣」。當 AI 從問答工具、到任務執行者、再到責任承擔者,建立在它之上的產品型態必然跟著改變。


任務想像力:真正的瓶頸

TikTok 創作者 Nate B. Jones 提出了一個精準的概念:「任務想像力」。他的核心觀點是,Fable 5 可以連續運行 9 小時、12 小時、甚至好幾天。但大多數人根本沒有任何工作是曾經需要交給 AI 超過一小時的。問題不是模型做不到,是我們想不到。

這個觀察觸及了一個被忽略的事實。人類歷來的工作委派只有兩種模式:要麼是「揮揮手給個大方向」然後祈禱對方理解,要麼是自己把所有細節全部做完。中間那個層次,「我要的是這個,標準是這樣,運作方式是那樣」,不需要微管理每一步但也不是完全放手,這種委派方式在 AI 出現之前幾乎不存在。Nate B. Jones 說得好:「我們正在贊助魔法,但需要一本魔法的使用手冊。」

Whittemore 把這個洞察延伸為兩個使用者需要培養的新技能。第一個是「使用場景分類」:在按量計費的時代,你必須判斷哪些任務值得用 Fable 級別的模型,哪些用 Opus 或 Sonnet 就夠了。他觀察到,很多重度使用者即使在查烤起司食譜時都開著最強模型,這在訂閱制時代無所謂,但在 6 月 23 日之後就是實實在在的浪費。第二個技能是任務想像力本身:學會構思那些需要 AI 連續工作數小時甚至數天的大型委派。目前的 AI 培訓課程,即使是最好的,都還停留在「用 AI 更好地做你今天的工作」的層次。在 Whittemore 看來,這遠遠不夠。


瓶頸從能力轉移到想像力

Fable 5 的早期使用者故事反覆印證同一個模式:獲益最大的人不是 prompt 寫得最好的人,而是敢於想像「如果我不用管執行,我會委派什麼」的人。

Whittemore 自己就是一個例子。他用 Fable 5 在幾小時內重建了 Superintelligent 平台的整個語音代理架構,從基於語音代理的輸入改為基於 Whisper API 的輸入模型。過程中他「什麼都不用做」,產出的結果「接近可以直接上線」。他又用一次提示語重建了一個新課程的行銷網站和教學平台。第三個專案更能說明問題:他之前用 Opus 4.8 為 AI Daily Brief 做了一組精美的網站原型圖,Fable 5 看了之後直接告訴他「這些只是漂亮的模型,不是可上線的東西」,然後把它們轉化為可交付 Claude Code 實作的生產管線。

這些經驗共同指向的核心變化是「管理開銷大幅降低」。過去即使用最強的模型,你仍然需要頻繁介入、修正方向、確認產出。現在管理開銷幾乎消失了,消失的結果就是使用者的野心可以跟著放大。你不再為了「值不值得花時間指揮 AI 做這件事」而猶豫,因為指揮的成本趨近於零。

Whittemore 還注意到一個容易被忽略的改善:Fable 5 是他見過第一個能在策略辯論中真正反駁使用者、被糾正後又不會完全倒向使用者立場的模型。過去的模型要麼為了反對而反對,要麼一被質疑就立刻全盤接受使用者的觀點。Fable 5 在被指出錯誤假設後,會吸收新資訊,但保留自己原始判斷中合理的部分。對於把 AI 當成策略思考夥伴的人來說,這個改變意義重大。

前沿 AI 的下一個分水嶺,可能不在於誰做出更強的模型,而在於誰先學會用這些模型做過去想都不敢想的事。Reisberg 說的「第三紀元」也好,Nate B. Jones 說的「任務想像力」也好,指向的是同一件事:模型的能力已經跑在使用者的想像力前面了。追上去的方法不是學更好的 prompt 技巧,而是重新思考「什麼工作值得交給 AI」這個問題本身。