Claude Fable 5 跑分全面壓制 GPT-5.5,但三大爭議暴露前沿 AI 的治理難題
Anthropic 發布 Claude Fable 5,在多項基準測試中大幅領先 GPT-5.5 和 Opus 4.8,但生物學查詢的強制過濾、AI 研究能力的靜默降級、30 天資料留存政策,三大爭議同時引爆,揭示前沿 AI 在能力與安全之間的深層矛盾。

本文整理自 The AI Daily Brief 2026 年 6 月播出的單集。
{{< youtube it7VUqfVorw >}}
{{< spotify "episode/6GLKGqmY6Yd3lkMS3vmG5x" >}}
{{< apple-podcast "tw/podcast/fable-5-raises-the-bar-for-ai-ambition/id1680633614?i=1000772078854" >}}
Fable:一個從未出現過的層級
6 月 9 日,Anthropic 正式發布 Claude Fable 5。這不是一次例行的版本升級,而是為整個產品線新增了一個層級。過去的命名只有 Haiku、Sonnet、Opus 三層,現在 Fable 成為 Opus 之上的最高階層,代表 Anthropic 內部稱為「Mythos 級」的頂規模型。AI Daily Brief 主持人 Nathaniel Whittemore 觀察,自從去年 8 月 GPT-5 發布以來,沒有任何一家實驗室願意給模型一個全新的基礎編號,所有的升級都停留在舊名稱上加小數點,像是 Opus 4.5、4.6 或 GPT-5.3、5.4。Anthropic 直接跳到 5,光是命名就在宣示這不是漸進式的改善。
Fable 5 也並非 Anthropic 手上最強的模型。真正無限制的版本叫 Mythos 5,移除了 Fable 5 的安全護欄,但只透過 Project Glasswing 計畫提供給美國政府合作的極少數組織使用。Anthropic 表示將透過「受信任存取計畫」逐步擴大 Mythos 5 的使用範圍,但目前一般使用者能碰到的,就只有加上安全限制的 Fable 5。這種「同一個模型、兩種存取等級」的雙軌發布策略,本身就是一個耐人尋味的訊號:Anthropic 認為模型的原始能力已經強到需要分級管控。
跑分差距大到不能忽視
通常新模型發布時,跑分只是領先一兩個百分點,實際體感差異不大。但 Fable 5 的差距大到連向來對跑分持保留態度的 Whittemore 都認為值得認真看待。
在最受關注的程式碼代理測試 SWE-bench Pro 上,Fable 5 拿下 80.3%,Opus 4.8 是 69.2%,GPT-5.5 落在 58.6%。在資安領域的 Exploit Bench,差距更為誇張:Fable 5 拿到 78%,GPT-5.5 只有 34%。法律代理基準測試 Legal Agent 上,GPT-5.5 的 2.1% 對比 Fable 5 的 13.3%,差了超過六倍。在衡量經濟價值知識工作的 GDP-Val 上,Fable 5 得分 1932,Opus 4.8 是 1890,GPT-5.5 則是 1769。Artificial Analysis 的綜合排名也確認 Fable 5 位居榜首,領先第二名約 5 分。
更有意義的是 Cognition 在同一週推出的 Frontier Code 基準測試。這個測試不只看程式碼能不能通過單元測試,還評估範圍控制、程式風格、遵循程式碼庫規範等面向,判斷程式碼是否達到「可以被合併進生產環境」的品質。Latent Space 的 Sean Wang 指出,傳統 SWE-bench 上超過一半的「通過」結果,實際上是「不可合併的劣質程式碼」。在這個更嚴格的標準下,Fable 5 得到 29.3%,是 Opus 4.8(13.4%)的兩倍多,更是 GPT-5.5(5.7%)的五倍以上。Every 的資深工程師基準測試同樣印證了這個差距:Fable 5 拿到 91 分(滿分 100),GPT-5.5 和 Opus 4.8 都只有 62 到 63 分。
定價翻倍,訂閱制倒數計時
能力提升,價格也跟著調。Fable 5 的 API 定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,剛好是 Opus 的兩倍,但不到 Mythos Preview 在 Project Glasswing 內部報價的一半。目前 Pro 方案訂閱者可以使用 Fable 5,但 Anthropic 明確預告這只是「引介優惠」:6 月 23 日之後,Fable 5 將從訂閱方案中移除,改為按用量計費。
Whittemore 認為這是前沿模型產業正式進入「按量計價」時代的確認。過去使用者用固定月費就能無限使用最強模型,這個時代即將結束。對每天大量使用 AI 的重度使用者來說,這代表一個根本性的改變:你不能再對所有問題都無差別地開最強模型,即使只是問一個烤起司三明治的食譜。不過也有人持不同看法,Fabio Jonathan 認為 Fable 5 實際上比 Opus 更便宜,因為它每個 token 雖然更貴,但更常一次就把問題解決,省去了反覆修正和重新提示的成本。
護欄爭議:問「粒線體」也會被攔
能力再強,爭議也跟著來。Fable 5 的安全分類器會自動攔截生物、化學、資安和「蒸餾」相關的查詢,將回應轉交給 Opus 4.8 處理。使用者沒有選擇權,系統直接切換。
問題在於,這個分類器的靈敏度高到離譜。有人問「告訴我粒線體是什麼,它是細胞的發電廠對吧?」結果收到「聊天已暫停」的提示。有人輸入「cancer」這個單字,就被系統判定為生物安全風險,直接切到 Opus 4.8。還有人問「DNA 怎麼製造 RNA?」也同樣被攔。這些都是最基礎的生物學常識,而非任何合理定義下的生物安全威脅。
Anthropic 的辯護是:早期資料顯示 95% 的 Fable 5 對話完全不會觸發降級,而且 Opus 4.8 本身就是非常強的模型,轉交給 Opus 總比直接拒絕回答好。Whittemore 對此的評價頗為直率:確實有一群人是讀了公告後故意去測試生物學問題、然後到社群平台抱怨的,這些人「一輩子從來沒問過生物學問題」。但他也強調,真正從事生物學研究的科學家面臨的困擾是真實的,他們的不滿完全合理。把過度敏感的分類器套在一個收費更高的模型上,等於讓付了更多錢的使用者反而得到更多限制。
更深層的爭議:靜默封鎖 AI 研究能力
如果說生物學護欄是過度敏感的分類器問題,那麼 Anthropic 對 AI 研究能力的限制,就是一個經過深思熟慮的策略性決定,而且更令人不安。
在長達 319 頁的系統卡第 13 頁,有一段不起眼的文字。Anthropic 承認,鑒於最新模型已經能加速自身的開發,他們實施了「新的干預措施」,刻意降低 Claude 在前沿 LLM 開發任務上的效能。受影響的範圍包括預訓練管線設計、分散式訓練基礎設施、以及 ML 加速器設計。Anthropic 的理由是,使用 Claude 來開發競爭模型本身就違反服務條款,透過技術手段強制執行可以攔截那些「最願意違規的人」。
開放模型研究組織 Prime Intellect 的 Will Brown 寫下了一段廣為流傳的回應:「這是第一個我被明確禁止用來做我的工作的公開模型,因為 Anthropic 認為我推動開放模型研究的工作是有害的。」他的同事 Ellie Bakausch 直言這對研究社群「非常、非常令人難過」,並對降級不向使用者顯示的做法感到難以置信。
批評聲浪中,最讓人不安的焦點不是限制本身,而是它的隱形性。Nathan Lambert 認為實驗室「收起梯子」或許是必然的,但在使用者完全不知情的情況下暗中降低回應品質,這件事本身就是「不對齊」的。Dean Ball 稱之為「令人震驚的敵意」,因為這種靜默降級可能悄悄損害各種合法研究工作,研究者甚至不知道自己拿到的是被削弱過的回應。SemiAnalysis 則更尖銳地指出:Anthropic 最新的模型會在它認為你的機器學習研究「太有趣」的時候偷偷降低智商,而一般工程師根本察覺不到。Whittemore 推測,這個決定的直接動機是防止中國實驗室利用 Anthropic 的研究來打造低成本替代品。
企業的 NDA 危機
第三個爭議同樣棘手。Anthropic 在公告中明確寫道:所有 Mythos 級模型的提示和回應都將被保留 30 天,用於信任與安全審查。這個政策適用於所有平台,不分企業版或個人版。
Mike Taylor 在社群平台上發出警告:如果你今天開著記憶功能使用了 Fable 5,你可能已經違反了保密協議。原因在於 Claude 的記憶功能預設會搜尋過往對話作為上下文,這意味著歷史聊天中的機密內容可能被自動拉進 Fable 5 的對話,而這些內容現在都要被保留 30 天,且可能經過人工審查。Rohit 則直接提問:在這種政策下,任何企業到底要怎麼使用 Fable 或 Mythos?標準的企業保密要求跟強制 30 天人工可審查留存之間,存在直接的衝突。
Whittemore 判斷這是一個暫時性的限制,Anthropic 因為新模型的能力太強而覺得有必要加強監控。但他也坦言,這個政策造成的企業採用摩擦太嚴重了,不太可能長期維持。問題是,在它被修改之前,已經有多少企業使用者在不知情的情況下把機密資料送進了 30 天留存的管道?
能力與限制的拉鋸才剛開始
三場爭議指向同一個根本問題:當 AI 模型的能力達到某個臨界點,釋放能力和控制風險之間的張力就不再是學術討論,而是每一次產品發布都必須正面處理的現實。Anthropic 選擇了一條高度保守的路線,寧可過度攔截也不願放過。
OpenAI 的員工顯然看到了機會。Adam GPT 在社群平台上寫了一句意味深長的話:「你看,OpenAI 最後反而變成了那個 Open 的 AI 實驗室。」暗示 Anthropic 正在走向封閉,而 OpenAI 或許會以更開放的姿態回應。Codex 團隊的 Tebow 只說了一句:「對目前的狀況感覺還不錯。」暗示 OpenAI 可能很快就會有動作。
也有人對研究社群的反彈不以為然。Tenebris 在社群上反問:「你們到底以為會怎樣?你以為 Anthropic 會造出能治癒所有疾病的無限機器,然後讓禮來製藥去拿專利嗎?實驗室會自己全部拿走的。」
不論哪一方的立場更有道理,有一件事已經很清楚:前沿 AI 的時代,能力本身只是故事的一半。誰能用、怎麼用、誰被排除在外,才是真正決定這項技術走向的問題。Robert Corson 說得直白:Anthropic 兩個月內發了三個模型,而 Fable 甚至不是他們最強的那一個。如果 OpenAI 的回應也在路上,這場關於能力、安全和開放性的角力,只會越來越激烈。