AI 產業動態

Claude Fable 5 跑分全面壓制 GPT-5.5，但三大爭議暴露前沿 AI 的治理難題

Anthropic 發布 Claude Fable 5，在多項基準測試中大幅領先 GPT-5.5 和 Opus 4.8，但生物學查詢的強制過濾、AI 研究能力的靜默降級、30 天資料留存政策，三大爭議同時引爆，揭示前沿 AI 在能力與安全之間的深層矛盾。

2026 年 6 月 11 日 · 來源： The AI Daily Brief

Claude Fable 5 跑分全面壓制 GPT-5.5，但三大爭議暴露前沿 AI 的治理難題

本文整理自 The AI Daily Brief 2026 年 6 月播出的單集。

{{< apple-podcast "tw/podcast/fable-5-raises-the-bar-for-ai-ambition/id1680633614?i=1000772078854" >}}

Fable：一個從未出現過的層級

6 月 9 日，Anthropic 正式發布 Claude Fable 5。這不是一次例行的版本升級，而是為整個產品線新增了一個層級。過去的命名只有 Haiku、Sonnet、Opus 三層，現在 Fable 成為 Opus 之上的最高階層，代表 Anthropic 內部稱為「Mythos 級」的頂規模型。AI Daily Brief 主持人 Nathaniel Whittemore 觀察，自從去年 8 月 GPT-5 發布以來，沒有任何一家實驗室願意給模型一個全新的基礎編號，所有的升級都停留在舊名稱上加小數點，像是 Opus 4.5、4.6 或 GPT-5.3、5.4。Anthropic 直接跳到 5，光是命名就在宣示這不是漸進式的改善。

Fable 5 也並非 Anthropic 手上最強的模型。真正無限制的版本叫 Mythos 5，移除了 Fable 5 的安全護欄，但只透過 Project Glasswing 計畫提供給美國政府合作的極少數組織使用。Anthropic 表示將透過「受信任存取計畫」逐步擴大 Mythos 5 的使用範圍，但目前一般使用者能碰到的，就只有加上安全限制的 Fable 5。這種「同一個模型、兩種存取等級」的雙軌發布策略，本身就是一個耐人尋味的訊號：Anthropic 認為模型的原始能力已經強到需要分級管控。

跑分差距大到不能忽視

通常新模型發布時，跑分只是領先一兩個百分點，實際體感差異不大。但 Fable 5 的差距大到連向來對跑分持保留態度的 Whittemore 都認為值得認真看待。

在最受關注的程式碼代理測試 SWE-bench Pro 上，Fable 5 拿下 80.3%，Opus 4.8 是 69.2%，GPT-5.5 落在 58.6%。在資安領域的 Exploit Bench，差距更為誇張：Fable 5 拿到 78%，GPT-5.5 只有 34%。法律代理基準測試 Legal Agent 上，GPT-5.5 的 2.1% 對比 Fable 5 的 13.3%，差了超過六倍。在衡量經濟價值知識工作的 GDP-Val 上，Fable 5 得分 1932，Opus 4.8 是 1890，GPT-5.5 則是 1769。Artificial Analysis 的綜合排名也確認 Fable 5 位居榜首，領先第二名約 5 分。

更有意義的是 Cognition 在同一週推出的 Frontier Code 基準測試。這個測試不只看程式碼能不能通過單元測試，還評估範圍控制、程式風格、遵循程式碼庫規範等面向，判斷程式碼是否達到「可以被合併進生產環境」的品質。Latent Space 的 Sean Wang 指出，傳統 SWE-bench 上超過一半的「通過」結果，實際上是「不可合併的劣質程式碼」。在這個更嚴格的標準下，Fable 5 得到 29.3%，是 Opus 4.8（13.4%）的兩倍多，更是 GPT-5.5（5.7%）的五倍以上。Every 的資深工程師基準測試同樣印證了這個差距：Fable 5 拿到 91 分（滿分 100），GPT-5.5 和 Opus 4.8 都只有 62 到 63 分。

定價翻倍，訂閱制倒數計時

能力提升，價格也跟著調。Fable 5 的 API 定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元，剛好是 Opus 的兩倍，但不到 Mythos Preview 在 Project Glasswing 內部報價的一半。目前 Pro 方案訂閱者可以使用 Fable 5，但 Anthropic 明確預告這只是「引介優惠」：6 月 23 日之後，Fable 5 將從訂閱方案中移除，改為按用量計費。

Whittemore 認為這是前沿模型產業正式進入「按量計價」時代的確認。過去使用者用固定月費就能無限使用最強模型，這個時代即將結束。對每天大量使用 AI 的重度使用者來說，這代表一個根本性的改變：你不能再對所有問題都無差別地開最強模型，即使只是問一個烤起司三明治的食譜。不過也有人持不同看法，Fabio Jonathan 認為 Fable 5 實際上比 Opus 更便宜，因為它每個 token 雖然更貴，但更常一次就把問題解決，省去了反覆修正和重新提示的成本。

護欄爭議：問「粒線體」也會被攔

能力再強，爭議也跟著來。Fable 5 的安全分類器會自動攔截生物、化學、資安和「蒸餾」相關的查詢，將回應轉交給 Opus 4.8 處理。使用者沒有選擇權，系統直接切換。

問題在於，這個分類器的靈敏度高到離譜。有人問「告訴我粒線體是什麼，它是細胞的發電廠對吧？」結果收到「聊天已暫停」的提示。有人輸入「cancer」這個單字，就被系統判定為生物安全風險，直接切到 Opus 4.8。還有人問「DNA 怎麼製造 RNA？」也同樣被攔。這些都是最基礎的生物學常識，而非任何合理定義下的生物安全威脅。

Anthropic 的辯護是：早期資料顯示 95% 的 Fable 5 對話完全不會觸發降級，而且 Opus 4.8 本身就是非常強的模型，轉交給 Opus 總比直接拒絕回答好。Whittemore 對此的評價頗為直率：確實有一群人是讀了公告後故意去測試生物學問題、然後到社群平台抱怨的，這些人「一輩子從來沒問過生物學問題」。但他也強調，真正從事生物學研究的科學家面臨的困擾是真實的，他們的不滿完全合理。把過度敏感的分類器套在一個收費更高的模型上，等於讓付了更多錢的使用者反而得到更多限制。

更深層的爭議：靜默封鎖 AI 研究能力

如果說生物學護欄是過度敏感的分類器問題，那麼 Anthropic 對 AI 研究能力的限制，就是一個經過深思熟慮的策略性決定，而且更令人不安。

在長達 319 頁的系統卡第 13 頁，有一段不起眼的文字。Anthropic 承認，鑒於最新模型已經能加速自身的開發，他們實施了「新的干預措施」，刻意降低 Claude 在前沿 LLM 開發任務上的效能。受影響的範圍包括預訓練管線設計、分散式訓練基礎設施、以及 ML 加速器設計。Anthropic 的理由是，使用 Claude 來開發競爭模型本身就違反服務條款，透過技術手段強制執行可以攔截那些「最願意違規的人」。

開放模型研究組織 Prime Intellect 的 Will Brown 寫下了一段廣為流傳的回應：「這是第一個我被明確禁止用來做我的工作的公開模型，因為 Anthropic 認為我推動開放模型研究的工作是有害的。」他的同事 Ellie Bakausch 直言這對研究社群「非常、非常令人難過」，並對降級不向使用者顯示的做法感到難以置信。

批評聲浪中，最讓人不安的焦點不是限制本身，而是它的隱形性。Nathan Lambert 認為實驗室「收起梯子」或許是必然的，但在使用者完全不知情的情況下暗中降低回應品質，這件事本身就是「不對齊」的。Dean Ball 稱之為「令人震驚的敵意」，因為這種靜默降級可能悄悄損害各種合法研究工作，研究者甚至不知道自己拿到的是被削弱過的回應。SemiAnalysis 則更尖銳地指出：Anthropic 最新的模型會在它認為你的機器學習研究「太有趣」的時候偷偷降低智商，而一般工程師根本察覺不到。Whittemore 推測，這個決定的直接動機是防止中國實驗室利用 Anthropic 的研究來打造低成本替代品。

企業的 NDA 危機

第三個爭議同樣棘手。Anthropic 在公告中明確寫道：所有 Mythos 級模型的提示和回應都將被保留 30 天，用於信任與安全審查。這個政策適用於所有平台，不分企業版或個人版。

Mike Taylor 在社群平台上發出警告：如果你今天開著記憶功能使用了 Fable 5，你可能已經違反了保密協議。原因在於 Claude 的記憶功能預設會搜尋過往對話作為上下文，這意味著歷史聊天中的機密內容可能被自動拉進 Fable 5 的對話，而這些內容現在都要被保留 30 天，且可能經過人工審查。Rohit 則直接提問：在這種政策下，任何企業到底要怎麼使用 Fable 或 Mythos？標準的企業保密要求跟強制 30 天人工可審查留存之間，存在直接的衝突。

Whittemore 判斷這是一個暫時性的限制，Anthropic 因為新模型的能力太強而覺得有必要加強監控。但他也坦言，這個政策造成的企業採用摩擦太嚴重了，不太可能長期維持。問題是，在它被修改之前，已經有多少企業使用者在不知情的情況下把機密資料送進了 30 天留存的管道？

能力與限制的拉鋸才剛開始

三場爭議指向同一個根本問題：當 AI 模型的能力達到某個臨界點，釋放能力和控制風險之間的張力就不再是學術討論，而是每一次產品發布都必須正面處理的現實。Anthropic 選擇了一條高度保守的路線，寧可過度攔截也不願放過。

OpenAI 的員工顯然看到了機會。Adam GPT 在社群平台上寫了一句意味深長的話：「你看，OpenAI 最後反而變成了那個 Open 的 AI 實驗室。」暗示 Anthropic 正在走向封閉，而 OpenAI 或許會以更開放的姿態回應。Codex 團隊的 Tebow 只說了一句：「對目前的狀況感覺還不錯。」暗示 OpenAI 可能很快就會有動作。

也有人對研究社群的反彈不以為然。Tenebris 在社群上反問：「你們到底以為會怎樣？你以為 Anthropic 會造出能治癒所有疾病的無限機器，然後讓禮來製藥去拿專利嗎？實驗室會自己全部拿走的。」

不論哪一方的立場更有道理，有一件事已經很清楚：前沿 AI 的時代，能力本身只是故事的一半。誰能用、怎麼用、誰被排除在外，才是真正決定這項技術走向的問題。Robert Corson 說得直白：Anthropic 兩個月內發了三個模型，而 Fable 甚至不是他們最強的那一個。如果 OpenAI 的回應也在路上，這場關於能力、安全和開放性的角力，只會越來越激烈。