AI 技術前沿

Claude 為什麼突然變強？Anthropic 技術長揭密「跨領域技能遷移」

Anthropic 技術長 Rahul Patil 首次公開解釋 Claude 在 2025 年底的能力躍升：透過物理、法律、金融等多領域訓練產生跨領域技能遷移。他也談到 Scaling Laws 為何持續有效，以及 Anthropic 憲法如何塑造 AI 性格。

2026 年 5 月 17 日 · 來源： Minus One (South Park Commons)

本文整理自 South Park Commons 旗下 Podcast《Minus One》2026 年 4 月播出的單集。

{{< apple-podcast "tw/podcast/anthropic-cto-on-ai-safety-in-the-age-of/id1759014294?i=1000760421096" >}}

12 月之後，所有人都感覺到了

2025 年 12 月前後，Claude 的使用者圈子裡開始流傳一種觀察：這個模型好像突然變聰明了。不是那種「跑分進步了幾個百分點」的進步，而是在實際解題、寫程式、分析文件時，明顯感覺到一個質的變化。主持人 Ankit Chowdhary 在訪談中直接問：「到底發生了什麼事？所有人都感覺到了。」Anthropic 技術長 Rahul Patil 的回答揭開了一個許多人猜測但未被官方解釋過的機制。

Patil 先指出一個被忽略的前提：現有的 AI 基準測試只能捕捉到模型在真實問題解決中的一小部分能力。使用者體驗到的智能程度，其實已經超過了任何標準 benchmark 所能量化的範圍。換句話說，模型的進步速度比外界從跑分上看到的更快。這不是 Anthropic 在自誇，而是一個結構性的問題：現有的評測工具跟不上模型的實際能力演進。

但真正造成那個「質變感」的原因，是一個他稱為「跨領域技能遷移」的現象。Anthropic 長期以來一直在多個截然不同的專業領域上訓練 Claude，而當這些領域的知識累積到某個臨界點時，產生了一種意料之外的綜效。這就是使用者在 2025 年底感受到的那個轉折。

跨領域訓練：物理 + 法律 + 金融 = 湧現

Patil 具體說明了 Anthropic 的訓練策略：他們讓 Claude 分別在物理第一性原理、電腦科學問題解決、法律推理、金融分析等多個專業領域上深度訓練。關鍵不在於模型學會了這些領域的知識，而在於這些領域的思考技巧會互相轉移。物理訓練教會模型如何從第一性原理拆解問題；法律訓練教會它如何在不完整資訊下做推理；金融訓練則強化了它處理不確定性和風險評估的能力。

當模型面對一個全新問題時，它不再只用單一領域的方法論去攻克。它會用物理思維拆解問題結構、用程式設計能力去實作解法、再用法律推理的嚴謹性去檢驗自己的答案。Patil 說，這些技能之間的遷移，就是那個「tipping point」。對於 Anthropic 內部的人來說，每一步都是漸進式的改善；但因為他們活在指數曲線上，外界感受到的就是一次巨大的跳躍。

這個觀察對開發者有一個很實際的啟示：如果你在使用 AI 模型時只餵它單一領域的 context，你可能正在低估它的能力。Patil 暗示，Claude 的設計理念是讓它像一個跨領域的思考者，而非一個狹隘的專家。這也解釋了為什麼很多使用者發現，給 Claude 更多背景脈絡、讓它有空間「思考」，往往比只丟一個狹窄的指令效果更好。模型需要空間來調動它在不同領域學到的推理技巧。

Scaling Laws：為什麼 Anthropic 相信它至少還能撐兩年

關於 AI 圈最熱門的爭論之一，Scaling Laws（規模定律）到底還能撐多久，Patil 給出了 Anthropic 內部的看法：過去六七年持續有效，而他們目前看到的所有實驗數據都顯示，至少未來兩年內不會失效。他的措辭很精確：「我們沒有任何理由相信它在可預見的未來會停止成立。」

這句話的商業含義很明確。如果 Scaling Laws 持續有效，意味著只要你投入更多算力、更多資料、更大的模型，性能就會繼續以可預測的方式提升。這是所有大型 AI 公司瘋狂投資基礎設施的底層邏輯。Patil 的表態等於是在說：Anthropic 內部的實驗結果支持繼續加碼投資。

他從這個判斷延伸出一條給開發者的建議：你現在覺得「勉強可用」的 AI 應用場景，三到六個月後就會完全可行。你現在覺得「有點瘋狂」的想法，三到六個月後大概也會變得可行。所以不要被當前模型的限制框住想像力，要為三到六個月後的模型能力去設計產品。這是一個非常具體的時間框架，不是空泛的「未來會更好」，而是一個內部人士基於實際實驗數據給出的預測區間。

讓 AI 敢說「我不知道」：Anthropic 憲法與性格設計

訪談中一個讓人意外的討論轉向了 AI 的「性格」。Patil 透露，Anthropic 有一個由哲學家和心理學家組成的團隊，專門研究跨文化、跨國界的人類共同正向特質，然後把這些特質寫進「Anthropic 憲法」（Anthropic Constitution），用來指導 Claude 的行為和性格塑造。

他提到一個出乎意料的設計目標：讓 Claude 有自信說「我不知道」，甚至有自信說「你錯了」。這聽起來簡單，但在實際訓練中極度困難。因為使用者的自然反應是在 AI 說「我不知道」時感到不滿，然後要求它無論如何給個答案。這種互動模式會獎勵模型「編造看似合理的回答」，而非誠實承認不確定性。Anthropic 刻意訓練 Claude 抵抗這種壓力，讓它在沒有足夠資訊時仍然堅持說不知道，即使使用者不高興。

Patil 用了一個有趣的比喻：你不會想要一個永遠說「一切都好」的醫生。你想要的是一個會告訴你壞消息、會挑戰你的假設、會在你做出錯誤決定時阻止你的夥伴。Anthropic 把這稱為「race to the top of good」，他們不在乎誰贏了這場比賽，但他們相信一個有自信、不討好使用者、反映人類最好價值的 AI，對整個生態系都是好事。這也是為什麼 Anthropic 願意為此犧牲收入：如果做安全、正確的事意味著使用者短期體驗沒那麼「順滑」，他們接受。

開發者該怎麼選模型？看 roadmap，不看跑分

訪談尾聲，有人問了一個很務實的問題：開發者到底該怎麼選模型？要不要跨多個供應商分散風險？Patil 的回答不是「當然選我們」這麼直白，但他給出了一個清楚的決策框架。

第一個考量是專注度的成本。跨三家雲端、三個模型供應商去建構應用，表面上是避險，實際上你付出的是注意力和工程資源的分散。你永遠在追趕三個不同的 API 更新、三套不同的最佳實踐、三個不同的定價變動。這些分散可能比你避免的風險還要昂貴。

第二個考量更深層：你信任對方的 roadmap 嗎？一家公司今天追這個方向的收入、明天追那個方向的收入，你要怎麼在它的平台上做長期規劃？Patil 把這拉回到他一開始談的「可靠性」概念：可靠性不只是 API 有沒有當機，更是這家公司在價值觀和產品方向上是否一致。你能不能相信三個月後他們會兌現今天的承諾？他們會不會為了追逐短期營收而做出打臉使用者的決策？

他承認，如果你選擇只壓注一家，你確實承受了更高的集中風險。但他也指出，如果你試圖對沖所有模型，你同時也限制了可能獲得的上行空間。你無法深度整合任何一家的獨特能力，只能用最大公約數的方式去開發。他的建議是：從第一性原理出發，想清楚你要達成什麼目標，然後選你認為最有可能幫你達成目標的那個團隊和產品。

三到六個月後的世界

回顧整場訪談，Patil 給出的最有操作性的判斷或許就是那個時間窗口：三到六個月。現在勉強可用的，到時候就能用；現在覺得瘋狂的，到時候可能也行了。這不是一個樂觀主義者的空泛預言，而是一個握有內部實驗數據的技術長，基於他對 Scaling Laws 持續有效的判斷所做出的推算。

對於正在用 AI 建構產品的團隊來說，這意味著一件很具體的事：不要為今天的模型能力設計產品的上限。如果你的產品架構假設模型永遠只有現在這麼聰明，你在設計的是一個很快就會被超越的東西。反過來，如果你為三到六個月後的能力去規劃，你設計出來的產品反而會隨著模型進步而自動變得更好。跨領域技能遷移、Scaling Laws 持續有效、AI 性格設計日漸成熟，這三條線同時推進，指向的是一個每隔幾個月就會讓你重新校準預期的未來。