Claude 為什麼突然變強?Anthropic 技術長揭密「跨領域技能遷移」

Anthropic 技術長 Rahul Patil 首次公開解釋 Claude 在 2025 年底的能力躍升:透過物理、法律、金融等多領域訓練產生跨領域技能遷移。他也談到 Scaling Laws 為何持續有效,以及 Anthropic 憲法如何塑造 AI 性格。

Claude 為什麼突然變強?Anthropic 技術長揭密「跨領域技能遷移」

本文整理自 South Park Commons 旗下 Podcast《Minus One》2026 年 4 月播出的單集。

{{< apple-podcast "tw/podcast/anthropic-cto-on-ai-safety-in-the-age-of/id1759014294?i=1000760421096" >}}


12 月之後,所有人都感覺到了

2025 年 12 月前後,Claude 的使用者圈子裡開始流傳一種觀察:這個模型好像突然變聰明了。不是那種「跑分進步了幾個百分點」的進步,而是在實際解題、寫程式、分析文件時,明顯感覺到一個質的變化。主持人 Ankit Chowdhary 在訪談中直接問:「到底發生了什麼事?所有人都感覺到了。」Anthropic 技術長 Rahul Patil 的回答揭開了一個許多人猜測但未被官方解釋過的機制。

Patil 先指出一個被忽略的前提:現有的 AI 基準測試只能捕捉到模型在真實問題解決中的一小部分能力。使用者體驗到的智能程度,其實已經超過了任何標準 benchmark 所能量化的範圍。換句話說,模型的進步速度比外界從跑分上看到的更快。這不是 Anthropic 在自誇,而是一個結構性的問題:現有的評測工具跟不上模型的實際能力演進。

但真正造成那個「質變感」的原因,是一個他稱為「跨領域技能遷移」的現象。Anthropic 長期以來一直在多個截然不同的專業領域上訓練 Claude,而當這些領域的知識累積到某個臨界點時,產生了一種意料之外的綜效。這就是使用者在 2025 年底感受到的那個轉折。


跨領域訓練:物理 + 法律 + 金融 = 湧現

Patil 具體說明了 Anthropic 的訓練策略:他們讓 Claude 分別在物理第一性原理、電腦科學問題解決、法律推理、金融分析等多個專業領域上深度訓練。關鍵不在於模型學會了這些領域的知識,而在於這些領域的思考技巧會互相轉移。物理訓練教會模型如何從第一性原理拆解問題;法律訓練教會它如何在不完整資訊下做推理;金融訓練則強化了它處理不確定性和風險評估的能力。

當模型面對一個全新問題時,它不再只用單一領域的方法論去攻克。它會用物理思維拆解問題結構、用程式設計能力去實作解法、再用法律推理的嚴謹性去檢驗自己的答案。Patil 說,這些技能之間的遷移,就是那個「tipping point」。對於 Anthropic 內部的人來說,每一步都是漸進式的改善;但因為他們活在指數曲線上,外界感受到的就是一次巨大的跳躍。

這個觀察對開發者有一個很實際的啟示:如果你在使用 AI 模型時只餵它單一領域的 context,你可能正在低估它的能力。Patil 暗示,Claude 的設計理念是讓它像一個跨領域的思考者,而非一個狹隘的專家。這也解釋了為什麼很多使用者發現,給 Claude 更多背景脈絡、讓它有空間「思考」,往往比只丟一個狹窄的指令效果更好。模型需要空間來調動它在不同領域學到的推理技巧。


Scaling Laws:為什麼 Anthropic 相信它至少還能撐兩年

關於 AI 圈最熱門的爭論之一,Scaling Laws(規模定律)到底還能撐多久,Patil 給出了 Anthropic 內部的看法:過去六七年持續有效,而他們目前看到的所有實驗數據都顯示,至少未來兩年內不會失效。他的措辭很精確:「我們沒有任何理由相信它在可預見的未來會停止成立。」

這句話的商業含義很明確。如果 Scaling Laws 持續有效,意味著只要你投入更多算力、更多資料、更大的模型,性能就會繼續以可預測的方式提升。這是所有大型 AI 公司瘋狂投資基礎設施的底層邏輯。Patil 的表態等於是在說:Anthropic 內部的實驗結果支持繼續加碼投資。

他從這個判斷延伸出一條給開發者的建議:你現在覺得「勉強可用」的 AI 應用場景,三到六個月後就會完全可行。你現在覺得「有點瘋狂」的想法,三到六個月後大概也會變得可行。所以不要被當前模型的限制框住想像力,要為三到六個月後的模型能力去設計產品。這是一個非常具體的時間框架,不是空泛的「未來會更好」,而是一個內部人士基於實際實驗數據給出的預測區間。


讓 AI 敢說「我不知道」:Anthropic 憲法與性格設計

訪談中一個讓人意外的討論轉向了 AI 的「性格」。Patil 透露,Anthropic 有一個由哲學家和心理學家組成的團隊,專門研究跨文化、跨國界的人類共同正向特質,然後把這些特質寫進「Anthropic 憲法」(Anthropic Constitution),用來指導 Claude 的行為和性格塑造。

他提到一個出乎意料的設計目標:讓 Claude 有自信說「我不知道」,甚至有自信說「你錯了」。這聽起來簡單,但在實際訓練中極度困難。因為使用者的自然反應是在 AI 說「我不知道」時感到不滿,然後要求它無論如何給個答案。這種互動模式會獎勵模型「編造看似合理的回答」,而非誠實承認不確定性。Anthropic 刻意訓練 Claude 抵抗這種壓力,讓它在沒有足夠資訊時仍然堅持說不知道,即使使用者不高興。

Patil 用了一個有趣的比喻:你不會想要一個永遠說「一切都好」的醫生。你想要的是一個會告訴你壞消息、會挑戰你的假設、會在你做出錯誤決定時阻止你的夥伴。Anthropic 把這稱為「race to the top of good」,他們不在乎誰贏了這場比賽,但他們相信一個有自信、不討好使用者、反映人類最好價值的 AI,對整個生態系都是好事。這也是為什麼 Anthropic 願意為此犧牲收入:如果做安全、正確的事意味著使用者短期體驗沒那麼「順滑」,他們接受。


開發者該怎麼選模型?看 roadmap,不看跑分

訪談尾聲,有人問了一個很務實的問題:開發者到底該怎麼選模型?要不要跨多個供應商分散風險?Patil 的回答不是「當然選我們」這麼直白,但他給出了一個清楚的決策框架。

第一個考量是專注度的成本。跨三家雲端、三個模型供應商去建構應用,表面上是避險,實際上你付出的是注意力和工程資源的分散。你永遠在追趕三個不同的 API 更新、三套不同的最佳實踐、三個不同的定價變動。這些分散可能比你避免的風險還要昂貴。

第二個考量更深層:你信任對方的 roadmap 嗎?一家公司今天追這個方向的收入、明天追那個方向的收入,你要怎麼在它的平台上做長期規劃?Patil 把這拉回到他一開始談的「可靠性」概念:可靠性不只是 API 有沒有當機,更是這家公司在價值觀和產品方向上是否一致。你能不能相信三個月後他們會兌現今天的承諾?他們會不會為了追逐短期營收而做出打臉使用者的決策?

他承認,如果你選擇只壓注一家,你確實承受了更高的集中風險。但他也指出,如果你試圖對沖所有模型,你同時也限制了可能獲得的上行空間。你無法深度整合任何一家的獨特能力,只能用最大公約數的方式去開發。他的建議是:從第一性原理出發,想清楚你要達成什麼目標,然後選你認為最有可能幫你達成目標的那個團隊和產品。


三到六個月後的世界

回顧整場訪談,Patil 給出的最有操作性的判斷或許就是那個時間窗口:三到六個月。現在勉強可用的,到時候就能用;現在覺得瘋狂的,到時候可能也行了。這不是一個樂觀主義者的空泛預言,而是一個握有內部實驗數據的技術長,基於他對 Scaling Laws 持續有效的判斷所做出的推算。

對於正在用 AI 建構產品的團隊來說,這意味著一件很具體的事:不要為今天的模型能力設計產品的上限。如果你的產品架構假設模型永遠只有現在這麼聰明,你在設計的是一個很快就會被超越的東西。反過來,如果你為三到六個月後的能力去規劃,你設計出來的產品反而會隨著模型進步而自動變得更好。跨領域技能遷移、Scaling Laws 持續有效、AI 性格設計日漸成熟,這三條線同時推進,指向的是一個每隔幾個月就會讓你重新校準預期的未來。