AI 憲法是什麼?Dario Amodei 談 Claude Code 起源與 Anthropic 文化

Anthropic 執行長 Dario Amodei 揭露 Claude Code 從內部工具變殺手產品的過程,解釋 AI 憲法為何用原則而非規則引導模型行為。

AI 憲法是什麼?Dario Amodei 談 Claude Code 起源與 Anthropic 文化

本文整理自 Dwarkesh Patel Podcast 2026 年 2 月播出的單集。

{{< youtube n1E9IZfvGMA >}}

{{< spotify "episode/2ZNrpVSrgZMlDwQinl20Ay" >}}

{{< apple-podcast "tw/podcast/dario-amodei-the-highest-stakes-financial-model-in-history/id1516093381?i=1000749621800" >}}


封面圖

在一場主要討論 AI 擴展定律和地緣政治的長訪談裡,Dario Amodei 花了不少時間談三個看似比較「軟」的話題:一個內部工具如何變成產品、AI 的行為準則該怎麼設計、以及他如何管理一家 2,500 人的公司。但聽完之後會發現,這三件事其實是 Anthropic 競爭力的底層結構,比任何技術突破都更難被複製。

Claude Code:從內部工具到產品的意外旅程

Claude Code 的故事是一個教科書級的「狗食效應」(dogfooding)案例。2025 年初,Amodei 鼓勵 Anthropic 的員工嘗試用自家的編碼模型來加速研究工作。一個最初叫做 Claude CLI 的命令列工具開始在公司內部流傳,然後迅速被大量採用。2,500 名員工中,有數百人每天都在用它寫程式碼。

Amodei 看到內部採用率後做了一個判斷:如果這個工具在 Anthropic 內部已經達到了產品市場契合(product-market fit),而 Anthropic 的工程師恰好就是目標用戶群的代表,那就值得對外推出。這個推理很簡單,但很多公司做不到,因為多數公司的員工和目標用戶之間存在巨大的差距。Anthropic 的特殊之處在於:打造模型的人同時也是模型最嚴苛的使用者。

這創造了一個獨特的回饋循環。工程師在用 Claude Code 寫改進 Claude 模型的程式碼,模型變強了,Claude Code 也變強了,工程師的效率提高了,又能更快地改進模型。Amodei 描述這個循環為 Anthropic 逐漸增長的競爭優勢。半年前這個優勢是 5%,現在是 15% 到 20%,而且持續擴大。

但他也坦承,目前擁有最好編碼模型的公司並沒有因此拉開決定性差距。這看似矛盾,其實不然。問題出在「端到端」。寫程式碼只是軟體開發的一個環節,前面有需求理解、架構設計,後面有測試、部署、維運。AI 在中間環節(寫程式碼本身)的加速效果很明顯,但瓶頸往往在它上下游的環節。這就是阿姆達爾定律的實際體現:你加速了最快的部分,但整體速度受限於最慢的部分。

API 模式比你想的更持久

討論 Claude Code 自然延伸到了 Anthropic 的商業模式。有一個常見的質疑:隨著 AI 模型越來越商品化,API 服務的利潤空間是不是會被壓縮到零?Amodei 認為不會,而且原因比多數人想的更有趣。

他的論點是:永遠有一個「新能力啟用」的邊界在往外擴展。昨天 AI 做不到的事情,今天勉強做得到,明天做得很好。在這個邊界上,新的使用案例不斷湧現,而這些新案例願意付出的價格遠高於已經成熟的舊案例。一個客服機器人每個 token 的價值和一個藥物分子設計系統每個 token 的價值,差距可能是百倍甚至千倍。

這意味著 AI 的商業模式不會停留在「按 token 計費」。Amodei 預期會出現「按結果計費」和「類似勞動力定價」的模式。如果一個 AI 系統能幫你省下一個年薪兩百萬的資深工程師的 30% 工時,你願意付多少?答案不是幾千個 token 的費用,而是幾十萬的年訂閱。

這個邏輯跟雲端運算的發展軌跡很像。早期的雲服務也是按資源(CPU、記憶體、頻寬)計費,後來演變成按服務層級(SaaS、PaaS)計費,最終變成按業務價值計費。AI 服務正在走同樣的路,只是速度快得多。

AI 憲法:原則優於規則

Amodei 花了不少時間解釋 Anthropic 如何設計 Claude 的行為準則,也就是所謂的「AI 憲法」(AI constitution)。核心洞見是:基於原則的指引比基於規則的指引效果更好。

規則的問題在於邊界情況。你可以列出一千條「不能做的事」,但永遠會遇到第一千零一種情況。而且規則之間可能互相矛盾,模型在面對衝突的規則時會產生不一致的行為。原則就不一樣了。「尊重人類的自主性」是一個原則,它能引導模型在無數種情境中做出合理的判斷,因為模型可以從原則出發進行推理,而不是在規則列表中搜尋匹配。

Amodei 把 Claude 的行為定位為「大部分可控」(mostly corrigible),同時設有不可跨越的硬性底線。「大部分可控」的意思是,Claude 在絕大多數情況下會遵循使用者的指示,即使使用者的要求聽起來有點奇怪。但在涉及「真正危險的行動」(如協助製造生物武器、大規模網路攻擊)時,無論使用者怎麼要求,模型都不會配合。

這套系統透過三個回饋循環持續精進。第一個循環是 Anthropic 內部的迭代:公司內部不斷訓練、測試、修正,然後公開更新版本讓外界檢視。第二個循環是公司之間的競爭:不同 AI 公司的不同「憲法」被擺在一起比較,外部觀察者可以指出各家的優劣,形成一種軟性的市場壓力。第三個循環是更廣泛的社會輸入:包括公眾意見、學術研究、甚至未來可能包括民選政府的參與。

Amodei 指出一個微妙的問題:目前的立法程序太慢了,跟不上 AI 的發展速度。但他也不認為應該因此完全排除政府的角色。他的想法更接近於一種漸進式的參與:先從產業自律和透明度開始,隨著技術和社會的理解加深,逐步引入更正式的治理機制。

40% 的時間用在文化上

訪談尾聲的一個細節引起了注意。Amodei 透露他大約把 40% 的時間花在公司文化上。對一家技術驅動的 AI 公司來說,這個比例高得驚人。

他具體做的事情之一是每兩週舉辦一次「Dario Vision Quest」(DVQ),這是一個面向全公司的一小時演講。他會準備一份三到四頁的文件,涵蓋內部進展、模型進步、產品動態、產業趨勢和地緣政治。這個名字不是他取的,而是員工自發命名的。Amodei 還維護了一個 Slack 頻道用來做透明的內部溝通。

他做這些事的原因很明確:在 AI 產業的極端壓力下,公司文化是最容易崩壞的東西,但也是最重要的東西。他暗示(沒有點名)某些競爭對手正在經歷「內部去相干」(internal decoherence),也就是團隊方向不一致、內部政治消耗精力、核心人才流失。Anthropic 的優勢不只是技術,更是團隊的凝聚力和方向一致性。

他強調的文化特質是「激進誠實」(radical honesty)。不搞公關辭令,不在內部用冠冕堂皇的話掩蓋問題。如果模型有缺陷就直說,如果競爭對手某個方面做得更好也直說。這聽起來簡單,但在一家估值 3,800 億美元、全世界都在盯著看的公司裡,保持這種坦率需要持續的紀律。

歷史會最難理解的三件事

在訪談接近尾聲時,Patel 問了一個有趣的問題:未來的歷史學家會最難理解我們這個時代的什麼?Amodei 的回答提供了一個罕見的自我反思視角。

第一,他認為歷史學家會很難理解,為什麼 AI 泡沫之外的世界如此缺乏危機感。在 AI 產業內部,人們每天都在與時間賽跑,相信自己正在打造可能改變人類文明的技術。但走出這個圈子,多數人對此毫無感覺。等到 AI 真的發生了,事後看來一切都是「必然的」,但身處其中的人知道這從來不是必然。

第二,做出最重要決策的是一小群極其特殊的人,而外界幾乎不知道這些人是誰、他們在想什麼。AI 發展的方向可能在幾場內部會議中就被決定了,但這些會議的參與者可能只有十幾個人。

第三,速度。最關鍵的決定可能只花了兩分鐘。他半開玩笑地描述了一個場景:有人走進他辦公室說「Dario,你有兩分鐘,我們應該做 A 還是 B?」他回答「我不知道,我得去吃午餐了,做 B 吧。」然後那個決定成了「有史以來影響最深遠的事」。

這段話的價值不在於它的字面意義,而在於它揭示的心態。在指數變化的環境中,完美的決策流程是奢侈品。你能做的是建立一個文化,讓組織中的每個人在必須快速決策時,都有足夠的共識和判斷力做出合理的選擇。這也許是 Amodei 把 40% 時間花在文化上的真正原因。

我的觀察:自己用自己做的東西,這件事有多稀缺

Claude Code 從內部工具到外部產品的故事,聽起來理所當然,但回頭看整個 AI 產業,你會發現這件事其實非常稀缺。大部分 AI 公司的員工並不是自己產品的重度使用者。OpenAI 的員工不見得每天都用 ChatGPT 來完成核心工作,Google 的 Gemini 團隊也不見得把 Gemini 當作主要開發工具。

Anthropic 的狀況不同,因為他們的核心工作(AI 研究和工程)恰好就是 AI 編碼工具的最佳使用場景。這不是刻意設計的,而是一個幸運的巧合加上正確的執行。Amodei 的判斷力在於他看到了這個巧合的價值,並且決定把它變成產品。

對於正在用各種 AI 工具的開發者來說,這提供了一個有用的判斷框架:這個工具的開發者自己有在用嗎?用得多深?如果一家公司的員工是自己產品最嚴苛的用戶,這通常是產品品質的最強信號。反過來,如果開發者自己都不用自己的工具,那你應該想想為什麼。