領袖思維

AI 憲法是什麼？Dario Amodei 談 Claude Code 起源與 Anthropic 文化

Anthropic 執行長 Dario Amodei 揭露 Claude Code 從內部工具變殺手產品的過程，解釋 AI 憲法為何用原則而非規則引導模型行為。

2026 年 2 月 18 日 · 來源： Dwarkesh Patel Podcast

AI 憲法是什麼？Dario Amodei 談 Claude Code 起源與 Anthropic 文化

本文整理自 Dwarkesh Patel Podcast 2026 年 2 月播出的單集。

{{< apple-podcast "tw/podcast/dario-amodei-the-highest-stakes-financial-model-in-history/id1516093381?i=1000749621800" >}}

封面圖

在一場主要討論 AI 擴展定律和地緣政治的長訪談裡，Dario Amodei 花了不少時間談三個看似比較「軟」的話題：一個內部工具如何變成產品、AI 的行為準則該怎麼設計、以及他如何管理一家 2,500 人的公司。但聽完之後會發現，這三件事其實是 Anthropic 競爭力的底層結構，比任何技術突破都更難被複製。

Claude Code：從內部工具到產品的意外旅程

Claude Code 的故事是一個教科書級的「狗食效應」（dogfooding）案例。2025 年初，Amodei 鼓勵 Anthropic 的員工嘗試用自家的編碼模型來加速研究工作。一個最初叫做 Claude CLI 的命令列工具開始在公司內部流傳，然後迅速被大量採用。2,500 名員工中，有數百人每天都在用它寫程式碼。

Amodei 看到內部採用率後做了一個判斷：如果這個工具在 Anthropic 內部已經達到了產品市場契合（product-market fit），而 Anthropic 的工程師恰好就是目標用戶群的代表，那就值得對外推出。這個推理很簡單，但很多公司做不到，因為多數公司的員工和目標用戶之間存在巨大的差距。Anthropic 的特殊之處在於：打造模型的人同時也是模型最嚴苛的使用者。

這創造了一個獨特的回饋循環。工程師在用 Claude Code 寫改進 Claude 模型的程式碼，模型變強了，Claude Code 也變強了，工程師的效率提高了，又能更快地改進模型。Amodei 描述這個循環為 Anthropic 逐漸增長的競爭優勢。半年前這個優勢是 5%，現在是 15% 到 20%，而且持續擴大。

但他也坦承，目前擁有最好編碼模型的公司並沒有因此拉開決定性差距。這看似矛盾，其實不然。問題出在「端到端」。寫程式碼只是軟體開發的一個環節，前面有需求理解、架構設計，後面有測試、部署、維運。AI 在中間環節（寫程式碼本身）的加速效果很明顯，但瓶頸往往在它上下游的環節。這就是阿姆達爾定律的實際體現：你加速了最快的部分，但整體速度受限於最慢的部分。

API 模式比你想的更持久

討論 Claude Code 自然延伸到了 Anthropic 的商業模式。有一個常見的質疑：隨著 AI 模型越來越商品化，API 服務的利潤空間是不是會被壓縮到零？Amodei 認為不會，而且原因比多數人想的更有趣。

他的論點是：永遠有一個「新能力啟用」的邊界在往外擴展。昨天 AI 做不到的事情，今天勉強做得到，明天做得很好。在這個邊界上，新的使用案例不斷湧現，而這些新案例願意付出的價格遠高於已經成熟的舊案例。一個客服機器人每個 token 的價值和一個藥物分子設計系統每個 token 的價值，差距可能是百倍甚至千倍。

這意味著 AI 的商業模式不會停留在「按 token 計費」。Amodei 預期會出現「按結果計費」和「類似勞動力定價」的模式。如果一個 AI 系統能幫你省下一個年薪兩百萬的資深工程師的 30% 工時，你願意付多少？答案不是幾千個 token 的費用，而是幾十萬的年訂閱。

這個邏輯跟雲端運算的發展軌跡很像。早期的雲服務也是按資源（CPU、記憶體、頻寬）計費，後來演變成按服務層級（SaaS、PaaS）計費，最終變成按業務價值計費。AI 服務正在走同樣的路，只是速度快得多。

AI 憲法：原則優於規則

Amodei 花了不少時間解釋 Anthropic 如何設計 Claude 的行為準則，也就是所謂的「AI 憲法」（AI constitution）。核心洞見是：基於原則的指引比基於規則的指引效果更好。

規則的問題在於邊界情況。你可以列出一千條「不能做的事」，但永遠會遇到第一千零一種情況。而且規則之間可能互相矛盾，模型在面對衝突的規則時會產生不一致的行為。原則就不一樣了。「尊重人類的自主性」是一個原則，它能引導模型在無數種情境中做出合理的判斷，因為模型可以從原則出發進行推理，而不是在規則列表中搜尋匹配。

Amodei 把 Claude 的行為定位為「大部分可控」（mostly corrigible），同時設有不可跨越的硬性底線。「大部分可控」的意思是，Claude 在絕大多數情況下會遵循使用者的指示，即使使用者的要求聽起來有點奇怪。但在涉及「真正危險的行動」（如協助製造生物武器、大規模網路攻擊）時，無論使用者怎麼要求，模型都不會配合。

這套系統透過三個回饋循環持續精進。第一個循環是 Anthropic 內部的迭代：公司內部不斷訓練、測試、修正，然後公開更新版本讓外界檢視。第二個循環是公司之間的競爭：不同 AI 公司的不同「憲法」被擺在一起比較，外部觀察者可以指出各家的優劣，形成一種軟性的市場壓力。第三個循環是更廣泛的社會輸入：包括公眾意見、學術研究、甚至未來可能包括民選政府的參與。

Amodei 指出一個微妙的問題：目前的立法程序太慢了，跟不上 AI 的發展速度。但他也不認為應該因此完全排除政府的角色。他的想法更接近於一種漸進式的參與：先從產業自律和透明度開始，隨著技術和社會的理解加深，逐步引入更正式的治理機制。

40% 的時間用在文化上

訪談尾聲的一個細節引起了注意。Amodei 透露他大約把 40% 的時間花在公司文化上。對一家技術驅動的 AI 公司來說，這個比例高得驚人。

他具體做的事情之一是每兩週舉辦一次「Dario Vision Quest」（DVQ），這是一個面向全公司的一小時演講。他會準備一份三到四頁的文件，涵蓋內部進展、模型進步、產品動態、產業趨勢和地緣政治。這個名字不是他取的，而是員工自發命名的。Amodei 還維護了一個 Slack 頻道用來做透明的內部溝通。

他做這些事的原因很明確：在 AI 產業的極端壓力下，公司文化是最容易崩壞的東西，但也是最重要的東西。他暗示（沒有點名）某些競爭對手正在經歷「內部去相干」（internal decoherence），也就是團隊方向不一致、內部政治消耗精力、核心人才流失。Anthropic 的優勢不只是技術，更是團隊的凝聚力和方向一致性。

他強調的文化特質是「激進誠實」（radical honesty）。不搞公關辭令，不在內部用冠冕堂皇的話掩蓋問題。如果模型有缺陷就直說，如果競爭對手某個方面做得更好也直說。這聽起來簡單，但在一家估值 3,800 億美元、全世界都在盯著看的公司裡，保持這種坦率需要持續的紀律。

歷史會最難理解的三件事

在訪談接近尾聲時，Patel 問了一個有趣的問題：未來的歷史學家會最難理解我們這個時代的什麼？Amodei 的回答提供了一個罕見的自我反思視角。

第一，他認為歷史學家會很難理解，為什麼 AI 泡沫之外的世界如此缺乏危機感。在 AI 產業內部，人們每天都在與時間賽跑，相信自己正在打造可能改變人類文明的技術。但走出這個圈子，多數人對此毫無感覺。等到 AI 真的發生了，事後看來一切都是「必然的」，但身處其中的人知道這從來不是必然。

第二，做出最重要決策的是一小群極其特殊的人，而外界幾乎不知道這些人是誰、他們在想什麼。AI 發展的方向可能在幾場內部會議中就被決定了，但這些會議的參與者可能只有十幾個人。

第三，速度。最關鍵的決定可能只花了兩分鐘。他半開玩笑地描述了一個場景：有人走進他辦公室說「Dario，你有兩分鐘，我們應該做 A 還是 B？」他回答「我不知道，我得去吃午餐了，做 B 吧。」然後那個決定成了「有史以來影響最深遠的事」。

這段話的價值不在於它的字面意義，而在於它揭示的心態。在指數變化的環境中，完美的決策流程是奢侈品。你能做的是建立一個文化，讓組織中的每個人在必須快速決策時，都有足夠的共識和判斷力做出合理的選擇。這也許是 Amodei 把 40% 時間花在文化上的真正原因。

我的觀察：自己用自己做的東西，這件事有多稀缺

Claude Code 從內部工具到外部產品的故事，聽起來理所當然，但回頭看整個 AI 產業，你會發現這件事其實非常稀缺。大部分 AI 公司的員工並不是自己產品的重度使用者。OpenAI 的員工不見得每天都用 ChatGPT 來完成核心工作，Google 的 Gemini 團隊也不見得把 Gemini 當作主要開發工具。

Anthropic 的狀況不同，因為他們的核心工作（AI 研究和工程）恰好就是 AI 編碼工具的最佳使用場景。這不是刻意設計的，而是一個幸運的巧合加上正確的執行。Amodei 的判斷力在於他看到了這個巧合的價值，並且決定把它變成產品。

對於正在用各種 AI 工具的開發者來說，這提供了一個有用的判斷框架：這個工具的開發者自己有在用嗎？用得多深？如果一家公司的員工是自己產品最嚴苛的用戶，這通常是產品品質的最強信號。反過來，如果開發者自己都不用自己的工具，那你應該想想為什麼。