AI 安全與治理

「棄權不是道德中立的決定」：Anthropic 拒絕 Maven 與自主武器責任之爭

Anthropic 因為堅持 Claude 在 Maven 計畫裡必須有人類監督，被五角大廈列為供應鏈風險。Anduril 共同創辦人 Stephens 反駁：方陣近迫武器系統已經自主四十年，責任歸屬從來不是「人在迴路」，而是「誰負責」。

2026 年 5 月 3 日 · 來源： All-In Podcast

「棄權不是道德中立的決定」：Anthropic 拒絕 Maven 與自主武器責任之爭

封面圖

本文整理自 All-In Podcast 2026 年 4 月播出的單集，錄製於華府 Hill & Valley Forum。

Anthropic 拒絕 Maven，五角大廈把它列為供應鏈風險

Anthropic 在 Maven 計畫上踩的那條線，可能是這幾年 AI 倫理議題上最被忽視的一場真實衝突。Maven 是美國國防部的旗艦級 AI 計畫，最初的目的是用電腦視覺分析無人機回傳的影像。Anthropic 在這個合作中堅持一條紅線：Claude 的能力可以用，但必須有人類監督介入每一個關鍵決策節點，不能讓模型直接驅動自主行動。聽起來這是合理的安全取向，至少在 AI 倫理圈內幾乎沒有人會反對。

但五角大廈的回應出乎很多人意料。國防部直接把 Anthropic 標記為「供應鏈風險」（supply-chain risk）。這個標籤的意思是：你這家公司的服務不能被視為國防部可以放心倚賴的關鍵基礎設施，因為當衝突真的發生時，你可能會在最關鍵的時刻基於你自己的內部倫理規範拒絕履約。這個風險定義不是針對技術品質，是針對「政策不確定性」。一個拒絕在沒有人類監督下執行 AI 任務的供應商，從採購方的角度看，跟一個會在關鍵時刻決定罷工的供應商沒有本質差別。

這場衝突真正令人不舒服的地方，不在於誰對誰錯，而在於它把一個過去被刻意模糊化的問題逼到了檯面上：當 AI 公司決定不替政府做某件事時，這個決策本身的政治性質是什麼？Anduril 共同創辦人 Trae Stephens 在 All-In Podcast 上的回應極為直接，他用了一句非常重的話：棄權，不是一個道德中立的決定。當你決定不參與某項國家安全相關技術的建構時，你就已經在道德天平上放下了你那一邊的砝碼，只是這個砝碼的後果可能要等到很久之後才會結帳。

方陣近迫武器系統：已經自主了四十年的反例

Stephens 反駁「自主武器有違倫理」這個直覺式論點時，搬出一個讓很多 AI 倫理討論者沒有準備好的歷史事實：完全自主的武器系統不是什麼新事物，方陣近迫武器系統（Phalanx CIWS，又稱「海方陣」SeaWiz）已經部署在美國海軍艦艇上超過四十年了。這套系統的工作原理是雷達自動偵測來襲飛彈或飛機，自動鎖定，自動射擊，速度遠遠超過任何人類反應時間。在那 1.5 秒內，沒有人能真的「在迴路裡」做決定。

但這套系統並沒有因此被視為失控的殺人機器，原因很簡單：它在部署設計階段就把責任歸屬寫進了組織結構裡。任何方陣系統射出的每一發子彈，最終的責任都歸屬於那艘船的艦長。艦長必須決定何時啟動系統、何時關閉、在什麼接戰規則下運作，並對系統的所有行為負法律與道德責任。這個責任鏈條不是後來補上的合規文件，是從方陣系統第一天上船就存在的設計前提。

Stephens 借這個歷史例子，把 AI 倫理討論的提問方式整個翻過來。他認為當代爭議經常陷入一個錯誤的問題：人類有沒有在迴路裡（human-in-the-loop）。這個提問把焦點放在介入點的時序上，但真正重要的問題不是時序，是責任歸屬：誰要為這個系統的行為負責？這個責任能不能被追溯、被起訴、被問責？只要這條責任線是清楚的，自主程度本身就不是道德的核心爭點。如果這條責任線是模糊的，那即使有十層人類審核也無法解決根本問題。

從「人在迴路」到「誰來負責」

把問題從「人在迴路」移到「誰來負責」，是 Stephens 與 Sankar 整段倫理討論裡最值得深思的視角轉換。Stephens 接著推了一步：在某些情境下，AI 驅動的精準打擊在道德上反而比沒有 AI 的傳統作戰更可接受。理由是精準度本身就是倫理的重要維度。如果你的選擇是用一架 AI 加持的偵察打擊系統去精準命中一個軍事目標，或是用一波 1980 年代風格的城市轟炸來摧毀同一個目標，前者造成的平民傷亡可能少了兩個數量級。這時候拒絕使用 AI，等於選擇了那個傷亡更高的方案。

這個論點當然有它的爭議點。AI 的精準度依賴訓練資料和模型可靠性，而戰場本身就是一個分布外（out-of-distribution）的高度動態環境。但 Stephens 的論點不是說 AI 永遠正確，而是說在已經決定要使用武力的前提下，引入 AI 通常會讓打擊更精準、附帶損害更少、決策更可追溯。這個前提條件很重要：他不是在主張更多戰爭，而是在說既然戰爭已經開打，越精準的工具越符合戰爭法的「相稱原則」。

更深一層的論點，是責任結構本身能怎麼被工程化。Stephens 認為下一代自主武器系統的設計重點，不是要不要讓人類按下每一個按鈕，而是要讓系統的每一個動作都能被回溯、被審計、被問責到具體的個人或單位。這跟方陣系統的艦長責任制是同一個思路的延伸。當一套自主武器系統的決策鏈、訓練資料來源、接戰規則設定、現場部署授權都能被完整追溯時，責任就有了具體的對象。當這條鏈條是模糊的，那才是真正的倫理問題所在。

Excel 不是監視工具：Palantir 對自己被誤解的反擊

Palantir 在公眾形象上承受的批評，跟 Anthropic 是另一個版本的鏡像。多年來 Palantir 被外界貼上「監視國家的核心承包商」這類標籤，Sankar 在這場對話裡終於有機會把話講開。他的反駁很直白：要把 Palantir 形容成監視工具，就跟把 Excel 形容成監視工具一樣不準確。Palantir 自己不收集任何資料，它做的是把客戶基於合法授權收集到的資料整合在一起，讓客戶能夠在這些資料上做決策。

Sankar 引用 Palantir 執行長卡普（Alex Karp）一個經常被引用的描述：Palantir 是世界上最不適合做違法事情的平台。原因是這套系統內建了極為嚴密的稽核軌跡，每一次資料調用、每一次跨資料庫的關聯查詢、每一個權限授予，都會留下不可竄改的紀錄。如果有人想要利用 Palantir 平台做違法的監視或資料濫用，他會留下大量到極致的證據鏈，最後一定會被抓到。這個設計選擇是刻意的：與其依賴後端的人工監督，不如把可問責性內建進技術架構本身。

Sankar 還補了一個經常被忽視的問題：當客戶真的用你的工具去做違法的事情時，你該怎麼辦？他和 Stephens 的答案是同一個：去找監察長（Inspector General）。每一個美國聯邦機構內部都有一個獨立法定設置的監察長辦公室，可以接受匿名投訴、無拘束地調查機關內部的不當行為。這個機制存在已久，是民主體制裡內建的問責管道，並不需要由廠商自己充當道德警察。當然這套機制有時候也會被濫用，Sankar 提到 Maven 計畫的創辦人庫科爾（Drew Cukor）就曾被惡意指控在自己根本沒有的地下室裡藏匿非法移民，海軍犯罪調查處還真的進去查了。但機制存在這件事本身，就否定了「除了讓廠商拒絕承包之外沒有別的辦法」這個前提。

西奧多．霍爾：當好意把世界推進地獄

Sankar 在這段討論裡丟出的最沉重的一個歷史例子，是西奧多．霍爾（Theodore Hall）。1944 年，18 歲的霍爾還是哈佛物理系學生，當時正在參與曼哈頓計畫。他自己走進紐約的蘇聯貿易代表處，把原子彈的關鍵技術交給了蘇聯。他的動機不是金錢，不是仇恨美國，而是一個聽起來甚至有點崇高的信念：他覺得如果只有美國一家擁有核彈，世界會失去平衡；如果美蘇雙方都有核彈，那麼任何一方都不敢發動核戰，世界反而會走向和平。

Sankar 的論斷不留情面：1949 年蘇聯成功試爆第一顆原子彈之後，每一個死於共產主義擴張的人，責任都應該回算到霍爾身上。從韓戰、越戰、柬埔寨大屠殺，到後來中國文革與蘇聯古拉格的那些死亡數字，霍爾用他 18 歲的「好意」啟動了一條漫長的因果鏈。而霍爾本人從來沒有為這些後果付出代價，他在學術界平安地度過了餘生，蘇聯的檔案要到 1990 年代才解密揭露他的角色。

Sankar 把霍爾的故事拉到當下的科技倫理討論，命名為「對技術兄弟的暴政」（tyranny by tech bro）。他的論點是：當一小群沒有民選授權、沒有公共問責機制的科技工作者，憑藉自己對倫理的私人判斷，去決定一個民主國家在國家安全相關技術上能做什麼、不能做什麼，這本身就是一種微型專制。這群人可能完全是出於好意，就像霍爾當年一樣，但他們的決定會在民主體制的合法授權之外，把整個國家的維權空間切薄一層又一層。Sankar 把這個動作稱為「臘腸切片」（salami slicing）：每一片單獨看都很合理，疊起來就是一個被技術團體單方面壓縮過的民主決策空間。

我的觀察：對台灣 AI 產業的兩個直接啟示

這場對話對台灣 AI 產業的第一個啟示，是不能再把「我們不做國防」當成一個可以乾乾淨淨切開的選擇。Stephens 那句「棄權不是道德中立的決定」，邏輯上同樣適用於台灣。台灣的地緣政治位置決定了我們不可能假裝跟全球 AI 軍備競賽無關，無論你是做晶片代工、做模型微調、做資料標註、做企業整合，都已經在這條供應鏈的某個節點上。真正的問題不是「要不要參與」，是「以什麼條件參與、用什麼樣的責任結構去界定參與的邊界」。

第二個啟示更實務。Stephens 把焦點從「人在迴路」拉到「誰來負責」，這個視角轉換對任何要落地企業 AI 的台灣公司都極具參考價值。當一家銀行、一家醫院、一家製造廠導入生成式 AI 進入決策流程時，真正有意義的問題從來不是「人類有沒有按下最後那個按鈕」，因為按按鈕的那個人多半也只是在依賴 AI 的建議。真正有意義的問題是：當這個決策出錯時，責任能不能被追溯到具體的人、具體的訓練資料、具體的系統設定？如果這條鏈條是清楚的，那麼即使部分流程被自動化也是可以接受的。如果這條鏈條是模糊的，即使表面上保留了人類審核也只是儀式。

Sankar 用霍爾的故事提出的那個更深的問題，則是給整個產業的：當你以為自己在拯救世界的時候，你有沒有問過自己，誰授權你做這個決定？這個問題不分立場，不分公司大小，不分國別。台灣這幾年在 AI 監管上開始有自己的討論，從生成式 AI 行政指引到 AI 基本法草案，公共領域的辯論才剛剛起步。這場 All-In Podcast 上的爭論可以當成一面鏡子，提醒我們：好的 AI 治理既不是把所有事都交給政府，也不是讓技術公司自己當道德裁判，而是建立一套讓責任能夠真的落地、真的被追究的機制。當這套機制存在時，自主程度與精準度才有資格成為被討論的細節。當這套機制不存在時，討論再多倫理原則都只是裝飾。