「棄權不是道德中立的決定」:Anthropic 拒絕 Maven 與自主武器責任之爭

Anthropic 因為堅持 Claude 在 Maven 計畫裡必須有人類監督,被五角大廈列為供應鏈風險。Anduril 共同創辦人 Stephens 反駁:方陣近迫武器系統已經自主四十年,責任歸屬從來不是「人在迴路」,而是「誰負責」。

「棄權不是道德中立的決定」:Anthropic 拒絕 Maven 與自主武器責任之爭

封面圖

本文整理自 All-In Podcast 2026 年 4 月播出的單集,錄製於華府 Hill & Valley Forum。

{{< youtube mjNP5IOzCbA >}}


Anthropic 拒絕 Maven,五角大廈把它列為供應鏈風險

Anthropic 在 Maven 計畫上踩的那條線,可能是這幾年 AI 倫理議題上最被忽視的一場真實衝突。Maven 是美國國防部的旗艦級 AI 計畫,最初的目的是用電腦視覺分析無人機回傳的影像。Anthropic 在這個合作中堅持一條紅線:Claude 的能力可以用,但必須有人類監督介入每一個關鍵決策節點,不能讓模型直接驅動自主行動。聽起來這是合理的安全取向,至少在 AI 倫理圈內幾乎沒有人會反對。

但五角大廈的回應出乎很多人意料。國防部直接把 Anthropic 標記為「供應鏈風險」(supply-chain risk)。這個標籤的意思是:你這家公司的服務不能被視為國防部可以放心倚賴的關鍵基礎設施,因為當衝突真的發生時,你可能會在最關鍵的時刻基於你自己的內部倫理規範拒絕履約。這個風險定義不是針對技術品質,是針對「政策不確定性」。一個拒絕在沒有人類監督下執行 AI 任務的供應商,從採購方的角度看,跟一個會在關鍵時刻決定罷工的供應商沒有本質差別。

這場衝突真正令人不舒服的地方,不在於誰對誰錯,而在於它把一個過去被刻意模糊化的問題逼到了檯面上:當 AI 公司決定不替政府做某件事時,這個決策本身的政治性質是什麼?Anduril 共同創辦人 Trae Stephens 在 All-In Podcast 上的回應極為直接,他用了一句非常重的話:棄權,不是一個道德中立的決定。當你決定不參與某項國家安全相關技術的建構時,你就已經在道德天平上放下了你那一邊的砝碼,只是這個砝碼的後果可能要等到很久之後才會結帳。

方陣近迫武器系統:已經自主了四十年的反例

Stephens 反駁「自主武器有違倫理」這個直覺式論點時,搬出一個讓很多 AI 倫理討論者沒有準備好的歷史事實:完全自主的武器系統不是什麼新事物,方陣近迫武器系統(Phalanx CIWS,又稱「海方陣」SeaWiz)已經部署在美國海軍艦艇上超過四十年了。這套系統的工作原理是雷達自動偵測來襲飛彈或飛機,自動鎖定,自動射擊,速度遠遠超過任何人類反應時間。在那 1.5 秒內,沒有人能真的「在迴路裡」做決定。

但這套系統並沒有因此被視為失控的殺人機器,原因很簡單:它在部署設計階段就把責任歸屬寫進了組織結構裡。任何方陣系統射出的每一發子彈,最終的責任都歸屬於那艘船的艦長。艦長必須決定何時啟動系統、何時關閉、在什麼接戰規則下運作,並對系統的所有行為負法律與道德責任。這個責任鏈條不是後來補上的合規文件,是從方陣系統第一天上船就存在的設計前提。

Stephens 借這個歷史例子,把 AI 倫理討論的提問方式整個翻過來。他認為當代爭議經常陷入一個錯誤的問題:人類有沒有在迴路裡(human-in-the-loop)。這個提問把焦點放在介入點的時序上,但真正重要的問題不是時序,是責任歸屬:誰要為這個系統的行為負責?這個責任能不能被追溯、被起訴、被問責?只要這條責任線是清楚的,自主程度本身就不是道德的核心爭點。如果這條責任線是模糊的,那即使有十層人類審核也無法解決根本問題。

從「人在迴路」到「誰來負責」

把問題從「人在迴路」移到「誰來負責」,是 Stephens 與 Sankar 整段倫理討論裡最值得深思的視角轉換。Stephens 接著推了一步:在某些情境下,AI 驅動的精準打擊在道德上反而比沒有 AI 的傳統作戰更可接受。理由是精準度本身就是倫理的重要維度。如果你的選擇是用一架 AI 加持的偵察打擊系統去精準命中一個軍事目標,或是用一波 1980 年代風格的城市轟炸來摧毀同一個目標,前者造成的平民傷亡可能少了兩個數量級。這時候拒絕使用 AI,等於選擇了那個傷亡更高的方案。

這個論點當然有它的爭議點。AI 的精準度依賴訓練資料和模型可靠性,而戰場本身就是一個分布外(out-of-distribution)的高度動態環境。但 Stephens 的論點不是說 AI 永遠正確,而是說在已經決定要使用武力的前提下,引入 AI 通常會讓打擊更精準、附帶損害更少、決策更可追溯。這個前提條件很重要:他不是在主張更多戰爭,而是在說既然戰爭已經開打,越精準的工具越符合戰爭法的「相稱原則」。

更深一層的論點,是責任結構本身能怎麼被工程化。Stephens 認為下一代自主武器系統的設計重點,不是要不要讓人類按下每一個按鈕,而是要讓系統的每一個動作都能被回溯、被審計、被問責到具體的個人或單位。這跟方陣系統的艦長責任制是同一個思路的延伸。當一套自主武器系統的決策鏈、訓練資料來源、接戰規則設定、現場部署授權都能被完整追溯時,責任就有了具體的對象。當這條鏈條是模糊的,那才是真正的倫理問題所在。

Excel 不是監視工具:Palantir 對自己被誤解的反擊

Palantir 在公眾形象上承受的批評,跟 Anthropic 是另一個版本的鏡像。多年來 Palantir 被外界貼上「監視國家的核心承包商」這類標籤,Sankar 在這場對話裡終於有機會把話講開。他的反駁很直白:要把 Palantir 形容成監視工具,就跟把 Excel 形容成監視工具一樣不準確。Palantir 自己不收集任何資料,它做的是把客戶基於合法授權收集到的資料整合在一起,讓客戶能夠在這些資料上做決策。

Sankar 引用 Palantir 執行長卡普(Alex Karp)一個經常被引用的描述:Palantir 是世界上最不適合做違法事情的平台。原因是這套系統內建了極為嚴密的稽核軌跡,每一次資料調用、每一次跨資料庫的關聯查詢、每一個權限授予,都會留下不可竄改的紀錄。如果有人想要利用 Palantir 平台做違法的監視或資料濫用,他會留下大量到極致的證據鏈,最後一定會被抓到。這個設計選擇是刻意的:與其依賴後端的人工監督,不如把可問責性內建進技術架構本身。

Sankar 還補了一個經常被忽視的問題:當客戶真的用你的工具去做違法的事情時,你該怎麼辦?他和 Stephens 的答案是同一個:去找監察長(Inspector General)。每一個美國聯邦機構內部都有一個獨立法定設置的監察長辦公室,可以接受匿名投訴、無拘束地調查機關內部的不當行為。這個機制存在已久,是民主體制裡內建的問責管道,並不需要由廠商自己充當道德警察。當然這套機制有時候也會被濫用,Sankar 提到 Maven 計畫的創辦人庫科爾(Drew Cukor)就曾被惡意指控在自己根本沒有的地下室裡藏匿非法移民,海軍犯罪調查處還真的進去查了。但機制存在這件事本身,就否定了「除了讓廠商拒絕承包之外沒有別的辦法」這個前提。

西奧多.霍爾:當好意把世界推進地獄

Sankar 在這段討論裡丟出的最沉重的一個歷史例子,是西奧多.霍爾(Theodore Hall)。1944 年,18 歲的霍爾還是哈佛物理系學生,當時正在參與曼哈頓計畫。他自己走進紐約的蘇聯貿易代表處,把原子彈的關鍵技術交給了蘇聯。他的動機不是金錢,不是仇恨美國,而是一個聽起來甚至有點崇高的信念:他覺得如果只有美國一家擁有核彈,世界會失去平衡;如果美蘇雙方都有核彈,那麼任何一方都不敢發動核戰,世界反而會走向和平。

Sankar 的論斷不留情面:1949 年蘇聯成功試爆第一顆原子彈之後,每一個死於共產主義擴張的人,責任都應該回算到霍爾身上。從韓戰、越戰、柬埔寨大屠殺,到後來中國文革與蘇聯古拉格的那些死亡數字,霍爾用他 18 歲的「好意」啟動了一條漫長的因果鏈。而霍爾本人從來沒有為這些後果付出代價,他在學術界平安地度過了餘生,蘇聯的檔案要到 1990 年代才解密揭露他的角色。

Sankar 把霍爾的故事拉到當下的科技倫理討論,命名為「對技術兄弟的暴政」(tyranny by tech bro)。他的論點是:當一小群沒有民選授權、沒有公共問責機制的科技工作者,憑藉自己對倫理的私人判斷,去決定一個民主國家在國家安全相關技術上能做什麼、不能做什麼,這本身就是一種微型專制。這群人可能完全是出於好意,就像霍爾當年一樣,但他們的決定會在民主體制的合法授權之外,把整個國家的維權空間切薄一層又一層。Sankar 把這個動作稱為「臘腸切片」(salami slicing):每一片單獨看都很合理,疊起來就是一個被技術團體單方面壓縮過的民主決策空間。

我的觀察:對台灣 AI 產業的兩個直接啟示

這場對話對台灣 AI 產業的第一個啟示,是不能再把「我們不做國防」當成一個可以乾乾淨淨切開的選擇。Stephens 那句「棄權不是道德中立的決定」,邏輯上同樣適用於台灣。台灣的地緣政治位置決定了我們不可能假裝跟全球 AI 軍備競賽無關,無論你是做晶片代工、做模型微調、做資料標註、做企業整合,都已經在這條供應鏈的某個節點上。真正的問題不是「要不要參與」,是「以什麼條件參與、用什麼樣的責任結構去界定參與的邊界」。

第二個啟示更實務。Stephens 把焦點從「人在迴路」拉到「誰來負責」,這個視角轉換對任何要落地企業 AI 的台灣公司都極具參考價值。當一家銀行、一家醫院、一家製造廠導入生成式 AI 進入決策流程時,真正有意義的問題從來不是「人類有沒有按下最後那個按鈕」,因為按按鈕的那個人多半也只是在依賴 AI 的建議。真正有意義的問題是:當這個決策出錯時,責任能不能被追溯到具體的人、具體的訓練資料、具體的系統設定?如果這條鏈條是清楚的,那麼即使部分流程被自動化也是可以接受的。如果這條鏈條是模糊的,即使表面上保留了人類審核也只是儀式。

Sankar 用霍爾的故事提出的那個更深的問題,則是給整個產業的:當你以為自己在拯救世界的時候,你有沒有問過自己,誰授權你做這個決定?這個問題不分立場,不分公司大小,不分國別。台灣這幾年在 AI 監管上開始有自己的討論,從生成式 AI 行政指引到 AI 基本法草案,公共領域的辯論才剛剛起步。這場 All-In Podcast 上的爭論可以當成一面鏡子,提醒我們:好的 AI 治理既不是把所有事都交給政府,也不是讓技術公司自己當道德裁判,而是建立一套讓責任能夠真的落地、真的被追究的機制。當這套機制存在時,自主程度與精準度才有資格成為被討論的細節。當這套機制不存在時,討論再多倫理原則都只是裝飾。