自願審查能管住 AI 嗎?川普行政命令的承諾與漏洞

川普簽署 AI 行政命令,建立前沿模型的自願審查機制與網路安全情報交換中心。行政命令明確排除強制許可,但批評者認為自願框架無法因應 AI 快速演進的安全風險。外交關係委員會專家指出關鍵實施缺口:找到漏洞容易,修補才是真正的難題。

自願審查能管住 AI 嗎?川普行政命令的承諾與漏洞

兩週前,我們才寫過川普政府正在討論 AI 審查機制的消息。當時的重點是「方向確認」:那個說 AI 是漂亮寶寶、不需要管的總統,開始認真考慮讓政府在模型上市前先看一眼。6 月 2 日,行政命令正式簽署了。但細讀內容之後,真正的問題才浮出來:這份命令的每一條規定都是「自願性」的。一個自願性的框架,到底能不能管住全世界最強大的 AI 模型?

三根支柱,一個核心邏輯

這份名為「促進先進人工智慧創新與安全」的行政命令,結構上可以拆成三個部分。第一部分是強化聯邦政府自身的網路防禦能力,要求國家安全系統、戰爭部(即原國防部,川普上任後更名)和民用聯邦系統在 30 天內優先部署 AI 驅動的資安防護工具。第二部分建立「前沿模型」的自願審查機制,由財政部、國家安全局和網路安全暨基礎設施安全局(CISA)在 60 天內制定基準測試流程,讓業者自願提交最強大的模型供政府預先評估。第三部分則是刑事執法,指示司法部長優先起訴利用 AI 進行未經授權電腦存取的犯罪行為。

三個部分看起來各自獨立,但背後有一條統一的邏輯:政府要成為 AI 能力的「優先使用者」,而非「許可核發者」。行政命令的措辭非常刻意,在多處強調這些措施「不得被解釋為授權建立任何強制性的政府許可、預審或審批要求」。白宮的算盤很清楚,用合作取代管制,用誘因取代禁令。AI 開發商如果自願提交模型,可以獲得政府的「受信任夥伴」身分和分類安全情報。如果不願意,也沒有任何法律後果。

這套邏輯的吸引力在於它理論上能讓政府和業界雙贏。政府提早 30 天看到最新模型,可以部署防禦、發現漏洞。業者則換到一張進入政府供應鏈的門票,以及一份「經過審查」的信譽背書。但這也引出了一個根本性的問題:如果參與是自願的,那些最需要被審查的模型,會不會恰好來自最不願意接受審查的開發者?

找到漏洞容易,修補才是難題

行政命令中另一個亮點是建立 AI 網路安全情報交換中心。這個由財政部主導的機構,會與 AI 業者和關鍵基礎設施營運商合作,利用 AI 技術大規模掃描軟體漏洞,然後將發現的問題回報給受影響的單位。行政命令還特別提到,CISA 的指引範圍要擴及州政府、地方政府,以及鄉村醫院、社區銀行、公用事業等資源有限的機構。

這個構想在紙面上很漂亮,但美國外交關係委員會(CFR)國家安全研究員 Matthew Ferren 的分析點出了關鍵盲點。他指出,這份行政命令本質上是在「製造一個網路安全的機會窗口」,讓防禦方優先取得前沿 AI 能力,拉開與攻擊方的時間差。問題是,找到漏洞往往是容易的部分,真正難的是持續修補。一家資源充沛的科技公司收到漏洞通報,可能在幾天內就完成修補。但一家鄉村醫院或學區呢?它們可能連專職的 IT 人員都沒有,更別說在 30 天內完成複雜的安全更新。

這不是假設性的擔憂。美國聯邦政府近年大幅裁減網路安全人力,而行政命令雖然提到要擴大「科技部隊」(Tech Force)的招聘,但只給了 60 天的期限來「擴大招聘管道」,並沒有附帶具體的預算承諾。Ferren 直言,制度性的人力約束限制了協調能力。換句話說,就算 AI 能以前所未有的速度找到漏洞,如果基層沒有足夠的人力和資源來修補,這個情報交換中心的效果會大打折扣。

自願框架的支持者與反對者

業界對這份行政命令的反應呈現明顯的分化。軟體資訊產業協會(SIIA)執行副總裁 Paul Lekas 公開「讚許」自願框架,認為這是政府與產業合作的正確方式。這並不意外。對大型 AI 開發商來說,自願審查代表它們可以自行決定參與的程度和條件,比起強制監管,這是一個好得多的結果。

但安全倡議者的態度截然不同。非營利組織 Alliance for Secure AI 執行長 Brendan Steinhauser 直接表示,自願審查不足以處理前沿模型帶來的網路安全風險。他呼籲國會將行政命令的內容立法化,建立強制性的政府審查機制。他的論點很簡單:如果這些模型真的像政府自己說的那樣具有國家安全等級的風險,為什麼應對措施卻是「請業者自願配合」?

維吉尼亞州民主黨參議員 Mark Warner 的批評更為尖銳。他認為這份行政命令代表川普政府「遲來的理解」,終於意識到自己先前拆除的那些安全機制是有必要的。Warner 指的是川普上任初期廢除拜登時代 AI 安全行政命令的決定。當時川普政府認為那些要求開發商進行安全評估的規定是不必要的官僚障礙,會拖慢美國 AI 的發展。現在,同一個政府回頭建立了自己的審查版本,只不過少了牙齒。

這場爭論的核心其實不是技術問題,而是治理哲學的根本分歧。川普政府從始至終的立場是「不挑選贏家和輸家」,讓市場力量引導 AI 發展。行政命令的 Fact Sheet 明確將自己與「拜登政府由上而下的監管路線」做區隔。但批評者認為,當一項技術的風險已經到了連開發者自己都害怕的程度,市場機制就不再是充分的安全保障。Anthropic 在今年四月選擇封存 Claude Mythos 模型的決定,就是這個論點最有力的佐證。

前沿 AI 的速度,制度追不上

CFR 資深 AI 研究員 Vinh Nguyen 則把問題拉到了更根本的層次。他指出,前沿 AI 系統的能力「以月為單位推進,而非以年為單位」,但制度建設的速度遠遠跟不上。行政命令給了 30 到 60 天的時間表來建立各種機制,但這些機制能否跟上 AI 能力的演進速度,是一個完全不同的問題。

Nguyen 還提出了一個他稱之為「可觀測性悖論」的概念。政府無法評估它看不見的能力。自願提交機制的設計初衷,就是要解決這個透明度問題。但如果提交是自願的,政府永遠只能看到業者願意讓它看到的東西。真正令人擔憂的能力,可能恰好存在於政府視野之外。

更棘手的是,預部署測試有其天然的局限性。一個模型在受控環境中的表現,不等於它在真實世界中被數百萬使用者以各種創意方式使用後的表現。而且,封閉模型的能力可能很快就會透過開源替代品被複製。政府花 30 天審查一個商業模型,但同等級的能力可能已經透過開源社群擴散了。

這份行政命令是川普政府 AI 政策的第五道重要命令,加上 2025 年七月的 AI 行動計畫、同月的反 AI 偏見命令、去年十二月的州法規預防命令,以及今年三月的國家網路戰略,構成了一套以「促進創新、避免過度監管」為主軸的政策框架。但 Nguyen 觀察到一個尚未解決的緊張關係:去管制化、政府控制和風險緩解這三個目標之間,存在戰略上的模糊性。這份行政命令試圖同時滿足三者,但長期來看,它們之間的衝突可能會越來越難以調和。

對臺灣的 AI 產業觀察者來說,這份行政命令傳遞的訊號值得注意。全球最大的 AI 市場選擇了一條「自願合作」的路線,這意味著至少在短期內,美國的 AI 開發商不會面臨歐盟《AI 法案》那種程度的合規壓力。但這也意味著,如果自願機制最終被證明無效,鐘擺可能會猛烈擺向另一個方向。到那時候,匆忙出臺的強制法規可能比一開始就設計好的框架更難預測、也更難適應。