AI 安全與治理

90% 模型由企業把持、透明度暴跌、公眾信任新低 — 史丹佛報告揭 AI 治理三重危機

史丹佛 2026 AI Index 報告揭示 AI 治理的三大警訊：超過九成重要模型由私人企業開發，95 個重要模型中 80 個未公開訓練程式碼，僅 31% 美國民眾信任政府的 AI 監管。AI 業者在國會聽證會的出席比例自 2017 年增加三倍，學術界的聲音則大幅萎縮。全球 47 國已有 AI 立法，但僅 12 國建立執法機制。

2026 年 4 月 14 日 · 來源： Stanford HAI

90% 模型由企業把持、透明度暴跌、公眾信任新低 — 史丹佛報告揭 AI 治理三重危機

本文整理自史丹佛以人為本人工智慧研究中心（Stanford HAI）2026 年 4 月發布的第九屆 AI Index 年度報告。

史丹佛 HAI 每年的 AI Index 報告都有很多亮眼的數字，更快的模型、更多的投資、更高的採用率。但今年報告裡最讓人擔心的數字，不在「成長」那幾頁，而在「治理」那幾頁。

三個趨勢正在同時發生：AI 模型的開發權集中在少數企業手中、這些企業的透明度正在快速下降、而公眾對政府監管 AI 的能力信心也跌到新低。這三件事分開看各有各的問題，合在一起看則形成了一個系統性的治理真空：最有影響力的 AI 系統，由最不透明的組織開發，而最該負責監管的政府，卻最不被信任。

90% 的模型，由不透明的企業決定

報告的第一個警訊很直白：目前超過 90% 的重要 AI 模型由私人企業開發。這個比例在過去幾年持續攀升，學術機構的角色正在快速邊緣化。回想 2010 年代初期，很多開創性的 AI 研究出自大學實驗室，從 ImageNet 到 Transformer 架構的早期探索。但現在，當訓練一個前沿模型的成本動輒數億美元時，只有手握大量資金和算力的企業才玩得起這個遊戲。

這不只是「誰出錢」的問題，核心是公共監督能力的問題。AI 模型的開發集中在少數幾家企業手中，訓練資料怎麼蒐集、模型的安全測試做到什麼程度、部署前的風險評估有多嚴謹，基本上都是企業自己說了算。外部研究者想要獨立驗證一個商業模型的安全性，通常連訓練資料的組成都看不到，更別說重現訓練過程了。監管機構的處境更尷尬：他們既缺乏技術專家來理解這些模型的內部運作，也缺乏法律工具來要求企業公開資訊。

更糟糕的是，透明度正在加速崩塌。報告指出，在過去一年發布的 95 個重要 AI 模型中，有 80 個沒有公開訓練程式碼。頂級 AI 公司已經放棄揭露最新模型的資料集規模和訓練時間。這個變化的速度很快：兩三年前，OpenAI、Google 這些公司還會在技術報告中披露模型的基本訓練細節（參數量、資料集大小、訓練時間等）。現在，這些資訊越來越被視為核心商業機密，連基本的數字都不願意公開。

我們甚至無法知道這些模型是用什麼資料訓練的、訓練了多久、消耗了多少算力。退一步想，這個趨勢有它的商業邏輯：當開發成本高達數十億美元，企業自然會把細節藏好。但問題在於，這些模型正在被數十億人使用，影響著從醫療建議到法律判決的各種場景。一個影響力如此巨大的技術，核心運作方式卻完全是黑箱。試想，如果藥廠拒絕揭露藥物的成分和臨床試驗數據，社會會怎麼反應？AI 模型目前享有的「免揭露特權」，在任何其他高風險產業都是不可想像的。

企業的聲音進了國會，學術界被擠到邊緣

模型開發集中在企業手中只是表面。更深的問題是：AI 業者正在系統性地擴大自己在政策制定過程中的影響力，而這個擴張有具體的數據可以佐證。

AI 產業代表在美國國會聽證會中的出席比例，自 2017 年以來增加了三倍，學術界的聲音同步萎縮。九年前，國會聽證會上還能聽到來自大學研究者的獨立觀點，和產業界的聲音形成一定的平衡。現在，國會議員在討論 AI 監管法案時，聽到的觀點越來越多來自被監管的對象本身，獨立研究者的聲音反而被邊緣化了。

這種失衡帶來的具體影響是什麼？當立法者主要從企業那裡獲取 AI 的技術知識時，他們對 AI 風險的理解就會被企業的框架所塑造。企業傾向於強調 AI 的正面效益和經濟價值，對潛在風險的描述則傾向於「技術問題可以用技術解決」的敘事。這不是說企業在刻意誤導，而是每個組織都有自己的利益視角，只聽一邊的聲音必然會得到偏頗的結論。

這種現象不是美國獨有的，但美國的情況特別值得關注，因為美國的 AI 政策選擇往往會成為其他國家的參考框架。歐盟的 AI Act 在立法過程中就大量參考了美國的技術標準和風險分類。如果美國的政策討論被產業利益主導，產出的法規傾向於保護現有玩家的市場地位而非保障公共利益，這個偏差會透過國際參照效應擴散到全球。

報告裡還有一個更深層的觀察讓人不安：AI 系統越來越複雜，能搞懂這些系統的專家越來越少，而這些專家大多在產業界工作。頂級的 AI 安全研究員，年薪動輒數百萬美元，大學和政府根本搶不到人。結果就是一個結構性的知識不對稱：最了解 AI 風險的人，恰好是最沒有動機去公開談論這些風險的人。他們不是不關心公共利益，而是身處企業體系中，發言受到保密協議和企業文化的約束。

31%：公眾信任跌到什麼程度

如果前兩個趨勢讓你覺得政府監管應該趕快跟上，那報告的第三組數字會讓你更不安：只有 31% 的美國民眾信任政府有能力妥善監管 AI。在所有受調查的國家中，只有中國（27%）的數字比美國更低。歐盟民眾的信任度相對較高，達到 53%，可能跟歐盟已經通過並開始實施 AI Act 有關，至少讓民眾覺得「有人在管」。

這個 31% 要放在更大的脈絡裡理解。它反映的不只是對政府技術能力的不信任，更是對整個 AI 治理生態系的信心缺失。民眾一方面對 AI 感到焦慮（52% 表示緊張，只有 23% 認為 AI 對就業有正面影響），一方面又不相信政府能管好這項技術。高度焦慮加上低度信任，是一個危險的組合，往往導致兩種極端：要麼放任不管（反正政府管也管不好），要麼在出事之後矯枉過正，倉促通過過度嚴格的法規。

全球的監管圖景同樣支離破碎。報告指出，目前有 47 個國家已有 AI 相關立法，但只有 12 個國家建立了實際的執法機制。也就是說，七成以上有 AI 法規的國家，法規停留在「紙上」階段，沒有對應的執法人力、技術工具和處罰機制來確保法規被遵守。

更棘手的是合規成本的差異。不同司法管轄區之間的 AI 合規成本差異高達八倍，等於替 AI 開發者創造了「監管套利」的空間：把最具風險的開發活動放到監管最寬鬆的地方就好。一家 AI 公司如果覺得歐盟的 AI Act 太嚴格，可以把研發基地設在監管寬鬆的國家，只把最終產品賣進歐盟市場。這種套利行為會削弱任何單一國家或地區的監管效力，除非各國能在 AI 監管上達成某種程度的國際協調。但從目前的進展來看，這個協調還很遙遠。

AI 事故增加 55%，治理跟不上的代價正在浮現

治理跟不上的後果已經開始浮現在具體的數字上。報告記錄的 AI 相關事故（偏誤、系統失控、安全漏洞等）從前一年的 233 件增加到 362 件，增幅超過 55%。

這個增長有兩種可能的解讀。樂觀的看法是：事故數量增加是因為記錄和通報機制變得更完善了。更多的組織開始主動追蹤和回報 AI 事故，以前可能被忽略的小問題現在被記錄下來了。如果是這樣，數字上升反而代表治理體系在變好。

悲觀的看法是：隨著 AI 被部署到越來越多的場景中，而安全護欄的建設速度跟不上部署速度，出問題的機率自然上升。當 AI 從聊天機器人擴展到醫療輔助、法律建議、自動駕駛、金融交易等高風險場景時，每一個錯誤的後果都更嚴重。AI Agent 在真實世界的電腦操作任務中成功率約 66%，聽起來不差，但反過來想，每三次操作就有一次失敗，這在很多關鍵場景中是不可接受的錯誤率。

真實的情況可能兩者都有。但無論哪種解讀，結論都指向同一個方向：AI 系統的複雜度和部署規模在快速增長，而我們用來監控和管理這些系統的工具和制度，遠遠沒有跟上。這個落差不會自動縮小，它需要有意識的投入和制度建設。但從報告的數據來看，這方面的進展速度令人擔憂。

我的觀察

讀完這些數字，我一直在想一個時間差的問題。AI 的能力提升是以月為單位在加速，企業的部署決策是以季為單位在推進，治理框架的建設卻是以年為單位在慢慢走。這三條時間線之間的落差，就是風險滋生的空間。

這個落差為什麼很難縮小？因為它涉及三重困境。第一，技術更新太快，法規永遠在追趕上一代的問題。第二，最懂技術的人在企業裡，政府搶不到人才。第三，民眾不信任政府的監管能力，讓政府更難獲得授權去做有力的監管。這三個問題互相強化，形成一個難以打破的循環。

關注 AI 的讀者，這份報告最重要的提醒或許是：不要只看 AI「能做什麼」的新聞，也要問「誰在決定 AI 怎麼做」。90% 的模型由企業開發、透明度持續下降、公眾信任處於低點。在這個組合之下，「AI 治理」已經不是學術研討會上的抽象議題了，它是決定這項技術最終對社會是利是弊的關鍵變數。而從這份報告的數據來看，這個變數目前的走向，並不讓人樂觀。