90% 模型由企業把持、透明度暴跌、公眾信任新低 — 史丹佛報告揭 AI 治理三重危機
史丹佛 2026 AI Index 報告揭示 AI 治理的三大警訊:超過九成重要模型由私人企業開發,95 個重要模型中 80 個未公開訓練程式碼,僅 31% 美國民眾信任政府的 AI 監管。AI 業者在國會聽證會的出席比例自 2017 年增加三倍,學術界的聲音則大幅萎縮。全球 47 國已有 AI 立法,但僅 12 國建立執法機制。

本文整理自史丹佛以人為本人工智慧研究中心(Stanford HAI)2026 年 4 月發布的第九屆 AI Index 年度報告。
史丹佛 HAI 每年的 AI Index 報告都有很多亮眼的數字,更快的模型、更多的投資、更高的採用率。但今年報告裡最讓人擔心的數字,不在「成長」那幾頁,而在「治理」那幾頁。
三個趨勢正在同時發生:AI 模型的開發權集中在少數企業手中、這些企業的透明度正在快速下降、而公眾對政府監管 AI 的能力信心也跌到新低。這三件事分開看各有各的問題,合在一起看則形成了一個系統性的治理真空:最有影響力的 AI 系統,由最不透明的組織開發,而最該負責監管的政府,卻最不被信任。
90% 的模型,由不透明的企業決定
報告的第一個警訊很直白:目前超過 90% 的重要 AI 模型由私人企業開發。這個比例在過去幾年持續攀升,學術機構的角色正在快速邊緣化。回想 2010 年代初期,很多開創性的 AI 研究出自大學實驗室,從 ImageNet 到 Transformer 架構的早期探索。但現在,當訓練一個前沿模型的成本動輒數億美元時,只有手握大量資金和算力的企業才玩得起這個遊戲。
這不只是「誰出錢」的問題,核心是公共監督能力的問題。AI 模型的開發集中在少數幾家企業手中,訓練資料怎麼蒐集、模型的安全測試做到什麼程度、部署前的風險評估有多嚴謹,基本上都是企業自己說了算。外部研究者想要獨立驗證一個商業模型的安全性,通常連訓練資料的組成都看不到,更別說重現訓練過程了。監管機構的處境更尷尬:他們既缺乏技術專家來理解這些模型的內部運作,也缺乏法律工具來要求企業公開資訊。
更糟糕的是,透明度正在加速崩塌。報告指出,在過去一年發布的 95 個重要 AI 模型中,有 80 個沒有公開訓練程式碼。頂級 AI 公司已經放棄揭露最新模型的資料集規模和訓練時間。這個變化的速度很快:兩三年前,OpenAI、Google 這些公司還會在技術報告中披露模型的基本訓練細節(參數量、資料集大小、訓練時間等)。現在,這些資訊越來越被視為核心商業機密,連基本的數字都不願意公開。
我們甚至無法知道這些模型是用什麼資料訓練的、訓練了多久、消耗了多少算力。退一步想,這個趨勢有它的商業邏輯:當開發成本高達數十億美元,企業自然會把細節藏好。但問題在於,這些模型正在被數十億人使用,影響著從醫療建議到法律判決的各種場景。一個影響力如此巨大的技術,核心運作方式卻完全是黑箱。試想,如果藥廠拒絕揭露藥物的成分和臨床試驗數據,社會會怎麼反應?AI 模型目前享有的「免揭露特權」,在任何其他高風險產業都是不可想像的。
企業的聲音進了國會,學術界被擠到邊緣
模型開發集中在企業手中只是表面。更深的問題是:AI 業者正在系統性地擴大自己在政策制定過程中的影響力,而這個擴張有具體的數據可以佐證。
AI 產業代表在美國國會聽證會中的出席比例,自 2017 年以來增加了三倍,學術界的聲音同步萎縮。九年前,國會聽證會上還能聽到來自大學研究者的獨立觀點,和產業界的聲音形成一定的平衡。現在,國會議員在討論 AI 監管法案時,聽到的觀點越來越多來自被監管的對象本身,獨立研究者的聲音反而被邊緣化了。
這種失衡帶來的具體影響是什麼?當立法者主要從企業那裡獲取 AI 的技術知識時,他們對 AI 風險的理解就會被企業的框架所塑造。企業傾向於強調 AI 的正面效益和經濟價值,對潛在風險的描述則傾向於「技術問題可以用技術解決」的敘事。這不是說企業在刻意誤導,而是每個組織都有自己的利益視角,只聽一邊的聲音必然會得到偏頗的結論。
這種現象不是美國獨有的,但美國的情況特別值得關注,因為美國的 AI 政策選擇往往會成為其他國家的參考框架。歐盟的 AI Act 在立法過程中就大量參考了美國的技術標準和風險分類。如果美國的政策討論被產業利益主導,產出的法規傾向於保護現有玩家的市場地位而非保障公共利益,這個偏差會透過國際參照效應擴散到全球。
報告裡還有一個更深層的觀察讓人不安:AI 系統越來越複雜,能搞懂這些系統的專家越來越少,而這些專家大多在產業界工作。頂級的 AI 安全研究員,年薪動輒數百萬美元,大學和政府根本搶不到人。結果就是一個結構性的知識不對稱:最了解 AI 風險的人,恰好是最沒有動機去公開談論這些風險的人。他們不是不關心公共利益,而是身處企業體系中,發言受到保密協議和企業文化的約束。
31%:公眾信任跌到什麼程度
如果前兩個趨勢讓你覺得政府監管應該趕快跟上,那報告的第三組數字會讓你更不安:只有 31% 的美國民眾信任政府有能力妥善監管 AI。在所有受調查的國家中,只有中國(27%)的數字比美國更低。歐盟民眾的信任度相對較高,達到 53%,可能跟歐盟已經通過並開始實施 AI Act 有關,至少讓民眾覺得「有人在管」。
這個 31% 要放在更大的脈絡裡理解。它反映的不只是對政府技術能力的不信任,更是對整個 AI 治理生態系的信心缺失。民眾一方面對 AI 感到焦慮(52% 表示緊張,只有 23% 認為 AI 對就業有正面影響),一方面又不相信政府能管好這項技術。高度焦慮加上低度信任,是一個危險的組合,往往導致兩種極端:要麼放任不管(反正政府管也管不好),要麼在出事之後矯枉過正,倉促通過過度嚴格的法規。
全球的監管圖景同樣支離破碎。報告指出,目前有 47 個國家已有 AI 相關立法,但只有 12 個國家建立了實際的執法機制。也就是說,七成以上有 AI 法規的國家,法規停留在「紙上」階段,沒有對應的執法人力、技術工具和處罰機制來確保法規被遵守。
更棘手的是合規成本的差異。不同司法管轄區之間的 AI 合規成本差異高達八倍,等於替 AI 開發者創造了「監管套利」的空間:把最具風險的開發活動放到監管最寬鬆的地方就好。一家 AI 公司如果覺得歐盟的 AI Act 太嚴格,可以把研發基地設在監管寬鬆的國家,只把最終產品賣進歐盟市場。這種套利行為會削弱任何單一國家或地區的監管效力,除非各國能在 AI 監管上達成某種程度的國際協調。但從目前的進展來看,這個協調還很遙遠。
AI 事故增加 55%,治理跟不上的代價正在浮現
治理跟不上的後果已經開始浮現在具體的數字上。報告記錄的 AI 相關事故(偏誤、系統失控、安全漏洞等)從前一年的 233 件增加到 362 件,增幅超過 55%。
這個增長有兩種可能的解讀。樂觀的看法是:事故數量增加是因為記錄和通報機制變得更完善了。更多的組織開始主動追蹤和回報 AI 事故,以前可能被忽略的小問題現在被記錄下來了。如果是這樣,數字上升反而代表治理體系在變好。
悲觀的看法是:隨著 AI 被部署到越來越多的場景中,而安全護欄的建設速度跟不上部署速度,出問題的機率自然上升。當 AI 從聊天機器人擴展到醫療輔助、法律建議、自動駕駛、金融交易等高風險場景時,每一個錯誤的後果都更嚴重。AI Agent 在真實世界的電腦操作任務中成功率約 66%,聽起來不差,但反過來想,每三次操作就有一次失敗,這在很多關鍵場景中是不可接受的錯誤率。
真實的情況可能兩者都有。但無論哪種解讀,結論都指向同一個方向:AI 系統的複雜度和部署規模在快速增長,而我們用來監控和管理這些系統的工具和制度,遠遠沒有跟上。這個落差不會自動縮小,它需要有意識的投入和制度建設。但從報告的數據來看,這方面的進展速度令人擔憂。
我的觀察
讀完這些數字,我一直在想一個時間差的問題。AI 的能力提升是以月為單位在加速,企業的部署決策是以季為單位在推進,治理框架的建設卻是以年為單位在慢慢走。這三條時間線之間的落差,就是風險滋生的空間。
這個落差為什麼很難縮小?因為它涉及三重困境。第一,技術更新太快,法規永遠在追趕上一代的問題。第二,最懂技術的人在企業裡,政府搶不到人才。第三,民眾不信任政府的監管能力,讓政府更難獲得授權去做有力的監管。這三個問題互相強化,形成一個難以打破的循環。
關注 AI 的讀者,這份報告最重要的提醒或許是:不要只看 AI「能做什麼」的新聞,也要問「誰在決定 AI 怎麼做」。90% 的模型由企業開發、透明度持續下降、公眾信任處於低點。在這個組合之下,「AI 治理」已經不是學術研討會上的抽象議題了,它是決定這項技術最終對社會是利是弊的關鍵變數。而從這份報告的數據來看,這個變數目前的走向,並不讓人樂觀。