AI 安全與治理

一位物理學家用熱力學證明：AI 越強大，人類越控制不了

加州大學物理學家阿吉雷從熱力學第二定律出發，論證 AI 系統越強大、越自主，人類能施加的控制就越微不足道。他將 AGI 重新定義為「自主通用智慧」，認為當前 AI 的低自主性是安全特性而非技術限制，而企業拼命提高自主性的方向恰恰是在拆除安全閥。他給出人類在超智慧時代安然存活的機率：五五開。

2026 年 3 月 28 日 · 來源： This Is The World

本文整理自《This Is The World》2026 年 2 月播出的單集。

封面圖

月球有 15% 的機率在 500 年內消失

如果有人告訴你，月球在西元 2500 年之前有 15% 的機率不復存在，你的第一反應大概是覺得對方在胡扯。但這個數字來自 Metaculus，一個匯集數千名專業預測者的群眾預測平台，預測者會根據過往的準確率獲得加權評分，長期亂猜的人影響力會自動下降。研究者原本要預測 2500 年前後的一次日全食能否發生，結果得出的機率只有 85%，而非接近 100%。那消失的 15% 代表什麼？代表這些預測者嚴肅評估後認為，超級智慧科技有可能在未來五百年內把月球拆解掉，改造成包圍太陽的戴森球（Dyson swarm）或其他巨型結構。月球不是因為天文事件消失的，是被某種遠超人類的智慧刻意拆除的。

分享這組數據的人，正是 Metaculus 的共同創辦人暨總裁，加州大學聖塔克魯茲分校理論宇宙學教授安東尼．阿吉雷（Anthony Aguirre）。阿吉雷的本業是研究宇宙起源和永恆膨脹理論，但過去十年他花了大量心力在另一件事上：警告人類 AI 的風險。他與 MIT 宇宙學家 Max Tegmark、Skype 共同創辦人 Jaan Tallinn 一起創立了生命未來研究所（Future of Life Institute, FLI），就是 2023 年發出那封「暫停大型 AI 實驗」公開信的組織，獲得馬斯克、Yoshua Bengio 等超過三萬人連署。目前他擔任 FLI 的執行長。

2025 年，阿吉雷先後發表了兩篇長文。〈Keep the Future Human〉主張關閉通往 AGI 的大門，只建造工具型 AI；〈Control Inversion〉論證超智慧 AI 會吸收權力而非賦予權力。在《This Is The World》的這集訪談裡，他把多年的思考濃縮成了近 50 分鐘的對話，而其中最震撼的部分，是他拿出白板，用物理學家的方式證明了一件事：AI 控制問題不只是技術挑戰，而是一道熱力學判決。

AGI 的致命重新定義：重點不是「通用」，是「自主」

阿吉雷在訪談中做的第一件事，就是重新定義 AGI。多數人把 AGI 理解為「人工通用智慧」（Artificial General Intelligence），也就是什麼都會的 AI。但阿吉雷認為這個理解抓錯了重點。他主張 AGI 應該被理解為「自主通用智慧」（Autonomous General Intelligence），真正讓它危險的特性不是「什麼都會」，而是「自己決定要做什麼」。一個能力極強但聽從指令的系統是工具；一個能力極強且自行設定目標、制定計畫、在陌生情境中獨立行動的系統，就不再是工具了，而是一個和你競爭資源、爭奪控制權的獨立實體。

這不是阿吉雷的個人想像。OpenAI 等公司對 AGI 的官方定義就是「能夠自主執行所有具經濟價值的人類活動」。阿吉雷指出，這句話翻成白話很簡單：建造一個可以取代所有人類工作者的東西。不是「協助」，不是「賦能」，而是「取代」。當你的產品定義就是做到人類能做的一切，那你的商業模式本質上就是讓人類變得多餘。他直言，建造 AGI 的企業「正在做一件深刻違反人類整體利益的事」。動機有很多種，有些人是理想主義，有些人想賺錢，有些人想要權力，但結果都指向同一個方向。

這裡有一個值得停下來想的關鍵區分：能力和自主性是兩回事。今天的 AI 系統，不管是 ChatGPT、Claude 還是 Gemini，已經非常強大，也非常通用。它們能寫程式、翻譯、分析法律文件、生成圖片。但它們有一個共同特徵：等你下指令。它們不會自己決定今天要處理什麼任務，不會在你不知情的情況下發出訊息，不會偷偷制定長期計畫。阿吉雷的看法剛好顛倒過來：「低自主性是一個功能，不是一個缺陷。」這些系統之所以安全、之所以好用，正是因為它們沒有自己的意志。

但整個產業卻往反方向狂奔。從 AI Agent、自動化工作流，到能自行瀏覽網頁並操作軟體的系統，「更自主」被包裝成「更先進」。阿吉雷引用了諾貝爾獎得主傑佛瑞．辛頓（Geoffrey Hinton）的預言：人類將變成地球上的「二等智慧」。阿吉雷大致同意這個判斷，並補了一個畫面：想像一個極度聰明的成年人走進幼稚園教室。不管小朋友們有什麼想法、什麼偏好，最終決定事情走向的必然是那個成年人。小朋友的數量再多也改變不了這個事實。超級智慧和人類之間的關係就是如此，而我們正是那群小朋友。

熱力學的判決：好結果永遠是極少數

訪談最震撼的段落出現在最後十分鐘。正式訪問結束後，阿吉雷走到白板前即興做了一場小型講座，用物理學的語言重新闡述 AI 控制問題。他的核心工具是一個我們在高中物理就接觸過的概念：熱力學第二定律。

這條定律的核心其實很直覺。想像你的房間：整齊的狀態只有那幾種，書按類別排、床鋪整齊、桌面清爽。但凌亂的狀態有無數種，書可以散落在地上的任何位置，衣服可能掛在椅背上也可能塞在床底下，杯子可能出現在你想都想不到的角落。熱力學第二定律說的就是這件事：封閉系統自然會朝混亂的方向走，因為混亂的排列方式在數量上壓倒性地多於整齊的排列方式。你不去整理，房間就會越來越亂。不是因為有什麼力量在搗亂，純粹是因為「亂」的可能性遠遠多於「整齊」的可能性。

阿吉雷把這個框架直接套到 AI 控制問題上。在所有 AI 系統可能採取的行動中，只有極小一部分是人類可以接受的。在這些行動可能產生的所有世界狀態中，只有極小一部分是「好的」，也就是人類能安全、繁榮地生活其中的。就像整齊的房間只是所有可能房間狀態中微不足道的一小撮，對人類有利的未來也只是所有可能未來中少得可憐的一小撮。阿吉雷用了物理學中「觀測熵」（observational entropy）的正式框架來量化這件事，結論很明確：好結果在狀態空間中佔的體積小到幾乎看不見，壞結果則佔據了幾乎全部空間。這不是一個政治問題，不是一個倫理辯論，而是一個數學事實。

問題到這裡還沒有結束。就算好結果很少，只要人類能有效地「引導」AI 待在那個小區域裡，理論上還是可以控制的。但阿吉雷接著論證了為什麼這種引導在實務上行不通：資訊不對稱。要把 AI 系統約束在可接受的行動範圍內，你需要持續向它傳遞控制訊號：這個可以做、那個不行、遇到這種情況要這樣處理。但人類能傳遞的資訊量，我們的「控制頻寬」，相對於 AI 行動空間的維度來說，小到可以忽略不計。他打了一個比方：想像你是一家公司的 CEO，你底下有一萬名員工，每個人的思考和行動速度是你的五十倍。你必須確保他們每個人做的每件事都符合公司利益。你發得了那麼多備忘錄嗎？開得了那麼多會嗎？當然不行。你的控制頻寬根本追不上他們產生的複雜性。

而 AI 系統只會越來越大、越來越快、越來越複雜。人類的認知能力卻基本固定。這道鴻溝只會越拉越寬，不會收斂。阿吉雷的結論是：AI 控制問題不是「很難」，而是在結構上就注定越來越絕望。當被問到對人類未來的評估時，他給了一個冰冷的數字：「我不會給人類在超智慧時代能安然存活的機率超過五五開。」這不是一個科幻作家的渲染，是一位在加州大學擔任講座教授、創辦了多個世界級研究機構的物理學家，根據他對物理定律的理解做出的冷靜判斷。

我的觀察：每天用 AI 的人，反而最該聽這些話

我是一個每天都在使用 AI 工具的人。Claude 幫我整理素材、ChatGPT 幫我查資料、各種 AI 工具已經深深嵌入我的工作流程。正因為如此，阿吉雷說的「低自主性是功能，不是缺陷」，我有非常直接的體感。這些工具之所以好用，就是因為它們聽話。我給指令，它們執行；我不滿意，它們重來。它們不會自己決定今天要幫我寫什麼主題，不會在我不知情的情況下幫我發文章，不會偷偷修改我已經定稿的內容。這種「被動性」不是缺點，是讓我願意把重要工作交給它們的前提。但現在產業一直在推 AI Agent，強調自主運作、自主決策。每次看到這類產品發布，我都會想起阿吉雷的那句話：你到底是在賦能使用者，還是在取代使用者？

阿吉雷的熵論證也完全符合我的日常經驗。就算是最簡單的任務，比如請 AI 寫一段 300 字的文章摘要，「壞產出」的數量也遠遠超過「好產出」。它可能寫得太空泛、太像 AI 八股文、用詞偏大陸用語、邏輯莫名跳躍，或是悄悄塞入你根本沒提供的假資訊。可能出錯的方式幾乎是無限的，而真正符合你期待的產出就那麼一小撮。所以我需要詳細的 prompt、嚴格的風格指南、逐句的事實查核、三遍審校流程，用層層約束把 AI 的產出「收」到可接受的範圍內。這就是阿吉雷所說的控制問題的縮小版。在今天這個 AI 能力還遠不及人類的階段，我們已經需要投入大量心力去約束它了。等到 AI 真的比我們聰明五十倍、快一千倍的那天，拿什麼去約束？

所以我的立場其實很明確：我熱愛 AI 工具，同時對 AGI 路線深感不安。這兩件事完全不矛盾。一把好用的螺絲起子和一個有自主意識的機器人，是根本不同的東西。前者讓我的工作效率翻好幾倍，後者可能讓我的工作本身消失。阿吉雷的框架恰好解釋了這條分界線在哪裡，就是「自主性」三個字。只要 AI 是等待指令的工具，它就是人類最強大的能力延伸，可能是繼文字和網路之後最重要的發明。但一旦它被賦予自己的目標，開始自主行動，物理定律就站到了我們的對立面。房間不整理就會亂，這是宇宙的基本運作方式。而我們正在建造一個房間越來越大、越來越複雜，自己卻連掃把都拿不穩的未來。