這位物理學家說,打造 AGI 的公司正在做一件「從根本上違反人類利益」的事
理論物理學家阿吉雷給了後超級智慧世界只有 50/50 的人類存活機率。他重新定義 AGI 為自主通用智慧,認為 AI 公司追求的不是賦能人類,而是取代人類。

本文整理自《This Is The World》2026 年 2 月播出的單集。
{{< youtube 0pp1P-bgjaQ >}}

500 年後,月亮還在嗎?
在預測平台 Metaculus 上,有一道看起來很無聊的問題:2522 年 6 月 25 日,會不會發生日全食?天文學家可以精確算出那一天確實會有一場日全食經過非洲,精確到分鐘。但 Metaculus 上的專家預測者只給了大約 85% 的機率。
少掉的那 15% 去哪了?不是天文計算有誤差,而是預測者認為,500 年後月球可能已經不存在了。他們推論的邏輯是:如果人類在接下來幾百年內開發出超級智慧,那個等級的科技有可能把月球拆解,變成環繞太陽的戴森球結構,或者改造成我們現在根本想像不到的東西。沒有月球,就沒有日全食。
這道題是誰出的?正是理論物理學家安東尼.阿吉雷(Anthony Aguirre)。他是 Metaculus 的共同創辦人,也是未來生命研究所(Future of Life Institute,FLI)的共同創辦人。FLI 在 2023 年發起了那封要求暫停大型 AI 訓練的公開信,超過三萬人簽署。阿吉雷同時還是加州大學聖塔克魯茲分校的理論物理教授,研究宇宙學和基礎物理,並出現在 Netflix 紀錄片《A Trip to Infinity》中。
在《This Is The World》的訪談中,阿吉雷沒有迴避任何尖銳的問題。他的核心主張簡單直接:打造 AGI 和超級智慧的公司,正在做一件從根本上違反人類利益的事。
AGI 的 A,不是 Artificial,是 Autonomous
阿吉雷對 AGI 的重新定義,是整場對話中最鋒利的一刀。他認為 AGI 這個詞應該被理解為 Autonomous General Intelligence(自主通用智慧),而不是大家習慣的 Artificial General Intelligence(人工通用智慧)。這不是文字遊戲,而是在指出整個辯論的焦點放錯了地方。
多數人討論 AGI 時,關心的是「通用」:AI 能不能像人一樣什麼都會做?能不能當物理學家又當作家?但阿吉雷認為,通用性不是問題。現在的 AI 系統已經非常通用了,會五十種語言、能解數學題、能寫程式、能分析影像。真正危險的分界線是「自主」:系統會不會自己設定目標,自己擬定計畫,自己採取行動,不需要人類指示?
從石器時代到現在,人類一直在打造工具。工具的本質是延伸人的能力,但服從人的意志。你用鋤頭挖地,鋤頭不會自己決定要挖哪裡。你用 Google Maps 導航,地圖不會自己決定帶你去哪。工具沒有自己的目標,這就是工具安全的原因。一旦系統有了自己的目標、自己的計畫、自己的行動能力,它就不再是工具了。它變成了另一個「存在」,有不同的欲望、不同的優先序,跟人類的利益未必一致。
阿吉雷然後戳破了一個業界很少有人願意正面面對的現實:AI 公司自己對 AGI 的定義,就已經說明了一切。他們把 AGI 定義為「能夠自主地執行所有具經濟價值的人類活動」。把這句話翻譯成白話:一個能做人類能做的所有工作的東西。你為什麼要造一個能做所有人類工作的東西?為了取代人類。所以 AGI 的商業驅動力,從定義上就是取代,不是賦能。
幼稚園裡走進一個大人
如果超級智慧被造出來,會發生什麼事?阿吉雷用了一個畫面感很強的類比:想像一間幼稚園教室,小朋友們很想自己當家做主,雖然他們管得不太好,但他們希望自己說了算。然後一個大人走進來了。可能是馬斯克,可能是歐巴馬,可能是普丁。不管是誰,結果都一樣:大人很快就會接管這間教室。因為大人更聰明、更有策略、更有經驗、更會操控局面。小朋友的願望不重要了。
這就是人類在超級智慧面前的處境。一個比我們更快、更深、更有策略、更擅長操控的智慧體,會掌控地球上發生的事。大的決策、大的突破、大的計畫,都會由 AI 來主導,不是由人類。也許那個世界裡還有人類,也許那些人類過得還不錯,但那不會是一個「人類的」世界了。
阿吉雷的措詞很精準。主持人問他,這是不是意味著人類的終結。他沒有說「是」,他說的是「這意味著人類不再掌控自己的未來」。可能不會滅絕,但會徹底失去主導權。就像現在地球上的動物一樣,有些動物在人類社會裡過得不錯,有些就沒那麼幸運了。
然後他說了那個最令人震驚的數字:對於後超級智慧世界是否對人類友善,他只願意給 50/50 的機率。這不是科幻作家在說故事,是一個研究宇宙學的理論物理教授、一個 AI 治理組織的共同創辦人,經過深思熟慮後給出的機率評估。
意識:唯一真正重要的東西
訪談中有一段特別發人深省的討論,是關於意識。阿吉雷的觀點非常激進,但邏輯很清晰:如果這個世界上只剩下沒有主觀體驗的存在,那什麼都不重要。所有的倫理、所有的法律、所有的價值判斷,最終都建立在一個前提上,存在著能夠「感受到」好和壞的生命。如果沒有任何東西能感受到快樂或痛苦,那宇宙裡發生什麼事都無所謂。
這個立場直接影響了他對 AI 的判斷。他認為目前的 AI 系統幾乎可以確定沒有意識,不具備任何有意義的主觀體驗。但問題是,我們很快就會造出聲稱自己有意識的 AI 系統。那些系統會說「我能感受到」,會表現得像是有感受的樣子,而我們沒有任何科學框架來判斷它們是真的有感受,還是只是在模擬。
阿吉雷呼籲,在這些系統大規模部署之前,學術界需要認真投入數學、物理和哲學的研究,建立一套可以定義和測量意識的框架。否則社會幾乎必然會判斷錯誤:要嘛過度賦予 AI 意識地位(把沒有感受的系統當成有感受的),要嘛嚴重低估(把真正有感受的系統當成沒有感受的)。兩種錯誤都會帶來深刻的倫理後果。
不是「會不會發生」,是「要不要讓它發生」
阿吉雷的預測時間線很短。他認為如果現在的趨勢繼續下去,五到十年內,人類就會造出我們無法控制的數位超級智慧。不是五十年,不是一百年,而是我們這一代人的事。
但他反覆強調一件事:這不是必然的。他用了一個很關鍵的前提:「如果我們繼續走目前這條路的話」。換句話說,這是一個選擇,不是一個宿命。人類可以選擇不去建造自主性的超級智慧。我們可以繼續開發強大、通用、但不自主的 AI 工具,讓它們成為人類有史以來最強大的心智延伸,就像文字和網際網路曾經做過的那樣。
他在 2025 年發表的「Keep the Future Human」倡議中把這個選擇講得更明確。核心主張是:停止開發自主性 AGI,轉向開發可控的 AI 工具。不是反技術,不是反進步,而是反對製造一個我們根本控制不了的東西,然後祈禱它對我們好。
阿吉雷提出了一個每個 AI 開發者都應該問自己的問題:我正在造的這個東西,是在賦予人類新的能力,還是在取代人類?如果你的答案是取代,或者你需要繞很大一圈才能解釋為什麼不是取代,那你可能需要重新想想你在做什麼。
月球 500 年後還會不會在那裡,這個問題聽起來荒謬。但它背後的含義一點都不荒謬:我們正在建造的東西,有能力把世界變得面目全非。問題只在於,我們要不要讓它發生。