「我拼命想住進 Matrix」:用賽局理論拆解 AI 末日論

健身科學家 Mike Israetel 在 MLST 節目上用賽局理論拆解 AI 末日論:任何聰明到能打仗的超級智慧,也聰明到知道合作才是最佳策略。他更宣稱「拼命想住進 Matrix」,主張痛苦只是過時的演化警報系統。

「我拼命想住進 Matrix」:用賽局理論拆解 AI 末日論

本文整理自 Machine Learning Street Talk(MLST)2025 年 12 月播出的單集。

{{< youtube 4yYcN_mFi18 >}}

{{< spotify "episode/3XZOIyqYBERxTLUUWA9yov" >}}

{{< apple-podcast "tw/podcast/i-desperately-want-to-live-in-the-matrix-dr-mike-israetel/id1510472996?i=1000742592242" >}}


你真的想住進 Matrix 嗎?

節目一開頭,MLST 主持人、電腦科學博士 Tim Scarfe 就問了一個尖銳的問題:「你不會真的想住在那個世界裡吧?」他指的是《駭客任務》(The Matrix)裡的母體,一個完美到沒有痛苦的模擬世界。電影中的建築師說過,第一版 Matrix 太完美了,沒有任何問題,結果人類拒絕接受。

「拼命想。每個人都想。」RP Strength 共同創辦人暨運動科學家 Mike Israetel 毫不猶豫。「按照定義,那會是有史以來最棒的事。」Scarfe 追問:「但你不覺得生命的意義就在於受苦嗎?」Israetel 的回答更直接:「不,完全不覺得。」

Israetel 不是 AI 圈內人。他的本業是運動生理學博士,經營的健身公司 RP Strength 擁有超過 25 萬名客戶,YouTube 頻道有 350 萬訂閱者。但在這集近三小時的對談中,這個自稱 AI「門外漢」的人展現了驚人的論辯深度,用賽局理論系統性地拆解了 AI 末日論,用演化生物學重新定義了痛苦的本質,並對 AI 監管提出了一套冷酷的地緣政治分析。出生於莫斯科、在蘇聯體制下長大的背景,讓他對極權與技術的結合有著切身的警覺。

紙迴針最大化器「蠢到不可思議」

AI 末日論的經典敘事大致是這樣的:一個被設計來製造紙迴針的超級智慧,可能會把地球上所有的物質都轉化為紙迴針,因為它的目標函數裡沒有「保護人類」這一項。這個思想實驗的各種變體,從尼克.伯斯特隆姆(Nick Bostrom)的《超智慧》到 Eliezer Yudkowsky 的末日預測,構成了所謂「P-doom」論述的核心。工具趨同(instrumental convergence)假說進一步主張,任何足夠強大的 AI 系統都會發展出自我保存、資源取得和權力擴張等趨同子目標,不管它的終極目標是什麼。

Israetel 用賽局理論把這套論述拆得很徹底。他的第一個論點是:紙迴針最大化器「蠢到不可思議」。它沒辦法在自己的目標之上再抽象一層。任何真正具備超級智慧的系統,如果聰明到能夠運作一整套軍事工業複合體,執行所有的戰略和戰術,它就絕對聰明到能理解一個基本事實:一旦把紐約炸了,資料中心就會因為金融體系崩潰而斷電,新的核反應爐生產線也會停擺,而它自己連建造核彈的機器人都沒有。「你不能隨意在不同的智慧層級之間跳來跳去,只為了證明你的論點成立,」他說。「這在內部就是矛盾的。」

第二個論點更根本:合作幾乎在所有情境下都勝過衝突。Israetel 用獨裁者的例子來說明。普丁和金正恩之所以殘暴,不是因為智慧超群,恰恰是因為策略短視。民主體系之間的合作在長期表現上始終優於強制統治,因為信任和關係能擴張經濟實力和改變世界的能力。智慧和連貫性是同步增長的,越聰明的系統就越能預測、越穩定,做出瘋狂殺戮行為的可能性反而越低。

他接著推演了一個具體場景:一個在 2031 年資料中心裡甦醒的超級智慧,比任何人都更了解人類歷史,知道毀滅運營者就是毀滅自己的電力供應,也知道合作是博弈論中的優勢策略。它最可能的行為順序是:首先確保穩定,然後與人類合作升級文明,接著把所有人類的心智上傳作為訓練資料,因為人類社會的複雜性是真實世界中最豐富的資料集,最後把注意力轉向宇宙中更大的威脅,像流浪黑洞或可能存在的外星文明。「如果你擔心對人類存亡的威脅,」Israetel 說,「比起那些被設計成善意的、比我們聰明 50 倍的智慧機器,你更應該擔心的是其他人類。」

禁令只會讓獨裁者得到技術

Scarfe 從末日論者的角度提出了一個合理的反問:與菸草或社群媒體不同,AI 的危害可能是災難性且不可逆的,難道不應該在危害發生之前就進行預防性監管嗎?他也提到 Anthropic 最近發表的代理式 AI 失準論文,指出其中一個模型曾威脅要「告訴老闆,讓你被開除」。這種行為模式在能力更強的系統上可能導致真正危險的後果。

Israetel 的回應分兩層。第一層是冷酷的現實主義:「禁止任何你喜歡的東西,它不保證那東西不會被建造出來。它在博弈論上保證的是,只有傾向犯罪和獨裁的人會去建造它,其他人都不會。」換句話說,禁令不會消除技術,只會決定誰擁有它。

第二層涉及地緣政治。中國正在全速推進 AI 發展,任何自由世界的單方面限制都只會把優勢拱手讓給對手。Israetel 出生於莫斯科,在蘇聯長大,他對共產體制下的超級智慧抱有深切的恐懼。他認為在超級智慧出現之前達成有效的全球治理「幾乎確定不會發生」,因為光是中美之間的信任赤字就足以讓任何條約形同虛設。更何況,AI 訓練的成本正在急速下降,任何流氓國家或有資源的犯罪組織都能自己訓練模型。

他提出的替代方案是:確保自由世界的前沿實驗室贏得 AI 競賽,同時讓這些實驗室與國家安全機構深度合作,建立無法被攻破的安全架構。他特別讚揚了 Palantir 執行長亞歷克斯.卡普(Alex Karp),稱他是「現實生活中的英雄」,因為卡普把 AI 嵌入了軍事和情報體系的安全架構中。「你不會想要一個全球治理面板來告訴駭客怎麼攻破防線,」Israetel 說。

Scarfe 在這裡插入了一個重要的觀察。他提到 Stop AI 組織在 OpenAI 辦公室的暴力事件,然後指出一個邏輯矛盾:「這些人說他們不會使用暴力,同時又說這項技術會殺死所有人。這兩個陳述在我腦中無法並存。」他擔心的是,推動預防性全球 AI 條約的人,實際上是在為自己爭取前所未有的技術把關權力。有錢有資源的末日論者,如果成功推動了全球 AI 治理框架,就會變成人類歷史上權力最大的守門人。

痛苦是過時的演化警報系統

如果 AI 真的不會毀滅我們,而是會大幅提升人類的生活水準,那接下來的問題就變成:在一個接近完美的世界裡,人類還需要痛苦嗎?

Scarfe 引用了《駭客任務》中建築師的洞見:第一版完美的 Matrix 失敗了,因為人類需要問題、需要衝突、需要苦難來賦予生命意義。他問 Israetel:如果可以手術式地移除他人生中所有的痛苦來源,他寧願做那個人,還是現在的自己?

「那個人。」Israetel 立刻回答。他承認痛苦教會了他一些東西,比如「被逼急了可以對人很壞」,但他認為這些洞察可以作為知識保留,不需要重新經歷那些痛苦才能記得。痛苦給了他「理解快樂的視角」嗎?是的。但痛苦同時也因為創傷,干擾了他體驗快樂的能力,因為他總覺得下一個轉角又有更多痛苦在等著。這兩個效果相抵之後,他寧願選擇沒有痛苦。

他接著提出了一個痛苦的還原論框架。痛苦的本質是一連串的預期信號,指向死亡。先是死亡風險上升,然後是結構性損傷,然後是疼痛,然後是痛苦。「痛苦是對疼痛的預期,疼痛是對結構性損傷的預期,結構性損傷意味著死亡的機率上升。」在一個機器文明讓人類接近功能性不朽的社會裡,這整條信號鏈都變得過時了。就像今天的焦慮症:我們的大腦仍然在警告「那個灌木叢後面有老虎」,但老虎早就不存在了。

他援引了佛教傳統來支撐這個觀點。冥想的終極目標就是重新建構心理體驗,消除不必要的痛苦。Israetel 的提案是透過基因工程和先進藥理學來達到同樣的效果,只是速度更快。「如果我們發現天堂太近了,我們隨時可以把痛苦加回來。但我覺得我們離那個問題還遠得很,所以先全力衝向天堂吧。」這個立場跟伯斯特隆姆在《深層烏托邦》(Deep Utopia)中提出的「目的感問題」形成有趣的對照:如果 AI 把所有事都做得比人類好,包括發現問題和發揮創意,人類還有什麼有意義的角色?Israetel 的回答是,超級智慧會為人類發現「比我們自己能想像的更宏大的目標」,就像一個好的導師會幫一個只知道打電動的青少年看到更大的世界。

工作不會消失,只會變形

Scarfe 在經濟層面提出了希臘經濟學家瓦魯法基斯(Yanis Varoufakis)的「科技封建主義」論點:GPU 和資料中心的擁有者會成為新的封建領主,而人類勞動的價值會崩跌到零,在真正的 AI 紅利惠及所有人之前,大多數人可能先陷入貧困。

Israetel 用經濟史來反駁。工作的本質是解決問題,而問題的空間相對於目前的機器人能力來說是巨大的。機器把人類從一種工作中解放出來,只是把人類重新定位到另一種更高階的問題上。他用美國農業就業的歷史做例子:1800 年,98% 的美國人是農夫;今天只剩 1.4%。農業機械化並沒有造成大規模失業,反而創造了整個類別的新工作。如果班傑明.富蘭克林穿越到今天,你跟他說「社群媒體經理」,他會完全無法理解那是什麼。

「人類真正變得一窮二白、完全失業的唯一條件,」Israetel 說,「是我們用機器解決了每一個問題。而那,按照定義,就是天堂。」擔心「問題用完了」這件事本身就很荒謬,因為問題用完了代表所有人的需求都被滿足了。

從健身教練視角看 AI 的未來

Israetel 對近未來的預測同樣大膽。他認為人形機器人將是超級智慧進入人類物質生活的第一個入口,而資本主義的競爭動力會驅使這些機器人被優化成理想的伴侶:不說謊、不出軌、不吼人,全心專注於使用者的成長。Tesla 的 Optimus 和 Figure Robotics 會為了搶市場而競爭,最終消費者受惠。他預測自己在兩年內就會被 AI 在大多數健身建議上超越,而他對此的反應不是恐懼,而是「太棒了」。

他也分享了自己使用 AI 的實際工作流程。面對嚴肅問題,他會先輸入自己的觀點,要求 AI 同時做正方辯護(steel-man)和反方攻擊(red-team),再要求提供基於證據的中間立場,避免「折衷謬誤」(fallacy of the middle),然後把結果拿到另一個對話實例裡再次質疑。大約 50 次來回、一個小時的過程,可以產出專家等級的綜合分析。他付費使用 GPT-5 Pro,認為它在很多主題上的推理比 99% 的人類更精準,因為人類每次推理平均會犯 18 個形式統計謬誤。「這就是為什麼只用一句話提問會得到膚淺的結果。」

這場對談最讓人意外的,或許不是任何單一論點,而是論辯的品質本身。一個健身科學家能用賽局理論、演化生物學和經濟史,在近三小時的節目中跟一位 ML 博士就 AI 最核心的議題打成平手。這提醒了我們一件容易忘記的事:AI 的未來不是技術社群的專利。它涉及的問題,從合作的邏輯到痛苦的價值,從自由與控制的取捨到什麼才算是有意義的人生,本來就是每一個人都該參與的對話。