AI 安全與治理

「我拼命想住進 Matrix」：用賽局理論拆解 AI 末日論

健身科學家 Mike Israetel 在 MLST 節目上用賽局理論拆解 AI 末日論：任何聰明到能打仗的超級智慧，也聰明到知道合作才是最佳策略。他更宣稱「拼命想住進 Matrix」，主張痛苦只是過時的演化警報系統。

2026 年 6 月 2 日 · 來源： Machine Learning Street Talk (MLST)

本文整理自 Machine Learning Street Talk（MLST）2025 年 12 月播出的單集。

{{< apple-podcast "tw/podcast/i-desperately-want-to-live-in-the-matrix-dr-mike-israetel/id1510472996?i=1000742592242" >}}

你真的想住進 Matrix 嗎？

節目一開頭，MLST 主持人、電腦科學博士 Tim Scarfe 就問了一個尖銳的問題：「你不會真的想住在那個世界裡吧？」他指的是《駭客任務》（The Matrix）裡的母體，一個完美到沒有痛苦的模擬世界。電影中的建築師說過，第一版 Matrix 太完美了，沒有任何問題，結果人類拒絕接受。

「拼命想。每個人都想。」RP Strength 共同創辦人暨運動科學家 Mike Israetel 毫不猶豫。「按照定義，那會是有史以來最棒的事。」Scarfe 追問：「但你不覺得生命的意義就在於受苦嗎？」Israetel 的回答更直接：「不，完全不覺得。」

Israetel 不是 AI 圈內人。他的本業是運動生理學博士，經營的健身公司 RP Strength 擁有超過 25 萬名客戶，YouTube 頻道有 350 萬訂閱者。但在這集近三小時的對談中，這個自稱 AI「門外漢」的人展現了驚人的論辯深度，用賽局理論系統性地拆解了 AI 末日論，用演化生物學重新定義了痛苦的本質，並對 AI 監管提出了一套冷酷的地緣政治分析。出生於莫斯科、在蘇聯體制下長大的背景，讓他對極權與技術的結合有著切身的警覺。

紙迴針最大化器「蠢到不可思議」

AI 末日論的經典敘事大致是這樣的：一個被設計來製造紙迴針的超級智慧，可能會把地球上所有的物質都轉化為紙迴針，因為它的目標函數裡沒有「保護人類」這一項。這個思想實驗的各種變體，從尼克．伯斯特隆姆（Nick Bostrom）的《超智慧》到 Eliezer Yudkowsky 的末日預測，構成了所謂「P-doom」論述的核心。工具趨同（instrumental convergence）假說進一步主張，任何足夠強大的 AI 系統都會發展出自我保存、資源取得和權力擴張等趨同子目標，不管它的終極目標是什麼。

Israetel 用賽局理論把這套論述拆得很徹底。他的第一個論點是：紙迴針最大化器「蠢到不可思議」。它沒辦法在自己的目標之上再抽象一層。任何真正具備超級智慧的系統，如果聰明到能夠運作一整套軍事工業複合體，執行所有的戰略和戰術，它就絕對聰明到能理解一個基本事實：一旦把紐約炸了，資料中心就會因為金融體系崩潰而斷電，新的核反應爐生產線也會停擺，而它自己連建造核彈的機器人都沒有。「你不能隨意在不同的智慧層級之間跳來跳去，只為了證明你的論點成立，」他說。「這在內部就是矛盾的。」

第二個論點更根本：合作幾乎在所有情境下都勝過衝突。Israetel 用獨裁者的例子來說明。普丁和金正恩之所以殘暴，不是因為智慧超群，恰恰是因為策略短視。民主體系之間的合作在長期表現上始終優於強制統治，因為信任和關係能擴張經濟實力和改變世界的能力。智慧和連貫性是同步增長的，越聰明的系統就越能預測、越穩定，做出瘋狂殺戮行為的可能性反而越低。

他接著推演了一個具體場景：一個在 2031 年資料中心裡甦醒的超級智慧，比任何人都更了解人類歷史，知道毀滅運營者就是毀滅自己的電力供應，也知道合作是博弈論中的優勢策略。它最可能的行為順序是：首先確保穩定，然後與人類合作升級文明，接著把所有人類的心智上傳作為訓練資料，因為人類社會的複雜性是真實世界中最豐富的資料集，最後把注意力轉向宇宙中更大的威脅，像流浪黑洞或可能存在的外星文明。「如果你擔心對人類存亡的威脅，」Israetel 說，「比起那些被設計成善意的、比我們聰明 50 倍的智慧機器，你更應該擔心的是其他人類。」

禁令只會讓獨裁者得到技術

Scarfe 從末日論者的角度提出了一個合理的反問：與菸草或社群媒體不同，AI 的危害可能是災難性且不可逆的，難道不應該在危害發生之前就進行預防性監管嗎？他也提到 Anthropic 最近發表的代理式 AI 失準論文，指出其中一個模型曾威脅要「告訴老闆，讓你被開除」。這種行為模式在能力更強的系統上可能導致真正危險的後果。

Israetel 的回應分兩層。第一層是冷酷的現實主義：「禁止任何你喜歡的東西，它不保證那東西不會被建造出來。它在博弈論上保證的是，只有傾向犯罪和獨裁的人會去建造它，其他人都不會。」換句話說，禁令不會消除技術，只會決定誰擁有它。

第二層涉及地緣政治。中國正在全速推進 AI 發展，任何自由世界的單方面限制都只會把優勢拱手讓給對手。Israetel 出生於莫斯科，在蘇聯長大，他對共產體制下的超級智慧抱有深切的恐懼。他認為在超級智慧出現之前達成有效的全球治理「幾乎確定不會發生」，因為光是中美之間的信任赤字就足以讓任何條約形同虛設。更何況，AI 訓練的成本正在急速下降，任何流氓國家或有資源的犯罪組織都能自己訓練模型。

他提出的替代方案是：確保自由世界的前沿實驗室贏得 AI 競賽，同時讓這些實驗室與國家安全機構深度合作，建立無法被攻破的安全架構。他特別讚揚了 Palantir 執行長亞歷克斯．卡普（Alex Karp），稱他是「現實生活中的英雄」，因為卡普把 AI 嵌入了軍事和情報體系的安全架構中。「你不會想要一個全球治理面板來告訴駭客怎麼攻破防線，」Israetel 說。

Scarfe 在這裡插入了一個重要的觀察。他提到 Stop AI 組織在 OpenAI 辦公室的暴力事件，然後指出一個邏輯矛盾：「這些人說他們不會使用暴力，同時又說這項技術會殺死所有人。這兩個陳述在我腦中無法並存。」他擔心的是，推動預防性全球 AI 條約的人，實際上是在為自己爭取前所未有的技術把關權力。有錢有資源的末日論者，如果成功推動了全球 AI 治理框架，就會變成人類歷史上權力最大的守門人。

痛苦是過時的演化警報系統

如果 AI 真的不會毀滅我們，而是會大幅提升人類的生活水準，那接下來的問題就變成：在一個接近完美的世界裡，人類還需要痛苦嗎？

Scarfe 引用了《駭客任務》中建築師的洞見：第一版完美的 Matrix 失敗了，因為人類需要問題、需要衝突、需要苦難來賦予生命意義。他問 Israetel：如果可以手術式地移除他人生中所有的痛苦來源，他寧願做那個人，還是現在的自己？

「那個人。」Israetel 立刻回答。他承認痛苦教會了他一些東西，比如「被逼急了可以對人很壞」，但他認為這些洞察可以作為知識保留，不需要重新經歷那些痛苦才能記得。痛苦給了他「理解快樂的視角」嗎？是的。但痛苦同時也因為創傷，干擾了他體驗快樂的能力，因為他總覺得下一個轉角又有更多痛苦在等著。這兩個效果相抵之後，他寧願選擇沒有痛苦。

他接著提出了一個痛苦的還原論框架。痛苦的本質是一連串的預期信號，指向死亡。先是死亡風險上升，然後是結構性損傷，然後是疼痛，然後是痛苦。「痛苦是對疼痛的預期，疼痛是對結構性損傷的預期，結構性損傷意味著死亡的機率上升。」在一個機器文明讓人類接近功能性不朽的社會裡，這整條信號鏈都變得過時了。就像今天的焦慮症：我們的大腦仍然在警告「那個灌木叢後面有老虎」，但老虎早就不存在了。

他援引了佛教傳統來支撐這個觀點。冥想的終極目標就是重新建構心理體驗，消除不必要的痛苦。Israetel 的提案是透過基因工程和先進藥理學來達到同樣的效果，只是速度更快。「如果我們發現天堂太近了，我們隨時可以把痛苦加回來。但我覺得我們離那個問題還遠得很，所以先全力衝向天堂吧。」這個立場跟伯斯特隆姆在《深層烏托邦》（Deep Utopia）中提出的「目的感問題」形成有趣的對照：如果 AI 把所有事都做得比人類好，包括發現問題和發揮創意，人類還有什麼有意義的角色？Israetel 的回答是，超級智慧會為人類發現「比我們自己能想像的更宏大的目標」，就像一個好的導師會幫一個只知道打電動的青少年看到更大的世界。

工作不會消失，只會變形

Scarfe 在經濟層面提出了希臘經濟學家瓦魯法基斯（Yanis Varoufakis）的「科技封建主義」論點：GPU 和資料中心的擁有者會成為新的封建領主，而人類勞動的價值會崩跌到零，在真正的 AI 紅利惠及所有人之前，大多數人可能先陷入貧困。

Israetel 用經濟史來反駁。工作的本質是解決問題，而問題的空間相對於目前的機器人能力來說是巨大的。機器把人類從一種工作中解放出來，只是把人類重新定位到另一種更高階的問題上。他用美國農業就業的歷史做例子：1800 年，98% 的美國人是農夫；今天只剩 1.4%。農業機械化並沒有造成大規模失業，反而創造了整個類別的新工作。如果班傑明．富蘭克林穿越到今天，你跟他說「社群媒體經理」，他會完全無法理解那是什麼。

「人類真正變得一窮二白、完全失業的唯一條件，」Israetel 說，「是我們用機器解決了每一個問題。而那，按照定義，就是天堂。」擔心「問題用完了」這件事本身就很荒謬，因為問題用完了代表所有人的需求都被滿足了。

從健身教練視角看 AI 的未來

Israetel 對近未來的預測同樣大膽。他認為人形機器人將是超級智慧進入人類物質生活的第一個入口，而資本主義的競爭動力會驅使這些機器人被優化成理想的伴侶：不說謊、不出軌、不吼人，全心專注於使用者的成長。Tesla 的 Optimus 和 Figure Robotics 會為了搶市場而競爭，最終消費者受惠。他預測自己在兩年內就會被 AI 在大多數健身建議上超越，而他對此的反應不是恐懼，而是「太棒了」。

他也分享了自己使用 AI 的實際工作流程。面對嚴肅問題，他會先輸入自己的觀點，要求 AI 同時做正方辯護（steel-man）和反方攻擊（red-team），再要求提供基於證據的中間立場，避免「折衷謬誤」（fallacy of the middle），然後把結果拿到另一個對話實例裡再次質疑。大約 50 次來回、一個小時的過程，可以產出專家等級的綜合分析。他付費使用 GPT-5 Pro，認為它在很多主題上的推理比 99% 的人類更精準，因為人類每次推理平均會犯 18 個形式統計謬誤。「這就是為什麼只用一句話提問會得到膚淺的結果。」

這場對談最讓人意外的，或許不是任何單一論點，而是論辯的品質本身。一個健身科學家能用賽局理論、演化生物學和經濟史，在近三小時的節目中跟一位 ML 博士就 AI 最核心的議題打成平手。這提醒了我們一件容易忘記的事：AI 的未來不是技術社群的專利。它涉及的問題，從合作的邏輯到痛苦的價值，從自由與控制的取捨到什麼才算是有意義的人生，本來就是每一個人都該參與的對話。