AI 技術前沿

「模擬的火會燙嗎？」一場健身科學家與 AI 博士的意識大辯論

MLST 節目上，運動科學家 Mike Israetel 與電腦科學博士 Tim Scarfe 就 AI 意識展開近三小時辯論。模擬的火會燙嗎？模擬的胃能消化嗎？功能主義與具身認知的正面交鋒，揭示 AI 最根本的哲學問題。

2026 年 6 月 2 日 · 來源： Machine Learning Street Talk (MLST)

本文整理自 Machine Learning Street Talk（MLST）2025 年 12 月播出的單集。

{{< apple-podcast "tw/podcast/i-desperately-want-to-live-in-the-matrix-dr-mike-israetel/id1510472996?i=1000742592242" >}}

當健身網紅走進 AI 辯論場

「如果你在電腦裡模擬一團火，它會燙嗎？模擬一個胃，它能消化嗎？」MLST 主持人、電腦科學博士 Tim Scarfe 丟出這個問題時，語氣篤定。他的答案是不會。火的模擬不會產生熱，水的模擬不會弄濕你。物理屬性是特定物質的湧現特性，不是運算可以複製的東西。

坐在對面的人不是 AI 研究者，而是 RP Strength 共同創辦人暨運動科學家 Mike Israetel。他的 YouTube 頻道有超過 350 萬訂閱者，主要內容是健身和營養科學。但這個自稱 AI「門外漢」的人，用了近三小時跟一位 ML 博士就 AI 意識、模擬理論和功能主義展開了一場火力全開的哲學辯論。他的回應同樣篤定：如果你逐粒子模擬一個胃，再把模擬的食物送進去，它就是真正的消化，因為那個模擬本身就是一個「口袋宇宙」。

這場對話值得關注，不只是因為論點精彩，更因為它示範了一件事：AI 最核心的哲學問題，其實不需要 AI 專業背景才能切入。Israetel 從演化生物學、賽局理論和認知科學的角度，對功能主義提出了一套有說服力的辯護；Scarfe 則從 Dreyfus、Searle 到 David Krakauer 的學術傳統，築起了一道反功能主義的高牆。兩人各有所長，誰也沒說服誰。

知識可以搬運嗎？符號接地問題

Scarfe 的核心論點從一個老問題開始：符號接地問題（Symbol Grounding Problem）。這個由哲學家 Dreyfus、Searle 和 Stevan Harnad 分別闡述的概念，指的是語法和語義之間存在一道無法跨越的鴻溝。維基百科上的知識只是「指標」，指向人類透過身體在真實世界中累積的經驗。離開了那些經驗，符號就只是符號，不構成理解。

Scarfe 用了一個登山的比喻來說明他的立場。哲學家 Anna Ciaunica 提出：理解不是站在山頂，而是爬山的路徑本身。這個比喻精準地捕捉了具身認知的核心主張，智慧是「適應性物質」的屬性，就像溫度是分子運動的湧現屬性。你沒辦法把它從物理基底抽離出來，放到任意的運算基底上運行。David Krakauer 的「物質性原則」進一步強化了這個論點：我們是用世界本身來思考的，不是用世界的抽象表徵。

Israetel 的反擊從一個巧妙的思想實驗開始。沒有任何物理學家曾經親身感受過一顆微中子。微中子穿過整個地球，不跟任何東西產生有意義的作用，人類的感官完全無法偵測它。但運行 CERN 大型強子對撞機的科學家，顯然具備真實、有效的粒子物理學知識。如果具身經驗是理解的必要條件，那沒有人應該能理解粒子物理學，但科學家們明明就能。這個例子直接動搖了「所有知識都必須紮根於身體經驗」的前提。

「你的大腦裡其實沒有什麼神奇的東西，」Israetel 說。「它就是神經網路彼此遞迴地傳遞訊號。你的大腦在很多深層意義上，跟一個資料中心一樣抽象，一樣與現實脫節。」這段話直接挑戰了具身認知的前提：如果大腦本身就是一個「抽象化的表徵系統」，那憑什麼說資料中心的抽象化就比較低級？Scarfe 承認大腦確實是透過多層抽象來處理感官輸入的，但他堅持這與資料中心有本質差異，因為大腦是因果鏈的一部分，嵌入在物理世界的粒子級網路中。

YouTube 全餵給 AI，它能比人更懂世界嗎？

辯論延伸到了一個更具體的場景。Israetel 主張，如果把 YouTube 上所有的 4K 影片拿來訓練一個視覺模型，建構出一個三維關聯世界模型，這個模型對視覺世界的「理解」會比任何人類一輩子累積的視覺經驗更豐富。他的理由很直接：人類童年的記憶其實是高度壓縮、大量填補的片段，十秒鐘的真實記憶裡可能有一半是大腦事後編造的。人類的眼睛「也只是攝影機」，把訊號餵給一台生物電腦。

Scarfe 承認統計泛化的威力出乎意料。沒有人預料到，從表層的統計規律中竟然能擠出如此驚人的泛化能力。Tesla 的自動駕駛確實在某些方面超越了人類駕駛，這一點他不否認。但他堅持這跟真正的具身認知不是同一回事。演化產生的表徵是路徑依賴的、集體共享的，它把抽象語言紮根在一種 YouTube 訓練無法複製的方式裡。關鍵不是視覺資料的量，而是處理的方式：目前的 AI 做的是「分佈匹配」和統計泛化，不是生物意義上的適應和理解。

這個分歧直接反映在他們對「AI 到底懂不懂」這件事的根本不同判斷上。Israetel 認為理解是一個光譜，從 GPT-3.5 到 GPT-5 代表的是真正的理解增量，不只是更好的模仿。他引用 Andrej Karpathy 的觀點來支撐自己的立場：認為靈長類動物「大部分時間在抓自己的睾丸，偶爾做點理論物理」就代表了所有可能智慧的上限，這種想法「荒謬到不行」。人類只佔據了可能智慧空間中極其狹窄的一個角落。Scarfe 則援引 Karpathy 的另一個概念「AI 生成廢料」（AI slop），把它定義為「一個沒有理解的過程產出的成品」。他用 AI 生成的 3D 模型做例子：表面看起來還行，但頂點分佈完全混亂，只有具備空間理解的藝術家能看出問題。

模擬的火到底會不會燙？

辯論最尖銳的交鋒發生在模擬理論。Scarfe 引用 Searle 的中文房間論證，主張模擬無法產出被模擬對象的物理屬性：模擬的胃不能消化，模擬的火不會燙。這反映了他的核心信念，意識和智慧是特定物理物質的「強湧現」屬性，跟溫度是分子運動的湧現屬性一樣，不是基底無關的功能。你可以在電腦上模擬一團火的所有行為，但運行模擬的那台電腦不會變燙。

Israetel 用「口袋宇宙」的概念反擊。他的論點是：如果模擬的精細度達到逐粒子的層級，那麼模擬內部的一切都會按照真實物理規則運作。模擬的食物通過模擬的胃，就是真正的消化，因為在那個運算宇宙裡，物理定律是相同的。就像如果我們的宇宙本身是某個外星文明手中彈珠裡的模擬，我們依然會感受到真實的物理。外面那個拿著彈珠的外星人不會因為我們的太陽而感到燙，但我們會。

他進一步用夢境來支撐這個論點。在夢裡，人類會感受到真實的濕度、恐懼和疼痛，儘管身體完全沒有接觸到任何外部刺激。一隻被截肢的手臂，如果神經已經切斷，就不會感到任何疼痛，即使物理損傷已經發生。「感受到真實的東西，唯一的必要條件就是你的大腦在運作。」Israetel 認為這證明了意識體驗是運算屬性，不是物理基底的專屬產物。疼痛是「心因性」的，它發生在運算層面，不在物質層面。

Scarfe 搬出了「哲學殭屍」做最後的反擊。想像一個在功能上完美複製了 Israetel 所有行為的模擬體，外觀、語言、反應都一模一樣，但內部沒有任何主觀意識體驗。如果這種東西在邏輯上是可能的，功能主義就站不住腳，因為功能等價不等於認知等價。Israetel 斷然否認哲學殭屍的可能性：「不存在這種東西。」如果所有的功能屬性都到位了，正確的表徵結構、邏輯運算、遞迴處理都在，主觀體驗就必然隨之而來。

推理模型到底有沒有在推理？

辯論的另一個焦點是推理模型（如 O3、GPT-5）是否真的在推理。Scarfe 引用可解釋性研究指出，AI 模型中負責「解釋決策」的迴路和實際「做出決策」的迴路是分離的。推理痕跡（chain of thought）其實是事後編造的合理化解釋，跟人類的事後歸因（post-hoc confabulation）如出一轍。他提到一個很有意思的證據：在 ARC v2 基準測試中，把 Opus 4.5 的輸出 token 預算從 32K 提高到 64K，表現確實提升了大約 5%，但推理痕跡本身「大多相當不連貫」。表現變好了，但解釋的品質沒有同步提升。

Israetel 承認事後編造的問題存在，但認為 O3 的推理品質確實讓他印象深刻。他用自己的壓力測試經驗為例：O3 曾直接告訴他「那個假設很蠢，我根本不會問那個問題」，這種深度的反駁和修正超越了大多數人類的推理水準。他認為「AI 不會推理」在 2022、2023 年是完全正確的批評，但在 O3 和 GPT-5 之後，還在堅持這個觀點的人「只是落後了兩年」。

兩人在一件事上達成罕見的共識：持續學習（continual learning）是目前 AI 架構的關鍵瓶頸。大型語言模型在推論時權重是凍結的，就像一個被吹大一百倍的壓縮檔，能覆蓋到訓練資料從未觸及的統計空間，但本身沒有在適應。新領域的微調會摧毀舊有知識（災難性遺忘），而完整重新訓練的成本是數百萬美元。Israetel 提出了一個嵌套式架構的構想：頂層核心模型在德州或內華達的大型資料中心每半年更新一次，區域級伺服器每月更新，個人裝置端每晚更新。他用人類的睡眠來類比：「人類為什麼需要睡覺？因為在運作中改寫模型的權重，結構上是不安全的。」他預測這個問題會在 2030 年左右被攻克，屆時 AI 的能力會出現真正的質變。

這場辯論告訴我們什麼

兩個半小時的激辯之後，沒有人改變立場。Scarfe 依然認為意識是特定物質的湧現屬性，不可能在矽基上複製；Israetel 依然堅持功能主義，認為足夠精細的運算就是那個東西本身。他甚至宣稱，如果把一個人的大腦逐粒子掃描後傳輸到機器人裡，「你會在機器人裡醒來」，而且你做的第一件事大概會是檢查自己的新身體有沒有該有的部位。Scarfe 對此搖頭。

但這場辯論的價值不在於誰贏了。它讓我們看到，AI 領域最根本的問題其實是幾百年前哲學家就在爭論的：意識是什麼？理解是什麼？物理世界和運算之間的關係是什麼？這些問題不會因為模型越來越大就自動有答案。而一個用微中子、夢境和胃的消化功能來跟 ML 博士打成平手的健身科學家，本身就說明了一件事：面對這些問題，沒有人是真正的專家，也沒有人是真正的門外漢。