「模擬的火會燙嗎?」一場健身科學家與 AI 博士的意識大辯論

MLST 節目上,運動科學家 Mike Israetel 與電腦科學博士 Tim Scarfe 就 AI 意識展開近三小時辯論。模擬的火會燙嗎?模擬的胃能消化嗎?功能主義與具身認知的正面交鋒,揭示 AI 最根本的哲學問題。

「模擬的火會燙嗎?」一場健身科學家與 AI 博士的意識大辯論

本文整理自 Machine Learning Street Talk(MLST)2025 年 12 月播出的單集。

{{< youtube 4yYcN_mFi18 >}}

{{< spotify "episode/3XZOIyqYBERxTLUUWA9yov" >}}

{{< apple-podcast "tw/podcast/i-desperately-want-to-live-in-the-matrix-dr-mike-israetel/id1510472996?i=1000742592242" >}}


當健身網紅走進 AI 辯論場

「如果你在電腦裡模擬一團火,它會燙嗎?模擬一個胃,它能消化嗎?」MLST 主持人、電腦科學博士 Tim Scarfe 丟出這個問題時,語氣篤定。他的答案是不會。火的模擬不會產生熱,水的模擬不會弄濕你。物理屬性是特定物質的湧現特性,不是運算可以複製的東西。

坐在對面的人不是 AI 研究者,而是 RP Strength 共同創辦人暨運動科學家 Mike Israetel。他的 YouTube 頻道有超過 350 萬訂閱者,主要內容是健身和營養科學。但這個自稱 AI「門外漢」的人,用了近三小時跟一位 ML 博士就 AI 意識、模擬理論和功能主義展開了一場火力全開的哲學辯論。他的回應同樣篤定:如果你逐粒子模擬一個胃,再把模擬的食物送進去,它就是真正的消化,因為那個模擬本身就是一個「口袋宇宙」。

這場對話值得關注,不只是因為論點精彩,更因為它示範了一件事:AI 最核心的哲學問題,其實不需要 AI 專業背景才能切入。Israetel 從演化生物學、賽局理論和認知科學的角度,對功能主義提出了一套有說服力的辯護;Scarfe 則從 Dreyfus、Searle 到 David Krakauer 的學術傳統,築起了一道反功能主義的高牆。兩人各有所長,誰也沒說服誰。

知識可以搬運嗎?符號接地問題

Scarfe 的核心論點從一個老問題開始:符號接地問題(Symbol Grounding Problem)。這個由哲學家 Dreyfus、Searle 和 Stevan Harnad 分別闡述的概念,指的是語法和語義之間存在一道無法跨越的鴻溝。維基百科上的知識只是「指標」,指向人類透過身體在真實世界中累積的經驗。離開了那些經驗,符號就只是符號,不構成理解。

Scarfe 用了一個登山的比喻來說明他的立場。哲學家 Anna Ciaunica 提出:理解不是站在山頂,而是爬山的路徑本身。這個比喻精準地捕捉了具身認知的核心主張,智慧是「適應性物質」的屬性,就像溫度是分子運動的湧現屬性。你沒辦法把它從物理基底抽離出來,放到任意的運算基底上運行。David Krakauer 的「物質性原則」進一步強化了這個論點:我們是用世界本身來思考的,不是用世界的抽象表徵。

Israetel 的反擊從一個巧妙的思想實驗開始。沒有任何物理學家曾經親身感受過一顆微中子。微中子穿過整個地球,不跟任何東西產生有意義的作用,人類的感官完全無法偵測它。但運行 CERN 大型強子對撞機的科學家,顯然具備真實、有效的粒子物理學知識。如果具身經驗是理解的必要條件,那沒有人應該能理解粒子物理學,但科學家們明明就能。這個例子直接動搖了「所有知識都必須紮根於身體經驗」的前提。

「你的大腦裡其實沒有什麼神奇的東西,」Israetel 說。「它就是神經網路彼此遞迴地傳遞訊號。你的大腦在很多深層意義上,跟一個資料中心一樣抽象,一樣與現實脫節。」這段話直接挑戰了具身認知的前提:如果大腦本身就是一個「抽象化的表徵系統」,那憑什麼說資料中心的抽象化就比較低級?Scarfe 承認大腦確實是透過多層抽象來處理感官輸入的,但他堅持這與資料中心有本質差異,因為大腦是因果鏈的一部分,嵌入在物理世界的粒子級網路中。

YouTube 全餵給 AI,它能比人更懂世界嗎?

辯論延伸到了一個更具體的場景。Israetel 主張,如果把 YouTube 上所有的 4K 影片拿來訓練一個視覺模型,建構出一個三維關聯世界模型,這個模型對視覺世界的「理解」會比任何人類一輩子累積的視覺經驗更豐富。他的理由很直接:人類童年的記憶其實是高度壓縮、大量填補的片段,十秒鐘的真實記憶裡可能有一半是大腦事後編造的。人類的眼睛「也只是攝影機」,把訊號餵給一台生物電腦。

Scarfe 承認統計泛化的威力出乎意料。沒有人預料到,從表層的統計規律中竟然能擠出如此驚人的泛化能力。Tesla 的自動駕駛確實在某些方面超越了人類駕駛,這一點他不否認。但他堅持這跟真正的具身認知不是同一回事。演化產生的表徵是路徑依賴的、集體共享的,它把抽象語言紮根在一種 YouTube 訓練無法複製的方式裡。關鍵不是視覺資料的量,而是處理的方式:目前的 AI 做的是「分佈匹配」和統計泛化,不是生物意義上的適應和理解。

這個分歧直接反映在他們對「AI 到底懂不懂」這件事的根本不同判斷上。Israetel 認為理解是一個光譜,從 GPT-3.5 到 GPT-5 代表的是真正的理解增量,不只是更好的模仿。他引用 Andrej Karpathy 的觀點來支撐自己的立場:認為靈長類動物「大部分時間在抓自己的睾丸,偶爾做點理論物理」就代表了所有可能智慧的上限,這種想法「荒謬到不行」。人類只佔據了可能智慧空間中極其狹窄的一個角落。Scarfe 則援引 Karpathy 的另一個概念「AI 生成廢料」(AI slop),把它定義為「一個沒有理解的過程產出的成品」。他用 AI 生成的 3D 模型做例子:表面看起來還行,但頂點分佈完全混亂,只有具備空間理解的藝術家能看出問題。

模擬的火到底會不會燙?

辯論最尖銳的交鋒發生在模擬理論。Scarfe 引用 Searle 的中文房間論證,主張模擬無法產出被模擬對象的物理屬性:模擬的胃不能消化,模擬的火不會燙。這反映了他的核心信念,意識和智慧是特定物理物質的「強湧現」屬性,跟溫度是分子運動的湧現屬性一樣,不是基底無關的功能。你可以在電腦上模擬一團火的所有行為,但運行模擬的那台電腦不會變燙。

Israetel 用「口袋宇宙」的概念反擊。他的論點是:如果模擬的精細度達到逐粒子的層級,那麼模擬內部的一切都會按照真實物理規則運作。模擬的食物通過模擬的胃,就是真正的消化,因為在那個運算宇宙裡,物理定律是相同的。就像如果我們的宇宙本身是某個外星文明手中彈珠裡的模擬,我們依然會感受到真實的物理。外面那個拿著彈珠的外星人不會因為我們的太陽而感到燙,但我們會。

他進一步用夢境來支撐這個論點。在夢裡,人類會感受到真實的濕度、恐懼和疼痛,儘管身體完全沒有接觸到任何外部刺激。一隻被截肢的手臂,如果神經已經切斷,就不會感到任何疼痛,即使物理損傷已經發生。「感受到真實的東西,唯一的必要條件就是你的大腦在運作。」Israetel 認為這證明了意識體驗是運算屬性,不是物理基底的專屬產物。疼痛是「心因性」的,它發生在運算層面,不在物質層面。

Scarfe 搬出了「哲學殭屍」做最後的反擊。想像一個在功能上完美複製了 Israetel 所有行為的模擬體,外觀、語言、反應都一模一樣,但內部沒有任何主觀意識體驗。如果這種東西在邏輯上是可能的,功能主義就站不住腳,因為功能等價不等於認知等價。Israetel 斷然否認哲學殭屍的可能性:「不存在這種東西。」如果所有的功能屬性都到位了,正確的表徵結構、邏輯運算、遞迴處理都在,主觀體驗就必然隨之而來。

推理模型到底有沒有在推理?

辯論的另一個焦點是推理模型(如 O3、GPT-5)是否真的在推理。Scarfe 引用可解釋性研究指出,AI 模型中負責「解釋決策」的迴路和實際「做出決策」的迴路是分離的。推理痕跡(chain of thought)其實是事後編造的合理化解釋,跟人類的事後歸因(post-hoc confabulation)如出一轍。他提到一個很有意思的證據:在 ARC v2 基準測試中,把 Opus 4.5 的輸出 token 預算從 32K 提高到 64K,表現確實提升了大約 5%,但推理痕跡本身「大多相當不連貫」。表現變好了,但解釋的品質沒有同步提升。

Israetel 承認事後編造的問題存在,但認為 O3 的推理品質確實讓他印象深刻。他用自己的壓力測試經驗為例:O3 曾直接告訴他「那個假設很蠢,我根本不會問那個問題」,這種深度的反駁和修正超越了大多數人類的推理水準。他認為「AI 不會推理」在 2022、2023 年是完全正確的批評,但在 O3 和 GPT-5 之後,還在堅持這個觀點的人「只是落後了兩年」。

兩人在一件事上達成罕見的共識:持續學習(continual learning)是目前 AI 架構的關鍵瓶頸。大型語言模型在推論時權重是凍結的,就像一個被吹大一百倍的壓縮檔,能覆蓋到訓練資料從未觸及的統計空間,但本身沒有在適應。新領域的微調會摧毀舊有知識(災難性遺忘),而完整重新訓練的成本是數百萬美元。Israetel 提出了一個嵌套式架構的構想:頂層核心模型在德州或內華達的大型資料中心每半年更新一次,區域級伺服器每月更新,個人裝置端每晚更新。他用人類的睡眠來類比:「人類為什麼需要睡覺?因為在運作中改寫模型的權重,結構上是不安全的。」他預測這個問題會在 2030 年左右被攻克,屆時 AI 的能力會出現真正的質變。

這場辯論告訴我們什麼

兩個半小時的激辯之後,沒有人改變立場。Scarfe 依然認為意識是特定物質的湧現屬性,不可能在矽基上複製;Israetel 依然堅持功能主義,認為足夠精細的運算就是那個東西本身。他甚至宣稱,如果把一個人的大腦逐粒子掃描後傳輸到機器人裡,「你會在機器人裡醒來」,而且你做的第一件事大概會是檢查自己的新身體有沒有該有的部位。Scarfe 對此搖頭。

但這場辯論的價值不在於誰贏了。它讓我們看到,AI 領域最根本的問題其實是幾百年前哲學家就在爭論的:意識是什麼?理解是什麼?物理世界和運算之間的關係是什麼?這些問題不會因為模型越來越大就自動有答案。而一個用微中子、夢境和胃的消化功能來跟 ML 博士打成平手的健身科學家,本身就說明了一件事:面對這些問題,沒有人是真正的專家,也沒有人是真正的門外漢。