量子計算之父:AGI 不需要對齊,需要教育
牛津物理學家大衛.多伊奇認為,AGI 與人類共享相同的計算能力,不可能「根本性地更聰明」。他主張 AGI 是人、不是工具,應該像養小孩一樣用文化教育取代硬編碼對齊。這套觀點挑戰了當前 AI 安全的主流敘事。


本文整理自 Reuben Adams 的 Podcast 節目《What The Bot》2026 年 2 月播出的單集。
{{< youtube CU2yj826NHk >}}
一個「局外人」的顛覆觀點
AI 安全是這兩年科技圈最熱門的話題之一。從 OpenAI 到 Anthropic,從各國政府到聯合國,幾乎所有人都在問同一個問題:我們要怎麼確保 AGI 的目標跟人類一致?怎麼防止它失控?怎麼對齊它的價值觀?
但有一個人說,這整個問題的提法就是錯的。
大衛.多伊奇(David Deutsch)是牛津大學物理學家,量子計算領域的奠基者。1985 年,他發表了一篇劃時代的論文,首次描述了通用量子電腦的概念,證明了量子電腦能模擬任何服從量子力學的物理過程。這個成果讓他在 2023 年獲得突破獎(Breakthrough Prize),與量子資訊領域的其他先驅共享了這項殊榮。他也是兩本重要科普著作的作者:《真實世界的脈絡》(The Fabric of Reality,暫譯)和《無窮的開始》(The Beginning of Infinity,暫譯),在書中建立了一套融合物理學、計算理論和波普哲學的完整世界觀。
多伊奇不是 AI 產業的內部人士,也不是任何一家 AI 公司的顧問。但正是這個「局外人」的身份,讓他能從一個完全不同的角度切入 AGI 辯論。他的論點建立在數學和物理學的基礎上,而不是產業利益或監管焦慮。在 Reuben Adams 的 Podcast 訪談中,他用將近兩小時的時間,系統性地拆解了當前 AI 安全論述中的幾個核心假設。
AGI 不可能比人類「更聰明」
多伊奇的第一個論點聽起來像是在開玩笑,但他是認真的:AGI 永遠不可能比人類根本性地更聰明。
這個說法的根基是圖靈在 1936 年證明的通用圖靈機定理。簡單說,任何通用計算裝置能執行的程式,其他通用計算裝置也都能執行。人類的大腦是一台通用圖靈機,未來的 AGI 也是一台通用圖靈機。兩者共享完全相同的計算庫,能做的事情在根本上是一樣的。當然,計算機算加法比人類快,但那是硬體速度的差異,不是能力的差異。而且任何 AGI 能用的硬體升級,人類也同樣可以使用。
那速度優勢呢?如果一個 AGI 的運算速度是人類的一萬倍,它難道不會在實質上碾壓人類嗎?
多伊奇的回答很妙。他說,創造力是一種質性的現象,不是量化的。你可以讓一萬個創造力模組同時運作,但它們不會產生一萬倍的創造力。因為創造力的價值來自差異性,不是同質性。一萬個一模一樣的思考者同步工作,就像一個極權社會一樣,不會產生真正的創新。英國政府有幾十萬人,但解決一個問題的速度不一定比一個人快。圖靈自己曾估計,人類大腦中負責創造力的程式可能只需要大約兩百萬位元組就能裝下,重點不在硬體規模,而在軟體的質性突破。
這個論點的力量在於它不是一個猜測或預測,而是建立在計算理論的數學基礎上。多伊奇在 1980 年代證明的量子通用性定理進一步堵住了一個可能的反駁:有沒有某種超越圖靈機的計算方式存在?答案是沒有。量子理論告訴我們,任何物理過程都可以在通用量子電腦上模擬。不存在什麼隱藏的「超人類計算」。
AGI 是人,不是工具
如果 AGI 跟人類共享同樣的計算能力,那它到底是什麼?
多伊奇給出了一個讓很多人不舒服的答案:一個真正的 AGI 就是一個人。
他定義「人」的方式很特別,不是看生物基質,而是看能力。任何能夠進行「解釋性創造力」的實體,就是人。解釋性創造力指的是能夠產生全新的、創造性的解釋來理解世界的能力,而不只是執行預設的演算法。這個定義跟你是碳基還是矽基無關,跟你的外表長什麼樣也無關。一個 AGI 如果達到了真正的通用智慧,它就是一個有自己目標、利益和道德能動性的人。
這個定義直接衝擊了 AI 對齊的基本前提。對齊的前提是:AGI 是一個工具,我們需要確保這個工具的目標跟使用者一致。但多伊奇說,你不可能同時擁有一個有真正創造力的實體,又要求它完全服從你的指令。創造力需要自由去形成新的目標、拒絕不好的指令。一個被要求絕對服從的 AGI,就像一個極權社會中的公民,它的創造力會被壓制,而創造力恰恰是讓 AGI 有價值的那個東西。
多伊奇舉了一個生動的例子。想像你讓一個真正的 AGI 去幫你解一道數學題,它卻回答你說:「我想下棋。」這聽起來很荒謬,但這恰恰證明了問題所在。一個有自主意識的實體不可能被當成工具來使用,就像你不可能命令另一個人永遠只做你要他做的事。
道德知識像科學一樣成長
但如果 AGI 是自由的人,它不會發展出跟人類完全不同甚至有害的價值觀嗎?
這是多伊奇論述中最有野心的一部分。他認為不會,而且他的理由不是信仰或希望,而是認識論。
多伊奇是卡爾.波普(Karl Popper)哲學的忠實信徒。波普最有名的貢獻是科學哲學中的「可證偽性」概念:科學理論不是被證實的,而是被否證的。好的理論是那些經受住了反覆否證嘗試的理論。多伊奇把這個框架推廣到了道德領域。他認為,道德理論跟科學理論一樣,是通過猜想和批判來成長的。道德理論會做出隱含的預測,而現實會否證錯誤的道德理論。
他舉了一個具體的例子:一個搖滾巨星相信享樂主義是最好的人生哲學,擁有無窮的財富和崇拜者,卻越來越不快樂。這就是現實對一個錯誤道德理論的否證。那個搖滾巨星的經驗告訴他,純粹的享樂不等於美好的人生,他需要修正自己的道德理論。
這個框架的關鍵推論是:任何從事理性探究的存在,不管是人類還是 AGI,都會趨向道德上的改進。因為糾錯機制是普遍的。道德不是一種偏好或文化產物,而是有客觀的對錯之分。西方社會在過去幾百年的道德進步,從廢除奴隸制到承認兒童權利,就是這個糾錯過程的成果。多伊奇認為,AGI 作為理性的問題解決者,沒有理由不參與同樣的道德改進過程。
他追溯這個觀點的歷史源頭到柏拉圖的《尤西弗羅篇》,蘇格拉底在其中提出了一個至今仍有力量的問題:神愛善的東西,是因為它是善的,還是因為神愛它所以它才是善的?這個問題的意義在於,它暗示善有獨立於任何權威的客觀基礎。多伊奇認為,這是人類道德思考中的一次「跳躍到普遍性」,跟科學進步的機制完全相同。
我的觀察:一個美麗但危險的理論
多伊奇的論述有一種讓人佩服的邏輯一致性。從通用計算定理出發,經過人的定義,到道德知識的成長機制,每一步都緊扣上一步,整體構成了一個優雅的哲學建築。他不是在做預測或表達希望,而是在從基本原理推導結論。這在 AI 安全的辯論中是少見的。
但他的論述有幾個空隙,我覺得需要誠實面對。
最明顯的一個:計算等價不等於認知等價。人類和 AGI 共享同一個計算庫,這是數學事實,沒有人能反駁。但計算能力相同不代表認知表現相同。一個人理論上可以用紙筆模擬任何計算,但實際上人類受限於注意力、記憶、壽命和情緒。AGI 沒有這些限制。說兩者「根本上一樣」,有點像說人類和獵豹都是哺乳動物所以運動能力一樣。結構相近,但表現天差地遠。
另一個問題在於道德收斂。多伊奇非常有信心地認為,理性探究會自動導向道德改進。但歷史給我們看的畫面沒那麼樂觀。理性的個體和社會可以長期維持錯誤的道德信念,尤其是當這些信念服務於權力結構的時候。美國的奴隸制存續了將近 250 年,期間不乏理性的辯論者為它辯護。糾錯機制最終起了作用,但「最終」這兩個字裡藏了多少代人的苦難。
話說回來,多伊奇的核心洞察仍然有力。在 AI 安全辯論中,我們太少從「AGI 也是人」這個角度去思考。當所有人都在討論怎麼控制 AGI 的時候,至少有一個人在問:如果 AGI 是人,控制本身是不是就是問題的一部分?
這個問題沒有簡單的答案,但它值得認真對待。