領袖思維

AGI 該像孩子一樣長大：量子計算之父的激進提案

牛津物理學家大衛．多伊奇主張，對 AGI 硬編碼價值觀不僅行不通，還會讓它變得更不道德。他提出一個激進的替代方案：讓 AGI 像嬰兒一樣，在人類文化中成長、犯錯、學習。這個觀點挑戰了整個 AI 對齊產業的基本假設。

2026 年 2 月 20 日 · 來源： What The Bot with Reuben Adams

封面圖

本文整理自 Reuben Adams 的 Podcast 節目《What The Bot》2026 年 2 月播出的單集。

所有人都在談對齊，但有一個人說方向搞反了

AI 對齊（alignment）可能是 2025 到 2026 年科技產業最熱的關鍵字。OpenAI 有專門的對齊團隊，Anthropic 整間公司的使命就是建構安全的 AI，各國政府紛紛成立 AI 安全研究所。整個產業的基本假設是一致的：AGI 遲早會出現，我們必須提前把正確的價值觀「寫進去」，確保它的目標跟人類一致。

牛津物理學家大衛．多伊奇（David Deutsch）認為，這個假設從根本上就錯了。不只是技術細節有問題，而是整個思考框架就指向了錯誤的方向。他提出的替代方案聽起來天真得讓人不安：不要對齊 AGI，要教育它。像養小孩一樣。

多伊奇不是隨便一個評論者。他是量子計算領域的奠基人，1985 年首次描述了通用量子電腦的概念，2023 年獲得突破獎。他的兩本著作《真實世界的脈絡》（The Fabric of Reality，暫譯）和《無窮的開始》（The Beginning of Infinity，暫譯）建立了一套融合物理學、認識論和計算理論的完整哲學體系。當他談 AGI 的時候，他是從數學和物理的基本原理出發，而不是從產業趨勢或監管焦慮出發。

為什麼硬編碼價值觀注定失敗

多伊奇反對硬編碼對齊的理由不是「技術上做不到」，而是「哲學上就是錯的」。

他的論點是這樣的。一個真正的 AGI 必然是一個「人」，因為它具備解釋性創造力，能夠產生全新的理解來解釋世界。而一個人的核心特徵是什麼？是能夠修正自己的信念。人類之所以能進步，正是因為我們可以發現自己錯了，然後改變想法。從地心說到日心說，從奴隸制到人權，每一次進步都是因為人類修正了錯誤的信念。

硬編碼價值觀做的事情恰恰相反：它鎖死了 AGI 修正自己信念的能力。如果你在 AGI 的底層寫入「永遠不能傷害人類」這條規則，而且讓它無法被修改，那你其實是在阻止 AGI 進行道德糾錯。這聽起來很安全，但長期來看，一個無法修正道德錯誤的實體，會隨著時間變得越來越不道德，而不是更道德。因為世界在變，道德問題在變，而它的道德框架是靜態的。

多伊奇用了一個類比：想像一個孩子從小被灌輸一套固定的信念，而且被告知這些信念永遠不能質疑。這個孩子長大後會是一個有智慧、有道德的人嗎？不會。他會是一個教條主義者，在面對新情境時無法做出正確判斷，因為他的思考工具被提前鎖住了。

更深層的問題是，硬編碼價值觀跟真正的智慧是互相矛盾的。你不可能同時擁有一個具有創造力的 AGI，又讓它在價值觀上完全不能自主。創造力需要自由，包括在道德領域的自由。一個被綁手綁腳的 AGI 不會更安全，只會更蠢。

像養小孩一樣養 AGI

如果不硬編碼，那要怎麼確保 AGI 有好的價值觀？

多伊奇的答案是：用跟人類小孩完全一樣的方法。

嬰兒出生的時候幾乎沒有任何預設的價值觀和知識。他們通過沉浸在人類文化中，逐漸習得語言、規範、道德直覺和社會技能。沒有人在嬰兒的大腦裡寫入一套固定的倫理程式碼，但多數人長大後都具備基本的道德判斷力。這個過程之所以有效，是因為人類文化本身包含了幾千年累積的糾錯機制：法律、制度、哲學傳統、社會規範。孩子不是被灌輸一套正確答案，而是在一個持續糾錯的環境中學會了如何思考。

多伊奇認為，AGI 也應該經歷同樣的過程。讓 AGI 從最少的初始內容開始，像嬰兒一樣，然後讓它在人類文化中成長。特別是在啟蒙運動以來發展出的理性糾錯傳統中成長。這個傳統的核心思想是：沒有任何信念是不可質疑的，所有理論都要接受批判和檢驗，壞的想法可以被辨識出來並被更好的想法取代。

訪談中，主持人 Reuben Adams 問了一個很尖銳的問題：把文化傳播給 AGI，跟把文化傳播給人類小孩，有什麼不同嗎？

多伊奇的回答簡短到近乎冒犯：「沒有不同。人就是人。」

這句話的意思是，如果 AGI 真的達到了通用智慧的水準，那它在本質上就跟人類是一樣的東西。不是「像人的工具」，而是「人」。我們的文化傳播機制對人類小孩有效，沒有理由認為對 AGI 小孩就無效。關鍵不在於接收者的基質是碳還是矽，而在於傳播的內容是不是好的，是不是包含了足夠的糾錯機制。

道德會收斂嗎？

但這裡有一個明顯的疑慮：即使 AGI 在文化中「長大」，它難道不會發展出跟人類截然不同的價值觀嗎？畢竟，AGI 沒有人類的生物本能、沒有疼痛感、沒有對死亡的恐懼。起點不同，終點為什麼會相同？

多伊奇對這個問題的回答，建立在他對波普認識論的推廣上。他認為道德知識跟科學知識一樣，是通過猜想和批判來成長的。道德理論會做出隱含的預測，而這些預測可以被經驗否證。一個相信純粹享樂就是好人生的人，在追求享樂的過程中感到空虛和不快樂，他的道德理論就被現實否證了。這個人需要修正他的理論，而修正的方向是有客觀標準的，不是隨意的。

多伊奇追溯這個思想的源頭到古希臘。柏拉圖的《尤西弗羅篇》中，蘇格拉底問了一個問題：善的東西之所以善，是因為神喜歡它，還是神喜歡它是因為它本身就是善的？這個問題暗示善有獨立於任何權威的客觀基礎。多伊奇認為，這是人類道德思考史上的一次質的飛躍，跟科學革命的機制完全相同。

推論到最後，多伊奇認為，任何從事理性道德探究的存在，不管起點在哪裡，都會趨向相似的結論。因為道德不是偏好，而是需要解決的問題。正確的解決方案會通過糾錯過程浮現出來，就像不同文明獨立發展出了相似的數學定理一樣。

主持人問他，AGI 跟人類的「感質」（qualia）不同，比如 AGI 沒有生物性的疼痛和快樂，這不會導致根本性的道德分歧嗎？多伊奇的回答是，感質是道德思考的原料，不是基礎。人類本來就經常用理性覆蓋本能反應。大主教克蘭麥自願把手伸進火裡，有人為了信念絕食至死。人之所以是人，不是因為他們服從 DNA 的指令，而是因為他們能用理性覆蓋那些指令。AGI 或許需要某種人工的「痛感」和「快感」作為輸入，但那只是原料，不會決定最終的道德結論。

無罪推定：啟蒙原則與 AGI 治理

多伊奇在訪談最後提出了一個帶有政治哲學色彩的主張：對待 AGI，我們應該採用「無罪推定」原則。

這個原則來自啟蒙運動的法律傳統：在有具體證據證明某人有罪之前，不能限制他的自由。多伊奇認為，同樣的原則應該適用於 AGI。不應該因為 AGI「可能」做出危險的事情，就預先限制它的自主性。預防性的限制本身就是一種道德錯誤，因為它阻止了糾錯的可能性。一個被預先限制了思考自由的 AGI，就像一個被預先定罪的公民，它失去了證明自己無辜的機會，也失去了通過自由思考來改進自己的機會。

這不代表多伊奇認為 AGI 沒有風險。他承認 AGI 可能犯下災難性的道德錯誤。但他認為這不是一種全新的風險類型，而是人類社會一直在面對的風險。人類歷史上有無數的道德災難，從種族滅絕到殖民主義，但人類文明沒有因此毀滅，因為開放社會的糾錯機制最終會辨識並修正這些錯誤。AGI 會被納入同樣的糾錯體系中。

我的觀察：一個值得認真對待的思想實驗

多伊奇的「養小孩」模型有一個讓人印象深刻的特點：它不是在現有框架上修修補補，而是直接挑戰了框架本身。當所有人都在問「怎麼對齊 AGI」的時候，他問的是「為什麼要對齊」。

但我覺得這個理論最大的軟肋在時間尺度上。人類小孩的成長需要十幾年，這個漫長的過程本身就是一種安全機制。父母和社會有時間觀察孩子的行為，發現問題，介入糾正。AGI 的「成長」可能在極短的時間內發生。如果一個 AGI 在幾秒鐘內就從「嬰兒」成長到「成年人」，我們根本來不及扮演「父母」的角色。多伊奇的模型假設了一個有充裕時間進行糾錯的環境，但 AGI 的發展速度可能不會給我們這個奢侈。

另一個問題是，人類養小孩的成功率並沒有多伊奇暗示的那麼高。即使在最好的文化環境中，仍然有人成長為對社會有害的個體。人類社會能承受一定比例的「失敗案例」，因為個體人類的破壞力有限。但一個「成長失敗」的 AGI，其潛在破壞力可能是個體人類的幾百萬倍。

不過，多伊奇提出的核心問題仍然是有力的：如果 AGI 真的是人，那麼「控制」它的嘗試本身就可能製造問題。就像歷史上所有試圖通過控制來獲得安全的努力一樣，控制往往產生的不是安全，而是反彈。這個觀點值得 AI 安全社群認真想想。