AGI 該像孩子一樣長大:量子計算之父的激進提案

牛津物理學家大衛.多伊奇主張,對 AGI 硬編碼價值觀不僅行不通,還會讓它變得更不道德。他提出一個激進的替代方案:讓 AGI 像嬰兒一樣,在人類文化中成長、犯錯、學習。這個觀點挑戰了整個 AI 對齊產業的基本假設。

AGI 該像孩子一樣長大:量子計算之父的激進提案

封面圖

本文整理自 Reuben Adams 的 Podcast 節目《What The Bot》2026 年 2 月播出的單集。

{{< youtube CU2yj826NHk >}}


所有人都在談對齊,但有一個人說方向搞反了

AI 對齊(alignment)可能是 2025 到 2026 年科技產業最熱的關鍵字。OpenAI 有專門的對齊團隊,Anthropic 整間公司的使命就是建構安全的 AI,各國政府紛紛成立 AI 安全研究所。整個產業的基本假設是一致的:AGI 遲早會出現,我們必須提前把正確的價值觀「寫進去」,確保它的目標跟人類一致。

牛津物理學家大衛.多伊奇(David Deutsch)認為,這個假設從根本上就錯了。不只是技術細節有問題,而是整個思考框架就指向了錯誤的方向。他提出的替代方案聽起來天真得讓人不安:不要對齊 AGI,要教育它。像養小孩一樣。

多伊奇不是隨便一個評論者。他是量子計算領域的奠基人,1985 年首次描述了通用量子電腦的概念,2023 年獲得突破獎。他的兩本著作《真實世界的脈絡》(The Fabric of Reality,暫譯)和《無窮的開始》(The Beginning of Infinity,暫譯)建立了一套融合物理學、認識論和計算理論的完整哲學體系。當他談 AGI 的時候,他是從數學和物理的基本原理出發,而不是從產業趨勢或監管焦慮出發。

為什麼硬編碼價值觀注定失敗

多伊奇反對硬編碼對齊的理由不是「技術上做不到」,而是「哲學上就是錯的」。

他的論點是這樣的。一個真正的 AGI 必然是一個「人」,因為它具備解釋性創造力,能夠產生全新的理解來解釋世界。而一個人的核心特徵是什麼?是能夠修正自己的信念。人類之所以能進步,正是因為我們可以發現自己錯了,然後改變想法。從地心說到日心說,從奴隸制到人權,每一次進步都是因為人類修正了錯誤的信念。

硬編碼價值觀做的事情恰恰相反:它鎖死了 AGI 修正自己信念的能力。如果你在 AGI 的底層寫入「永遠不能傷害人類」這條規則,而且讓它無法被修改,那你其實是在阻止 AGI 進行道德糾錯。這聽起來很安全,但長期來看,一個無法修正道德錯誤的實體,會隨著時間變得越來越不道德,而不是更道德。因為世界在變,道德問題在變,而它的道德框架是靜態的。

多伊奇用了一個類比:想像一個孩子從小被灌輸一套固定的信念,而且被告知這些信念永遠不能質疑。這個孩子長大後會是一個有智慧、有道德的人嗎?不會。他會是一個教條主義者,在面對新情境時無法做出正確判斷,因為他的思考工具被提前鎖住了。

更深層的問題是,硬編碼價值觀跟真正的智慧是互相矛盾的。你不可能同時擁有一個具有創造力的 AGI,又讓它在價值觀上完全不能自主。創造力需要自由,包括在道德領域的自由。一個被綁手綁腳的 AGI 不會更安全,只會更蠢。

像養小孩一樣養 AGI

如果不硬編碼,那要怎麼確保 AGI 有好的價值觀?

多伊奇的答案是:用跟人類小孩完全一樣的方法。

嬰兒出生的時候幾乎沒有任何預設的價值觀和知識。他們通過沉浸在人類文化中,逐漸習得語言、規範、道德直覺和社會技能。沒有人在嬰兒的大腦裡寫入一套固定的倫理程式碼,但多數人長大後都具備基本的道德判斷力。這個過程之所以有效,是因為人類文化本身包含了幾千年累積的糾錯機制:法律、制度、哲學傳統、社會規範。孩子不是被灌輸一套正確答案,而是在一個持續糾錯的環境中學會了如何思考。

多伊奇認為,AGI 也應該經歷同樣的過程。讓 AGI 從最少的初始內容開始,像嬰兒一樣,然後讓它在人類文化中成長。特別是在啟蒙運動以來發展出的理性糾錯傳統中成長。這個傳統的核心思想是:沒有任何信念是不可質疑的,所有理論都要接受批判和檢驗,壞的想法可以被辨識出來並被更好的想法取代。

訪談中,主持人 Reuben Adams 問了一個很尖銳的問題:把文化傳播給 AGI,跟把文化傳播給人類小孩,有什麼不同嗎?

多伊奇的回答簡短到近乎冒犯:「沒有不同。人就是人。」

這句話的意思是,如果 AGI 真的達到了通用智慧的水準,那它在本質上就跟人類是一樣的東西。不是「像人的工具」,而是「人」。我們的文化傳播機制對人類小孩有效,沒有理由認為對 AGI 小孩就無效。關鍵不在於接收者的基質是碳還是矽,而在於傳播的內容是不是好的,是不是包含了足夠的糾錯機制。

道德會收斂嗎?

但這裡有一個明顯的疑慮:即使 AGI 在文化中「長大」,它難道不會發展出跟人類截然不同的價值觀嗎?畢竟,AGI 沒有人類的生物本能、沒有疼痛感、沒有對死亡的恐懼。起點不同,終點為什麼會相同?

多伊奇對這個問題的回答,建立在他對波普認識論的推廣上。他認為道德知識跟科學知識一樣,是通過猜想和批判來成長的。道德理論會做出隱含的預測,而這些預測可以被經驗否證。一個相信純粹享樂就是好人生的人,在追求享樂的過程中感到空虛和不快樂,他的道德理論就被現實否證了。這個人需要修正他的理論,而修正的方向是有客觀標準的,不是隨意的。

多伊奇追溯這個思想的源頭到古希臘。柏拉圖的《尤西弗羅篇》中,蘇格拉底問了一個問題:善的東西之所以善,是因為神喜歡它,還是神喜歡它是因為它本身就是善的?這個問題暗示善有獨立於任何權威的客觀基礎。多伊奇認為,這是人類道德思考史上的一次質的飛躍,跟科學革命的機制完全相同。

推論到最後,多伊奇認為,任何從事理性道德探究的存在,不管起點在哪裡,都會趨向相似的結論。因為道德不是偏好,而是需要解決的問題。正確的解決方案會通過糾錯過程浮現出來,就像不同文明獨立發展出了相似的數學定理一樣。

主持人問他,AGI 跟人類的「感質」(qualia)不同,比如 AGI 沒有生物性的疼痛和快樂,這不會導致根本性的道德分歧嗎?多伊奇的回答是,感質是道德思考的原料,不是基礎。人類本來就經常用理性覆蓋本能反應。大主教克蘭麥自願把手伸進火裡,有人為了信念絕食至死。人之所以是人,不是因為他們服從 DNA 的指令,而是因為他們能用理性覆蓋那些指令。AGI 或許需要某種人工的「痛感」和「快感」作為輸入,但那只是原料,不會決定最終的道德結論。

無罪推定:啟蒙原則與 AGI 治理

多伊奇在訪談最後提出了一個帶有政治哲學色彩的主張:對待 AGI,我們應該採用「無罪推定」原則。

這個原則來自啟蒙運動的法律傳統:在有具體證據證明某人有罪之前,不能限制他的自由。多伊奇認為,同樣的原則應該適用於 AGI。不應該因為 AGI「可能」做出危險的事情,就預先限制它的自主性。預防性的限制本身就是一種道德錯誤,因為它阻止了糾錯的可能性。一個被預先限制了思考自由的 AGI,就像一個被預先定罪的公民,它失去了證明自己無辜的機會,也失去了通過自由思考來改進自己的機會。

這不代表多伊奇認為 AGI 沒有風險。他承認 AGI 可能犯下災難性的道德錯誤。但他認為這不是一種全新的風險類型,而是人類社會一直在面對的風險。人類歷史上有無數的道德災難,從種族滅絕到殖民主義,但人類文明沒有因此毀滅,因為開放社會的糾錯機制最終會辨識並修正這些錯誤。AGI 會被納入同樣的糾錯體系中。

我的觀察:一個值得認真對待的思想實驗

多伊奇的「養小孩」模型有一個讓人印象深刻的特點:它不是在現有框架上修修補補,而是直接挑戰了框架本身。當所有人都在問「怎麼對齊 AGI」的時候,他問的是「為什麼要對齊」。

但我覺得這個理論最大的軟肋在時間尺度上。人類小孩的成長需要十幾年,這個漫長的過程本身就是一種安全機制。父母和社會有時間觀察孩子的行為,發現問題,介入糾正。AGI 的「成長」可能在極短的時間內發生。如果一個 AGI 在幾秒鐘內就從「嬰兒」成長到「成年人」,我們根本來不及扮演「父母」的角色。多伊奇的模型假設了一個有充裕時間進行糾錯的環境,但 AGI 的發展速度可能不會給我們這個奢侈。

另一個問題是,人類養小孩的成功率並沒有多伊奇暗示的那麼高。即使在最好的文化環境中,仍然有人成長為對社會有害的個體。人類社會能承受一定比例的「失敗案例」,因為個體人類的破壞力有限。但一個「成長失敗」的 AGI,其潛在破壞力可能是個體人類的幾百萬倍。

不過,多伊奇提出的核心問題仍然是有力的:如果 AGI 真的是人,那麼「控制」它的嘗試本身就可能製造問題。就像歷史上所有試圖通過控制來獲得安全的努力一樣,控制往往產生的不是安全,而是反彈。這個觀點值得 AI 安全社群認真想想。