AI 技術前沿

我們讀完了十九篇 AI 經典，學到的不是答案

十五年、十九個主題、二十八篇導讀。讀完之後學到的不是答案，而是五個轉折點、三場未完的辯論、和一個反覆出現的模式：每一次有人因為安全問題離開，都創造了新的組織——然後面對同樣的壓力。

2024 年 12 月 31 日

封面圖

本文是「AI 經典文獻回顧」系列的收束之作。系列共 28 篇，橫跨 2009-2024 年。

讀完這二十八篇文章，最強烈的感受不是「AI 好厲害」。

是重複。

同樣的模式一再出現：有人看見了問題，發出警告，被忽視或被開除。帶著技術和信念離開，創造新的組織。然後在新的組織裡，面對完全相同的壓力。

這個系列橫跨十五年，從 2009 年三個 Google 研究者說「別再調模型了，給我更多數據」，到 2024 年一個被 OpenAI 開除的 22 歲年輕人寫了 165 頁報告論證 AGI 三年內到來。十九個主題，二十六篇論文導讀，兩本書評。

這篇不是摘要。想知道每篇論文在講什麼，回去讀那二十八篇就好。這裡要做的是另一件事：把散落在十五年裡的碎片拼起來，看看它們合在一起說了什麼——一篇一篇讀的時候，不容易看見的事。

五個轉折

回頭看，這十五年的 AI 思想史有五個清晰的轉折點。不是五個里程碑——是五次基本假設的改變。

第一次，2009 年，問題本身被重新定義。 在所有人都在問「哪個演算法比較好」的年代，Halevy、Norvig 和 Pereira 在〈數據的不合理有效性〉裡說：你問錯問題了。簡單方法加海量數據，打敗精巧方法加有限數據。這在當時是異端。後來被證明是預言。

第二次，2012 年，預言被兩張顯卡證實。 三個多倫多大學的人用兩張遊戲顯卡贏了 ImageNet。AlexNet 不只是一場比賽的勝利——它是深度學習的 Big Bang。但最值得記住的不是那個 10.8 個百分點的差距。是〈三條截然不同的路〉裡我們看見的：同一篇論文的三位作者，一個消失了，一個發動了 OpenAI 董事會政變後帶著 30 億美元出走，一個拿了諾貝爾獎然後開始警告世界他親手催生的技術。

三條路，三種選擇。整個產業後來的分裂，在 2012 年這篇論文裡已經埋下了種子。

第三次，2017 年，能力和安全從同一棟大樓分道揚鑣。 Google Brain 的大樓裡，幾乎同一群人在差不多的時間做了兩件事。Dario Amodei 等人寫了〈Concrete Problems in AI Safety〉，把「AI 會不會毀滅人類」翻譯成「機器人會不會打翻花瓶」，讓 AI 安全從哲學變成工程。八個研究者寫了 Transformer 論文，用純注意力機制取代所有循環結構，給了整個產業未來十年的基礎架構。

安全和能力，同一棟大樓，同一批人。然後〈一篇論文，八條路〉——八位 Transformer 作者全部離開了 Google，走向八條完全不同的方向。同一年，Karpathy 在〈Software 2.0〉宣告神經網路正在取代人寫的程式碼，Sebastian Ruder 宣布〈NLP 終於等到了它的 ImageNet 時刻〉。2017 年的人不知道自己站在什麼上面。

第四次，2020 年，信仰有了數學。 Richard Sutton 在 2019 年用一篇短文寫出了 AI 界的聖經。〈The Bitter Lesson〉的核心論點：七十年的歷史證明，利用算力的通用方法永遠打敗嵌入人類知識的特殊方法。一年後，物理學家 Jared Kaplan 把這個直覺變成了冪律方程式。〈Scaling Laws〉告訴矽谷：給我 X 億美元的算力，我能告訴你模型會多好。Gwern 更進一步，在〈The Scaling Hypothesis〉裡把 Scaling Laws 推向邏輯極端：規模本身就能產生智慧。

但這篇論文最深遠的影響不是技術的——是〈一篇論文，拆出了 Anthropic〉。論文核心作者跟著 Dario Amodei 離開了 OpenAI。原因是：Scaling Laws 證明 AI 能力會可預測地增長，所以安全問題不是假設性的，是迫在眉睫的。證明規模有效的人，成了最擔心規模失控的人。

第五次，2022 年，四星連珠。 沒有哪一年比 2022 年更擁擠。一月，〈Chain-of-Thought Prompting〉證明五個字「讓我們一步一步想」就能解鎖推理能力。三月，〈Chinchilla〉證明整個產業一直在浪費算力——模型太大，數據太少。同月，〈InstructGPT〉用四十個標註員的判斷力，讓 13 億參數的小模型打敗 1750 億的 GPT-3。六月，〈Emergent Abilities〉記錄了大模型的湧現——小模型完全做不到的事，大模型突然就會了。十二月，Anthropic 寫出了〈Constitutional AI〉，用十六條原則取代五萬個人類判斷。

怎麼推理、怎麼訓練、怎麼對齊、規模何時產生質變——四個不同的問題，答案交織在一起，構成了 ChatGPT 年底爆紅的知識基礎。

三場未完的辯論

穿越這十五年，有三場辯論從未真正結束。

鸚鵡還是火花？ 2021 年，Emily Bender 和 Timnit Gebru 在〈Stochastic Parrots〉裡主張大語言模型是「隨機鸚鵡」——不理解語言，只做統計配對。兩位作者被 Google 解僱，但她們的問題沒有被解僱。兩年後，微軟的研究者在〈Sparks of AGI〉裡宣稱 GPT-4 展現了 AGI 的火花——155 頁的測試，獨角獸、莎士比亞體數學證明、心智理論。

鸚鵡還是火花？Chain-of-Thought 能讓模型展現推理過程，但那是真的推理還是模仿推理的模式？湧現能力顯示大模型突然學會新技能，但那是真正的質變還是測量方式造成的海市蜃樓？2026 年了，在這個最基本的問題上，我們和 2021 年的認知差距，遠比我們願意承認的小。

規模還是安全？ 寫出 Scaling Laws 的人，離開了 OpenAI 去創立 Anthropic。開創 RLHF 的核心人物，幾乎全部離開了 OpenAI——〈開創 RLHF 的人，後來都離開了 OpenAI〉不只是一個標題，是一個事實。Jan Leike 公開譴責 OpenAI「安全文化已被閃亮的產品取代」。Anthropic 寫了一部 AI 憲法，但四年後面對 3800 億美元估值，悄悄修改了自己的責任擴展政策。

這不是好人壞人的故事。這是〈Meditations on Moloch〉的故事。Scott Alexander 在 2014 年描述的古老困境——所有參與者都理性地犧牲價值以換取競爭優勢，最終所有人都更糟——在十年後的 AI 產業裡完美重現。每個前沿實驗室私下都承認想慢下來，但沒人能停。

哲學預言還是工程解法？ 系列的早期文章帶有濃厚的哲學色彩。Bostrom 的〈超級智慧〉用正交性論題描繪了存在性風險的世界。Tim Urban 的〈火柴人、馬斯克和世界末日〉把這些概念變成全民議題。Stuart Russell 的〈Human Compatible〉提出了三原則處方——哲學家提出了問題，工程師帶來了答案。

然後工程師真的到了。Concrete Problems 把終極問題拆成五個可研究的子問題。InstructGPT 用 RLHF 提供了第一個可擴展的對齊方案。Constitutional AI 用 AI 取代了人類標註員。但到了 2024 年，Leopold Aschenbrenner 的〈Situational Awareness〉把討論推向國安層級，哲學和工程的邊界又開始模糊了。

一個模式：每一次出走

如果要用一句話總結這個系列的暗線：重要的 AI 文獻，往往是有人付出代價之後的產物。

Gebru 和 Mitchell 因為〈隨機鸚鵡〉被 Google 解僱。Amodei 帶著 Scaling Laws 核心團隊離開 OpenAI，創立 Anthropic。Leike 公開譴責 OpenAI 後加入 Anthropic，超級對齊團隊三天後解散。Leopold 被 OpenAI 開除，然後〈被 OpenAI 解僱的人，募了十五億美元〉。Kokotajlo 放棄了兩百萬美元股權，拒簽保密條款。Sutskever 從 AlexNet 三作者之一，到 OpenAI 首席科學家，到發動董事會政變，到帶著 320 億美元創立 SSI——一間沒有產品、二十個員工的公司。

每一次出走都創造了新的東西。每一個新組織都帶著「我們會做得不一樣」的信念。然後每一個都面對同樣的 Moloch：競爭者不會停，資本不會等。

這不是巧合。這是結構性的。AI 安全領域最大的矛盾是：最有資格做安全研究的人，永遠是最接近能力前沿的人。而最接近能力前沿的組織，永遠面對最強的商業壓力。

從 2026 回望：對了、錯了、不知道

讀完十九篇經典，哪些觀點經受住了時間考驗？

說對了的。 數據比演算法重要。通用方法打敗特殊方法。規模能持續帶來性能提升。對齊是真實問題，不是科幻小說。每一個安全警告——從 Bostrom 到 Gebru 到 Leopold——都指向了真實存在的問題，即使他們對問題的描述各自不同。

說錯了的。 幾乎所有時間表預測都太早。Leopold 的「2027 年 AGI」目前看來偏快。Bostrom 預測的智慧爆炸沒有發生。Karpathy 預測神經網路會取代人寫的程式碼——實際發生的是語言模型讓所有人都能寫程式碼，方向對了但機制完全不同。Gwern 沒預見到推理時間計算會成為新的 scaling 維度。

仍然不知道的。 LLM 到底理不理解它們在處理的東西。湧現能力是真正的相變還是測量假象。RLHF 和 Constitutional AI 能不能擴展到超人類系統。Scaling 曲線什麼時候——或會不會——彎下來。

一句話給決策者

如果你是必須做 AI 策略決策的人，這個系列最值得帶走的不是任何技術趨勢。是一個模式：在 AI 領域，正確的觀點幾乎總是先被當成異端，然後在三到五年內變成共識。

2009 年說數據比演算法重要，異端。2014 年說 AI 安全很重要，科幻小說。2021 年說大語言模型有系統性風險，說的人被開除。每一次，三到五年後，異端變成了產業基礎設施。

所以你現在該問的不是「目前的共識是什麼」，而是：現在被當成異端的觀點裡，哪一個會在三年後變成共識？

這個系列的第一篇文章結尾寫道：那篇 2009 年的論文提出了「正確的直覺，但不完整的處方」。

十五年後回頭看，這句話適用於這裡的每一篇文獻。

每一篇都看見了什麼重要的東西。沒有任何一篇看見了全部。數據的不合理有效性、AlexNet 的兩張顯卡、Transformer 的並行化革命、Scaling Laws 的冪律方程式、鸚鵡與火花的根本對立、每一次出走背後的安全焦慮——它們合在一起，構成了我們理解 AI 的最佳起點。

起點，不是終點。

因為這十九篇經典教會我們的，從來不是答案。是正確的問法。而正確的問法，比任何答案都活得更久。