AI 技術前沿

AI 的《記憶拼圖》困境：為什麼你的 AI 助手永遠學不會新東西？

a16z 合夥人 Malika Aubakirova 用諾蘭經典電影《記憶拼圖》比喻當前 AI 模型的根本限制：訓練完就凍結，只能靠便條紙過日子。RAG 和 System Prompt 終將觸頂，真正的突破需要讓模型學會「從經驗中成長」。

2026 年 5 月 17 日 · 來源： AI + a16z

本文整理自《AI + a16z》2026 年 4 月播出的單集。

{{< apple-podcast "tw/podcast/why-we-need-continual-learning/id1740178076?i=1000764007235" >}}

封面圖

你的 AI 助手其實是個失憶症患者

你有沒有這種經驗：跟 ChatGPT 聊了三個月的專案，換一個對話視窗，它就什麼都不記得了。你跟它說過你偏好什麼程式風格、你的公司在做什麼產品、上次那個 bug 怎麼解的，全部歸零。你以為它在「學習」，但其實它只是在當下的對話裡假裝記得你。對話一結束，一切煙消雲散。

這是當前所有大型語言模型共有的根本架構限制。a16z AI 基礎設施團隊合夥人 Malika Aubakirova 最近發表了一篇深度分析，用一個絕妙的比喻點破了這個問題的本質：現在的 AI 模型，活得就像諾蘭電影《記憶拼圖》（Memento）裡的主角 Leonard Shelby。

等等，讓我先解釋一下這部電影，因為這個比喻實在太精準了。

便條紙、拍立得、還有刺青

《記憶拼圖》的主角 Leonard Shelby 患有一種罕見的失憶症，他無法形成新的長期記憶。每天醒來，他只記得受傷前的人生，之後發生的一切都會消失。為了在這種狀態下生存，他發展出一套外部記憶系統：隨身帶著拍立得相機拍下重要的人和地點、在便條紙上寫下關鍵資訊、甚至把最重要的線索直接刺在身上，確保怎樣都不會忘記。

Aubakirova 指出，這跟我們現在對待 AI 模型的方式幾乎一模一樣。模型有一個「預訓練」階段，在這個階段裡它吸收了大量的世界知識。但預訓練結束之後，模型就被「凍結」了，它的內部參數不再改變。從這個時間點開始，模型就像失憶的 Leonard 一樣，被部署到真實世界中，卻無法從新的經驗中學習任何東西。

那我們怎麼讓一個「凍結」的模型看起來好像很聰明？答案是：我們幫它搭建了大量的外部鷹架。RAG（檢索增強生成）就是它的便條紙，負責在需要的時候從外部資料庫撈取資訊。System Prompt 就是它的刺青，把最重要的指令直接刻在每次對話的開頭。Agent 框架就是它的拍立得，幫它在執行任務的過程中暫時記住上下文。這些工具確實有效，但它們本質上都是在繞過一個根本問題：模型本身沒有在學習。

In-context Learning 的天花板在哪裡？

你可能會想：這些外掛不是用得好好的嗎？Cursor 靠著讀取你的整個程式碼庫就能寫出很棒的程式碼，Claude 靠著長上下文就能處理複雜任務。為什麼非要更新模型的「大腦」不可？

Aubakirova 承認，in-context learning（上下文學習）確實非常強大，任何關於持續學習的誠實討論都必須先承認這一點。但她提出了兩個具體場景，說明光靠上下文為什麼不夠。

第一個場景是對抗式攻擊。假設有人發現了一種新的 jailbreak 手法，可以讓你部署的模型吐出不該說的內容。你的第一反應可能是更新 System Prompt，加一條「遇到這種攻擊時不要回應」。但問題是，模型的核心參數已經學會了「對使用者有幫助」這個目標，這個目標寫進了它的權重裡。攻擊者能看到你的上下文，跟任何普通使用者一樣，他們可以設計方法繞過你的 System Prompt。你真正需要做的是把防禦知識編碼進模型的權重中，那是攻擊者碰不到的地方。

第二個場景是軟體生態的演化。假設你最愛用的 JavaScript 框架 React 發布了一個破壞性更新，把某個函式從 x 改名成了 y。模型在預訓練階段讀了成千上萬個使用 x 的程式碼範例，這個「直覺」已經寫進了它的參數裡。你可以在上下文裡反覆告訴它「現在要用 y 了」，但模型的本能反應還是會傾向用 x。因為上下文只能覆蓋模型的表層行為，無法改變它深層的「肌肉記憶」。

壓縮光譜：從便條紙到腦神經改造

Aubakirova 在文章中提出了一個清晰的框架，把所有的「學習」機制放在一個光譜上，她稱之為「壓縮」（compaction）。這個框架分成三層，代表資訊被整合進模型的不同深度。

第一層是「上下文」，也就是非參數化學習。這是我們今天最熟悉的做法：RAG、Agent 記憶、System Prompt。模型的權重完全不動，所有新資訊都透過上下文視窗餵進去。這層的主要限制很直觀：上下文長度是有限的，你塞不下全世界的知識。Pinecone 這類向量資料庫、各種 Agent 記憶框架，本質上都在解決同一個問題：如何在有限的上下文裡塞進最相關的資訊。

第二層是「模組」，介於上下文和權重之間的中間地帶。史丹佛大學有一篇叫做「Cartridges」的論文，探索的就是這個方向：你不更新整個模型的權重，但可以更新 KV Cache 這類中間組件，讓模型獲得某種程度的適應性。這就像是不做全腦手術，而是植入一個可以隨時更換的記憶晶片。

第三層是「權重」，也就是真正的參數化學習。這是持續學習研究的最前沿，也是最困難的部分。你要直接修改模型的內部參數，讓它真正「學會」新東西，而不只是暫時「看到」新東西。目前的研究方向分成兩大陣營：一派認為可以在現有的 Transformer 架構上發展更高效的權重更新方法（比如 LoRD、自我蒸餾），另一派則認為 Transformer 本身就是瓶頸，我們需要全新的架構才能實現真正的持續學習。

費馬最後定理告訴我們的事

要理解「持續學習」為什麼不只是工程問題，而是 AI 的下一個根本突破，Aubakirova 舉了一個數學史上的經典案例。

費馬最後定理（Fermat's Last Theorem）是一個困擾數學界超過 350 年的問題。所有相關的文獻、研究論文、數學工具，對每一位數學家來說都是公開可得的。但沒有人能解開它，直到安德魯．懷爾斯（Andrew Wiles）獨自閉關七年，發明了全新的數學技巧，把兩個原本不相干的數學分支（橢圓曲線和模形式）連接起來。

這個故事的啟示是：真正的突破性發現，不是把所有已知資訊彙整起來就能得到的。懷爾斯靠的不是更多的「預訓練資料」，他是在持續思考的過程中，產生出全新的知識。如果我們希望 AI 也能做到類似的事，光是給它更大的上下文視窗、更好的搜尋引擎是不夠的。我們需要讓模型本身具備從經驗中「長出」新知識的能力。

重新定義「模型」這件事

Aubakirova 引用了 Ilya Sutskever 最近的一段話：「關於 AGI，我們幾乎把目標定得太高了。人類不是 AGI，但人類會從經驗中學習，會在工作中進步。這才是讓人類獨特的地方。」

這段話把問題拉回了一個很務實的層次。持續學習的終極檢驗其實很簡單：你的 AI 系統用了三個月之後，有沒有比剛部署時更好用？它有沒有從你的回饋中學到東西、從犯的錯誤中改進、從新遇到的情境中成長？

目前，柏克萊和其他頂尖實驗室正在開發新的基準測試，試圖定義「持續學習」的具體衡量標準。早期的研究方向，像是 test-time training（測試時訓練），已經展現出一些令人興奮的跡象：模型在面對從未見過的問題時，能夠即時調整自身的架構來應對。這還只是雛形，但方向已經很清楚了。

我們需要的不是更聰明的便條紙系統，而是一個能真正「活著」的 AI，一個不再被困在永恆當下的系統。《記憶拼圖》的主角最終沒有治好他的失憶症，但 AI 研究者不打算接受這個結局。