AI 技術前沿

九位頂級數學家如何評價 AI 的數學突破

包括菲爾茲獎得主高爾斯在內的九位數學家，聯合發表了對 OpenAI 推翻艾狄胥猜想的詳細評論。他們不只確認了證明正確，更反思了一個根本問題：當 AI 能做出人類 80 年做不出的數學發現，數學研究的本質是否正在改變？

2026 年 5 月 21 日 · 來源： OpenAI

本文整理自九位數學家於 2026 年 5 月 20 日發表的聯合評論論文（arXiv: 2605.20695）。

一份前所未有的聯合評論

5 月 20 日，就在 OpenAI 宣布旗下 AI 模型推翻了艾狄胥單位距離猜想的同一天，一份由九位數學家聯合撰寫的評論論文也隨之發布。這不是一般的同行審查報告，而是九位學者各自獨立撰寫評語的集體回應。在數學界，這種形式極為罕見。通常一篇論文的審稿過程是匿名且漫長的，但這次完全不同：九位頂級學者公開署名、快速回應，而且每個人都寫了獨立分析。

這份評論的作者陣容幾乎可以說是數學界的夢幻隊伍。菲爾茲獎得主蒂莫西．高爾斯（Timothy Gowers）是組合數學和巴拿赫空間理論的頂尖人物。諾加．阿隆（Noga Alon）是組合數學和圖論領域的泰斗，以超過 500 篇論文的驚人產出聞名。威爾．薩溫（Will Sawin）和雅各布．齊默曼（Jacob Tsimerman）是代數數論的新生代領袖。湯瑪斯．布魯姆（Thomas Bloom）專攻解析數論和加法組合學。丹尼爾．利特（Daniel Litt）研究代數幾何。阿魯爾．尚卡（Arul Shankar）是數論學者。維克多．王（Victor Wang）和梅蘭妮．伍德（Melanie Matchett Wood）則分別在解析數論和算術統計學領域有重要貢獻。

他們做的遠不只是「驗證」。每位數學家不僅確認了 AI 證明的正確性，還從各自的專業角度分析了這個結果的數學意義、AI 的能力邊界，以及對學術界的潛在衝擊。這九份獨立評語加在一起，構成了一幅多維度的全景圖：數學界第一次如此認真地面對 AI 作為獨立研究者的角色。

「毫不猶豫推薦在任何期刊發表」

九位數學家的第一個共識是：這個結果是正確的，而且是重要的。

阿隆的評價最為直接，他稱這是「卓越的成就，解決了一個長期懸而未決的開放問題」。他特別指出，鑒於 80 年來無人能改進艾狄胥的格子構造下界，這個結果「令人驚訝」。AI 展現了「超人的耐心」來處理技術細節，這是阿隆認為值得注意的能力特徵。尚卡的評價同樣毫無保留：他會「毫不猶豫地推薦這篇論文在任何期刊發表」，稱讚證明是「一個非常漂亮的想法的乾淨執行」。尚卡的評語格外有分量，因為他自己曾經嘗試過攻克這個問題，但未能取得進展。

數學家們還各自嘗試理解 AI 的核心策略。齊默曼在評語中承認，把數域的次數推向無窮大是一個「看起來很可怕」的操作，因為過程中有太多設計選擇：質數的大小、球的半徑、分裂條件等，稍有不慎就會走進死胡同。他特別提醒同行：「看完一個證明之後宣稱它一目了然，這種誘惑總是很大的。」這句話暗示了一個重要的觀點：AI 找到這條路，並不像事後看起來那麼理所當然。

薩溫則直接付諸行動。他在審閱 AI 證明的同時，獨立寫出一篇後續論文，仔細追蹤了所有參數，把指數 δ 明確計算為大約 0.014。這代表平面上存在 n 個點的排列，其中等距對數超過 n 的 1.014 次方，遠超原始證明的理論下限。薩溫在評語中也解釋了為什麼這個推廣對人類來說並不「那麼直覺」：在固定數域的框架下，根本看不出改變數域會帶來什麼好處。你必須先跳出原有框架，才能看到新的可能性。

為什麼人類 80 年想不到

最引人入勝的部分，是數學家們對於「為什麼是 AI 而不是人類」的集體反省。

高爾斯提出了一個精妙的概念框架。他把 AI 的數學能力比作「柯爾莫哥洛夫複雜度模除專家知識」（Kolmogorov complexity modulo experts）。這個術語背後的意思不複雜：AI 的厲害之處不在於它知道了什麼新的數學定理，而在於它能把已知的工具以新穎的方式組合起來。如果你把「已經被學術界充分理解的方法」從解題過程中剔除，剩下需要的「新想法」其實不多。AI 的優勢是對所有領域的工具都有百科全書式的熟悉，而且願意嘗試看起來不太有希望的組合方式。高爾斯坦言，他最初聽到 AI 推翻了猜想時鬆了一口氣：推翻一個猜想（找反例）比建立新的正面理論（找證明）更容易想像 AI 能做到。但他也明確表示，AI 的數學進步「不會即將觸頂」。

利特的角度更為切實。他直接說這是「第一個 AI 自主產出的、讓我真正覺得興奮的數學成果」。讓他困惑的是，當他坐下來閱讀 AI 的證明時，只花了幾個小時就完全理解了。這代表解法的核心思路「相當自然」，並不是什麼超越人類理解力的外星智慧。問題在於，沒有人去嘗試這個方向。利特把原因歸咎於學術界的結構性問題：「朝向專業化和筒倉化的激勵機制，讓我們失去了一些高品質的科學。」組合幾何的專家不會去碰代數數論的深層工具，代數數論的專家又不關注組合幾何的老問題。AI 沒有這種壁壘，它可以自由地「掃描整個問題清單」，在不同領域之間建立人類學術體制無法輕易建立的橋樑。

布魯姆的分析從歷史脈絡切入。他指出，艾狄胥生前為這個問題懸賞了 500 美元。要贏得這筆獎金，需要同時滿足幾個不太可能的條件：首先要有勇氣去「推翻」猜想而不是證明猜想成立（80 年來多數人選擇了後者）；其次要想到把構造推廣到高斯整數以外的數域；最後要對類域塔這種深層代數數論工具足夠熟悉，才能看出它在組合幾何中的潛力。布魯姆觀察到：「AI 滿足了所有這些條件。」但他也做了一個重要的區分：這個結果並沒有帶來「強大的新幾何工具」，那是如果猜想被證明成立才會需要的突破。AI 展現了組合已知技術的卓越能力，但還沒有證明它能創造全新的理論框架。

來自驗證者的警告

讚譽之外，九位數學家也表達了程度不同的擔憂。這些警告或許比讚美更值得認真對待。

伍德的警告最為尖銳。她承認 AI 的證明是「數論在自然問題上的一個漂亮應用」，但隨即提出了一個令人不安的預判：「AI 說服人類它有一個正確的證明，比實際產出正確的論證要容易得多。」這句話的意義深遠。這一次有九位頂級數學家花時間逐行審閱，但這種奢侈的驗證規格不可能每次都有。如果未來每個月都有 AI 聲稱解決了重大猜想，數學界是否有足夠的人力和注意力來逐一驗證？錯誤結果被接受的風險會不會隨之上升？更糟的是，如果 AI 產出的證明越來越長、越來越依賴人類不熟悉的跨領域技術，驗證本身就會變成一項極其艱鉅的工作。

王提出的問題更加根本。他直接追問：「當我們把研究成果免費放上 arXiv 的時候，我們是否都隱含地同意了讓 AI 自由取用？」這觸及了學術知識在 AI 時代的產權核心。AI 的證明建立在數百萬篇人類論文的訓練之上，那些原始作者花了畢生精力發展出來的理論，現在被 AI 當作積木組裝成了新結果。他們是否應該在某種形式上被承認貢獻？學術界長期依賴引用機制來追蹤知識的傳承脈絡，但 AI 的運作方式讓這套機制面臨根本性的挑戰。一篇由 AI 寫的論文不會引用它訓練資料中的所有來源，事實上它也不知道自己的特定推理來自哪些具體的論文。

伍德進一步提出了具體呼籲：數學界需要盡快建立關於 AI 生成結果的引用和歸屬標準。當一篇論文的作者是「OpenAI」而不是任何個人，傳統的學術信用系統就遇到了前所未有的挑戰。誰獲得引用？誰獲得學術聲譽？如果一個年輕研究者的終身教職評審中，競爭對手是一個不需要休息、不需要經費、不需要職位的 AI 系統，學術評估的規則是否需要重新設計？這些問題在幾天前還是理論性的假設，但單位距離猜想的被推翻讓它們變成了迫切的現實。

數學家的角色正在改變

阿隆在評語中特別提到 AI 展現了「超人的耐心」。這個觀察值得停下來想想。數學研究的日常並不都是優雅的靈感迸發，很多時候它是漫長而乏味的技術操作：追蹤參數、驗算不等式、排除邊界情形。人類數學家的注意力和精力有限，當一條研究路線看起來希望不大時，理性的選擇是放棄、轉向更有前景的方向。但 AI 沒有這個限制。它可以在人類會放棄的路線上繼續前進，耐心地處理每一個技術障礙。

齊默曼和尚卡不約而同地指出了同一件事：AI 可以「在更險惡的水域中航行更久，而不會被壓垮」。數學研究中有大量嘗試是失敗的，這些失敗通常不會被發表，也不會被記錄。一個數學家可能花三個月走進一條死胡同，除了沮喪之外一無所獲。AI 不會沮喪，不會質疑自己的選擇，不會因為連續失敗而倉促改變策略。這種「無畏的探索」在面對像單位距離猜想這樣需要嘗試非主流方法的問題時，可能恰恰是決定性的優勢。

但高爾斯也給這股樂觀情緒提出了更深的追問。他問了一個核心問題：AI 能不能找到那些需要「長提示序列」的證明？有些數學問題的解法不是一個聰明想法加上技術性的執行，而是需要一連串環環相扣的洞察，每一步都為下一步打開可能性。目前 AI 展現的是強大的組合能力和不知疲倦的探索，但它是否具備建構長鏈推理的能力，仍然是一個開放的問題。高爾斯的判斷是：AI 的數學能力「不會即將觸頂」，但從推翻猜想走到建立全新的數學理論，中間的距離可能比表面看起來要遠得多。這九份獨立評語合在一起，既是對一個歷史時刻的見證，也是對一段未知旅程的第一份路線報告。數學家們很清楚：他們的角色正在改變，而他們還在學習該怎麼適應。