九位頂級數學家如何評價 AI 的數學突破
包括菲爾茲獎得主高爾斯在內的九位數學家,聯合發表了對 OpenAI 推翻艾狄胥猜想的詳細評論。他們不只確認了證明正確,更反思了一個根本問題:當 AI 能做出人類 80 年做不出的數學發現,數學研究的本質是否正在改變?

本文整理自九位數學家於 2026 年 5 月 20 日發表的聯合評論論文(arXiv: 2605.20695)。
一份前所未有的聯合評論
5 月 20 日,就在 OpenAI 宣布旗下 AI 模型推翻了艾狄胥單位距離猜想的同一天,一份由九位數學家聯合撰寫的評論論文也隨之發布。這不是一般的同行審查報告,而是九位學者各自獨立撰寫評語的集體回應。在數學界,這種形式極為罕見。通常一篇論文的審稿過程是匿名且漫長的,但這次完全不同:九位頂級學者公開署名、快速回應,而且每個人都寫了獨立分析。
這份評論的作者陣容幾乎可以說是數學界的夢幻隊伍。菲爾茲獎得主蒂莫西.高爾斯(Timothy Gowers)是組合數學和巴拿赫空間理論的頂尖人物。諾加.阿隆(Noga Alon)是組合數學和圖論領域的泰斗,以超過 500 篇論文的驚人產出聞名。威爾.薩溫(Will Sawin)和雅各布.齊默曼(Jacob Tsimerman)是代數數論的新生代領袖。湯瑪斯.布魯姆(Thomas Bloom)專攻解析數論和加法組合學。丹尼爾.利特(Daniel Litt)研究代數幾何。阿魯爾.尚卡(Arul Shankar)是數論學者。維克多.王(Victor Wang)和梅蘭妮.伍德(Melanie Matchett Wood)則分別在解析數論和算術統計學領域有重要貢獻。
他們做的遠不只是「驗證」。每位數學家不僅確認了 AI 證明的正確性,還從各自的專業角度分析了這個結果的數學意義、AI 的能力邊界,以及對學術界的潛在衝擊。這九份獨立評語加在一起,構成了一幅多維度的全景圖:數學界第一次如此認真地面對 AI 作為獨立研究者的角色。
「毫不猶豫推薦在任何期刊發表」
九位數學家的第一個共識是:這個結果是正確的,而且是重要的。
阿隆的評價最為直接,他稱這是「卓越的成就,解決了一個長期懸而未決的開放問題」。他特別指出,鑒於 80 年來無人能改進艾狄胥的格子構造下界,這個結果「令人驚訝」。AI 展現了「超人的耐心」來處理技術細節,這是阿隆認為值得注意的能力特徵。尚卡的評價同樣毫無保留:他會「毫不猶豫地推薦這篇論文在任何期刊發表」,稱讚證明是「一個非常漂亮的想法的乾淨執行」。尚卡的評語格外有分量,因為他自己曾經嘗試過攻克這個問題,但未能取得進展。
數學家們還各自嘗試理解 AI 的核心策略。齊默曼在評語中承認,把數域的次數推向無窮大是一個「看起來很可怕」的操作,因為過程中有太多設計選擇:質數的大小、球的半徑、分裂條件等,稍有不慎就會走進死胡同。他特別提醒同行:「看完一個證明之後宣稱它一目了然,這種誘惑總是很大的。」這句話暗示了一個重要的觀點:AI 找到這條路,並不像事後看起來那麼理所當然。
薩溫則直接付諸行動。他在審閱 AI 證明的同時,獨立寫出一篇後續論文,仔細追蹤了所有參數,把指數 δ 明確計算為大約 0.014。這代表平面上存在 n 個點的排列,其中等距對數超過 n 的 1.014 次方,遠超原始證明的理論下限。薩溫在評語中也解釋了為什麼這個推廣對人類來說並不「那麼直覺」:在固定數域的框架下,根本看不出改變數域會帶來什麼好處。你必須先跳出原有框架,才能看到新的可能性。
為什麼人類 80 年想不到
最引人入勝的部分,是數學家們對於「為什麼是 AI 而不是人類」的集體反省。
高爾斯提出了一個精妙的概念框架。他把 AI 的數學能力比作「柯爾莫哥洛夫複雜度模除專家知識」(Kolmogorov complexity modulo experts)。這個術語背後的意思不複雜:AI 的厲害之處不在於它知道了什麼新的數學定理,而在於它能把已知的工具以新穎的方式組合起來。如果你把「已經被學術界充分理解的方法」從解題過程中剔除,剩下需要的「新想法」其實不多。AI 的優勢是對所有領域的工具都有百科全書式的熟悉,而且願意嘗試看起來不太有希望的組合方式。高爾斯坦言,他最初聽到 AI 推翻了猜想時鬆了一口氣:推翻一個猜想(找反例)比建立新的正面理論(找證明)更容易想像 AI 能做到。但他也明確表示,AI 的數學進步「不會即將觸頂」。
{{< x-post wtgowers 2057175729008153069 >}}
利特的角度更為切實。他直接說這是「第一個 AI 自主產出的、讓我真正覺得興奮的數學成果」。讓他困惑的是,當他坐下來閱讀 AI 的證明時,只花了幾個小時就完全理解了。這代表解法的核心思路「相當自然」,並不是什麼超越人類理解力的外星智慧。問題在於,沒有人去嘗試這個方向。利特把原因歸咎於學術界的結構性問題:「朝向專業化和筒倉化的激勵機制,讓我們失去了一些高品質的科學。」組合幾何的專家不會去碰代數數論的深層工具,代數數論的專家又不關注組合幾何的老問題。AI 沒有這種壁壘,它可以自由地「掃描整個問題清單」,在不同領域之間建立人類學術體制無法輕易建立的橋樑。
布魯姆的分析從歷史脈絡切入。他指出,艾狄胥生前為這個問題懸賞了 500 美元。要贏得這筆獎金,需要同時滿足幾個不太可能的條件:首先要有勇氣去「推翻」猜想而不是證明猜想成立(80 年來多數人選擇了後者);其次要想到把構造推廣到高斯整數以外的數域;最後要對類域塔這種深層代數數論工具足夠熟悉,才能看出它在組合幾何中的潛力。布魯姆觀察到:「AI 滿足了所有這些條件。」但他也做了一個重要的區分:這個結果並沒有帶來「強大的新幾何工具」,那是如果猜想被證明成立才會需要的突破。AI 展現了組合已知技術的卓越能力,但還沒有證明它能創造全新的理論框架。
來自驗證者的警告
讚譽之外,九位數學家也表達了程度不同的擔憂。這些警告或許比讚美更值得認真對待。
伍德的警告最為尖銳。她承認 AI 的證明是「數論在自然問題上的一個漂亮應用」,但隨即提出了一個令人不安的預判:「AI 說服人類它有一個正確的證明,比實際產出正確的論證要容易得多。」這句話的意義深遠。這一次有九位頂級數學家花時間逐行審閱,但這種奢侈的驗證規格不可能每次都有。如果未來每個月都有 AI 聲稱解決了重大猜想,數學界是否有足夠的人力和注意力來逐一驗證?錯誤結果被接受的風險會不會隨之上升?更糟的是,如果 AI 產出的證明越來越長、越來越依賴人類不熟悉的跨領域技術,驗證本身就會變成一項極其艱鉅的工作。
王提出的問題更加根本。他直接追問:「當我們把研究成果免費放上 arXiv 的時候,我們是否都隱含地同意了讓 AI 自由取用?」這觸及了學術知識在 AI 時代的產權核心。AI 的證明建立在數百萬篇人類論文的訓練之上,那些原始作者花了畢生精力發展出來的理論,現在被 AI 當作積木組裝成了新結果。他們是否應該在某種形式上被承認貢獻?學術界長期依賴引用機制來追蹤知識的傳承脈絡,但 AI 的運作方式讓這套機制面臨根本性的挑戰。一篇由 AI 寫的論文不會引用它訓練資料中的所有來源,事實上它也不知道自己的特定推理來自哪些具體的論文。
伍德進一步提出了具體呼籲:數學界需要盡快建立關於 AI 生成結果的引用和歸屬標準。當一篇論文的作者是「OpenAI」而不是任何個人,傳統的學術信用系統就遇到了前所未有的挑戰。誰獲得引用?誰獲得學術聲譽?如果一個年輕研究者的終身教職評審中,競爭對手是一個不需要休息、不需要經費、不需要職位的 AI 系統,學術評估的規則是否需要重新設計?這些問題在幾天前還是理論性的假設,但單位距離猜想的被推翻讓它們變成了迫切的現實。
數學家的角色正在改變
阿隆在評語中特別提到 AI 展現了「超人的耐心」。這個觀察值得停下來想想。數學研究的日常並不都是優雅的靈感迸發,很多時候它是漫長而乏味的技術操作:追蹤參數、驗算不等式、排除邊界情形。人類數學家的注意力和精力有限,當一條研究路線看起來希望不大時,理性的選擇是放棄、轉向更有前景的方向。但 AI 沒有這個限制。它可以在人類會放棄的路線上繼續前進,耐心地處理每一個技術障礙。
齊默曼和尚卡不約而同地指出了同一件事:AI 可以「在更險惡的水域中航行更久,而不會被壓垮」。數學研究中有大量嘗試是失敗的,這些失敗通常不會被發表,也不會被記錄。一個數學家可能花三個月走進一條死胡同,除了沮喪之外一無所獲。AI 不會沮喪,不會質疑自己的選擇,不會因為連續失敗而倉促改變策略。這種「無畏的探索」在面對像單位距離猜想這樣需要嘗試非主流方法的問題時,可能恰恰是決定性的優勢。
但高爾斯也給這股樂觀情緒提出了更深的追問。他問了一個核心問題:AI 能不能找到那些需要「長提示序列」的證明?有些數學問題的解法不是一個聰明想法加上技術性的執行,而是需要一連串環環相扣的洞察,每一步都為下一步打開可能性。目前 AI 展現的是強大的組合能力和不知疲倦的探索,但它是否具備建構長鏈推理的能力,仍然是一個開放的問題。高爾斯的判斷是:AI 的數學能力「不會即將觸頂」,但從推翻猜想走到建立全新的數學理論,中間的距離可能比表面看起來要遠得多。這九份獨立評語合在一起,既是對一個歷史時刻的見證,也是對一段未知旅程的第一份路線報告。數學家們很清楚:他們的角色正在改變,而他們還在學習該怎麼適應。