AI 獨力破解 80 年數學難題:OpenAI 如何推翻艾狄胥單位距離猜想
OpenAI 宣布旗下通用推理模型在無人類協作下,獨立推翻匈牙利數學家艾狄胥 1946 年提出的單位距離猜想,這是組合幾何領域懸而未決 80 年的經典難題。AI 運用代數數論的創新手法構造反例,九位頂級數學家驗證結果正確,普林斯頓數學家薩溫更在一天內將結果大幅強化。

本文整理自 OpenAI 於 2026 年 5 月 20 日發表的研究論文及相關資料。
一個 80 年的猜想倒下了
5 月 20 日,OpenAI 發表了一篇 18 頁的數學論文。作者欄上只寫了兩個字:「OpenAI」。沒有任何人類數學家掛名,因為確實沒有人類數學家參與了推導。論文的結論很明確:匈牙利傳奇數學家保羅.艾狄胥(Paul Erdős)在 1946 年提出的「單位距離猜想」是錯的。這個困擾組合幾何領域 80 年的經典問題,被一個通用推理模型解決了。
這不是一般意義上的「AI 輔助數學研究」。過去幾年,AI 在數學領域的應用大多停留在輔助角色:幫忙驗證已知結果、搜尋反例候選人、或是在人類指導下執行特定計算。但這一次完全不同。OpenAI 研究員陳立傑(Lijie Chen)把問題交給模型後,AI 自行理解問題、探索策略、構造證明,全程沒有人類介入。驗證工作由 OpenAI 的馬克.塞爾克(Mark Sellke)和梅塔布.索尼(Mehtaab Sawhney)完成,他們確認了 AI 產出的數學推理完全正確。
消息傳出後,數學界反應既興奮又震撼。菲爾茲獎得主蒂莫西.高爾斯(Timothy Gowers)在 X 上發文,稱這是「最著名的艾狄胥問題之一」,並提醒同行「讀下去之前先坐好」。
{{< x-post wtgowers 2057175729008153069 >}}
同一天,包括高爾斯在內的九位頂級數學家發表了一篇聯合評論論文,逐行審閱了 AI 的證明,一致確認結果正確。OpenAI 研究員塞巴斯蒂安.布貝克(Sebastian Bubeck)回憶起第一次看到結果時的反應:「這聽起來好到不像是真的。」
一個聽起來很簡單的問題
想像你在一張大桌子上擺了 n 枚相同大小的硬幣。你拿出一把尺,測量每兩枚之間的距離,然後數有多少對恰好相距某個固定長度,比如 10 公分。問題是:在最理想的排列方式下,你最多能找到多少對這樣的「等距硬幣」?
如果你把硬幣排成一條直線、等距放置,那只有相鄰的硬幣滿足條件,大約有 n 對。但聰明的排列方式可以做得遠遠更好。艾狄胥發現,如果你把硬幣放在正方形格子的交叉點上(想像棋盤的格點),每枚硬幣周圍就會有好幾個鄰居恰好落在目標距離上,整體的等距對數可以遠超 n。他精確計算出,這種格子排列能產生大約 n 的 1+C/log log n 次方的等距對。這個數學表達式裡的 log log n 是「對 n 取兩次對數」,增長極為緩慢。拿 n 等於一兆(10 的 12 次方)來說,log log n 大約只有 3。所以格子能達到的上限雖然超過線性增長,但超出的幅度微乎其微。
艾狄胥的猜想是:他找到的格子排列已經是最好的了。不管你用什麼天才方法排列這些點,等距對的數量永遠不可能達到 n 的任何固定次方,比如 n 的 1.01 次方。這是一個關於「天花板在哪裡」的猜想。80 年來,數學家們試過各種方法,從解析數論到圖論再到組合幾何,就是無法把下界推過那個 log log n 的障礙。有些人嘗試證明猜想成立,有些人嘗試構造反例推翻它,兩邊都沒有突破。慢慢地,多數專家開始相信猜想是對的。
事實上,數學界對這個問題的最佳下界始終停留在艾狄胥本人用正方形格子得到的結果。幾十年間,有人改進了常數 C 的值,有人把結果推廣到更高維度,但沒有人撼動那個 log log n 的根本結構。組合數學大師諾加.阿隆(Noga Alon)在事後的評論中承認:「鑒於這麼長的時間都沒有進展,猜想似乎是對的。」這道題需要的不是更精細的計算,而是一個全新的視角。
AI 的洞察:換棋盤,不換棋子
AI 找到的突破口,核心在於翻轉了艾狄胥構造方法的邏輯。
艾狄胥用的是「高斯整數格子」Z[i],一種基於複數的固定座標系統。在這個格子上,有些質數有特殊性質:它們可以被分解成兩個高斯整數的乘積,數學上叫做「分裂質數」。這些分裂質數越多,格子上的等距對就越豐富。但問題在於,在固定的高斯整數格子上,分裂質數的增長速度有天然的極限,這直接導致了那個 log log n 的天花板。艾狄胥的策略是在固定棋盤上盡可能利用更多棋子,但棋盤的結構本身限制了你能做到的一切。
AI 的思路完全不同:它不在固定的格子上做文章,而是改變格子本身。AI 使用了代數數論中一個叫做「無限不分歧類域塔」的結構。這是由戈洛德-沙法列維奇定理(Golod-Shafarevich theorem)保證存在的無窮數域序列,每一層都比上一層更大、更複雜,但始終保持某些關鍵的算術性質。AI 的策略是:先固定一小組分裂質數,然後沿著類域塔往上爬,讓每一層新的數域為這組固定質數提供越來越多的幾何結構。
用一個不精確但有助理解的比喻:想像你要在城市裡建造盡可能多的、恰好一公里長的道路。艾狄胥的方法是選一座固定的城市(比如曼哈頓的方格街道),然後數有多少對路口恰好相距一公里。他能做到的極限取決於曼哈頓的街道格局。AI 的方法是:先決定利用哪幾條主幹道的方向,然後不斷擴建城市,讓每次擴建都新增大量恰好一公里的路口對。因為城市可以無限擴建(類域塔是無窮的),最終產生的一公里道路對數就能超越任何固定城市所能達到的上限。
這個證明建立的核心結果是:存在一個正數 δ,使得對無窮多個 n,平面上可以找到 n 個點,其中等距對數至少有 n 的 1+δ 次方。這直接推翻了艾狄胥的猜想,因為猜想聲稱不可能有任何固定正指數 δ 能做到這一點。更引人注目的是後續進展:普林斯頓大學數學家威爾.薩溫(Will Sawin)在論文發表當天就寫出了一篇後續研究,仔細追蹤所有參數後,把 δ 明確計算為大約 0.014。這意味著存在 n 個點的排列,其中等距對數超過 n 的 1.014 次方。薩溫的改進說明 AI 找到的不只是一個勉強成立的反例,而是打開了一個可以持續優化的新方向。
全自動的數學發現
這個證明的產出過程本身就值得仔細審視。
根據 OpenAI 的說明,參與這個突破的是一個「通用推理模型」,沒有針對單位距離問題做過專門訓練,也沒有配備特殊的數學搜索工具。陳立傑把問題和相關背景描述成一道 prompt,交給模型處理。模型自行探索了多條可能的解題路徑,最終找到了使用類域塔的構造方法。塞爾克在受訪時提到,過去數學家也嘗試過類似方向,但那些嘗試「太精細,難以實際執行」。AI 的優勢在於它能夠「更全面地探索所有可能性」,不會因為某條路看起來希望渺茫就提前放棄。
「完全自主」在這裡有精確的含義。AI 不是寫了一份草稿讓人類去修改完善,而是獨立產出了完整的、數學上成立的證明。之後的人類介入分為兩個階段:第一階段是 OpenAI 內部的塞爾克和索尼確認核心數學推理的正確性;第二階段是九位外部數學家逐行審閱、撰寫獨立評論,並提供了簡化版的證明。人類專家改進的是論文的「表述」,不是數學本身。布貝克回憶,從第一次看到 AI 的產出到完成正式驗證,只花了幾個月的時間。
這與過去的 AI 數學成就有本質區別。2024 年 DeepMind 的 AlphaProof 在國際數學奧林匹克中解決了幾道競賽題目,但那些是在有限範圍內尋找已知類型的解法,與攻克一個 80 年未解的研究級開放問題完全不同。在學術界,過去也有 AI 系統發現新猜想或驗證已有結果,但人類始終扮演核心思考者的角色。這一次,從問題理解、策略選擇到技術執行,整條鏈路都是 AI 獨立完成的。陳立傑自己的反應或許最能說明問題:「我預期 AI 遲早會在這方面做出成績,只是我的時間表被提前了。」
數學界的集體驗證
論文發表的同一天,一份罕見的聯合評論文件也隨之公布。九位數學家各自獨立撰寫了評語,從不同專業角度分析這個結果的意義和侷限。
這九位作者的陣容本身就說明了數學界對此事的重視。阿隆是組合數學領域的泰斗,高爾斯是菲爾茲獎得主,薩溫和雅各布.齊默曼(Jacob Tsimerman)是代數數論的新生代領袖,梅蘭妮.伍德(Melanie Matchett Wood)是近年備受矚目的數論與機率專家。阿魯爾.尚卡(Arul Shankar)直言這是「一個非常漂亮的想法的乾淨執行」,表示會「毫不猶豫地推薦這篇論文在任何期刊發表」。阿隆稱之為「卓越的成就,解決了一個長期懸而未決的開放問題」,並特別指出 AI 展現了「超人的耐心」來處理繁瑣的技術細節。
但驗證只是文件的一部分。更有意思的是數學家們對「為什麼人類 80 年沒想到」的反思。丹尼爾.利特(Daniel Litt)坦承,他在幾小時內就理解了 AI 的證明,這代表解法的核心思路「相當自然」。問題在於,沒有人去嘗試這個方向。利特把原因歸結為學術界的專業化傾向:組合幾何的專家不太碰代數數論的深層工具,而代數數論的專家又不太關注組合幾何的經典問題。AI 沒有這種學科壁壘,它可以自由地在不同數學分支之間建立連結。
不過,伍德也提出了重要的警告。她指出,隨著 AI 生成的數學結果越來越多,一個根本性的問題將浮上檯面:「AI 說服人類它有一個正確的證明,比實際找到正確的論證要容易得多。」另一個她關心的問題是引用與歸屬:當 AI 的證明建立在數百萬篇人類論文的基礎上,那些原始作者是否該被某種形式地承認?維克多.王(Victor Wang)更直接地追問:「當我們把研究成果免費放上 arXiv,我們是否都隱含地同意了讓 AI 自由取用?」
被推翻的不只是一個猜想
艾狄胥單位距離猜想的倒下,在數學層面上最直接的影響是重新打開了一個被認為已經定型的研究方向。80 年來,多數研究者假設猜想成立,把精力放在改進上界或處理相關問題上。現在反方向被證明是正確的,整個問題的格局需要重新評估。目前已知的最佳上界是 n 的 4/3 次方(由 Spencer、Szemerédi 和 Trotter 建立),而 AI 證明的下界大約是 n 的 1.014 次方(薩溫的改進版)。這兩者之間仍然有巨大的差距,這個差距本身就可能催生數十年的後續研究。
但更值得思考的是方法論層面的衝擊。AI 用來解決這個問題的每一個工具,類域塔、CM 域、Golod-Shafarevich 定理、Hajir-Maire-Ramakrishna 方法,都是人類數學家花了幾十年發展出來的。AI 沒有發明新數學,它做的事情是看出了一個人類沒有看出的連結。高爾斯提出的「柯爾莫哥洛夫複雜度模除專家知識」框架或許是理解這個現象的最好方式:AI 的能力不在於創造新理論,而在於把已知工具以意想不到的方式組合起來。
知名組合數學家吉爾.卡萊(Gil Kalai)把這個事件比作 1976 年的四色定理電腦輔助證明,認為這是「重要性超越組合數學、甚至超越數學本身的科學里程碑」。50 年前,電腦證明四色定理引發了「這算不算真正的證明」的哲學爭論。今天 AI 推翻艾狄胥猜想,提出的問題更根本:當 AI 能獨立做出人類 80 年做不出的數學發現時,數學研究的本質是否正在改變?這不只是一個理論問題。艾狄胥生前為這道題懸賞了 500 美元。現在解決問題的不是人,而數學界恐怕得開始認真思考:這筆獎金該付給誰。