AI 技術前沿

Vibe Physics：AI 解開了困擾物理學家一年的量子場論難題

范德堡大學教授、OpenAI 駐所研究員 Alex Lupsasca 的團隊用 GPT-5.2 Pro 解決了困擾理論物理學家超過一年的前沿問題，證明「單負膠子樹振幅」不為零，並找到複雜度從階乘降為線性的優美公式。這是 AI 首次在量子場論前沿做出超越人類專家的貢獻。

2026 年 5 月 30 日 · 來源： Latent Space Podcast

本文整理自 Latent Space Podcast 旗下的 AI for Science 系列，2026 年 5 月播出的單集。

{{< apple-podcast "tw/podcast/doing-vibe-physics-alex-lupsasca-openai/id1674008350?i=1000766317713" >}}

一位物理學家的 Move 37 時刻

去年八月 GPT-5 剛發布，范德堡大學（Vanderbilt University）物理學教授 Alex Lupsasca 做了一個實驗。他把自己最得意的一篇論文的核心問題交給模型：找出旋轉黑洞方程式的隱藏對稱性。這篇論文花了他很長時間才推導完成，他估計全世界能獨立做到的人「一隻手就數得完」。而且 GPT-5 的訓練資料截止在這篇論文發表之前，所以模型從未看過答案。

Lupsasca 先給了一個提示：從比較簡單的平坦時空版本開始。模型花了九分鐘解出正確答案。接著他把同樣的問題換成完整的黑洞版本，模型思考了 18 分鐘，又給出了完全正確的結果。「這是我的 Move 37 時刻，」他在 Podcast 中說。Move 37 是 AlphaGo 在 2016 年對弈李世石時那步震驚圍棋界的走法。從那一刻起，Lupsasca 確信 AI 已經跨過了某個門檻。

幾個月後，他人已經在 OpenAI 辦公室。接下來發生的事情，比 Move 37 更瘋狂。

教科書說這個答案是零，但它不是

Lupsasca 是 2024 年突破獎新視野物理學獎（New Horizons in Physics Prize）得主，研究領域是黑洞物理和天球全像術。他最近的研究轉向了一個古老但核心的問題：量子場論中的散射振幅。

量子場論是二十世紀物理學的巔峰成就，它描述了自然界四種基本力的數學框架。物理學家最想計算的東西叫做「散射振幅」，簡單說就是粒子碰撞後各種結果發生的機率。如果你能算出任意數量粒子的散射振幅，你就等於知道了這個理論的一切。

其中一種關鍵粒子叫膠子，它是強核力的媒介粒子，負責把原子核中的質子和中子黏在一起。你在高中學過「同性電荷互斥」，那為什麼質子擠在原子核裡不會飛散？因為在極近距離下，由膠子傳遞的強核力會壓過電磁力，把質子「黏」在一起。物理學家研究膠子的散射振幅時，會按粒子的「螺旋度」分類。螺旋度類似偏振光的旋轉方向：右旋是正，左旋是負。

如果所有膠子的螺旋度都相同，振幅為零，代表這種反應不會發生。這是對稱性直接決定的結果，不需要計算就能知道。下一個層級是「單負」：只有一個膠子的螺旋度跟其他所有膠子相反。教科書和講義幾十年來都說，同樣的對稱性論證也適用於單負情況，所以答案也是零。

但哈佛大學教授 Andrew Strominger（Lupsasca 的博士導師）、劍橋大學的 David Skinner、和普林斯頓高等研究院的 Alfredo Guevara，在一年多前發現了漏洞。傳統論證的前提是粒子從不同方向飛來，但如果粒子完全對齊，也就是物理學家所說的「共線」，那個論證就不成立。振幅不是零。

問題來了：如果不是零，那到底是多少？

從階乘爆炸到線性優雅

Guevara 投入大量心力用手算推導這些振幅。三個粒子的情況還算簡單，就是一個函數。四個粒子變成兩項的加總。五個粒子膨脹到八項。到了六個粒子，結果佔了論文將近四分之一頁，32 項的複雜表達式，每一項又是好幾個函數的乘積。

更嚴重的問題是增長速度。項數隨粒子數呈階乘增長，這比指數增長還快。六個粒子就已經幾乎無法處理，七個、八個粒子的情況根本不可能靠人力展開。但物理學家有理由相信背後存在簡化。1980 年代，物理學家 Park 和 Taylor 在研究更複雜的「雙負」振幅時，發現了一個奇蹟：看似天量的計算項幾乎全部相消，最終剩下一個半行就能寫完的漂亮公式，後來被命名為 Park-Taylor 公式。

Strominger 和合作者相信，單負振幅也應該有類似的簡潔形式。他們花了整整一年尋找這個公式，但始終找不到。

Lupsasca 邀請 Strominger 到 OpenAI 辦公室來合作。「我想，大概不會成功，」他回憶，「但就算失敗，至少我們能搞清楚模型卡在哪裡。」然而 Strominger 人還沒到舊金山，答案就出來了。

AI 的三步破解

團隊把五點振幅（五個粒子的完整表達式）餵給 ChatGPT 5.2 Pro，問它能不能簡化。模型指出在相空間中存在一個特殊區域，在那個區域內，八項複雜乘積可以化簡為三項乘積。團隊驗證後，又餵入 Guevara 辛苦算出的六點振幅。32 項變成了 4 項。

接下來是關鍵的一步：他們問模型「一般情況的公式長什麼樣？」GPT-5.2 Pro 思考了大約 20 分鐘，給出了一個通用公式。在這個公式裡，項數隨粒子數線性增長。粒子數加倍，項數也只是加倍。跟原本的階乘爆炸相比，這是你能想像到的最漂亮行為。

但 GPT-5.2 Pro 沒辦法完整證明這個公式。所以團隊動用了一個 OpenAI 的內部模型，這個模型可以長時間思考，而且在物理推導方面特別強。他們把整個問題從頭給它，沒有透露公式本身，只是清楚地陳述了問題。模型花了 12 個小時，獨立推導出了相同的公式，並且附上完整的證明。

論文在 2026 年 2 月 12 日放上 arXiv。後半部分的三步證明結構，基本上就是 AI 的產出。Lupsasca 直言：他們刻意沒有在論文摘要中提到 AI，因為他認為這是一個獨立成立的物理結果。二十年後回頭看，沒有人會在乎是哪個版本的軟體完成了計算。

重力子：三週複製一年的突破

膠子論文發表三週後，團隊又發了第二篇，標題幾乎一模一樣，只是把「膠子」換成「重力子」。重力子是理論上的重力媒介粒子，自旋為 2（膠子是 1），數學複雜度更高。

但這次連內部模型都不需要了。團隊把膠子論文餵給公開的 ChatGPT 5.2 Pro，要求它理解整篇論文的推導邏輯，然後把方法推廣到重力子。模型思考了約 30 分鐘，開始自行推導，過程中還引用了「有向矩陣樹定理」這個數學工具。Guevara 和 Skinner 看到這一步都吃了一驚，他們沒想到這個定理在這裡能派上用場。

Lupsasca 把 110 頁的完整對話紀錄公開在 OpenAI 部落格上。他形容這是「Vibe Physics」：你給 AI 一篇論文、兩段指示，然後它自己規劃後續步驟、自己做完計算、自己提出驗證方案。人類主要負責審查結果。「三天就拿到了答案，但花了三週才確認它是對的，」Lupsasca 說，「如果一年前有人跟我說大部分時間會花在驗證 AI 的答案，我會覺得他瘋了。」

一條還在加速的曲線

回顧過去一年，Lupsasca 看到的是一條清晰的能力遞進曲線。2025 年初，O3 是第一個能做實際數學推理的模型，把他花好幾天的計算壓縮到 11 分鐘。半年後 GPT-5 出來，能在半小時內重現他最好的成果。又過了幾個月，5.2 版本解決了困擾領域專家一年的公開問題。到了 5.4 版本，能力再次明顯躍升。

「如果你順著這條軌跡往前推六個月或一年，我想不出任何理由認為它會停下來，」他說。

但他也很誠實。他提到跟數學家陶哲軒（Terence Tao）的對話：陶哲軒告訴他，到目前為止 AI 在數學領域展現的所有看似創造性的步驟，事後都能追溯到某篇冷門文獻裡的既有結果。也就是說，模型可能仍然是在重組已知知識，而非做出真正的原創跳躍。

Lupsasca 對此的回應很有意思：「我不確定我們人類是否比重組做得更多。」他把跟 GPT Pro 合作的經驗比作跟一位有創造力的協作者共事，模型會做出讓他驚訝的事情，引導他到自己沒想到的方向。不管你怎麼定義「創造力」，結果是一樣的：知識的邊界被往前推了。

現在，Lupsasca 團隊沒打算花一整年去刷更多類似複雜度的論文。他們要做的是拿著這個新工具，去挑戰更困難的問題。「我們還沒看到 AI 解開一個讓整個物理學社群困惑了幾十年的難題，」他說，「但照這個速度，那一天可能不會太遠。」