Vibe Physics:AI 解開了困擾物理學家一年的量子場論難題

范德堡大學教授、OpenAI 駐所研究員 Alex Lupsasca 的團隊用 GPT-5.2 Pro 解決了困擾理論物理學家超過一年的前沿問題,證明「單負膠子樹振幅」不為零,並找到複雜度從階乘降為線性的優美公式。這是 AI 首次在量子場論前沿做出超越人類專家的貢獻。

Vibe Physics:AI 解開了困擾物理學家一年的量子場論難題

本文整理自 Latent Space Podcast 旗下的 AI for Science 系列,2026 年 5 月播出的單集。

{{< youtube 9d899Ram9Bs >}}

{{< spotify "episode/31rDDzc60G2ZX3sM6FuCP5" >}}

{{< apple-podcast "tw/podcast/doing-vibe-physics-alex-lupsasca-openai/id1674008350?i=1000766317713" >}}


一位物理學家的 Move 37 時刻

去年八月 GPT-5 剛發布,范德堡大學(Vanderbilt University)物理學教授 Alex Lupsasca 做了一個實驗。他把自己最得意的一篇論文的核心問題交給模型:找出旋轉黑洞方程式的隱藏對稱性。這篇論文花了他很長時間才推導完成,他估計全世界能獨立做到的人「一隻手就數得完」。而且 GPT-5 的訓練資料截止在這篇論文發表之前,所以模型從未看過答案。

Lupsasca 先給了一個提示:從比較簡單的平坦時空版本開始。模型花了九分鐘解出正確答案。接著他把同樣的問題換成完整的黑洞版本,模型思考了 18 分鐘,又給出了完全正確的結果。「這是我的 Move 37 時刻,」他在 Podcast 中說。Move 37 是 AlphaGo 在 2016 年對弈李世石時那步震驚圍棋界的走法。從那一刻起,Lupsasca 確信 AI 已經跨過了某個門檻。

幾個月後,他人已經在 OpenAI 辦公室。接下來發生的事情,比 Move 37 更瘋狂。

教科書說這個答案是零,但它不是

Lupsasca 是 2024 年突破獎新視野物理學獎(New Horizons in Physics Prize)得主,研究領域是黑洞物理和天球全像術。他最近的研究轉向了一個古老但核心的問題:量子場論中的散射振幅。

量子場論是二十世紀物理學的巔峰成就,它描述了自然界四種基本力的數學框架。物理學家最想計算的東西叫做「散射振幅」,簡單說就是粒子碰撞後各種結果發生的機率。如果你能算出任意數量粒子的散射振幅,你就等於知道了這個理論的一切。

其中一種關鍵粒子叫膠子,它是強核力的媒介粒子,負責把原子核中的質子和中子黏在一起。你在高中學過「同性電荷互斥」,那為什麼質子擠在原子核裡不會飛散?因為在極近距離下,由膠子傳遞的強核力會壓過電磁力,把質子「黏」在一起。物理學家研究膠子的散射振幅時,會按粒子的「螺旋度」分類。螺旋度類似偏振光的旋轉方向:右旋是正,左旋是負。

如果所有膠子的螺旋度都相同,振幅為零,代表這種反應不會發生。這是對稱性直接決定的結果,不需要計算就能知道。下一個層級是「單負」:只有一個膠子的螺旋度跟其他所有膠子相反。教科書和講義幾十年來都說,同樣的對稱性論證也適用於單負情況,所以答案也是零。

但哈佛大學教授 Andrew Strominger(Lupsasca 的博士導師)、劍橋大學的 David Skinner、和普林斯頓高等研究院的 Alfredo Guevara,在一年多前發現了漏洞。傳統論證的前提是粒子從不同方向飛來,但如果粒子完全對齊,也就是物理學家所說的「共線」,那個論證就不成立。振幅不是零。

問題來了:如果不是零,那到底是多少?

從階乘爆炸到線性優雅

Guevara 投入大量心力用手算推導這些振幅。三個粒子的情況還算簡單,就是一個函數。四個粒子變成兩項的加總。五個粒子膨脹到八項。到了六個粒子,結果佔了論文將近四分之一頁,32 項的複雜表達式,每一項又是好幾個函數的乘積。

更嚴重的問題是增長速度。項數隨粒子數呈階乘增長,這比指數增長還快。六個粒子就已經幾乎無法處理,七個、八個粒子的情況根本不可能靠人力展開。但物理學家有理由相信背後存在簡化。1980 年代,物理學家 Park 和 Taylor 在研究更複雜的「雙負」振幅時,發現了一個奇蹟:看似天量的計算項幾乎全部相消,最終剩下一個半行就能寫完的漂亮公式,後來被命名為 Park-Taylor 公式。

Strominger 和合作者相信,單負振幅也應該有類似的簡潔形式。他們花了整整一年尋找這個公式,但始終找不到。

Lupsasca 邀請 Strominger 到 OpenAI 辦公室來合作。「我想,大概不會成功,」他回憶,「但就算失敗,至少我們能搞清楚模型卡在哪裡。」然而 Strominger 人還沒到舊金山,答案就出來了。

AI 的三步破解

團隊把五點振幅(五個粒子的完整表達式)餵給 ChatGPT 5.2 Pro,問它能不能簡化。模型指出在相空間中存在一個特殊區域,在那個區域內,八項複雜乘積可以化簡為三項乘積。團隊驗證後,又餵入 Guevara 辛苦算出的六點振幅。32 項變成了 4 項。

接下來是關鍵的一步:他們問模型「一般情況的公式長什麼樣?」GPT-5.2 Pro 思考了大約 20 分鐘,給出了一個通用公式。在這個公式裡,項數隨粒子數線性增長。粒子數加倍,項數也只是加倍。跟原本的階乘爆炸相比,這是你能想像到的最漂亮行為。

但 GPT-5.2 Pro 沒辦法完整證明這個公式。所以團隊動用了一個 OpenAI 的內部模型,這個模型可以長時間思考,而且在物理推導方面特別強。他們把整個問題從頭給它,沒有透露公式本身,只是清楚地陳述了問題。模型花了 12 個小時,獨立推導出了相同的公式,並且附上完整的證明。

論文在 2026 年 2 月 12 日放上 arXiv。後半部分的三步證明結構,基本上就是 AI 的產出。Lupsasca 直言:他們刻意沒有在論文摘要中提到 AI,因為他認為這是一個獨立成立的物理結果。二十年後回頭看,沒有人會在乎是哪個版本的軟體完成了計算。

重力子:三週複製一年的突破

膠子論文發表三週後,團隊又發了第二篇,標題幾乎一模一樣,只是把「膠子」換成「重力子」。重力子是理論上的重力媒介粒子,自旋為 2(膠子是 1),數學複雜度更高。

但這次連內部模型都不需要了。團隊把膠子論文餵給公開的 ChatGPT 5.2 Pro,要求它理解整篇論文的推導邏輯,然後把方法推廣到重力子。模型思考了約 30 分鐘,開始自行推導,過程中還引用了「有向矩陣樹定理」這個數學工具。Guevara 和 Skinner 看到這一步都吃了一驚,他們沒想到這個定理在這裡能派上用場。

Lupsasca 把 110 頁的完整對話紀錄公開在 OpenAI 部落格上。他形容這是「Vibe Physics」:你給 AI 一篇論文、兩段指示,然後它自己規劃後續步驟、自己做完計算、自己提出驗證方案。人類主要負責審查結果。「三天就拿到了答案,但花了三週才確認它是對的,」Lupsasca 說,「如果一年前有人跟我說大部分時間會花在驗證 AI 的答案,我會覺得他瘋了。」

一條還在加速的曲線

回顧過去一年,Lupsasca 看到的是一條清晰的能力遞進曲線。2025 年初,O3 是第一個能做實際數學推理的模型,把他花好幾天的計算壓縮到 11 分鐘。半年後 GPT-5 出來,能在半小時內重現他最好的成果。又過了幾個月,5.2 版本解決了困擾領域專家一年的公開問題。到了 5.4 版本,能力再次明顯躍升。

「如果你順著這條軌跡往前推六個月或一年,我想不出任何理由認為它會停下來,」他說。

但他也很誠實。他提到跟數學家陶哲軒(Terence Tao)的對話:陶哲軒告訴他,到目前為止 AI 在數學領域展現的所有看似創造性的步驟,事後都能追溯到某篇冷門文獻裡的既有結果。也就是說,模型可能仍然是在重組已知知識,而非做出真正的原創跳躍。

Lupsasca 對此的回應很有意思:「我不確定我們人類是否比重組做得更多。」他把跟 GPT Pro 合作的經驗比作跟一位有創造力的協作者共事,模型會做出讓他驚訝的事情,引導他到自己沒想到的方向。不管你怎麼定義「創造力」,結果是一樣的:知識的邊界被往前推了。

現在,Lupsasca 團隊沒打算花一整年去刷更多類似複雜度的論文。他們要做的是拿著這個新工具,去挑戰更困難的問題。「我們還沒看到 AI 解開一個讓整個物理學社群困惑了幾十年的難題,」他說,「但照這個速度,那一天可能不會太遠。」