當計算不再是瓶頸:一位理論物理學家的 AI 研究革命
OpenAI 駐所物理學家 Alex Lupsasca 分享 AI 如何改變他的日常研究工作流:同時派出十個 AI 實例探索不同研究路徑、大幅縮短困惑時間,但驗證 AI 產出的正確性卻成了新的最大瓶頸。他認為未來物理學家最重要的能力不是計算,而是提出對的問題。

本文整理自 Latent Space Podcast 旗下的 AI for Science 系列,2026 年 5 月播出的單集。
{{< youtube 9d899Ram9Bs >}}
{{< spotify "episode/31rDDzc60G2ZX3sM6FuCP5" >}}
{{< apple-podcast "tw/podcast/doing-vibe-physics-alex-lupsasca-openai/id1674008350?i=1000766317713" >}}
計算從來不是最難的部分
如果你問一位理論物理教授「做研究最花時間的事情是什麼」,答案通常不是計算本身。范德堡大學教授、OpenAI 駐所研究員 Alex Lupsasca 在 Podcast 中講得很直白:花最多時間的是困惑。你做完一個計算,得到一個結果,然後發現它跟你已知的某個事實對不上。你不知道哪裡出了問題。你散步、換個專案做、睡一覺,過幾天回來再想。這個循環是研究的常態,也是進展緩慢的最大原因。
但 Lupsasca 說,他的研究方式在過去一年間發生了根本性的改變。AI 帶來的加速不只是「算得更快」,而是在兩個完全不同的層面重塑了他的工作流。第一個是困惑時間的劇烈壓縮。第二個是探索路徑的平行化。這兩個改變加在一起,產生的效果不是線性提升,而是量級的跳躍。
Lupsasca 最近跟合作者連續發表了兩篇突破性的量子場論論文,證明了「單負膠子樹振幅」和「單負重力子樹振幅」不為零。這兩個結果困擾了頂尖理論物理學家超過一年,但在 AI 的協助下,膠子論文幾天內就拿到了核心結果,重力子論文更是在三週內完成。支撐這些成果的,正是他所說的這套新工作方法。
困惑消除器:從幾天壓縮到幾分鐘
傳統的理論物理研究有一個典型節奏:做一步計算、碰到矛盾、陷入困惑、想幾天、找到線索、繼續往前。Lupsasca 形容,這個「困惑期」佔據了研究生涯中大量的時間。不是因為問題本身無解,而是因為你可能忘了某個條件、搞錯了一個假設、或者只是沒想到兩個已知事實之間的連結。
現在他遇到這種狀況會直接問 GPT。「我剛算出這個結果,但它跟那個已知定理矛盾了,問題出在哪裡?」模型通常能馬上指出問題所在:你忘了某個邊界條件,或者你引用的定理有一個前提你沒注意到。以前需要散步三天才能想通的卡關,現在幾分鐘就解決了。
這聽起來可能像「比較好的搜尋引擎」,但實際效果遠不止於此。因為研究的推進是連續的:每一步的困惑如果能快速解決,你就能更快到達下一步。當每一步的延遲都從天縮短到分鐘,整個研究的節奏會從月尺度壓縮到週甚至天的尺度。重力子論文三天內拿到核心結果,就是這個效應的直接展現。
偵察兵:同時派十個 AI 探路
第二個改變更有策略性。Lupsasca 說,以前面對一個研究問題時,你會花很多時間在心裡規劃路線:從 A 點要到 C 點,中間需要經過 B 點,但 B 點可能有好幾個候選方案。你得仔細評估哪條路最有希望,因為一旦選錯,可能就是幾週的沉沒成本。物理論文的典型時間尺度是半年到一年,你承擔不起太多次選錯方向。
現在他的做法完全不同。他會同時開十個 ChatGPT 對話,每個走不同的路線,讓 AI 當「偵察兵」快速往前探。十條路裡可能七條很快就碰壁了,但剩下三條看起來有希望。然後他會集中精力在那三條路上。
「第一個走進未知領域和跟著前面的人走,感覺完全不一樣,」Lupsasca 解釋。即使 AI 不能每次都走到終點,光是在路上留下幾個路標,就已經大幅降低了人類後續探索的難度。這不是取代物理學家,而是把物理學家從「一次只能嘗試一條路」的限制中解放出來。
重力子論文的推導過程就是最好的例子。團隊把膠子論文餵給模型,告訴它「把這個推廣到重力子情況」,然後 AI 自己規劃了推導步驟,甚至引用了研究者們沒想到的數學工具。110 頁的對話紀錄裡,AI 每隔半小時回報一次進度,列出還剩什麼需要做,然後繼續往前推進。Lupsasca 稱之為「Vibe Physics」。
驗證地獄:新的最大瓶頸
但加速帶來了一個出乎意料的後果。當 AI 能在幾十分鐘內產出複雜的數學證明時,驗證這些證明是否正確就變成了整個流程中最慢的環節。重力子論文三天就拿到了結果,但團隊花了三週才確認答案無誤。大部分時間不是在做新的計算,而是在逐步檢查 AI 的推導有沒有出錯。
Lupsasca 坦言,有時候模型確實會犯錯。它可能在推導的某一步「猜」了一下,而不是嚴格推導。如果人類不仔細檢查,就可能把錯誤的結果發表出去。他說現在已經有人這樣做了,arXiv 上開始出現由 AI 驅動但品質堪憂的論文。
「我們現在處於一個模型可以同時解決數千個問題的時代,但我們必須非常謹慎,」他說。他認為改進的方向有兩個。第一,讓模型更明確地標示自己在每一步的信心水準,區分「這是嚴格推導」和「這是我的猜測」。第二,形式化驗證工具(像 Lean 這樣的證明語言)會變得越來越重要。有趣的是,一年前他認為自然語言推理就夠了,因為模型夠聰明。但現在他改變了想法:當產出量暴增時,自動化驗證成了必需品。
研究所教育的危機
AI 帶來的衝擊不只在研究前沿,也直接威脅到物理學的人才培養方式。Lupsasca 身為教授,深感這個問題的急迫性。傳統上,物理學的訓練是通過一系列「成年禮」完成的:你必須親手做完那些極其艱難的計算,才能證明自己掌握了這個學科。這不只是技能測試,更是建立自信的過程。
但如果 AI 現在能輕鬆「碾壓」這些問題呢?博士生在六個月的獨立研究中,怎麼可能完全不用 AI?更棘手的是,研究所課程結束的地方和研究前沿之間有一片巨大的「沙漠」,學生必須獨自穿越。Lupsasca 回憶自己博士二年級時,這段穿越是他研究生涯中最痛苦的階段,充滿了困惑和碰壁。
他認為 AI 在這裡反而可以扮演「最好的老師」。它什麼都知道,能把任何複雜概念拆解到你需要的細節程度。但學術界需要正視的問題是:如果學生不再需要自己做那些艱難的計算,我們要用什麼來建立他們的自信和判斷力?這個問題目前沒有好答案。
提問力:好物理學家和偉大物理學家的分水嶺
在所有這些改變中,Lupsasca 反覆強調一個觀點:AI 改變了「做」物理的方式,但最核心的人類能力不但沒有被取代,反而變得更重要了。那就是知道該問什麼問題。
「好的物理學家和偉大的物理學家之間的差別,一直都在於知道什麼才是對的問題,」他說。AI 現在是一個超級厲害的研究生,你給它一個明確的問題,它能做出難以置信的計算。但它還不太會自己找到值得問的問題。而找到那些剛好在知識邊界上、既不太簡單也不太困難、而且能通向重要結果的問題,「這是做科學家最難的部分」。
他把這個能力類比為教授指導學生的技巧:知道給每個學生什麼程度的問題、用什麼方式提出、給多少細節。跟 AI 協作需要的是非常相似的技能。會帶學生的教授,用 AI 做研究的效果也會特別好。
這意味著 AI 時代的科學家需要的是更多的「品味」(taste),而不是更多的計算能力。他援引了一個有趣的觀察:在理論物理這個沒有太多實驗數據來約束方向的領域,研究的走向很大程度上取決於社群集體認為什麼是「有趣的」。AI 可以在任何方向上產出大量結果,但判斷哪個方向真正重要,仍然是人類的工作。
論文的終結?
Lupsasca 對科學出版的未來有一個很激進的想法。他不確定 20 年後人們是否還會用靜態論文來發表研究成果。
他的理由很實際。首先,寫論文耗費大量時間。做完研究後最大的瓶頸就是把結果整理成論文格式,這個過程既痛苦又緩慢。其次,論文本質上是知識的壓縮格式,它把複雜的思考過程濃縮成精煉但不完整的陳述。讀者看到的是最終結果,看不到中間的嘗試和失敗。第三,現在的流程有一種荒謬感:研究者用 AI 做出結果,花時間寫成論文,然後別的研究者把論文餵回 AI 來理解它。既然兩端都已經是 AI 了,中間為什麼還要經過一個靜態文件?
他想像的未來是「互動式論文」,一個研究成果以某種 AI 可互動的形式存在。你可以問它大方向是什麼,也可以深入到任何一步推導的細節。他承認寫論文的過程本身有價值,因為它迫使你把思考整理清楚。但目前的格式、投稿、同儕審查、等半年的流程,顯然已經跟不上 AI 加速後的研究節奏。
物理學的計算能力瓶頸正在被 AI 打破。取而代之的新瓶頸是驗證、是品味、是提出對的問題。這些聽起來都比「算數學」更像人類的核心能力。某種意義上,AI 正在把物理學家推回他們最擅長的位置。