AI 技術前沿

當計算不再是瓶頸：一位理論物理學家的 AI 研究革命

OpenAI 駐所物理學家 Alex Lupsasca 分享 AI 如何改變他的日常研究工作流：同時派出十個 AI 實例探索不同研究路徑、大幅縮短困惑時間，但驗證 AI 產出的正確性卻成了新的最大瓶頸。他認為未來物理學家最重要的能力不是計算，而是提出對的問題。

2026 年 5 月 30 日 · 來源： Latent Space Podcast

本文整理自 Latent Space Podcast 旗下的 AI for Science 系列，2026 年 5 月播出的單集。

{{< apple-podcast "tw/podcast/doing-vibe-physics-alex-lupsasca-openai/id1674008350?i=1000766317713" >}}

計算從來不是最難的部分

如果你問一位理論物理教授「做研究最花時間的事情是什麼」，答案通常不是計算本身。范德堡大學教授、OpenAI 駐所研究員 Alex Lupsasca 在 Podcast 中講得很直白：花最多時間的是困惑。你做完一個計算，得到一個結果，然後發現它跟你已知的某個事實對不上。你不知道哪裡出了問題。你散步、換個專案做、睡一覺，過幾天回來再想。這個循環是研究的常態，也是進展緩慢的最大原因。

但 Lupsasca 說，他的研究方式在過去一年間發生了根本性的改變。AI 帶來的加速不只是「算得更快」，而是在兩個完全不同的層面重塑了他的工作流。第一個是困惑時間的劇烈壓縮。第二個是探索路徑的平行化。這兩個改變加在一起，產生的效果不是線性提升，而是量級的跳躍。

Lupsasca 最近跟合作者連續發表了兩篇突破性的量子場論論文，證明了「單負膠子樹振幅」和「單負重力子樹振幅」不為零。這兩個結果困擾了頂尖理論物理學家超過一年，但在 AI 的協助下，膠子論文幾天內就拿到了核心結果，重力子論文更是在三週內完成。支撐這些成果的，正是他所說的這套新工作方法。

困惑消除器：從幾天壓縮到幾分鐘

傳統的理論物理研究有一個典型節奏：做一步計算、碰到矛盾、陷入困惑、想幾天、找到線索、繼續往前。Lupsasca 形容，這個「困惑期」佔據了研究生涯中大量的時間。不是因為問題本身無解，而是因為你可能忘了某個條件、搞錯了一個假設、或者只是沒想到兩個已知事實之間的連結。

現在他遇到這種狀況會直接問 GPT。「我剛算出這個結果，但它跟那個已知定理矛盾了，問題出在哪裡？」模型通常能馬上指出問題所在：你忘了某個邊界條件，或者你引用的定理有一個前提你沒注意到。以前需要散步三天才能想通的卡關，現在幾分鐘就解決了。

這聽起來可能像「比較好的搜尋引擎」，但實際效果遠不止於此。因為研究的推進是連續的：每一步的困惑如果能快速解決，你就能更快到達下一步。當每一步的延遲都從天縮短到分鐘，整個研究的節奏會從月尺度壓縮到週甚至天的尺度。重力子論文三天內拿到核心結果，就是這個效應的直接展現。

偵察兵：同時派十個 AI 探路

第二個改變更有策略性。Lupsasca 說，以前面對一個研究問題時，你會花很多時間在心裡規劃路線：從 A 點要到 C 點，中間需要經過 B 點，但 B 點可能有好幾個候選方案。你得仔細評估哪條路最有希望，因為一旦選錯，可能就是幾週的沉沒成本。物理論文的典型時間尺度是半年到一年，你承擔不起太多次選錯方向。

現在他的做法完全不同。他會同時開十個 ChatGPT 對話，每個走不同的路線，讓 AI 當「偵察兵」快速往前探。十條路裡可能七條很快就碰壁了，但剩下三條看起來有希望。然後他會集中精力在那三條路上。

「第一個走進未知領域和跟著前面的人走，感覺完全不一樣，」Lupsasca 解釋。即使 AI 不能每次都走到終點，光是在路上留下幾個路標，就已經大幅降低了人類後續探索的難度。這不是取代物理學家，而是把物理學家從「一次只能嘗試一條路」的限制中解放出來。

重力子論文的推導過程就是最好的例子。團隊把膠子論文餵給模型，告訴它「把這個推廣到重力子情況」，然後 AI 自己規劃了推導步驟，甚至引用了研究者們沒想到的數學工具。110 頁的對話紀錄裡，AI 每隔半小時回報一次進度，列出還剩什麼需要做，然後繼續往前推進。Lupsasca 稱之為「Vibe Physics」。

驗證地獄：新的最大瓶頸

但加速帶來了一個出乎意料的後果。當 AI 能在幾十分鐘內產出複雜的數學證明時，驗證這些證明是否正確就變成了整個流程中最慢的環節。重力子論文三天就拿到了結果，但團隊花了三週才確認答案無誤。大部分時間不是在做新的計算，而是在逐步檢查 AI 的推導有沒有出錯。

Lupsasca 坦言，有時候模型確實會犯錯。它可能在推導的某一步「猜」了一下，而不是嚴格推導。如果人類不仔細檢查，就可能把錯誤的結果發表出去。他說現在已經有人這樣做了，arXiv 上開始出現由 AI 驅動但品質堪憂的論文。

「我們現在處於一個模型可以同時解決數千個問題的時代，但我們必須非常謹慎，」他說。他認為改進的方向有兩個。第一，讓模型更明確地標示自己在每一步的信心水準，區分「這是嚴格推導」和「這是我的猜測」。第二，形式化驗證工具（像 Lean 這樣的證明語言）會變得越來越重要。有趣的是，一年前他認為自然語言推理就夠了，因為模型夠聰明。但現在他改變了想法：當產出量暴增時，自動化驗證成了必需品。

研究所教育的危機

AI 帶來的衝擊不只在研究前沿，也直接威脅到物理學的人才培養方式。Lupsasca 身為教授，深感這個問題的急迫性。傳統上，物理學的訓練是通過一系列「成年禮」完成的：你必須親手做完那些極其艱難的計算，才能證明自己掌握了這個學科。這不只是技能測試，更是建立自信的過程。

但如果 AI 現在能輕鬆「碾壓」這些問題呢？博士生在六個月的獨立研究中，怎麼可能完全不用 AI？更棘手的是，研究所課程結束的地方和研究前沿之間有一片巨大的「沙漠」，學生必須獨自穿越。Lupsasca 回憶自己博士二年級時，這段穿越是他研究生涯中最痛苦的階段，充滿了困惑和碰壁。

他認為 AI 在這裡反而可以扮演「最好的老師」。它什麼都知道，能把任何複雜概念拆解到你需要的細節程度。但學術界需要正視的問題是：如果學生不再需要自己做那些艱難的計算，我們要用什麼來建立他們的自信和判斷力？這個問題目前沒有好答案。

提問力：好物理學家和偉大物理學家的分水嶺

在所有這些改變中，Lupsasca 反覆強調一個觀點：AI 改變了「做」物理的方式，但最核心的人類能力不但沒有被取代，反而變得更重要了。那就是知道該問什麼問題。

「好的物理學家和偉大的物理學家之間的差別，一直都在於知道什麼才是對的問題，」他說。AI 現在是一個超級厲害的研究生，你給它一個明確的問題，它能做出難以置信的計算。但它還不太會自己找到值得問的問題。而找到那些剛好在知識邊界上、既不太簡單也不太困難、而且能通向重要結果的問題，「這是做科學家最難的部分」。

他把這個能力類比為教授指導學生的技巧：知道給每個學生什麼程度的問題、用什麼方式提出、給多少細節。跟 AI 協作需要的是非常相似的技能。會帶學生的教授，用 AI 做研究的效果也會特別好。

這意味著 AI 時代的科學家需要的是更多的「品味」（taste），而不是更多的計算能力。他援引了一個有趣的觀察：在理論物理這個沒有太多實驗數據來約束方向的領域，研究的走向很大程度上取決於社群集體認為什麼是「有趣的」。AI 可以在任何方向上產出大量結果，但判斷哪個方向真正重要，仍然是人類的工作。

論文的終結？

Lupsasca 對科學出版的未來有一個很激進的想法。他不確定 20 年後人們是否還會用靜態論文來發表研究成果。

他的理由很實際。首先，寫論文耗費大量時間。做完研究後最大的瓶頸就是把結果整理成論文格式，這個過程既痛苦又緩慢。其次，論文本質上是知識的壓縮格式，它把複雜的思考過程濃縮成精煉但不完整的陳述。讀者看到的是最終結果，看不到中間的嘗試和失敗。第三，現在的流程有一種荒謬感：研究者用 AI 做出結果，花時間寫成論文，然後別的研究者把論文餵回 AI 來理解它。既然兩端都已經是 AI 了，中間為什麼還要經過一個靜態文件？

他想像的未來是「互動式論文」，一個研究成果以某種 AI 可互動的形式存在。你可以問它大方向是什麼，也可以深入到任何一步推導的細節。他承認寫論文的過程本身有價值，因為它迫使你把思考整理清楚。但目前的格式、投稿、同儕審查、等半年的流程，顯然已經跟不上 AI 加速後的研究節奏。

物理學的計算能力瓶頸正在被 AI 打破。取而代之的新瓶頸是驗證、是品味、是提出對的問題。這些聽起來都比「算數學」更像人類的核心能力。某種意義上，AI 正在把物理學家推回他們最擅長的位置。