95% 機率,2040 年前徹底解決機器人:NVIDIA 范麟熙的三階段終局路線圖

NVIDIA 機器人團隊負責人范麟熙在 Sequoia AI Ascent 2026 宣稱,他有 95% 信心機器人技術樹將在 2040 年前走到底。他畫出三大里程碑:物理圖靈測試、物理 API 和物理自動研究,並以《文明帝國》的科技樹比喻描繪機器人的終局之路。從 AlexNet 到自主研究花了 14 年,機器人的 14 年倒數已經開始。

95% 機率,2040 年前徹底解決機器人:NVIDIA 范麟熙的三階段終局路線圖

本文整理自 Sequoia Capital 2026 年 4 月舉辦的 AI Ascent 活動演講。

{{< youtube 3Y8aq_ofEVs >}}


科技樹上只剩三個成就要解鎖

「你們玩《文明帝國》嗎?」NVIDIA AI 總監范麟熙(Jim Fan)在紅杉資本 AI Ascent 2026 的舞台上問了觀眾這個問題。《文明帝國》(Civilization)是一款經典策略遊戲,玩家要帶領一個文明從石器時代發展到太空時代,途中不斷在科技樹上解鎖新技術。范麟熙說他一直喜歡把自己的研究想成在解鎖這棵科技樹上的成就。而機器人的科技樹,只剩三個成就要解鎖。「解完我就可以退休了。」

這不是一位分析師在做預測,而是一個正在做這件事的人在畫路線圖。范麟熙是 NVIDIA GEAR Lab 的負責人,共同主導 Project GR00T 人形機器人基礎模型計畫。他是李飛飛在史丹佛的博士生,2016 年曾是 OpenAI 的首位實習生。他做出了 MineDojo(NeurIPS 2022 傑出論文獎)和 Voyager(首個在 Minecraft 中自主探索學習的 LLM Agent)。這些背景讓他的預測多了一層可信度:他不只知道理論,他實際在把這些技術做出來。

在詳細介紹三個里程碑之前,范麟熙先用二十分鐘的時間鋪墊了技術基礎。他提出「Great Parallel」戰略,主張把 LLM 的三步成功方程式(預訓練、微調、強化學習)直接搬進機器人領域。他展示了新的模型架構 WAM(World Action Models),把視覺和動作提升為第一公民。他秀出了資料策略的突破:用兩萬小時人類第一人稱影片訓練出高靈巧度的機器人手,而且發現了靈巧度的 Scaling Law。這些都不是未來計畫,而是已經有成果的進行中研究。路線圖的底氣,來自這些已經走出來的路。

里程碑一:物理圖靈測試(2028-2029 年)

第一個里程碑叫做 Physical Turing Test(物理圖靈測試)。定義很直接:在各種廣泛的活動中,你分不出執行任務的是人類還是機器人。范麟熙特別澄清,這不是指機器人的外表要像人類(他還開了個玩笑:「也許不包括喝醉的人類」),而是指勞動輸出的品質和效率。物理圖靈測試的核心衡量指標是「單位能量輸入對單位勞動輸出」,在相同的能量消耗下,機器人的工作產出要能和人類匹敵。

這個里程碑為什麼排第一?因為它代表的是機器人從「特化工具」到「通用勞動力」的轉折點。今天的工業機器人非常擅長特定任務。汽車焊接線上的機器手臂,精度和速度早就超越人類。但讓同一台機器人去摺衣服、泡咖啡或整理倉庫裡雜亂的貨架,它就完全無能為力。物理圖靈測試要求的不是在某個任務上超越人類,而是在「廣泛的活動」中達到人類水準。這是一個質變,不是量變。

范麟熙認為我們離這個目標只有兩到三年。他沒有詳細解釋這個時間估計的推導過程,但從他演講前半段的技術展示可以拼湊出邏輯。三個支柱在同步推進:WAM 架構讓機器人能學會物理規則而不只是語言指令,EgoScale 的資料策略解決了訓練資料的瓶頸,靈巧度 Scaling Law 的發現則證明了只要持續投入預訓練資料,靈巧度會沿著可預測的曲線持續提升。三個齒輪同時轉動,進展速度會比單獨推進任何一個快得多。

里程碑二:物理 API 與無人工廠

第二個里程碑叫做 Physical API(物理 API)。概念是這樣的:你擁有一整個機器人車隊,而它們可以像任何軟體一樣被設定。用 API 呼叫、用命令列配置、用設定檔定義任務。范麟熙半開玩笑地說,到時候可能由「Opus 9.0」來做協調調度。

如果物理 API 實現了,它會帶來兩個革命性的應用場景。第一個是 lights-out factories(無人工廠)。范麟熙把它描述成「原子的列印機」。工廠接收數位設計文件作為輸入,輸出完全組裝好的實體產品,整個過程全自動,不需要任何人類在場。「無人」是字面意義的無人,工廠不需要開燈,因為沒有人需要看見任何東西。今天的製造業已經高度自動化,但「高度自動化」和「完全無人」之間的差距比想像中大得多。無人工廠需要的不只是機器人能做重複性工作,還需要它們能處理異常狀況、自主維護設備、在不同產品之間靈活切換。

第二個場景是自動化濕實驗室(automated wet labs)。在化學、生物和醫學領域,大量的科學發現需要在實驗室裡做實際的實驗:混合試劑、觀察反應、測量結果、調整條件,然後再來一輪。這些工作耗時、重複,對精確度的要求極高,非常適合讓機器人接手。如果機器人能自主執行數百個平行實驗,科學發現的速度可能會出現數量級的提升。

范麟熙把物理 API 定位為「通過物理圖靈測試之後的自然延伸」。他的邏輯是:一旦單台機器人的通用操作能力達到人類水準,剩下的就是系統整合和軟體工程的問題。讓一群機器人協同工作、透過 API 接收指令、處理異常狀況,這些在軟體世界裡都是已經解決的問題。技術棧已經存在,差的只是機器人本身的能力。

里程碑三:機器人設計下一代機器人

第三個也是最後一個里程碑,叫做 Physical Auto Research(物理自動研究)。這是機器人開始設計、改進和製造下一代機器人的時刻。范麟熙沒有用太多篇幅描述這個階段,可能因為它離現在最遠,也可能因為它的含意太深,不適合在二十分鐘的演講裡展開。

但如果把它放在 AI 發展的脈絡裡,這個概念並不陌生。范麟熙的演講開場就回顧了 LLM 的最新發展階段:auto research(自動研究)。AI 系統已經開始在數位世界裡自主進行科學研究,加速研究迴路到超越人類研究員的速度。他把同樣的邏輯延伸到物理世界:如果 AI 已經能在數位世界裡自主做研究,那物理世界的自動研究只是時間問題。

差別在於門檻更高。數位世界裡的實驗成本接近零:跑一個模型訓練、測試一個新演算法、產生一組合成資料,都只是算力成本。物理世界裡的實驗需要真實的材料、真實的工具和真實的時間。一次機器人硬體的設計迭代,從概念到原型到測試,可能需要數個月。但如果有了里程碑二的無人工廠和自動實驗室,硬體迭代的速度也會大幅加快。軟體世界裡每天部署十次更新是常態,硬體世界如果能做到每週迭代一個原型,那已經是革命性的加速。

14 年的算術:為什麼是 2040?

范麟熙用一個簡單的算術為自己 95% 信心的預測提供依據。

2012 年,AlexNet 完成了第一次前向傳播。那是一個勉強能分辨貓和狗的模型,用今天的標準來看原始到可笑。2026 年的 AI Ascent,大家已經在討論自主 AI 研究系統,LLM 的能力已經接近人類在許多認知任務上的表現。從貓狗分類到自主研究,花了 14 年。

現在加上 14 年。2026 加 14 等於 2040。而 2026 年剛好在 2012 和 2040 的正中間。

「技術不是線性發展的,是指數發展的」,范麟熙強調這一點。如果過去 14 年的進展是從「幾乎什麼都做不了」到「接近人類水準的推理和創造」,未來 14 年的進展只會更多。指數曲線的特性就是這樣:後半段永遠比前半段陡峭。加上他在演講中展示的具體技術進展,包括 WAM 模型架構、EgoScale 資料策略、靈巧度 Scaling Law 和 DreamDojo 神經模擬器,他認為機器人領域已經找到了自己的「LLM 方程式」,剩下的就是沿著這條路走到底。

他用一句話收尾,語氣從科學家變成了佈道者:「如果你相信機器人,機器人會相信你。」這句話改編自 Ilya Sutskever 那句在 AI 圈廣為流傳的名言:「如果你相信深度學習,深度學習會相信你。」十年前 Ilya 說這句話時,大多數人覺得他在開玩笑。回頭看,他是對的。

我的觀察:95% 的信心,和剩下的 5%

范麟熙的 2040 預測在技術社群引起了不少討論。95% 的信心是一個非常強的宣稱,特別是來自一個在 NVIDIA 擔任要職的人,而不是一個沒有利害關係的旁觀者。

他的論證有幾個明顯的弱點。最直接的質疑是:物理世界的複雜度遠高於數位世界,進展速度不一定能維持同樣的指數軌跡。語言的規則是有限的,物理世界的情境是無限的。一台機器人在實驗室裡能完美地摺衣服,換到一個材質、光線、桌面高度都不同的真實家庭環境,可能就會出各種問題。這種「長尾」挑戰在自動駕駛領域已經被充分驗證了:最後 10% 的場景往往需要 90% 的工程努力。

另一個問題是,14 年的類比假設了 AI 和機器人的發展曲線形狀相同。但機器人面臨的瓶頸不只是軟體,還有材料科學、電池能量密度、製造成本等硬體限制。這些領域的進展速度通常比軟體慢得多,遵循的可能是不同形狀的曲線。

但范麟熙的核心論點有一個很難反駁的地方。他不是在空中畫大餅,他能列出具體的技術路徑。Great Parallel 的框架已經被初步驗證,WAM 模型已經展示了零樣本泛化能力,Scaling Law 已經在靈巧度上被發現。這些不是計畫書裡的東西,是實驗室裡的東西。而且他團隊過去幾年的產出(MineDojo、Voyager、Eureka、GR00T)確實展現了持續且加速的節奏。

我覺得最值得關注的不是 2040 這個年份本身,而是「通過物理圖靈測試」的時間點。如果范麟熙說的「兩到三年」大致準確,也就是 2028-2029 年機器人在通用操作任務上接近人類水準,那對臺灣製造業的影響可能比大多數人以為的更近。臺灣在半導體製造、工具機、電子組裝等領域的深厚積累,恰好是機器人 AI 落地的最佳試驗場。問題從來不是「臺灣的工廠需不需要機器人」,而是「機器人什麼時候夠聰明到能在臺灣的工廠裡派上用場」。范麟熙畫的路線圖,給了這個問題一個值得認真對待的時間參考。