領袖思維

95% 機率，2040 年前徹底解決機器人：NVIDIA 范麟熙的三階段終局路線圖

NVIDIA 機器人團隊負責人范麟熙在 Sequoia AI Ascent 2026 宣稱，他有 95% 信心機器人技術樹將在 2040 年前走到底。他畫出三大里程碑：物理圖靈測試、物理 API 和物理自動研究，並以《文明帝國》的科技樹比喻描繪機器人的終局之路。從 AlexNet 到自主研究花了 14 年，機器人的 14 年倒數已經開始。

2026 年 5 月 12 日 · 來源： Sequoia Capital AI Ascent 2026

95% 機率，2040 年前徹底解決機器人：NVIDIA 范麟熙的三階段終局路線圖

本文整理自 Sequoia Capital 2026 年 4 月舉辦的 AI Ascent 活動演講。

科技樹上只剩三個成就要解鎖

「你們玩《文明帝國》嗎？」NVIDIA AI 總監范麟熙（Jim Fan）在紅杉資本 AI Ascent 2026 的舞台上問了觀眾這個問題。《文明帝國》（Civilization）是一款經典策略遊戲，玩家要帶領一個文明從石器時代發展到太空時代，途中不斷在科技樹上解鎖新技術。范麟熙說他一直喜歡把自己的研究想成在解鎖這棵科技樹上的成就。而機器人的科技樹，只剩三個成就要解鎖。「解完我就可以退休了。」

這不是一位分析師在做預測，而是一個正在做這件事的人在畫路線圖。范麟熙是 NVIDIA GEAR Lab 的負責人，共同主導 Project GR00T 人形機器人基礎模型計畫。他是李飛飛在史丹佛的博士生，2016 年曾是 OpenAI 的首位實習生。他做出了 MineDojo（NeurIPS 2022 傑出論文獎）和 Voyager（首個在 Minecraft 中自主探索學習的 LLM Agent）。這些背景讓他的預測多了一層可信度：他不只知道理論，他實際在把這些技術做出來。

在詳細介紹三個里程碑之前，范麟熙先用二十分鐘的時間鋪墊了技術基礎。他提出「Great Parallel」戰略，主張把 LLM 的三步成功方程式（預訓練、微調、強化學習）直接搬進機器人領域。他展示了新的模型架構 WAM（World Action Models），把視覺和動作提升為第一公民。他秀出了資料策略的突破：用兩萬小時人類第一人稱影片訓練出高靈巧度的機器人手，而且發現了靈巧度的 Scaling Law。這些都不是未來計畫，而是已經有成果的進行中研究。路線圖的底氣，來自這些已經走出來的路。

里程碑一：物理圖靈測試（2028-2029 年）

第一個里程碑叫做 Physical Turing Test（物理圖靈測試）。定義很直接：在各種廣泛的活動中，你分不出執行任務的是人類還是機器人。范麟熙特別澄清，這不是指機器人的外表要像人類（他還開了個玩笑：「也許不包括喝醉的人類」），而是指勞動輸出的品質和效率。物理圖靈測試的核心衡量指標是「單位能量輸入對單位勞動輸出」，在相同的能量消耗下，機器人的工作產出要能和人類匹敵。

這個里程碑為什麼排第一？因為它代表的是機器人從「特化工具」到「通用勞動力」的轉折點。今天的工業機器人非常擅長特定任務。汽車焊接線上的機器手臂，精度和速度早就超越人類。但讓同一台機器人去摺衣服、泡咖啡或整理倉庫裡雜亂的貨架，它就完全無能為力。物理圖靈測試要求的不是在某個任務上超越人類，而是在「廣泛的活動」中達到人類水準。這是一個質變，不是量變。

范麟熙認為我們離這個目標只有兩到三年。他沒有詳細解釋這個時間估計的推導過程，但從他演講前半段的技術展示可以拼湊出邏輯。三個支柱在同步推進：WAM 架構讓機器人能學會物理規則而不只是語言指令，EgoScale 的資料策略解決了訓練資料的瓶頸，靈巧度 Scaling Law 的發現則證明了只要持續投入預訓練資料，靈巧度會沿著可預測的曲線持續提升。三個齒輪同時轉動，進展速度會比單獨推進任何一個快得多。

里程碑二：物理 API 與無人工廠

第二個里程碑叫做 Physical API（物理 API）。概念是這樣的：你擁有一整個機器人車隊，而它們可以像任何軟體一樣被設定。用 API 呼叫、用命令列配置、用設定檔定義任務。范麟熙半開玩笑地說，到時候可能由「Opus 9.0」來做協調調度。

如果物理 API 實現了，它會帶來兩個革命性的應用場景。第一個是 lights-out factories（無人工廠）。范麟熙把它描述成「原子的列印機」。工廠接收數位設計文件作為輸入，輸出完全組裝好的實體產品，整個過程全自動，不需要任何人類在場。「無人」是字面意義的無人，工廠不需要開燈，因為沒有人需要看見任何東西。今天的製造業已經高度自動化，但「高度自動化」和「完全無人」之間的差距比想像中大得多。無人工廠需要的不只是機器人能做重複性工作，還需要它們能處理異常狀況、自主維護設備、在不同產品之間靈活切換。

第二個場景是自動化濕實驗室（automated wet labs）。在化學、生物和醫學領域，大量的科學發現需要在實驗室裡做實際的實驗：混合試劑、觀察反應、測量結果、調整條件，然後再來一輪。這些工作耗時、重複，對精確度的要求極高，非常適合讓機器人接手。如果機器人能自主執行數百個平行實驗，科學發現的速度可能會出現數量級的提升。

范麟熙把物理 API 定位為「通過物理圖靈測試之後的自然延伸」。他的邏輯是：一旦單台機器人的通用操作能力達到人類水準，剩下的就是系統整合和軟體工程的問題。讓一群機器人協同工作、透過 API 接收指令、處理異常狀況，這些在軟體世界裡都是已經解決的問題。技術棧已經存在，差的只是機器人本身的能力。

里程碑三：機器人設計下一代機器人

第三個也是最後一個里程碑，叫做 Physical Auto Research（物理自動研究）。這是機器人開始設計、改進和製造下一代機器人的時刻。范麟熙沒有用太多篇幅描述這個階段，可能因為它離現在最遠，也可能因為它的含意太深，不適合在二十分鐘的演講裡展開。

但如果把它放在 AI 發展的脈絡裡，這個概念並不陌生。范麟熙的演講開場就回顧了 LLM 的最新發展階段：auto research（自動研究）。AI 系統已經開始在數位世界裡自主進行科學研究，加速研究迴路到超越人類研究員的速度。他把同樣的邏輯延伸到物理世界：如果 AI 已經能在數位世界裡自主做研究，那物理世界的自動研究只是時間問題。

差別在於門檻更高。數位世界裡的實驗成本接近零：跑一個模型訓練、測試一個新演算法、產生一組合成資料，都只是算力成本。物理世界裡的實驗需要真實的材料、真實的工具和真實的時間。一次機器人硬體的設計迭代，從概念到原型到測試，可能需要數個月。但如果有了里程碑二的無人工廠和自動實驗室，硬體迭代的速度也會大幅加快。軟體世界裡每天部署十次更新是常態，硬體世界如果能做到每週迭代一個原型，那已經是革命性的加速。

14 年的算術：為什麼是 2040？

范麟熙用一個簡單的算術為自己 95% 信心的預測提供依據。

2012 年，AlexNet 完成了第一次前向傳播。那是一個勉強能分辨貓和狗的模型，用今天的標準來看原始到可笑。2026 年的 AI Ascent，大家已經在討論自主 AI 研究系統，LLM 的能力已經接近人類在許多認知任務上的表現。從貓狗分類到自主研究，花了 14 年。

現在加上 14 年。2026 加 14 等於 2040。而 2026 年剛好在 2012 和 2040 的正中間。

「技術不是線性發展的，是指數發展的」，范麟熙強調這一點。如果過去 14 年的進展是從「幾乎什麼都做不了」到「接近人類水準的推理和創造」，未來 14 年的進展只會更多。指數曲線的特性就是這樣：後半段永遠比前半段陡峭。加上他在演講中展示的具體技術進展，包括 WAM 模型架構、EgoScale 資料策略、靈巧度 Scaling Law 和 DreamDojo 神經模擬器，他認為機器人領域已經找到了自己的「LLM 方程式」，剩下的就是沿著這條路走到底。

他用一句話收尾，語氣從科學家變成了佈道者：「如果你相信機器人，機器人會相信你。」這句話改編自 Ilya Sutskever 那句在 AI 圈廣為流傳的名言：「如果你相信深度學習，深度學習會相信你。」十年前 Ilya 說這句話時，大多數人覺得他在開玩笑。回頭看，他是對的。

我的觀察：95% 的信心，和剩下的 5%

范麟熙的 2040 預測在技術社群引起了不少討論。95% 的信心是一個非常強的宣稱，特別是來自一個在 NVIDIA 擔任要職的人，而不是一個沒有利害關係的旁觀者。

他的論證有幾個明顯的弱點。最直接的質疑是：物理世界的複雜度遠高於數位世界，進展速度不一定能維持同樣的指數軌跡。語言的規則是有限的，物理世界的情境是無限的。一台機器人在實驗室裡能完美地摺衣服，換到一個材質、光線、桌面高度都不同的真實家庭環境，可能就會出各種問題。這種「長尾」挑戰在自動駕駛領域已經被充分驗證了：最後 10% 的場景往往需要 90% 的工程努力。

另一個問題是，14 年的類比假設了 AI 和機器人的發展曲線形狀相同。但機器人面臨的瓶頸不只是軟體，還有材料科學、電池能量密度、製造成本等硬體限制。這些領域的進展速度通常比軟體慢得多，遵循的可能是不同形狀的曲線。

但范麟熙的核心論點有一個很難反駁的地方。他不是在空中畫大餅，他能列出具體的技術路徑。Great Parallel 的框架已經被初步驗證，WAM 模型已經展示了零樣本泛化能力，Scaling Law 已經在靈巧度上被發現。這些不是計畫書裡的東西，是實驗室裡的東西。而且他團隊過去幾年的產出（MineDojo、Voyager、Eureka、GR00T）確實展現了持續且加速的節奏。

我覺得最值得關注的不是 2040 這個年份本身，而是「通過物理圖靈測試」的時間點。如果范麟熙說的「兩到三年」大致準確，也就是 2028-2029 年機器人在通用操作任務上接近人類水準，那對臺灣製造業的影響可能比大多數人以為的更近。臺灣在半導體製造、工具機、電子組裝等領域的深厚積累，恰好是機器人 AI 落地的最佳試驗場。問題從來不是「臺灣的工廠需不需要機器人」，而是「機器人什麼時候夠聰明到能在臺灣的工廠裡派上用場」。范麟熙畫的路線圖，給了這個問題一個值得認真對待的時間參考。