Replit CEO 馬薩德的路線圖思維:把產品蓋在六個月後的 AI 上,Agent 4 全解構

Replit 在三月完成 $90 億估值募資的同時,端出第四代 AI 代理人 Agent 4:並行代理、設計畫布、即時協作、一鍵跨模態部署。創辦人馬薩德解釋他押注的方法論:AI 能力一年躍進兩次,產品要蓋在六個月後的能力上,而不是現在。並點名兩個還沒到位的 AI 解鎖:電腦使用模型與持續學習。

Replit CEO 馬薩德的路線圖思維:把產品蓋在六個月後的 AI 上,Agent 4 全解構

本文整理自 Y Combinator Startup Podcast 2026 年 4 月播出的單集,主持人專訪 Replit 共同創辦人暨 CEO 阿姆賈德.馬薩德(Amjad Masad)。

{{< youtube kMYeTRqzAfc >}}


封面圖

一個押注式的產品路線圖

每家做 AI 應用的公司都在面對同一個尷尬問題:你的產品要蓋在「現在 AI 能做到什麼」之上,還是「半年後 AI 會能做到什麼」之上?前者保守、可控,但容易在模型一升級時被自己的 codebase 綁死;後者押注、刺激,但每押錯一次就是一整個版本的 sunk cost。馬薩德在最近這集 YC Podcast 上分享了 Replit 過去兩年的選擇:每次新代理人版本都建立在「六個月後的 AI 能力預判」之上。他把這個預判稱作公司最重要的策略資產。

四月剛發的 Agent 4 就是這個押注的最新具象化。它不是一次小升級,而是一次以「下一代模型應該能撐起來的工作流」為前提,整個產品被重塑的版本。理解 Agent 4 的功能清單之前,得先理解馬薩德內部用什麼方法論在排這個路線圖。這篇文章拆三件事:他預判 AI 能力曲線的方法、Agent 4 端出來的四大功能、以及他點名「還沒到位、但會解鎖下一波」的兩個 AI 能力。對任何在做 AI 產品的團隊,這套方法論本身比任何單一功能更值得參考。

「AI 能力一年躍進兩次」:馬薩德的時間軸方法論

馬薩德的核心論點是:自從 2024 年以來,前沿 AI 模型大約每六個月會出現一次重大能力躍進,一年共兩次。這個節奏不是巧合,而是各大實驗室訓練週期、運算資源週期、加上模型架構研究週期的疊加結果。如果你接受這個經驗法則,產品策略的問題就從「模型現在能做什麼」變成「半年後模型會能做什麼」,後者才是值得提前蓋產品基礎建設的地方。

他自己給的時間軸示範特別具體。2024 年中,Anthropic 推出 Claude 3.5 Sonnet,第一次讓「一次生成一大段可執行程式碼」成為可能。在這之前,GPT-3.5 系列那種「寫到一半就懶得繼續」的傾向,讓自動化寫程式只能停留在補完層級。2024 年底,各大實驗室開始展現「長視野推理」的雛形,模型可以在多步驟任務裡保持目標一致性。2025 年初,vibe coding 真正成形,自然語言寫軟體從技術示範走進日常工具。2025 年底,Opus 4.6 帶來「自主性革命」,代理人可以連續無人監督跑數小時,而不是每幾分鐘就需要人類介入修正。

這四個轉折點對 Replit 都不是事後追上,而是事前準備好。馬薩德舉 Agent 3 為例:當他們開始做 Agent 3 時,市場上能讓代理人連續跑數小時的模型還沒出現,但 Replit 已經在重寫底層的容器化基礎建設,讓代理人可以在長時間運行的虛擬機裡自主工作、不會因為連線中斷或 session 過期而失敗。等 Opus 4.6 真的釋出,Replit 是少數幾個立刻能展現「無人監督多小時連續執行」的產品,因為基礎建設早就鋪好了。「我們花了大把時間蓋一個當下還用不到的東西,但等模型對齊上來,我們是現成的。」

這個方法論有一個隱藏的前提:你必須對「下一個躍進是什麼」有強烈的看法。馬薩德在訪談裡承認,這部分七成是基於對前沿實驗室的研究進度判斷、三成是基於自己長期試用 alpha 模型的直覺。他不會公開講具體訊息來源,但反覆強調 Replit 內部會玩到別家還沒釋出的早期模型版本,這是判斷下一波會在哪裡發生的關鍵情報。對沒有這種訪問權限的團隊,他建議的替代方案是「持續玩」:每週至少拿出半天時間試用每一個新發布的模型、每一個新出現的研究 demo,不是當技術新聞看,而是當作預判未來能力曲線的訊號。

Agent 4 解構:四個功能、一個共同前提

理解了上面的方法論,再回頭看 Agent 4 端出來的功能就會發現,這四項加起來其實是同一個假設的不同切面:「下半年的模型,足以同時跑多個自主任務、長時間不中斷、且能在多模態之間無縫切換。」整個 Agent 4 都是在這個假設上設計的。

第一個功能是並行代理人(parallel agents)。以前 Replit 的代理人是單執行緒的,使用者交付一個任務、等代理人做完、再交付下一個。Agent 4 讓多個代理人可以在同一個專案裡並行工作,你可以同時叫一個代理人寫前端、另一個重構後端、第三個寫測試。這聽起來簡單,但背後最難的工程問題是合併衝突解決:當兩個代理人改到同一個檔案,誰的版本算數、怎麼整合。Replit 把這部分自動化,讓使用者不用親自處理 Git 等級的衝突。

第二個功能是非同步設計畫布(asynchronous design canvas)。馬薩德解釋這個功能是為了打破「prompting」這個瓶頸。對非工程師來說,要把腦袋裡模糊的設計想法轉成精準的文字指令是極大的認知負擔。新的畫布讓你可以拖拉元件、加註解、要求「給我這個按鈕的三個變體」,所有這些設計操作都會被翻譯成代理人能理解的指令,由背景代理人實作出來。這個介面選擇直接呼應馬薩德對非開發者市場的判斷:他們的母語是視覺,不是程式碼。

第三個功能是即時多人協作(multiplayer with auto-forked VMs)。這在傳統 IDE 裡很常見,但在代理人世界是新東西。當第二個協作者加入專案,系統會自動 fork 出他自己的虛擬機環境,他在那個 fork 上跟自己的代理人合作,不會干擾原本的主線。要合併時走標準 PR 流程。馬薩德把這個設計形容為「為非工程師設計的 GitHub」,目的不是再造一套版本控制系統,而是讓多個非工程師同時在一個專案裡工作這件事,第一次變得不痛苦。

第四個功能也是最具話題性的:一鍵跨模態部署。一個 prompt 不只能產出 Web App,同一個專案可以一鍵部署到 TestFlight(iOS 測試版)、Android、變成簡報、產出影片素材,全部共用同一個專案的內容脈絡。這個功能背後的工程量極大,每個輸出模態都需要對應的編譯流程、發布管道、平台政策遵循(特別是 Apple 的 TestFlight 簽署)。但馬薩德選擇做這個功能的原因很單純:「使用者腦中的『產品』不只是一個 Web 頁面,是一個完整的存在,包括能下載、能展示、能宣傳。產品就應該長這樣。」

把這四個功能擺在一起看,會發現它們都在押注一個共同前提:模型有足夠能力同時管理多個並發、長時間、跨模態的任務。如果這個前提不成立,並行代理人就會打架、設計畫布就會誤譯指令、多人協作就會合併衝突、跨模態部署就會在某個環節崩掉。Replit 願意把這四個功能同時推出,意味著他們對下半年模型能力的預判有強烈信心。

兩個還沒到位的 AI 解鎖

訪談裡最值得記住的,反而不是 Agent 4 已經做到什麼,而是馬薩德點出的「還沒做到、但會解鎖下一波」的兩個 AI 能力。這份「等待清單」對任何在思考 AI 產品下一步的人來說,都是高密度的訊號。

第一個是電腦使用模型(computer-use models)的成熟。馬薩德對這件事的觀察很有意思:「電腦使用模型奇怪地落後其他能力,比語言落後、甚至比自動駕駛還落後。」直覺上不應該這樣,畢竟我們有海量的螢幕截圖資料、海量的 UI 互動紀錄、訓練資料應該充裕。但實際上目前的電腦使用模型仍然脆弱,操作真實 UI 時錯誤率高、回復能力差。馬薩德推測,過去兩年寫程式代理人之所以發展這麼快,部分原因正是「電腦使用模型不夠好」。很多原本應該由 UI 代理人處理的任務(例如自動化某個 SaaS 的操作流程),業界用「叫代理人去寫 API 調用程式」這條路繞過去了。但這是一條 hack 路徑,真正乾淨的解法還是讓模型直接看著螢幕操作。當電腦使用模型成熟,他預期會再開出一波新的 vibe coding 應用形態。

第二個解鎖更深層:真正的持續學習(continual learning)。今天所有「代理人能記住組織內部慣例」的功能,本質上都是 hack。Replit 自己的解法是讓代理人寫一些 markdown skill 檔到磁碟上,下次再讀進來,這在表面上像學習,本質上是「外掛筆記」。馬薩德形容真正的持續學習是「代理人部署到一家公司之後,會在那家公司內部持續變得更好」,不是對所有客戶共享改進,是專屬於那個組織的、隨時間累積的能力。如果這個能力到位,代理人在企業內的價值會跨越一個量級:今天是「一個能用的工具」,到那時是「一個越用越懂你的同事」。

馬薩德為什麼把這兩件事拿出來談?因為這呼應了他開頭講的方法論:他正在把這兩個尚未到位的能力,當作 Agent 5、Agent 6 的設計前提。他沒有公開承諾時間表,但訪談的字裡行間都在暗示,下一代 Replit 代理人會押注「電腦使用模型 + 真正持續學習」會在 2026 下半年到 2027 年之間到位。如果他押對,下一代產品又會領先別人六個月;押錯,就是又一次的 sunk cost。但這就是這套方法論的本質:你不押注,永遠跟在後面。

我的觀察:給臺灣 AI 產品團隊的一個提醒

聽完馬薩德這套方法論,我心裡浮現的第一個對照組,是臺灣絕大多數 AI 產品團隊目前的設計姿態。這幾年我接觸過不少臺灣的新創、企業內部 AI 團隊、甚至某些大型 SI 的 AI 部門,普遍的設計起點是「現在 GPT/Claude/Gemini 能做什麼」,拿到一個能力清單,然後反向設計產品功能。這個做法的好處是務實、可控、能很快上線;壞處是當下半年新模型釋出,你的產品架構往往沒有對齊新能力的能力,要再吃一輪重寫成本。

馬薩德的方法論直接挑戰這個習慣。他逼產品團隊去做一件不舒服的事:對「半年後模型會變強到什麼程度」做出明確判斷,並且為了這個判斷,現在就投資去蓋還用不到的基礎建設。這對臺灣團隊來說特別不順手,因為臺灣的工程文化偏好「做一個能用的、上線、再改善」,這套思維面對短週期任務很有效,但面對 AI 這種「能力曲線陡峭、每六個月變一次」的場景就會吃虧。

我自己的觀察是,要在臺灣團隊裡導入這種「押注式路線圖」,最大的關鍵不在工程能力,在組織能不能容忍「短期看似浪費」的投入。如果你的老闆每個月看 KPI 看的是「這個月新增功能數」,那團隊就不可能花三個月蓋一個當下沒功能可量的容器化平台。馬薩德的押注之所以做得起來,是因為 Replit 內部對這套方法論有共識,連投資人都接受短期看不到產出的策略性投資。這個共識的建立可能比任何技術判斷都更難複製。

這集訪談留給我最深的啟發,反而是另一個面向:押注式路線圖隱含一個謙卑的姿態,你必須持續承認自己對未來的判斷可能錯,而且願意因應錯誤迅速重來。馬薩德沒有把任何一代 Agent 講成「終局產品」,他講的都是「對應到那個時間點 AI 能力的最佳介面」。這種把產品看成滾動快照、而不是長期資產的世界觀,可能是 AI 時代產品團隊最需要練的一種反射動作。