每個 Agent 都需要一台電腦:Daytona 如何用裸機架構搶佔 AI 運算市場
AI Agent 的運算需求與人類工程師截然不同,需要有狀態、毫秒級啟動、可暫停恢復的環境。Daytona 執行長 Ivan Burazin 分享這家月增長 74% 的新創如何從跨年夜的一個粗糙原型起步,用裸機架構打造 Agent 專用沙箱,並搶佔價值數兆美元的知識工作自動化市場。

本文整理自《Latent Space》2026 年 5 月播出的單集。
{{< youtube kaX43RRRUKY >}}
跨年夜寫出的 MVP
2025 年的最後一天,Daytona 執行長 Ivan Burazin 哄睡了女兒和妻子,回到電腦前開始寫程式。凌晨三點,他把一個粗糙的原型傳給共同創辦人兼技術長。早上收到的回覆是:「這東西爛透了,絕對不要給任何人看。但這個想法是對的。」技術長花了兩週重建,做出一個堪用的版本。他們聯絡了上一季曾經拒絕舊產品的二、三十位潛在客戶,安排了 15 分鐘的展示通話。結果每一通都超時,延長到 25 甚至 30 分鐘,每個人掛完電話都在問同一件事:「我的 API key 呢?」
Burazin 做過好幾間公司,他說自己從來沒有經歷過這種情況:如果隔天沒把 API key 寄出去,客戶會直接打電話來催。這個跨年夜誕生的原型,就是今天的 Daytona,一家專門為 AI Agent 提供運算環境的基礎建設公司。2026 年 2 月他們完成了 2,400 萬美元的 A 輪融資(由 FirstMark Capital 領投),月營收增長率達到 74%,最大客戶每天運行近 85 萬個沙箱。
故事要從更早說起。Burazin 和他的技術長搭檔超過十五年,從 2000 年代初期堆伺服器、做虛擬化的服務公司開始,到後來打造 CodeAnywhere(最早的瀏覽器端 IDE 之一,約 300 萬人使用過),再到創辦科技大會 Shift,最後在三年前啟動 Daytona,替人類工程師自動化開發環境。2025 年初的轉向幾乎是被市場推著走的:他們想用既有的基礎建設去跑 OpenHands(當時叫 OpenDevin)的 SaaS 版本,結果一堆人找上門,但不是要用他們的產品,而是問能不能把底層的運算環境單獨拿出來給自家 Agent 用。
他們最初以為只要把為人類設計的環境稍作調整就好。但所有拿到手的人都說同一句話:「不能用。」不是功能缺了什麼,而是設計邏輯就不對。Agent 跟人類需要的電腦,根本不是同一種東西。
Agent 不是人類,它需要不同的電腦
Burazin 用了一個直覺的比喻:你不會希望自己的筆電在工作做到一半的時候被強制關機。你會想蓋上螢幕、隔天打開,所有東西還在原來的狀態。Agent 也一樣,它需要有狀態的、可以暫停和恢復的運算環境,而不是用完就丟的無狀態函式。
但大多數雲端沙箱的架構是在虛擬機器上面跑 Firecracker,硬碟狀態透過網路掛載,而且沙箱有存活時限。Agent 要的恰恰相反:毫秒級啟動、持續運行到任務完成、隨時暫停恢復。Burazin 形容這是「把 Lambda 和 EC2 結合在一起」。
Daytona 的解法是回到最底層:裸機(bare metal)伺服器加上自建的排程器。沙箱的範本預先載入到機器上的 NVMe 固態硬碟,Agent 啟動沙箱時直接導向已經有對應範本的實體機器,在本地啟動。硬碟和 CPU 之間沒有任何網路延遲,所以 I/O 等於原生速度。單一沙箱啟動只要 60 毫秒,同時啟動 5 萬個大約 75 秒。部分競爭對手完成同樣的事需要超過 30 分鐘。
第三位共同創辦人第一次看到這個架構的反應是:「這是 2008 年的做法吧。」技術長點頭:「沒錯。」有時候最好的技術選擇不是追逐新的抽象層,而是繞回去用更底層的方案。
讓 Agent 操作 Windows:10 兆美元市場的入口
在 Burazin 看來,Agent 運算沙箱最大的市場機會不在程式碼執行,而在一個聽起來有點「復古」的方向:讓 Agent 操作圖形介面,也就是業界說的「Computer Use」。
全球大約有 10 億知識工作者,光美國就有 1 億人,薪資總額在美國約 10 兆美元、全球約 50 兆美元。取最保守的估算,如果五大產業(醫療、政府、金融服務等)中有 40% 的白領工作可以被 Agent 自動化,那就是一年 10 兆美元的可觸及市場。關鍵問題是:這些工作中的大量任務鎖在舊版 Windows 應用程式裡,這些軟體永遠不會被重寫,也沒有完整的 API 可以用程式存取。
Burazin 自己就撞過這堵牆。他最近在準備董事會簡報時,用 Claude Code 串接了 ClickHouse、PostHog、QuickBooks、Brex 等工具的 API 來拉資料。第一份報告很漂亮,McKinsey 等級的排版。但往下挖就出問題了,到處都是「部分資料」、「資料缺失」。即使這些現代 SaaS 工具都有 API,也不是所有欄位和功能都能透過 API 取得。
最後他在自家的 Mac mini 虛擬沙箱上跑了一個 Computer Use 工具,開了公司內部的唯讀帳號,就像僱了一個實習生。他跟它說:「登入這個網站、匯出資料、做出報告。」它就真的一步一步點進去、匯出 CSV、完成任務。一個科技新創的 CEO,用的都是最前沿的工具,仍然需要一個能操作瀏覽器的 Agent 才能搞定日常工作。那麼大型金融機構或政府單位,有多少工作流程是鎖在無法程式化存取的內部系統裡?
Daytona 已經在開發 Windows 沙箱,可以在幾秒內啟動(EC2 和 Azure 的 Windows 實例需要 3 到 5 分鐘),支援即時快照和分叉。這基本上就是 RPA(機器人流程自動化)的復興,只是這次驅動它的不是寫死規則的腳本,而是能理解螢幕內容、做出判斷的 AI 模型。微軟的納德拉(Satya Nadella)最近也公開表示「每個 Agent 都需要一台電腦」,方向上已經很明確。
B2B2C 模式與開源策略
Daytona 的營收不是靠個人開發者堆出來的。Burazin 把客戶分成兩類:B2B(直接賣給 AI 實驗室做 RL 訓練)和 B2B2C(賣給 Lovable、Manus 這類做出消費端產品的 Agent 公司)。後者才是真正推動規模成長的引擎。
Burazin 把 Daytona 的定位比作 Twilio:你不會以個人身分去用 Twilio,但每一個需要傳簡訊功能的 App 背後都有它。Daytona 也是一樣,當越來越多公司說「拿 Claude Code 丟進沙箱,前面加個介面,就是一個新的 Agent 產品」的時候,它們都會拉進 Daytona 這類底層供應商。Anthropic 的 Agent SDK 和 Claude Code 的推出,實際上推動了一波 Agent 應用公司的創業潮,這些公司全都需要運算沙箱。
開源策略也扮演了重要角色。Daytona 的沙箱產品使用 AGPL 3 授權,排程器等核心元件的程式碼完全公開。純粹的開源信仰者可能會覺得 AGPL 不夠「純」,但它實際上做到了兩件事:第一,讓企業客戶可以先在內部試用開源版本,繞過漫長的採購流程。Burazin 說,過去跟大企業談合作要花兩三個月走採購程序,現在因為市場需求太強,五天就能過關。第二,AGPL 的 copyleft 條款防止了競爭對手直接 fork 去做同樣的產品。
開源還有一個沒預料到的好處:Agent 在整合 Daytona 的 SDK 時,可以直接讀公開的原始碼來理解 API 的行為,比單看文件更有效率。雖然 Burazin 坦承「好的文件也能達到同樣效果」,但這確實降低了整合門檻。
「AI 雲端」正在成形
如果每一個 Agent 在執行每一項任務時都需要一台電腦,那這個市場有多大?Burazin 算了一筆帳:全球 PC 市場(Apple、HP、Lenovo 加起來)大約 1,500 到 1,800 億美元,跟三大雲端超級服務商的營收規模差不多。但那是 80 億人類搭配有限數量的裝置。兩年後、十年後會有多少 Agent 在運行?每一個都需要一個運算環境。
Semi Analysis 的 Dylan Patel 已經提出警告:CPU 即將成為瓶頸。GPU 短缺的連鎖反應正在向下游蔓延,從記憶體到現在的 CPU。所有的沙箱、資料庫、搜尋引擎都跑在 CPU 上,這些服務全都以每月 40% 以上的速度成長。Burazin 甚至說:「如果你做 Agent 基礎建設,月增長沒到 40%,那不是你做得好,那只是市場的自然成長速度。」提前鎖定 CPU 產能,會變成跟 GPU 一樣的戰略問題。
這些趨勢指向一個正在成形的概念:Agent 專屬的雲端。它不會像 AWS 那樣包山包海,反而更像 Stripe 或 Twilio,用簡潔的 API 讓開發者幾行程式碼就能為 Agent 配置一台完整的電腦。這個雲端會包含沙箱(Daytona)、資料庫(如 Neon)、搜尋(如 Parallel),全部針對 Agent 的消費模式最佳化。
OpenAI 和 Vercel 都在說「AI Cloud」。Daytona 也是候選者之一。但 Burazin 觀察到一件更根本的事:這個新雲端的基礎建設原始元件(primitive)還沒有被全部發明出來,「還有更多會在未來幾年出現。」不管最後誰贏,趨勢已經很清楚:就像人類從大型主機走到個人電腦再走到雲端,Agent 正在走一條自己的演化路徑。
Burazin 也對 SaaS 公司靠轉售 AI token 來宣稱「營收重新加速」的現象提出質疑。他認為 token 轉售的利潤率遠低於傳統 SaaS 訂閱,黏著度也不同,市場遲早會對此「清醒」。真正有價值的做法是像 Salesforce 最近做的那樣,把所有產品透過 API 開放出來,讓 Agent 以程式方式消費資料,並按用量收費。那才是可持續的營收模式。
我的觀察
這集 Podcast 最讓我有感的不是那些驚人的數字,而是 Burazin 準備董事會簡報的那段經歷。一個科技新創的 CEO,用著市面上最新的工具,API 串接做得很順,照樣在「拉出完整資料」這件事上卡關,最後得靠一個能登入網站、手動匯出 CSV 的 Agent 才搞定。
這說明我們對「AI 自動化」的想像太乾淨了。真實世界的工作流程充滿半殘的 API、登入牆、只有圖形介面能做的匯出功能。Agent 要真正有用,不能只活在 API 和 CLI 的世界裡,它得能像一個人一樣打開瀏覽器、登入系統、點按鈕。
這也是為什麼「每個 Agent 都需要一台電腦」不只是行銷口號。臺灣有大量的製造業和金融機構,企業內部系統的「API 化」程度可能比矽谷新創更低。如果 Computer Use 的方向成立,這些看似落後的「遺產系統」反而可能成為 Agent 創造最大價值的地方。