AI 產業動態

當 Agent 比員工多千倍，軟體要為誰而建？

Box 執行長 Aaron Levie、前微軟 Windows 總裁 Steve Sinofsky 與 a16z 合夥人 Martin Casado 三人對談：當 AI Agent 與員工比例達到 1000:1，軟體設計、安全模型、企業 IT 架構都必須全面改寫。

2026 年 5 月 17 日 · 來源： AI + a16z

本文整理自《AI + a16z》2026 年 4 月播出的單集，來賓為 Box 執行長 Aaron Levie，與談人為 a16z 董事合夥人 Steve Sinofsky 及一般合夥人 Martin Casado。

Box 最近推出了官方 CLI 工具，讓使用者可以透過 Claude Code 用自然語言操作整個企業檔案系統。執行長列維（Aaron Levie）在這集 podcast 裡描述了測試時的場景：你可以對它說「把桌面這整個資料夾上傳到 Box」，它就會執行；你也可以說「處理這個資料夾裡所有文件」，它也會照做。聽起來很美好，但列維馬上點出問題：如果你是一家五千人的公司，每個人都有 Claude Code 或 Codex 搭配這個 CLI 在跑，你突然就面對一個全新的協調問題。某個 Agent 可能一小時打你的系統一萬次，不是因為惡意，而是它就是被設計成高效率完成任務。這不是效能問題，而是當一個 Agent 把檔案從 A 資料夾搬到 B 資料夾、另一個 Agent 正在寫入、第三個想刪除的時候，整個系統的一致性該怎麼維護？

這個場景揭示了一個更大的命題：當 Agent 數量是員工的一百倍甚至一千倍，整個軟體產業的設計邏輯、安全模型、採用速度，都需要根本性的重新思考。

為 Agent 而建：從漂亮介面到堅實後端

列維在對談中提出的核心假設很直接：如果未來 Agent 與人類使用者的比例是 1000:1，那軟體的設計優先級就必須翻轉。現在大多數 SaaS 產品把資源花在打磨人類看得到的介面，漂亮的儀表板、直覺的操作流程、精心設計的通知系統。但 Agent 不在乎這些。Agent 在乎的是 API 是否穩定、成本參數是否透明、系統是否耐用可靠。

這意味著軟體公司必須把同等甚至更多的心力放在 Agent 介面上。所謂 Agent 介面，就是 API、CLI、以及 Model Context Protocol（MCP）這類讓 AI 模型能直接與資料來源和工具互動的開放標準。列維說 Box 現在花在思考 Agent 介面的時間，已經和人類介面一樣多。因為邏輯很簡單：如果你的軟體對 Agent 來說是封閉的、難以導航的，那 Agent 遲早會找到更好的替代品，然後建議企業換掉你。

a16z 合夥人卡薩多（Martin Casado）在這裡提出了一個出乎意料的觀點。他說業界很多人把「為 Agent 而建」理解成「做好 API 介面就行」，但他認為這個理解幾乎完全錯誤。真正重要的不是介面形式，而是後端的實質品質。Agent 在選擇使用哪個平台時，看的是成本結構、資料耐久性、系統可靠度這些有意義的技術指標，而不是介面是否友善。過去企業買軟體可能看 Gartner 報告或業務關係，但在 Agent 主導的未來，軟體的「好壞」會被以更接近技術實力的標準來評判。

列維補充了一個更具體的場景：未來某一天，Agent 在幫你自動化工作流程時，可能會一再撞牆，然後直接告訴你「你該把這套老舊的 HR 系統換掉了，不然我沒辦法幫你完成這個任務」。這不是人類 IT 顧問會輕易說出口的話，但 Agent 會。因為它只看功能性和效率，不看政治。

Computer Use 的崛起：Agent 變成「使用電腦的人」

在這場討論中浮現的另一個重要趨勢是「computer use」模式的興起。卡薩多指出，業界對 AI Agent 的想像經歷了幾個階段：一開始是把 AI 加進既有的 SaaS 軟體裡，然後是讓 Agent 寫程式碼來解決問題，再來是讓 Agent 用終端機和 CLI。而現在正在發生的是 Agent 直接像人一樣「使用電腦」，操作滑鼠、讀螢幕、在各種應用程式之間切換。

這個演變方向其實很合理。前微軟 Windows 總裁辛諾夫斯基（Steve Sinofsky）點出了關鍵：過去 25 年來，軟體累積了龐大的功能，但人類使用者一直是瓶頸。他說自己職業生涯中最常遇到的場景，就是在飛機上有人問他「PowerPoint 怎麼做到 X？」或者有人花半天搞不定 Excel 的雙軸圖表。這些功能其實都在，只是人類介面設計造成了巨大的使用阻力。

Agent 不受這個限制。一個 Agent 可以完美地導航 SAP 那些令人崩潰的選單層級，可以在 Excel 裡找到那個藏在第三層功能表底下的雙軸圖表選項。列維把這稱為「mezzanine step」（中介步驟）：在 Agent 完全取代軟體之前，它們會先成為既有軟體的超級使用者，釋放那些被複雜介面鎖住的生產力。

辛諾夫斯基則用歷史類比把這個觀點說得更清楚。他舉了表格計算的例子：他的表姐在 MBA 畢業後進入銀行工作，那時電子試算表剛出現，她自己不會用，所以雇了一整間的實習生幫她跑數字，就像現在的人雇一堆 Agent 跑任務。但兩年後，她和同期的人全部學會了試算表，那些實習生的工作就消失了，整個抽象層往上移動了一層。Agent 現在就在這個階段：你需要一個超級聰明的人來協調 42 個 Agent 完成複雜工作流程，但這個「火箭科學」的階段很快就會蒸發，最終變成每個領域專家都能輕鬆使用的標準工具。

Agent 沒有隱私權：安全模型為什麼不能照搬

討論到一半，卡薩多分享了一個有趣的做法：他給自己的 NanoClaw Agent 開了獨立的 Gmail 帳號、獨立的電話號碼、甚至獨立的信用卡。他的邏輯是，既然 Gmail 已經有完整的 RBAC（角色型存取控制）權限系統，為什麼不直接把 Agent 當作一個新員工來管理？

列維立刻拆解了這個想法的風險。他指出，Agent 和真人員工之間有一個根本差異：Agent 沒有隱私權。真人員工有自己的 Slack 頻道，你不能隨便登入他們的帳號偷看，他們對自己的行為負法律責任，被開除的威脅讓 95% 的人不會做壞事。但 Agent 不一樣，你擁有對它的完全監控權，你要為它的所有行為負責，你可以隨時「登入」查看它在做什麼。既然你能登入它的帳號，那它怎麼可能在與其他人的 Agent 協作時維持資訊保密？

更致命的問題是 prompt injection（提示注入攻擊）。列維說，如果你知道某人 Agent 的 email 地址，你要對它進行社交工程比對真人容易十倍。因為 Agent 的 context window 裡如果包含了敏感資訊，目前還沒有可靠的方法能保證這些資訊不會被誘導洩漏。你沒辦法對 Agent 說「不要透露 X」然後就安心，因為精心設計的 prompt injection 可以繞過這些指令。辛諾夫斯基補充說，Agent 一旦被注入，它就是「史上最快、最瘋狂的人類」，可以一小時打你的系統一萬次，把資訊洩漏得無影無蹤。

這就是為什麼目前 Agent 只能作為「你的延伸」來運作，而不是獨立的行為主體。列維坦承，Box 正在為此開發解決方案，也很喜歡 Agent 擁有獨立帳號的想法，但在 context window 的保密問題被根本性解決之前，讓 Agent 自主存取 M&A 資料室之類的高敏感環境，風險仍然太大。

新創飛奔，大企業凍結：AI 採用的巨大落差

三位對談者都同意一個判斷：AI Agent 在企業端的擴散速度，會比矽谷的人想像得慢很多。原因很簡單，新創公司從零開始，沒有遺留系統需要保護，沒有資訊邊界需要維護，可以直接把所有 context 餵給 Agent 讓它自由發揮。但大企業如 JP Morgan 呢？他們有海量的敏感資料、複雜的合規要求、數十年累積的系統整合邏輯，光是讓一個 Agent 讀取檔案的「唯讀版」就需要通過層層審核。

辛諾夫斯基認為這個落差會創造出最有趣的張力：大企業將被那些善用 Agent 的個人和新創公司遠遠甩開。這些個人會開始看起來像新創公司，新創公司會以遠超大企業的速度推進，因為他們根本不需要擔心那些安全和協調問題。在新創公司裡，Agent 失控頂多就是一集 Silicon Valley 影集的劇情，大不了重來。但在 JP Morgan，一次 Agent 失控可能意味著 M&A 資料外洩和數十億的訴訟。

不過，對於「SaaS 末日」的說法，三人都持保留態度。辛諾夫斯基特別強調，認為可以用 vibe coding（用自然語言隨手產生程式碼）取代 SAP 是「荒謬的」。SAP 裡面編碼的不只是資料層，還有深厚的領域知識、中介層的商業邏輯、UI 裡嵌入的特定作業流程。這些不是一個聰明的 Agent 加上隨手寫幾行程式就能重建的。Agent 會讓這些系統的「消費層」變得更流暢，但核心的記錄系統不會在短期內被取代。

列維提出了一個更務實的觀點：真正會發生的是，Agent 會不斷測試你的系統，如果某個後端無法滿足 Agent 的需求，它會建議企業更換。這不是一夜之間的革命，而是持續施壓的進化過程。未來企業的業務表現，將直接與「你的 Agent 能多有效率地取得它需要的資訊」掛鉤。

我的觀察

這場對談最有價值的地方在於三位講者的立場差異。列維是正在建造 agent-first 產品的人，每天面對真實的工程取捨；辛諾夫斯基是看過 PC、Windows、雲端三次典範轉移的歷史學者，習慣用長週期視角看事情；卡薩多則是投資了 240 家基礎設施公司的 VC，他看到的是資料層面所有公司都在急速成長。

把三個視角疊在一起，我看到的結論是：Agent 時代的軟體業不會是一場快速的淘汰賽，而是一場持續數年的雙軌演進。一條軌道上，新創公司和先進個人以全新架構飛速前進；另一條軌道上，大企業緩慢但確實地重建基礎設施。兩者之間的落差，就是未來三到五年最大的商業機會所在。

對台灣的企業軟體產業來說，訊息很明確：如果你的產品沒有高品質的 API、無法被 Agent 有效存取，你不只是錯過一個功能更新的機會，而是在 Agent 主導的評選機制中被淘汰。Agent 不會被你的業務請吃牛排，它只看你的系統是否穩定、快速、開放。