AI 產業動態

全球 84% 的人從未用過 AI：Brex 的企業 Agent 實戰手冊

Brex 執行長 Pedro Franceschi 用一張 2,500 點的圖表揭示：全球 84% 的人從未用過 AI，付費用 Agent 的只有 2,500 分之一。他分享 Brex 如何用開源工具 CrabTrap、客戶世界模型和夢境循環，打造真正能自我進化的企業級 AI。

2026 年 6 月 11 日 · 來源： Y Combinator Lightcone Podcast

本文整理自 Y Combinator Lightcone Podcast 2026 年 6 月播出的單集。

一張 2,500 點的圖，看懂 AI 採用的真實狀態

想像一張有 2,500 個點的圖片，每個點代表 320 萬人。Pedro Franceschi（Brex 共同創辦人暨執行長）在 YC Lightcone 節目中分享了這組數據：84% 的點，也就是全球絕大多數人，從未使用過任何 AI 工具。16% 至少用過一次免費的聊天機器人。付費使用 AI 的人，每月花 20 美元的，只有 0.3%，大約六、七個點。而真正在用 AI Agent 的？整張圖上大約只有一個點。

這是 Pedro 所說的「做多推論」（long inference）論點的核心。當市場上充斥著「AI 是否被高估」的辯論時，這些數字說的是另一個故事：AI 的採用曲線連起跑線都還沒跨過。即使 Token 成本降低十倍，使用量也會增加十倍，所以 Token 支出不會因為降價而消失，反而會成為企業最大的單一費用項目。

他進一步用 Brex 的客戶數據佐證這個觀點。在舊金山和紐約的 10 英里半徑內，企業的 Token 消耗量極高，而且可以觀察到更快的營收成長。但離開這兩個科技聚落，即使是預算充裕的大型企業，每月的 Token 支出也只有大約一萬美元。「你應該花十倍、二十倍、甚至一百倍，」Pedro 說。這個落差仍然令他驚訝。

三層 AI 採用金字塔：你的團隊在哪一層？

Pedro 在 Brex 內部觀察到的 AI 使用狀況，可以分成明確的三個層次。最上面是「Token 極大化者」（token maxers），通常是工程師，整天活在 coding harness 裡面，推送大量程式碼，生產力提升最為顯著。這群人已經把 AI 融入每一個工作環節，Token 消耗量遠高於其他人。

中間層是一般工程師。他們會使用 AI 來完成部分工作，但沒有真正 all-in，生產力大概只有頂層的十分之一。他們知道 AI 有用，偶爾會用，但還沒有把它變成工作流程的核心。最底層是公司裡的其他所有人，他們與 AI 的接觸方式被 Pedro 稱為「Google 搜尋模式」，一個聊天機器人加上幾個 MCP 工具，本質上還是在搜尋，而不是在讓 AI 替自己工作。

Pedro 認為，AI 創造價值的關鍵在於 harness（工作框架），而不是模型本身。對工程師來說，Claude Code 這類 coding harness 已經解決了這個問題。但對非技術團隊，挑戰在於如何打造一個等價的框架，讓 AI 不再只是一個搜尋框，而更像一個虛擬員工：有 Slack 帳號、有 email、可以被邀請到會議裡、可以做會議紀錄。Brex 的內部策略就是朝這個「虛擬員工」方向前進，而不只是「給大家多幾個 MCP 工具」。

別再把 Agent 關在富士康工廠裡

為什麼 Token 極大化沒有更快速地普及？YC 執行長 Garry Tan 在節目中點出了一個核心問題：大多數軟體團隊把 LLM 當成「非常珍貴、非常昂貴」的東西。結果就是用大量的 if 語句、嚴格的 context window 控制，把 Agent 像富士康工廠的工人一樣管起來。他自己就曾經寫了將近五十萬行的 Rails 程式碼，只為了控制模型看到的每一段 context。後來他才意識到，這整套做法從根本上就錯了。

Pedro 的觀點是，每一個好的 AI 產品，本質上都是「一個 Agent 迴圈加上工具」，僅此而已。過度工程化 harness、試圖控制模型的每一個行為，反而扼殺了 Agent 的能力。Agent 需要的不是富士康工廠的嚴密監控，而是充足的 context 和行動自由。真正該做的是在安全邊界上下功夫，而不是在模型的每一步動作上設限。

Pedro 提出一個簡單的自我檢測標準，叫做「AI 藥丸測試」：不管你生活中遇到什麼問題，你的第一反應是不是交給 AI？如果這已經變成你的第二天性，你的大腦就已經被重新配置了。但他觀察到，在社群媒體上抱怨 Claude 或 ChatGPT 的用量上限的人，大概只佔 0.1%。這代表真正推到極限的人少之又少，我們離大規模採用還非常遠。

CrabTrap：在網路層解決 Agent 安全問題

在 Brex 這樣處理金融數據的公司，讓 AI Agent 擁有系統寫入權限是一件需要極度謹慎的事。Pedro 回憶，他最初給自己的 OpenClaw 設定了所有系統的讀取權限（email、Slack 等等），但不給寫入權限。光是這樣就已經帶來驚人的價值。接下來的問題是：如何安全地開放寫入？

Brex 的安全團隊對此有強烈的抗拒，這是可以理解的。Pedro 花了大約四週的時間研究這個問題，最終得出一個關鍵洞察：安全控制不應該在工具呼叫（tool call）層面，而應該在網路層。他注意到，NVIDIA 的 NeMo 等方案試圖在 shell 層面控制 Agent，但問題是 Agent 不一定透過工具存取系統，它也可以直接發出一個「錯誤的 HTTP 請求」。而模型因為是在數百億的網頁文件上訓練的，它們用 HTTP 流量來推理的能力可能比任何其他格式都強。

這就是 CrabTrap 的由來。Brex 大約兩個月前將它開源。CrabTrap 是一個 HTTP 代理，攔截 Agent 發出的所有網路請求。運作方式是先讓 Agent 正常運行一天，記錄所有流量，然後用另一個 LLM 來分析這些流量、建立安全政策。之後，所有請求都會根據政策自動審核：符合規則的直接放行，不確定的交給 LLM 當裁判。在 Brex 的招募 Agent「Jim」身上，98% 的請求自動通過，只有 2% 需要 LLM 判斷。這個結果讓 Brex 嚴格的安全團隊終於願意放手讓公司更大膽地實驗。Pedro 特別強調，Brex 不是做 HTTP 代理的公司，「我們做這件事，是因為要到達 AI 的前沿，就必須先解決這個擋在路上的問題。」

客戶世界模型：比客戶經理更了解你的客戶

Brex 正在建構的另一個核心 AI 基礎建設是「客戶世界模型」（Customer World Model）。概念很直觀：把客戶與公司的每一個接觸點都匯入同一個系統。客戶在儀表板上點了什麼按鈕、寄了什麼 email、打了什麼電話、提了什麼客服工單，全部整合。然後你可以問這個模型：這個客戶接下來需要什麼？他們可能遇到什麼問題？這個帳戶目前的狀態如何？

Pedro 分享了一個具體場景。他隔天要跟一位客戶午餐，但對那個帳戶的狀況不夠熟悉。客戶世界模型在幾秒內生成了一份完整報告，裡面包含了連客戶經理都不知道的資訊：一位高階主管出差時在機場遇到了租車問題，這個細節是從客服工單裡挖出來的。Garry Tan 聽完直接說了四個字：「全面資訊感知。」這就是一個已經在生產環境中運作的系統，Brex 的客戶銷售團隊現在就是靠它在工作。

Pedro 特別強調，他更傾向打造「特定領域的虛擬員工」，而不是追求 Jack Dorsey 所說的單一「公司 AGI」。客戶世界模型就是一個好例子：它有清楚定義的問題邊界、明確的 API、可以做 eval 評估。在它之上，可以再建構一個「產品路線圖 Agent」，根據客戶洞察來規劃產品方向。Pedro 比喻這就像一個虛擬高階主管團隊，每個成員專精一個領域，透過明確的介面協作，而不是把所有資料丟進一個巨大的模型裡期待它什麼都懂。

夢境循環：讓 Agent 每天自己進化

大多數公司花了大量力氣讓一個 Agent 能夠運作，但從來沒想過怎麼讓它每天都在進步。Pedro 認為，這才是 AI Agent 從「堪用」跨越到「真正有價值」的分水嶺。

他在 Brex 推動的做法是：把公司裡每一次「人類介入 AI」的動作，自動轉化成一個 eval（評估案例）。舉例來說，入門流程中的 KYC Agent 遇到無法處理的例外狀況，人類審核員會手動解決。這個手動介入不是處理完就結束，它會自動成為一個 breaking change 測試案例，下次 Agent 必須能自己處理同樣的情境。Brex 的費用管理 Agent 也是同樣的邏輯：當一次與客戶的對話出了問題或標記了一個 bug，系統會自動觸發另一個 Agent 去修改程式碼和 prompt，直到那個 eval 通過為止。如果 Agent 修不好，工程師才會介入。Garry Tan 把這個機制稱為「夢境循環」（dream cycle），Agent 每天回顧所有狀況，找出模式，然後自我修正。

在 Token 支出管理方面，Brex 內部建了一個叫 MagPy 的工具。MagPy 追蹤公司裡每一塊錢的 Token 支出歸屬，每一筆花費都可以對應到特定的產品、特定的客戶服務，或特定的內部工具和員工。Pedro 把這件事定位為一個新興的基礎建設需求：當 Token 支出成為企業最大的費用項目之一，你需要像管理雲端成本一樣去管理它。知道錢花在哪裡，才能判斷哪些 AI 投資真正帶來了回報，哪些只是在空轉。

我的觀察

Pedro 的「2,500 個點」視覺化讓人印象深刻，但真正值得咀嚼的是它背後的含義。在各種「AI 泡沫」的論述裡，我們很容易忘記一個基本事實：絕大多數人根本還沒開始用 AI。付費使用者是極少數中的極少數，而真正在用 Agent 的人，用那張圖來看，幾乎看不見。

這跟我在臺灣觀察到的狀況吻合。很多企業在談 AI 轉型，但實際的 Token 消耗量可能連 Pedro 所說的「應該花的」的百分之一都不到。不是沒有預算，不是不知道 AI 存在，而是整個組織的使用方式還停留在「搜尋模式」。Pedro 的三層金字塔可以當成一個自我檢測工具：你公司裡有多少人是第一層的 token maxer？如果答案是零，那問題不在工具，在組織。

CrabTrap 的開源值得特別關注。企業部署 AI Agent 最大的卡點往往不是技術能力，而是安全團隊的信任。在網路層做審計、用 LLM 當裁判這個思路，解決的是一個非常實際的組織問題：怎麼讓保守的安全團隊願意說「好，我們可以試試看」。而「夢境循環」的概念可能是最容易被忽略、卻最有長期價值的一塊。一個不會自我改進的 Agent，跟一個每天都在變好的 Agent，半年後的差距會是天壤之別。多數公司把力氣花在「讓 Agent 動起來」，卻沒有思考「讓 Agent 持續進步」的機制。