全球 84% 的人從未用過 AI:Brex 的企業 Agent 實戰手冊
Brex 執行長 Pedro Franceschi 用一張 2,500 點的圖表揭示:全球 84% 的人從未用過 AI,付費用 Agent 的只有 2,500 分之一。他分享 Brex 如何用開源工具 CrabTrap、客戶世界模型和夢境循環,打造真正能自我進化的企業級 AI。

本文整理自 Y Combinator Lightcone Podcast 2026 年 6 月播出的單集。
{{< youtube mPAHvz8kW24 >}}
一張 2,500 點的圖,看懂 AI 採用的真實狀態
想像一張有 2,500 個點的圖片,每個點代表 320 萬人。Pedro Franceschi(Brex 共同創辦人暨執行長)在 YC Lightcone 節目中分享了這組數據:84% 的點,也就是全球絕大多數人,從未使用過任何 AI 工具。16% 至少用過一次免費的聊天機器人。付費使用 AI 的人,每月花 20 美元的,只有 0.3%,大約六、七個點。而真正在用 AI Agent 的?整張圖上大約只有一個點。
這是 Pedro 所說的「做多推論」(long inference)論點的核心。當市場上充斥著「AI 是否被高估」的辯論時,這些數字說的是另一個故事:AI 的採用曲線連起跑線都還沒跨過。即使 Token 成本降低十倍,使用量也會增加十倍,所以 Token 支出不會因為降價而消失,反而會成為企業最大的單一費用項目。
他進一步用 Brex 的客戶數據佐證這個觀點。在舊金山和紐約的 10 英里半徑內,企業的 Token 消耗量極高,而且可以觀察到更快的營收成長。但離開這兩個科技聚落,即使是預算充裕的大型企業,每月的 Token 支出也只有大約一萬美元。「你應該花十倍、二十倍、甚至一百倍,」Pedro 說。這個落差仍然令他驚訝。
三層 AI 採用金字塔:你的團隊在哪一層?
Pedro 在 Brex 內部觀察到的 AI 使用狀況,可以分成明確的三個層次。最上面是「Token 極大化者」(token maxers),通常是工程師,整天活在 coding harness 裡面,推送大量程式碼,生產力提升最為顯著。這群人已經把 AI 融入每一個工作環節,Token 消耗量遠高於其他人。
中間層是一般工程師。他們會使用 AI 來完成部分工作,但沒有真正 all-in,生產力大概只有頂層的十分之一。他們知道 AI 有用,偶爾會用,但還沒有把它變成工作流程的核心。最底層是公司裡的其他所有人,他們與 AI 的接觸方式被 Pedro 稱為「Google 搜尋模式」,一個聊天機器人加上幾個 MCP 工具,本質上還是在搜尋,而不是在讓 AI 替自己工作。
Pedro 認為,AI 創造價值的關鍵在於 harness(工作框架),而不是模型本身。對工程師來說,Claude Code 這類 coding harness 已經解決了這個問題。但對非技術團隊,挑戰在於如何打造一個等價的框架,讓 AI 不再只是一個搜尋框,而更像一個虛擬員工:有 Slack 帳號、有 email、可以被邀請到會議裡、可以做會議紀錄。Brex 的內部策略就是朝這個「虛擬員工」方向前進,而不只是「給大家多幾個 MCP 工具」。
別再把 Agent 關在富士康工廠裡
為什麼 Token 極大化沒有更快速地普及?YC 執行長 Garry Tan 在節目中點出了一個核心問題:大多數軟體團隊把 LLM 當成「非常珍貴、非常昂貴」的東西。結果就是用大量的 if 語句、嚴格的 context window 控制,把 Agent 像富士康工廠的工人一樣管起來。他自己就曾經寫了將近五十萬行的 Rails 程式碼,只為了控制模型看到的每一段 context。後來他才意識到,這整套做法從根本上就錯了。
Pedro 的觀點是,每一個好的 AI 產品,本質上都是「一個 Agent 迴圈加上工具」,僅此而已。過度工程化 harness、試圖控制模型的每一個行為,反而扼殺了 Agent 的能力。Agent 需要的不是富士康工廠的嚴密監控,而是充足的 context 和行動自由。真正該做的是在安全邊界上下功夫,而不是在模型的每一步動作上設限。
Pedro 提出一個簡單的自我檢測標準,叫做「AI 藥丸測試」:不管你生活中遇到什麼問題,你的第一反應是不是交給 AI?如果這已經變成你的第二天性,你的大腦就已經被重新配置了。但他觀察到,在社群媒體上抱怨 Claude 或 ChatGPT 的用量上限的人,大概只佔 0.1%。這代表真正推到極限的人少之又少,我們離大規模採用還非常遠。
CrabTrap:在網路層解決 Agent 安全問題
在 Brex 這樣處理金融數據的公司,讓 AI Agent 擁有系統寫入權限是一件需要極度謹慎的事。Pedro 回憶,他最初給自己的 OpenClaw 設定了所有系統的讀取權限(email、Slack 等等),但不給寫入權限。光是這樣就已經帶來驚人的價值。接下來的問題是:如何安全地開放寫入?
Brex 的安全團隊對此有強烈的抗拒,這是可以理解的。Pedro 花了大約四週的時間研究這個問題,最終得出一個關鍵洞察:安全控制不應該在工具呼叫(tool call)層面,而應該在網路層。他注意到,NVIDIA 的 NeMo 等方案試圖在 shell 層面控制 Agent,但問題是 Agent 不一定透過工具存取系統,它也可以直接發出一個「錯誤的 HTTP 請求」。而模型因為是在數百億的網頁文件上訓練的,它們用 HTTP 流量來推理的能力可能比任何其他格式都強。
這就是 CrabTrap 的由來。Brex 大約兩個月前將它開源。CrabTrap 是一個 HTTP 代理,攔截 Agent 發出的所有網路請求。運作方式是先讓 Agent 正常運行一天,記錄所有流量,然後用另一個 LLM 來分析這些流量、建立安全政策。之後,所有請求都會根據政策自動審核:符合規則的直接放行,不確定的交給 LLM 當裁判。在 Brex 的招募 Agent「Jim」身上,98% 的請求自動通過,只有 2% 需要 LLM 判斷。這個結果讓 Brex 嚴格的安全團隊終於願意放手讓公司更大膽地實驗。Pedro 特別強調,Brex 不是做 HTTP 代理的公司,「我們做這件事,是因為要到達 AI 的前沿,就必須先解決這個擋在路上的問題。」
客戶世界模型:比客戶經理更了解你的客戶
Brex 正在建構的另一個核心 AI 基礎建設是「客戶世界模型」(Customer World Model)。概念很直觀:把客戶與公司的每一個接觸點都匯入同一個系統。客戶在儀表板上點了什麼按鈕、寄了什麼 email、打了什麼電話、提了什麼客服工單,全部整合。然後你可以問這個模型:這個客戶接下來需要什麼?他們可能遇到什麼問題?這個帳戶目前的狀態如何?
Pedro 分享了一個具體場景。他隔天要跟一位客戶午餐,但對那個帳戶的狀況不夠熟悉。客戶世界模型在幾秒內生成了一份完整報告,裡面包含了連客戶經理都不知道的資訊:一位高階主管出差時在機場遇到了租車問題,這個細節是從客服工單裡挖出來的。Garry Tan 聽完直接說了四個字:「全面資訊感知。」這就是一個已經在生產環境中運作的系統,Brex 的客戶銷售團隊現在就是靠它在工作。
Pedro 特別強調,他更傾向打造「特定領域的虛擬員工」,而不是追求 Jack Dorsey 所說的單一「公司 AGI」。客戶世界模型就是一個好例子:它有清楚定義的問題邊界、明確的 API、可以做 eval 評估。在它之上,可以再建構一個「產品路線圖 Agent」,根據客戶洞察來規劃產品方向。Pedro 比喻這就像一個虛擬高階主管團隊,每個成員專精一個領域,透過明確的介面協作,而不是把所有資料丟進一個巨大的模型裡期待它什麼都懂。
夢境循環:讓 Agent 每天自己進化
大多數公司花了大量力氣讓一個 Agent 能夠運作,但從來沒想過怎麼讓它每天都在進步。Pedro 認為,這才是 AI Agent 從「堪用」跨越到「真正有價值」的分水嶺。
他在 Brex 推動的做法是:把公司裡每一次「人類介入 AI」的動作,自動轉化成一個 eval(評估案例)。舉例來說,入門流程中的 KYC Agent 遇到無法處理的例外狀況,人類審核員會手動解決。這個手動介入不是處理完就結束,它會自動成為一個 breaking change 測試案例,下次 Agent 必須能自己處理同樣的情境。Brex 的費用管理 Agent 也是同樣的邏輯:當一次與客戶的對話出了問題或標記了一個 bug,系統會自動觸發另一個 Agent 去修改程式碼和 prompt,直到那個 eval 通過為止。如果 Agent 修不好,工程師才會介入。Garry Tan 把這個機制稱為「夢境循環」(dream cycle),Agent 每天回顧所有狀況,找出模式,然後自我修正。
在 Token 支出管理方面,Brex 內部建了一個叫 MagPy 的工具。MagPy 追蹤公司裡每一塊錢的 Token 支出歸屬,每一筆花費都可以對應到特定的產品、特定的客戶服務,或特定的內部工具和員工。Pedro 把這件事定位為一個新興的基礎建設需求:當 Token 支出成為企業最大的費用項目之一,你需要像管理雲端成本一樣去管理它。知道錢花在哪裡,才能判斷哪些 AI 投資真正帶來了回報,哪些只是在空轉。
我的觀察
Pedro 的「2,500 個點」視覺化讓人印象深刻,但真正值得咀嚼的是它背後的含義。在各種「AI 泡沫」的論述裡,我們很容易忘記一個基本事實:絕大多數人根本還沒開始用 AI。付費使用者是極少數中的極少數,而真正在用 Agent 的人,用那張圖來看,幾乎看不見。
這跟我在臺灣觀察到的狀況吻合。很多企業在談 AI 轉型,但實際的 Token 消耗量可能連 Pedro 所說的「應該花的」的百分之一都不到。不是沒有預算,不是不知道 AI 存在,而是整個組織的使用方式還停留在「搜尋模式」。Pedro 的三層金字塔可以當成一個自我檢測工具:你公司裡有多少人是第一層的 token maxer?如果答案是零,那問題不在工具,在組織。
CrabTrap 的開源值得特別關注。企業部署 AI Agent 最大的卡點往往不是技術能力,而是安全團隊的信任。在網路層做審計、用 LLM 當裁判這個思路,解決的是一個非常實際的組織問題:怎麼讓保守的安全團隊願意說「好,我們可以試試看」。而「夢境循環」的概念可能是最容易被忽略、卻最有長期價值的一塊。一個不會自我改進的 Agent,跟一個每天都在變好的 Agent,半年後的差距會是天壤之別。多數公司把力氣花在「讓 Agent 動起來」,卻沒有思考「讓 Agent 持續進步」的機制。