從四天原型到八萬顆星:Browser Use 如何在瀏覽器自動化紅海中殺出重圍?

Browser Use 是一個讓 AI 代理人用自然語言控制瀏覽器的開源工具,上線不到兩年就累積近 8 萬顆 GitHub 星星。創辦人 Magnus Müller 分享了爆紅背後的成長策略、開源商業化的血淚教訓,以及他對 AI 代理人未來的大膽預測。

從四天原型到八萬顆星:Browser Use 如何在瀏覽器自動化紅海中殺出重圍?

本文整理自《Open Source Startup Podcast》2026 年 2 月播出的單集。收聽完整節目:SpotifyApple Podcast

四天做出原型,然後呢?

瀏覽器自動化這件事一點都不新鮮。從 Selenium 到 Puppeteer 再到 Playwright,工程師們十幾年來都在寫腳本讓電腦代替人類點按鈕、填表單、抓資料。問題是,這些腳本就像用稻草搭的房子:網站一改版,全部崩潰。你花三個小時寫好的自動化流程,可能隔天就因為一個按鈕的 class name 變了而報廢。

Browser Use 的創辦人暨 CEO 穆勒(Magnus Müller)從十歲就開始寫瀏覽器自動化腳本,對這種痛苦再熟悉不過。2024 年,他和共同創辦人祖尼奇(Gregor Zunic)在蘇黎世一間禁止讀書、只准做 side project 的加速器宿舍裡,花了四天拼出一個原型:讓 AI 模型看螢幕截圖和 HTML,然後自己決定要點哪裡、打什麼字。他們把程式碼往 GitHub 一推、在 Hacker News 上貼了一篇帖子,當晚就收到第一批 100 顆星星。

聽起來像是典型的「一夜爆紅」故事,但穆勒很坦白:爆紅只是開始,後面的路才是真正的考驗。截至 2026 年初,Browser Use 已經累積近 79,000 顆 GitHub 星星、拿到 YC W25 的入場券、融資 1,700 萬美元,團隊卻只有 8 個人。這中間到底發生了什麼?

爆紅三支柱:讓人三秒鐘看見魔法

穆勒把 Browser Use 的成長歸納為三個策略,而且每一個都跟「技術有多強」無關。

第一個是「製造魔法時刻」。他觀察到,很多自動化框架的 README 一打開就是一堆程式碼範例和功能清單,使用者要花十分鐘設定環境、再花十分鐘讀文件,才能體會到產品的價值。Browser Use 反過來做:README 第一行是一句話說明,第二行就是一段影片,讓你親眼看到 AI 打開瀏覽器、幫你投履歷。穆勒的原話是:「魔法時刻要越快越好。」這個原則聽起來簡單,但多數開發者工具的創辦人都做不到,因為工程師的本能是先展示技術深度,而不是展示結果。

第二個策略是「搭趨勢便車」。每當科技圈有新模型或新產品發布,穆勒就會在第一時間做出「Browser Use + 新東西」的整合示範。OpenAI 推出 Operator 的那一週,他發了一條推文:「你現在可以在本機免費使用跟 Operator 一樣的功能。」DeepSeek 爆紅的那一週,他立刻加入 DeepSeek 模型支援,然後說:「不用付 200 美元月費,用 DeepSeek 加 Browser Use 就能做到一樣的事。」每一次熱門話題都成為他的免費流量入口。這不是投機取巧,而是因為 Browser Use 的架構本來就支援任何 LLM,他只是比別人更快把這個事實包裝成故事。

第三個策略是「製造爭議」。2024 年 12 月,穆勒做了一支 demo 影片,展示 AI 如何自動幫你在網路上投履歷。這支影片一開始乏人問津,但三週後被大型 YouTuber 翻出來,引發一場「AI 該不該幫人投履歷」的公開辯論。有人說這太不道德了,有人說以後需要 AI 招募員來分析 AI 投的履歷。爭議本身成了最好的行銷,而 Browser Use 的名字就這樣烙進了所有人的腦海裡。

看著別人靠你的程式碼賺翻

開源專案的宿命是:你寫的程式碼越好用,包裝你的人賺得越多。

穆勒親身經歷了這個教訓。2025 年初,一個叫 Manus 的產品橫空出世,核心功能基本上就是把 Browser Use 的函式庫包一層漂亮的 UI,搭配其他功能。Manus 從零到高速成長,年經常性收入衝到驚人的數字。而 Browser Use 這邊,收入是零。「他們沒有付我們任何費用,」穆勒回憶,「我們看著別人用我們的 code 建立龐大的生意,卻完全沒有分到一杯羹。」

這是所有開源創辦人遲早要面對的問題:免費策略帶來了社群和影響力,但當你需要養團隊的時候,星星數不能當飯吃。穆勒的對策是在核心函式庫周圍建立「微服務生態系」。他們推出了全託管的雲端版本、代理伺服器(proxy)服務,以及專門為瀏覽器操作優化的自訓練 LLM。邏輯很直接:使用者自己架不起來的東西、或者自己做成本太高的東西,才值得付費。

其中一個有趣的觀察是代理伺服器成本。穆勒指出,去年 LLM token 費用和代理伺服器費用大約各占一半,但隨著模型價格急速下降,代理伺服器反而會成為瀏覽器代理人最大的營運成本。這意味著誰掌握了高效的代理伺服器基礎設施,誰就掌握了這個生態系的定價權。

自訓練 LLM:因為通用模型不知道什麼時候該等兩秒

Browser Use 做了一件這個領域其他競爭者沒做的事:自己訓練瀏覽器專用的語言模型。

動機很實際。通用的前沿模型在瀏覽器操作上有一個致命弱點:它們不懂得「等」。你打開 Amazon 的產品頁,圖片載入了但價格還沒出來,人類會下意識等兩秒鐘。但 GPT-4 或 Claude 看到頁面上沒有價格,可能就判定網站壞了,然後跳去別的地方。這種「瀏覽直覺」是通用模型的訓練資料裡幾乎沒有的東西。

穆勒的團隊建立了大量的評估基準,每一個 pull request 都會跑五組不同的 benchmark,追蹤分數是上升還是下降。他們甚至把跑出來的 JSON 結果(動輒上千萬 token)丟進 Claude Code,讓 AI 分析「這次跑測哪裡出了問題」。這種用 AI 訓練另一個 AI 的迭代速度,是小團隊能跟大模型公司競爭的關鍵。

從商業角度看,穆勒發現他們的使用者每天光是 token 費用就花掉三到五萬美元,全部付給 OpenAI 和 Anthropic。如果他們能提供一個更快、更便宜、更專門的模型,就能截取這條價值流中的一部分。速度是最直接的賣點:當開發者在迭代 prompt 的時候,每個步驟等五到十秒和等一到兩秒,開發體驗完全不同。

從一萬一千次 commit 到學會講故事

穆勒去年在 GitHub 上有 11,000 次 commit。他把自我價值跟寫了多少程式碼畫上等號:commit 越多,代表自己越有價值。他可以花整整一個月,把代理人的效能提升 1%,然後在 X 上發一條推文,隔天就跳進下一個專案。

但這種工程師式的「交付就好」心態幾乎殺死了公司的成長。「我們建了非常厲害的技術,卻沒有告訴任何人,」穆勒坦承。他花了好幾週才接受一個事實:再好的技術,如果沒有人知道它存在,就等於不存在。

轉型的過程不是一夜之間發生的。穆勒坦言自己在 12 月一度嚴重拖延,凌晨四點還在打手遊(Clash Royale),因為他對銷售和行銷完全進入不了心流狀態。最後讓他找到平衡的方法,竟然是用自己的產品。他讓 Claude Code 分析使用者資料,找出兩週前很活躍但最近停用的 B2B 客戶,然後用 Gmail MCP 自動發送客製化的開發者關懷信。用 coding agent 來做銷售,這對一個工程師背景的 CEO 來說,大概是最舒服的妥協方式。穆勒說他給自己的建議只有一句話:「學會好奇。」當你跟人起衝突的時候,本能反應是防衛或反擊,但如果你能停下來問「你為什麼這麼想?」,大部分問題都能解開。對一個從獨立開發者變成帶團隊的 CEO 來說,這大概是最難也最值得學的一件事。

我的觀察

我自己每天都在用各種 AI 代理人工具,從 Claude Code 到各種瀏覽器自動化方案,對穆勒講的「魔法時刻」深有體會。真正讓我持續使用一個工具的,從來不是它的功能清單有多長,而是第一次啟動時那個「哇,它真的動了」的瞬間。很多台灣的開發者工具團隊在技術上非常扎實,但就是少了那臨門一腳:把技術成果包裝成三秒鐘就能感受到的體驗。

穆勒搭便車的策略也值得注意。他本質上是在做「即時內容行銷」,但跟一般行銷人不同的是,他有能力在幾小時內把整合做出來,而不只是寫一篇「我們也支援 XXX」的公告。這需要架構上的前瞻設計:你的系統必須夠模組化,才能在新模型發布當天就接上去。

最後,Manus 靠包裝 Browser Use 就能快速起飛這件事,其實是 2025-2026 年 AI 圈最殘酷也最真實的寫照:在 AI 時代,「做出核心技術」和「獲取商業價值」之間的距離,比以往任何時候都大。開源不等於免費勞動,但如果你的商業化動作慢了,別人就會替你把價值拿走。對台灣的開源開發者來說,Browser Use 的教訓很清楚:從第一天就要想清楚,你的護城河不在程式碼本身,而在程式碼周圍的基礎設施和服務。