AI 產業動態

從四天原型到八萬顆星：Browser Use 如何在瀏覽器自動化紅海中殺出重圍？

Browser Use 是一個讓 AI 代理人用自然語言控制瀏覽器的開源工具，上線不到兩年就累積近 8 萬顆 GitHub 星星。創辦人 Magnus Müller 分享了爆紅背後的成長策略、開源商業化的血淚教訓，以及他對 AI 代理人未來的大膽預測。

2026 年 5 月 17 日 · 來源： Open Source Startup Podcast E192

從四天原型到八萬顆星：Browser Use 如何在瀏覽器自動化紅海中殺出重圍？

本文整理自《Open Source Startup Podcast》2026 年 2 月播出的單集。收聽完整節目：Spotify ｜ Apple Podcast

四天做出原型，然後呢？

瀏覽器自動化這件事一點都不新鮮。從 Selenium 到 Puppeteer 再到 Playwright，工程師們十幾年來都在寫腳本讓電腦代替人類點按鈕、填表單、抓資料。問題是，這些腳本就像用稻草搭的房子：網站一改版，全部崩潰。你花三個小時寫好的自動化流程，可能隔天就因為一個按鈕的 class name 變了而報廢。

Browser Use 的創辦人暨 CEO 穆勒（Magnus Müller）從十歲就開始寫瀏覽器自動化腳本，對這種痛苦再熟悉不過。2024 年，他和共同創辦人祖尼奇（Gregor Zunic）在蘇黎世一間禁止讀書、只准做 side project 的加速器宿舍裡，花了四天拼出一個原型：讓 AI 模型看螢幕截圖和 HTML，然後自己決定要點哪裡、打什麼字。他們把程式碼往 GitHub 一推、在 Hacker News 上貼了一篇帖子，當晚就收到第一批 100 顆星星。

聽起來像是典型的「一夜爆紅」故事，但穆勒很坦白：爆紅只是開始，後面的路才是真正的考驗。截至 2026 年初，Browser Use 已經累積近 79,000 顆 GitHub 星星、拿到 YC W25 的入場券、融資 1,700 萬美元，團隊卻只有 8 個人。這中間到底發生了什麼？

爆紅三支柱：讓人三秒鐘看見魔法

穆勒把 Browser Use 的成長歸納為三個策略，而且每一個都跟「技術有多強」無關。

第一個是「製造魔法時刻」。他觀察到，很多自動化框架的 README 一打開就是一堆程式碼範例和功能清單，使用者要花十分鐘設定環境、再花十分鐘讀文件，才能體會到產品的價值。Browser Use 反過來做：README 第一行是一句話說明，第二行就是一段影片，讓你親眼看到 AI 打開瀏覽器、幫你投履歷。穆勒的原話是：「魔法時刻要越快越好。」這個原則聽起來簡單，但多數開發者工具的創辦人都做不到，因為工程師的本能是先展示技術深度，而不是展示結果。

第二個策略是「搭趨勢便車」。每當科技圈有新模型或新產品發布，穆勒就會在第一時間做出「Browser Use + 新東西」的整合示範。OpenAI 推出 Operator 的那一週，他發了一條推文：「你現在可以在本機免費使用跟 Operator 一樣的功能。」DeepSeek 爆紅的那一週，他立刻加入 DeepSeek 模型支援，然後說：「不用付 200 美元月費，用 DeepSeek 加 Browser Use 就能做到一樣的事。」每一次熱門話題都成為他的免費流量入口。這不是投機取巧，而是因為 Browser Use 的架構本來就支援任何 LLM，他只是比別人更快把這個事實包裝成故事。

第三個策略是「製造爭議」。2024 年 12 月，穆勒做了一支 demo 影片，展示 AI 如何自動幫你在網路上投履歷。這支影片一開始乏人問津，但三週後被大型 YouTuber 翻出來，引發一場「AI 該不該幫人投履歷」的公開辯論。有人說這太不道德了，有人說以後需要 AI 招募員來分析 AI 投的履歷。爭議本身成了最好的行銷，而 Browser Use 的名字就這樣烙進了所有人的腦海裡。

看著別人靠你的程式碼賺翻

開源專案的宿命是：你寫的程式碼越好用，包裝你的人賺得越多。

穆勒親身經歷了這個教訓。2025 年初，一個叫 Manus 的產品橫空出世，核心功能基本上就是把 Browser Use 的函式庫包一層漂亮的 UI，搭配其他功能。Manus 從零到高速成長，年經常性收入衝到驚人的數字。而 Browser Use 這邊，收入是零。「他們沒有付我們任何費用，」穆勒回憶，「我們看著別人用我們的 code 建立龐大的生意，卻完全沒有分到一杯羹。」

這是所有開源創辦人遲早要面對的問題：免費策略帶來了社群和影響力，但當你需要養團隊的時候，星星數不能當飯吃。穆勒的對策是在核心函式庫周圍建立「微服務生態系」。他們推出了全託管的雲端版本、代理伺服器（proxy）服務，以及專門為瀏覽器操作優化的自訓練 LLM。邏輯很直接：使用者自己架不起來的東西、或者自己做成本太高的東西，才值得付費。

其中一個有趣的觀察是代理伺服器成本。穆勒指出，去年 LLM token 費用和代理伺服器費用大約各占一半，但隨著模型價格急速下降，代理伺服器反而會成為瀏覽器代理人最大的營運成本。這意味著誰掌握了高效的代理伺服器基礎設施，誰就掌握了這個生態系的定價權。

自訓練 LLM：因為通用模型不知道什麼時候該等兩秒

Browser Use 做了一件這個領域其他競爭者沒做的事：自己訓練瀏覽器專用的語言模型。

動機很實際。通用的前沿模型在瀏覽器操作上有一個致命弱點：它們不懂得「等」。你打開 Amazon 的產品頁，圖片載入了但價格還沒出來，人類會下意識等兩秒鐘。但 GPT-4 或 Claude 看到頁面上沒有價格，可能就判定網站壞了，然後跳去別的地方。這種「瀏覽直覺」是通用模型的訓練資料裡幾乎沒有的東西。

穆勒的團隊建立了大量的評估基準，每一個 pull request 都會跑五組不同的 benchmark，追蹤分數是上升還是下降。他們甚至把跑出來的 JSON 結果（動輒上千萬 token）丟進 Claude Code，讓 AI 分析「這次跑測哪裡出了問題」。這種用 AI 訓練另一個 AI 的迭代速度，是小團隊能跟大模型公司競爭的關鍵。

從商業角度看，穆勒發現他們的使用者每天光是 token 費用就花掉三到五萬美元，全部付給 OpenAI 和 Anthropic。如果他們能提供一個更快、更便宜、更專門的模型，就能截取這條價值流中的一部分。速度是最直接的賣點：當開發者在迭代 prompt 的時候，每個步驟等五到十秒和等一到兩秒，開發體驗完全不同。

從一萬一千次 commit 到學會講故事

穆勒去年在 GitHub 上有 11,000 次 commit。他把自我價值跟寫了多少程式碼畫上等號：commit 越多，代表自己越有價值。他可以花整整一個月，把代理人的效能提升 1%，然後在 X 上發一條推文，隔天就跳進下一個專案。

但這種工程師式的「交付就好」心態幾乎殺死了公司的成長。「我們建了非常厲害的技術，卻沒有告訴任何人，」穆勒坦承。他花了好幾週才接受一個事實：再好的技術，如果沒有人知道它存在，就等於不存在。

轉型的過程不是一夜之間發生的。穆勒坦言自己在 12 月一度嚴重拖延，凌晨四點還在打手遊（Clash Royale），因為他對銷售和行銷完全進入不了心流狀態。最後讓他找到平衡的方法，竟然是用自己的產品。他讓 Claude Code 分析使用者資料，找出兩週前很活躍但最近停用的 B2B 客戶，然後用 Gmail MCP 自動發送客製化的開發者關懷信。用 coding agent 來做銷售，這對一個工程師背景的 CEO 來說，大概是最舒服的妥協方式。穆勒說他給自己的建議只有一句話：「學會好奇。」當你跟人起衝突的時候，本能反應是防衛或反擊，但如果你能停下來問「你為什麼這麼想？」，大部分問題都能解開。對一個從獨立開發者變成帶團隊的 CEO 來說，這大概是最難也最值得學的一件事。

我的觀察

我自己每天都在用各種 AI 代理人工具，從 Claude Code 到各種瀏覽器自動化方案，對穆勒講的「魔法時刻」深有體會。真正讓我持續使用一個工具的，從來不是它的功能清單有多長，而是第一次啟動時那個「哇，它真的動了」的瞬間。很多台灣的開發者工具團隊在技術上非常扎實，但就是少了那臨門一腳：把技術成果包裝成三秒鐘就能感受到的體驗。

穆勒搭便車的策略也值得注意。他本質上是在做「即時內容行銷」，但跟一般行銷人不同的是，他有能力在幾小時內把整合做出來，而不只是寫一篇「我們也支援 XXX」的公告。這需要架構上的前瞻設計：你的系統必須夠模組化，才能在新模型發布當天就接上去。

最後，Manus 靠包裝 Browser Use 就能快速起飛這件事，其實是 2025-2026 年 AI 圈最殘酷也最真實的寫照：在 AI 時代，「做出核心技術」和「獲取商業價值」之間的距離，比以往任何時候都大。開源不等於免費勞動，但如果你的商業化動作慢了，別人就會替你把價值拿走。對台灣的開源開發者來說，Browser Use 的教訓很清楚：從第一天就要想清楚，你的護城河不在程式碼本身，而在程式碼周圍的基礎設施和服務。