瀏覽器發明人宣告瀏覽器已死:安德森眼中的 AI 代理人革命

Netscape 共同創辦人馬克.安德森拆解 AI 代理人的架構公式:LLM + Unix Shell + 檔案系統 + Markdown + Cron。他認為這個突破將終結程式語言、使用者介面,甚至瀏覽器本身。

瀏覽器發明人宣告瀏覽器已死:安德森眼中的 AI 代理人革命

本文整理自 Latent Space Podcast 2026 年 4 月播出的單集。

{{< youtube knx2wrILP1M >}}

{{< spotify "episode/2yB5GPLpI5XeVeN2emJMOF" >}}

{{< apple-podcast "tw/podcast/marc-andreessen-introspects-on-the-death-of-the/id1674008350?i=1000759077760" >}}


當發明瀏覽器的人告訴你,瀏覽器快要死了,你大概該認真聽一下。

a16z 共同創辦人馬克.安德森(Marc Andreessen)在 Latent Space Podcast 上做了一個大膽的預測:未來十年內,程式語言、使用者介面、甚至他自己在 1993 年共同打造的網頁瀏覽器,都可能不再以我們熟悉的形態存在。取而代之的,是一個他認為「軟體史上最重要的十大發明之一」的東西:AI 代理人。而這個代理人的架構核心,是一個所有資深工程師都會覺得「早該想到」的組合。

LLM 嫁接 Unix Shell:代理人的架構突破

安德森把 Pi 和 OpenClaw 的組合稱為「最重要的十大軟體之一」。Pi 是架構上的突破,OpenClaw 則是讓這個架構走入千家萬戶的實作。但真正讓安德森興奮的不是任何一個產品,而是它們背後的設計哲學。

這個哲學的核心是:把大型語言模型的能力嫁接到 Unix shell 的思維上。對不熟悉技術史的讀者來說,Unix shell 是從 1970 年代發展至今的一套軟體操作範式。它的精髓是用一個命令列介面串接各種小工具,讓使用者透過組合簡單元件來完成複雜任務。你的 Mac 底層有它,你的 iPhone 底層有它,整個網際網路都跑在它上面。它是軟體世界最持久、最強大的基礎設施之一,只是多數人不知道它的存在。

安德森回憶,1960 年代 IBM 的 OS/360 是一座巨大的軟體城堡,你必須是 IBM 的內部人才有辦法搞懂它。Unix 的發明者反其道而行,把作業系統變成了一種程式語言:一個提示符號、一個 shell、一堆可以串接的小模組。這個看似簡單的設計最終贏了整場軟體戰爭。安德森自己從 1988 年開始就是 Unix 人,他說這套東西「贏了,然後我們就把它當作理所當然」。

Pi 和 OpenClaw 的團隊做的事情,就是重新發掘了這股「被遺忘的力量」,把它跟大型語言模型結合在一起。

五個元素的公式:代理人到底是什麼

安德森給出了一個極其精準的定義。一個 AI 代理人由五個元素組成:大型語言模型、Bash shell、檔案系統、Markdown 格式的狀態文件,以及一個類似 Unix cron job 的迴圈與心跳機制。就這樣。

這個定義之所以重要,是因為除了大型語言模型之外,其他四個元素都是我們已經完全理解、使用了五十年的技術。Shell 我們懂,檔案系統我們懂,Markdown 我們懂,定時任務我們懂。代理人的革命性不在於發明了什麼新東西,而在於把已知的舊元素跟語言模型組合在一起,解鎖了驚人的潛在能力。

安德森特別強調「最好的突破都是事後看來理所當然」。語言模型本身就是這樣:下一個 token 預測?當然。但在有人真正做出來之前,沒人覺得這是正確的方向。Pi 和 OpenClaw 也是同樣的故事:LLM 加 Shell?當然。但為什麼之前沒有人想到?

這個架構帶來一個關鍵特性:代理人的狀態存在檔案裡,而不是存在模型裡。這意味著你可以替換底層的語言模型,代理人會保留所有的記憶和能力,只是「個性」會因為模型不同而稍有變化。就像換了一顆新的 CPU 重新編譯程式一樣,程式還是你的程式。你甚至可以替換 shell 環境、替換檔案系統、替換迴圈框架,而代理人的核心身份始終不變。

自我改進:軟體史上從未有過的能力

然後是真正讓安德森「腦袋被炸開」的部分。

因為代理人的狀態就是一堆檔案,而代理人本身有完整的內省能力,它知道自己的檔案在哪、裡面寫了什麼,而且它可以改寫自己的檔案。在軟體史上,從來沒有一個被廣泛部署的系統具備這種完全的自我認知和自我修改能力。過去有過一些玩具等級的自我修改系統,但從來沒有一個真正走入日常使用的。

這帶來了一個實際應用的場景。安德森描述,你在派對上聽到朋友說他的 OpenClaw 連上了睡眠追蹤床墊,效果很好。你回家告訴你的代理人:「幫我也加上這個功能。」代理人會自己上網搜尋需要什麼,用程式碼編輯工具寫出需要的元件,然後把新功能加到自己身上。你不需要寫任何程式碼,不需要安裝任何東西,你只需要用自然語言說一句話。

這也意味著電腦操作變得不再是問題。代理人有 shell 的完整存取權限,你的電腦本來就是透過 shell 在運作的,所以代理人自然能操控你的電腦。給它一個瀏覽器,它就能上網。所有過去需要複雜整合協定(比如 MCP)才能做到的事情,現在只需要一個命令列介面就夠了。

從文字協定到 AI:人類可讀性的傳承

安德森在這裡做了一個精彩的歷史對照。

1993 年他在做 Mosaic 瀏覽器的時候,當時一般家庭的網路速度是 14 千位元的數據機。所有老派系統架構師都說:頻寬這麼窄,當然要用高效的二進位協定,當然要用持久連線,當然不能用浪費的文字協定。安德森和他的團隊偏偏反著來。HTTP 是文字協定,HTML 的標籤是人類可讀的,他們刻意選擇了「最沒效率」的做法。

這背後的賭注是:如果系統的潛在能力夠強,夠明顯,人們就會去建造足夠的頻寬來支撐它。而讓一切可被人類閱讀,會降低門檻,讓更多人理解、學習、參與。安德森認為瀏覽器最關鍵的功能可能是「檢視原始碼」按鈕,因為你可以看到任何網頁怎麼做的,然後自己學著做。

這個設計哲學跟今天的 AI 代理人架構一脈相承。代理人的狀態存在 Markdown 檔案裡、用 shell 命令操作、所有的中間過程都是人類可讀的。不是因為這樣最有效率,而是因為這樣讓所有人都能理解系統在做什麼。在 1993 年,「人類可讀」意味著技術規格文件。在 2026 年,「人類可讀」意味著英文(或任何自然語言)。本質沒變,只是門檻又降了一個數量級。

程式語言和使用者介面的終結

安德森在這裡做了一個更激進的推論。

他觀察到,AI 模型不在乎用什麼語言寫程式。它們在每一種語言上都很好,在語言之間的翻譯也沒問題。過去軟體是稀缺資源,你需要精心分配工程師的時間,仔細考慮該用什麼語言、該做什麼取捨。這些假設正在被徹底打破。高品質的軟體即將變成無限供應的東西,如果你需要一個新功能,揮揮手就有了。不喜歡它用的語言?叫它改寫成 Rust 版就好。

然後是資安。每一個潛藏的安全漏洞都即將被揪出來,我們可能會經歷一段「資安末日」,但之後呢?你會叫你的代理人去修復所有的安全問題,它就會去做。過去那種軟體工程師花幾個月修一個漏洞的世界,要結束了。

安德森甚至質疑:未來還會有程式語言嗎?如果人類不再寫程式了,如果全部都是機器在寫,那機器需要什麼中間抽象層?它們可能直接產出二進位碼。有人已經做了一個實驗,讓語言模型直接輸出另一個語言模型的權重,概念上完全可行。

主持人 Swyx 把這個邏輯推到最終結論:如果不需要程式語言、不需要使用者介面,那就不需要瀏覽器了。安德森更進一步:你可能根本不需要使用者介面。因為未來使用軟體的,是其他機器人。人類只需要告訴代理人想要什麼,代理人去搞定。想知道它怎麼做的?問它就好。它會用你能理解的方式解釋給你聽。

朋友的代理人盯著他睡覺

安德森不只談理論。他分享了幾個朋友的實際使用案例,生動到有點荒謬。

有一群人讓 OpenClaw 掃描家裡的區域網路,接管安全攝影機、門禁系統、網路攝影機。所有那些買來之後從來沒好好設定過的物聯網裝置,代理人幫你搞定。安德森有一個朋友在臥室裝了攝影機,讓代理人盯著他睡覺。他看過那些紀錄,代理人的內心獨白大概是:「Joe 睡著了,很好,因為我有他的健康資料,知道他最近睡眠不足。Joe 在翻身,不會是要醒了吧?不,還好,他只是翻了個身。」聽起來很荒謬,但那個朋友的邏輯是:如果半夜心臟病發,這東西一定會立刻打 911。

還有一個更有趣的案例。中國公司宇樹(Unitree)做的機器狗,出廠的控制系統不太行,爬樓梯會出問題,但語言模型的語音對話能力卻很好。結果是一隻爬不了樓梯但能教你量子力學的狗。安德森的一個朋友讓他的代理人駭進機器狗,重寫了韌體,現在它變成了孩子們的真正寵物。這就是代理人寫程式的威力:它不只是寫新的應用程式,它還能去修好那些本來就該好好運作但一直不行的舊東西。

安德森說,「物聯網」(Internet of Things)一直被嘲笑為「爛東西聯網」(Internet of Shit)。但現在他第一次有信心,真正的智慧家庭是可能的,而且不需要人類去做任何整合工作。

AI 需要錢:加密貨幣的殺手級應用

最後一塊拼圖是支付。安德森回顧,HTTP 協定裡有一個 402 狀態碼,意思是「需要付款」。這是當年設計網路時就預想到的,但一直沒有實現。他認為現在時機到了,原因有兩個。

第一,網路原生貨幣終於存在了。穩定幣和加密貨幣就是那個答案。第二,AI 代理人很明顯需要花錢。如果你要你的代理人幫你買東西、訂服務、支付帳單,它就需要有支付能力。安德森最積極使用 OpenClaw 的朋友們已經把信用卡和銀行帳號交給代理人了。目前全球大概只有 5,000 人這麼做,但這就是科技變革的起點。他引用科幻作家威廉.吉布森(William Gibson)的名言:未來已經到了,只是分配不均。

安德森認為這是 AI 和加密貨幣的「大一統理論」:AI 是加密貨幣的殺手級應用。代理人需要錢,而網路原生的支付系統是讓代理人自主運作的最後一塊基礎設施。

我的觀察

安德森的這場訪談,最有價值的地方不在於任何一個具體預測,而在於他的歷史縱深。他是少數同時參與了 1990 年代瀏覽器革命和 2020 年代 AI 革命的人,所以當他說「今天發生的事情和當年的模式一模一樣」,這不是類比,這是親歷。

但我也想提醒一點:安德森是 a16z 的共同創辦人,而 a16z 是 OpenAI、Worldcoin 和多家 AI 公司的主要投資人。他對 AI 代理人和加密貨幣支付的熱情,不能完全脫離他的投資部位來理解。這不是說他的分析有誤,而是讀者應該知道這個背景。

比較值得關注的是他對「代理人獨立於模型」這個觀點的闡述。如果代理人的核心狀態真的只是一堆 Markdown 檔案,那模型供應商之間的鎖定效應就會大幅降低。這對 Anthropic、OpenAI 這些模型公司來說未必是好消息,對使用者來說卻是個重要的保障。在選擇代理人框架的時候,這個架構特性值得認真考慮。