「無馬馬車」的教訓:YC 合夥人為何說 AI 該是作業系統,不是功能按鈕

YC 合夥人 Pete Koomen 的「無馬馬車」論述引發廣泛討論。他批評多數 AI 產品只是把 AI 當功能塞進既有軟體,正確的架構應該反過來。這集 Lightcone Podcast 更深入探討了 AI 組織需要的文化條件、聊天介面為何勝出,以及 AI 正站在中心化與個人賦權的岔路口。

「無馬馬車」的教訓:YC 合夥人為何說 AI 該是作業系統,不是功能按鈕

本文整理自 Y Combinator Lightcone Podcast 2026 年 5 月播出的單集。

{{< youtube B246K_G7mHU >}}


Gmail 的 AI 寫信功能,就是問題的縮影

Gmail 有一個 AI 寫信功能。你點一下按鈕,它幫你生成一封電子郵件草稿。聽起來很方便,但 YC 合夥人 Pete Koomen(Optimizely 共同創辦人)認為,這正是當前 AI 軟體最典型的錯誤示範。

問題出在哪裡?那個控制 AI 行為的 prompt,被開發者鎖在使用者看不到的地方。你無法修改它,無法告訴 AI 你偏好什麼語氣、什麼長度、什麼格式。開發者替你決定了 AI 應該怎麼運作,使用者只能被動接受。Pete 在他 2025 年廣為流傳的「Horseless Carriages」(無馬馬車)文章中,用這個例子來說明一個更大的問題:大多數公司在做 AI 產品的時候,只是把一小塊 AI 功能塞進一大堆傳統軟體裡。就像汽車剛發明的時候,人們做出來的東西長得像馬車,只是把馬換成了引擎。

Pete 認為,AI 真正的潛力在於把軟體的控制權從開發者轉移到使用者手中。過去的軟體開發邏輯是:開發者決定功能,使用者照著用。但 AI 讓另一種可能性浮現了。使用者可以用自然語言告訴系統自己想要什麼,系統就去執行。在這個架構下,prompt 不應該被藏起來,而是應該暴露給使用者,因為 prompt 就是新的「程式碼」。

正確的架構:Agent 包裹工具,而不是軟體包裹 AI

這篇文章的核心論點,Pete 在節目中用一句話總結:未來的 AI 原生軟體,會看起來像「Agent 包裹確定性工具」,而不是「確定性軟體包裹一點 AI」。

這個區別很重要。在傳統架構裡,軟體的主體是確定性的程式碼,AI 只是其中一個被呼叫的功能。使用者操作的還是那套固定的介面,AI 只負責填一個文字框或做一個推薦。但在 Pete 提倡的架構裡,Agent 才是主體。Agent 理解使用者的意圖,然後去呼叫各種確定性工具來完成任務。工具可能是資料庫查詢、API 呼叫、表單填寫,但控制邏輯在 Agent 手上,而 Agent 聽的是使用者的自然語言指令。

Garry Tan(YC 執行長)直接把傳統做法稱為「安全主義」(safetyism),批評那些把 prompt 鎖起來、不讓使用者碰的產品設計思維。他認為這種做法本質上是對使用者的不信任,而且嚴重限制了 AI 的實用性。

Pete 觀察到,他用過最好的 AI 軟體有一個共同特徵:非常小。程式碼量很少,只做最少的事情,讓模型本身去發光。他以開源的 Pi 框架為例。Pi 是一個極度精簡的程式碼 Agent,你甚至可以用 Pi 自己來修改和擴展 Pi。OpenClaw 就建在 Pi 之上。Pete 預測,未來大多數軟體都會以這種形態出現:極簡的起點,加上 Agent 隨時間自我擴展的能力。與其開發者事先預想所有功能,不如讓系統自己長出來。

超級組織需要什麼文化?信任、透明、還有錢

技術架構只是一半。YC 的經驗顯示,要真正讓 AI 在組織層級發揮作用,文化條件同樣關鍵。

YC 做了一個大膽的決定:所有員工與 Agent 的對話,預設公開給全體正職員工,而且會自動廣播到一個 Slack 頻道。任何人都可以進去看同事怎麼使用 Agent。Garry 坦言這個決定不容易,團隊內部討論了很久。但事後證明效果很好。首先,它變成了一種有機的學習機制。當 Garry 開始大量創意地使用 Agent 時,其他人看到了,才發現原來還可以這樣用。其次,公開廣播發揮了社會控制的作用。因為同事們都看得到你跟 Agent 說了什麼,人們自然會注意不去用 Agent 處理太過敏感的資訊。這讓 YC 可以在給 Agent 更大存取權限的同時,維持合理的資料衛生。

Garry 從這個經驗歸納出兩個他認為缺一不可的組織文化特質。第一是平等主義:組織內的每個人都能使用同樣的工具,而不是只有管理層有權限。第二是信任預設:預設信任員工會負責任地使用這些工具。他直言,這兩個特質是多數組織不具備的,尤其是那些習慣了階層式管理和嚴格權限控制的大型企業。這也是為什麼他認為這種模式最適合新創公司,因為從第一天就可以把平等和信任寫進組織的 DNA 裡。

還有一個現實條件:錢。Garry 估計,要讓一個組織現在就活在這個未來裡,每位員工每年需要花費一萬到十萬美元的 token 費用。但他強調這是一個時間套利的機會。今天花十萬美元買到的能力,兩年後只要一萬美元,再過兩年可能只要幾百美元。願意現在投入的組織,等於提前活在 2028 年,能夠跳過所有競爭對手。

為什麼聊天是最好的 AI 介面

業界一直有人呼籲要為 AI 設計全新的介面,認為聊天太原始、太受限。但 YC 的合夥人們在這集節目中表達了相反的看法。

Diana Hu(YC 合夥人)認為,那些覺得 AI 需要新介面的人,多半還沒有深度使用過現在的工具。當你越來越信任 Agent 的判斷,你其實不太需要一個豐富的 UI 去逐步檢查它做了什麼。你只要告訴它你要什麼,等結果就好。YC 合夥人 Harj Taggar 則坦承自己改變了立場。2023 年 ChatGPT 剛出來的時候,他也覺得聊天不會是 AI 的最終介面。但深度使用這些工具之後,他改變了想法。他的推理是:聊天是最接近自然語言的介面,而自然語言是最接近思維的表達方式。如果你要跟一個通用智慧互動,用語言是最自然的方式。把它塞進一個特定用途的 UI 框框裡,反而限制了它的能力。

Diana 還指出了一個容易被忽略的優勢:聊天介面天生就是多模態的。你可以給它文字、語音備忘錄、圖片、檔案。Garry 接著提出了「即時軟體」(just-in-time software)的概念。當 Agent 偶爾需要呈現一個視覺化的結果時,它可以當場生成一個單頁的 JavaScript 應用,專為那個瞬間的需求而建。不需要事先開發一個完整的 UI 來應對所有情境。

Garry 用自己的經歷來說明這個轉變。他在今年一二月間用 Claude Code 寫了大約五十萬行的 Rails 程式碼,做了一個叫 Garry's List 的專案。那是用 2013 年的 Web 2.0 思維來建的,有完整的深度研究框架、事實查核流程、複雜的評估基礎設施,全部寫死在 Ruby 檔案裡。後來他用大約三天時間把同樣的功能改寫成 G-Brain:大概一萬行 TypeScript 加上兩千行 Markdown。最關鍵的差異是,他的主編現在可以直接修改技能檔案來改變系統行為,不用碰任何程式碼。

AI 的岔路口:五大巨頭,還是個人電腦時刻

這集節目最後的討論,觸及了一個更大的問題:AI 會走向中心化,還是走向個人賦權?

Garry 描繪了兩個截然不同的未來。第一個是中心化的版本:五家巨頭控制了最先進的 AI,擁有所有的運算資源和太空資料中心,而且不讓使用者修改 prompt。就像 Gmail 的做法,但延伸到你整個數位生活。你的 AI 體驗由平台決定,你只是消費者。Garry 把這比作 1960 年代的大型主機時代,只有少數機構擁有電腦,一般人連碰都碰不到。

第二個是去中心化的版本:個人 AI 革命。每個人都可以執行自己的軟體、修改自己的 prompt、選擇自己的模型(包括開源模型)、擁有自己的私人程式碼庫。AI 成為你自身的延伸,反映你的價值觀和需求,而不是 Meta、Alphabet 或 OpenAI 的價值觀。Garry 認為我們現在就站在這個岔路口,而他把目前的狀態比作「Apple I 時刻」。就像賈伯斯和沃茲尼亞克在車庫裡焊接麵包板的年代,只賣出了五百台,但正在發現那些會改變一切的基礎原語。

他具體指出了現有工具的光譜。ChatGPT 有十億使用者,但 MCP 整合很受限,你很難把它接上自己的資料庫。Claude 稍微開放一點,但也有限制。Perplexity Computer 是主流工具中最好的版本。而 OpenClaw 和 Hermes Agent 則代表了另一端:完全的 prompt 控制、私有程式庫、自選模型。Jared Friedman 補充了一個歷史觀察:真正觸發個人電腦革命的,是人們擁有了可以自由實驗的電腦。

Pete 在最後做了一個他顯然很在意的澄清。他說他每次看到 AI 被框架成「取代人類」的敘事,都會很不舒服,因為這完全不符合他的實際經驗。從大型主機到個人電腦,再到網際網路,科技發展的主線一直是個人賦權。每一次技術躍進都讓更多人獲得了更多能力。AI 也會走同樣的路,它會消除那些讓工作痛苦的重複性勞動,讓人們能做到以前做不到的事。

但 Garry 加了一個重要的但書:這個結果不是自動發生的。企業預設是階層式管理、預設是限制存取權限、預設是領導層才有最好的工具。要走向個人賦權的那個未來,需要有人刻意做出不同的選擇。而正在看這集節目的人,就是那些會把這些選擇寫進社會結構裡的人。