AI 產業動態

「無馬馬車」的教訓：YC 合夥人為何說 AI 該是作業系統，不是功能按鈕

YC 合夥人 Pete Koomen 的「無馬馬車」論述引發廣泛討論。他批評多數 AI 產品只是把 AI 當功能塞進既有軟體，正確的架構應該反過來。這集 Lightcone Podcast 更深入探討了 AI 組織需要的文化條件、聊天介面為何勝出，以及 AI 正站在中心化與個人賦權的岔路口。

2026 年 5 月 29 日 · 來源： Y Combinator Lightcone Podcast

本文整理自 Y Combinator Lightcone Podcast 2026 年 5 月播出的單集。

Gmail 的 AI 寫信功能，就是問題的縮影

Gmail 有一個 AI 寫信功能。你點一下按鈕，它幫你生成一封電子郵件草稿。聽起來很方便，但 YC 合夥人 Pete Koomen（Optimizely 共同創辦人）認為，這正是當前 AI 軟體最典型的錯誤示範。

問題出在哪裡？那個控制 AI 行為的 prompt，被開發者鎖在使用者看不到的地方。你無法修改它，無法告訴 AI 你偏好什麼語氣、什麼長度、什麼格式。開發者替你決定了 AI 應該怎麼運作，使用者只能被動接受。Pete 在他 2025 年廣為流傳的「Horseless Carriages」（無馬馬車）文章中，用這個例子來說明一個更大的問題：大多數公司在做 AI 產品的時候，只是把一小塊 AI 功能塞進一大堆傳統軟體裡。就像汽車剛發明的時候，人們做出來的東西長得像馬車，只是把馬換成了引擎。

Pete 認為，AI 真正的潛力在於把軟體的控制權從開發者轉移到使用者手中。過去的軟體開發邏輯是：開發者決定功能，使用者照著用。但 AI 讓另一種可能性浮現了。使用者可以用自然語言告訴系統自己想要什麼，系統就去執行。在這個架構下，prompt 不應該被藏起來，而是應該暴露給使用者，因為 prompt 就是新的「程式碼」。

正確的架構：Agent 包裹工具，而不是軟體包裹 AI

這篇文章的核心論點，Pete 在節目中用一句話總結：未來的 AI 原生軟體，會看起來像「Agent 包裹確定性工具」，而不是「確定性軟體包裹一點 AI」。

這個區別很重要。在傳統架構裡，軟體的主體是確定性的程式碼，AI 只是其中一個被呼叫的功能。使用者操作的還是那套固定的介面，AI 只負責填一個文字框或做一個推薦。但在 Pete 提倡的架構裡，Agent 才是主體。Agent 理解使用者的意圖，然後去呼叫各種確定性工具來完成任務。工具可能是資料庫查詢、API 呼叫、表單填寫，但控制邏輯在 Agent 手上，而 Agent 聽的是使用者的自然語言指令。

Garry Tan（YC 執行長）直接把傳統做法稱為「安全主義」（safetyism），批評那些把 prompt 鎖起來、不讓使用者碰的產品設計思維。他認為這種做法本質上是對使用者的不信任，而且嚴重限制了 AI 的實用性。

Pete 觀察到，他用過最好的 AI 軟體有一個共同特徵：非常小。程式碼量很少，只做最少的事情，讓模型本身去發光。他以開源的 Pi 框架為例。Pi 是一個極度精簡的程式碼 Agent，你甚至可以用 Pi 自己來修改和擴展 Pi。OpenClaw 就建在 Pi 之上。Pete 預測，未來大多數軟體都會以這種形態出現：極簡的起點，加上 Agent 隨時間自我擴展的能力。與其開發者事先預想所有功能，不如讓系統自己長出來。

超級組織需要什麼文化？信任、透明、還有錢

技術架構只是一半。YC 的經驗顯示，要真正讓 AI 在組織層級發揮作用，文化條件同樣關鍵。

YC 做了一個大膽的決定：所有員工與 Agent 的對話，預設公開給全體正職員工，而且會自動廣播到一個 Slack 頻道。任何人都可以進去看同事怎麼使用 Agent。Garry 坦言這個決定不容易，團隊內部討論了很久。但事後證明效果很好。首先，它變成了一種有機的學習機制。當 Garry 開始大量創意地使用 Agent 時，其他人看到了，才發現原來還可以這樣用。其次，公開廣播發揮了社會控制的作用。因為同事們都看得到你跟 Agent 說了什麼，人們自然會注意不去用 Agent 處理太過敏感的資訊。這讓 YC 可以在給 Agent 更大存取權限的同時，維持合理的資料衛生。

Garry 從這個經驗歸納出兩個他認為缺一不可的組織文化特質。第一是平等主義：組織內的每個人都能使用同樣的工具，而不是只有管理層有權限。第二是信任預設：預設信任員工會負責任地使用這些工具。他直言，這兩個特質是多數組織不具備的，尤其是那些習慣了階層式管理和嚴格權限控制的大型企業。這也是為什麼他認為這種模式最適合新創公司，因為從第一天就可以把平等和信任寫進組織的 DNA 裡。

還有一個現實條件：錢。Garry 估計，要讓一個組織現在就活在這個未來裡，每位員工每年需要花費一萬到十萬美元的 token 費用。但他強調這是一個時間套利的機會。今天花十萬美元買到的能力，兩年後只要一萬美元，再過兩年可能只要幾百美元。願意現在投入的組織，等於提前活在 2028 年，能夠跳過所有競爭對手。

為什麼聊天是最好的 AI 介面

業界一直有人呼籲要為 AI 設計全新的介面，認為聊天太原始、太受限。但 YC 的合夥人們在這集節目中表達了相反的看法。

Diana Hu（YC 合夥人）認為，那些覺得 AI 需要新介面的人，多半還沒有深度使用過現在的工具。當你越來越信任 Agent 的判斷，你其實不太需要一個豐富的 UI 去逐步檢查它做了什麼。你只要告訴它你要什麼，等結果就好。YC 合夥人 Harj Taggar 則坦承自己改變了立場。2023 年 ChatGPT 剛出來的時候，他也覺得聊天不會是 AI 的最終介面。但深度使用這些工具之後，他改變了想法。他的推理是：聊天是最接近自然語言的介面，而自然語言是最接近思維的表達方式。如果你要跟一個通用智慧互動，用語言是最自然的方式。把它塞進一個特定用途的 UI 框框裡，反而限制了它的能力。

Diana 還指出了一個容易被忽略的優勢：聊天介面天生就是多模態的。你可以給它文字、語音備忘錄、圖片、檔案。Garry 接著提出了「即時軟體」（just-in-time software）的概念。當 Agent 偶爾需要呈現一個視覺化的結果時，它可以當場生成一個單頁的 JavaScript 應用，專為那個瞬間的需求而建。不需要事先開發一個完整的 UI 來應對所有情境。

Garry 用自己的經歷來說明這個轉變。他在今年一二月間用 Claude Code 寫了大約五十萬行的 Rails 程式碼，做了一個叫 Garry's List 的專案。那是用 2013 年的 Web 2.0 思維來建的，有完整的深度研究框架、事實查核流程、複雜的評估基礎設施，全部寫死在 Ruby 檔案裡。後來他用大約三天時間把同樣的功能改寫成 G-Brain：大概一萬行 TypeScript 加上兩千行 Markdown。最關鍵的差異是，他的主編現在可以直接修改技能檔案來改變系統行為，不用碰任何程式碼。

AI 的岔路口：五大巨頭，還是個人電腦時刻

這集節目最後的討論，觸及了一個更大的問題：AI 會走向中心化，還是走向個人賦權？

Garry 描繪了兩個截然不同的未來。第一個是中心化的版本：五家巨頭控制了最先進的 AI，擁有所有的運算資源和太空資料中心，而且不讓使用者修改 prompt。就像 Gmail 的做法，但延伸到你整個數位生活。你的 AI 體驗由平台決定，你只是消費者。Garry 把這比作 1960 年代的大型主機時代，只有少數機構擁有電腦，一般人連碰都碰不到。

第二個是去中心化的版本：個人 AI 革命。每個人都可以執行自己的軟體、修改自己的 prompt、選擇自己的模型（包括開源模型）、擁有自己的私人程式碼庫。AI 成為你自身的延伸，反映你的價值觀和需求，而不是 Meta、Alphabet 或 OpenAI 的價值觀。Garry 認為我們現在就站在這個岔路口，而他把目前的狀態比作「Apple I 時刻」。就像賈伯斯和沃茲尼亞克在車庫裡焊接麵包板的年代，只賣出了五百台，但正在發現那些會改變一切的基礎原語。

他具體指出了現有工具的光譜。ChatGPT 有十億使用者，但 MCP 整合很受限，你很難把它接上自己的資料庫。Claude 稍微開放一點，但也有限制。Perplexity Computer 是主流工具中最好的版本。而 OpenClaw 和 Hermes Agent 則代表了另一端：完全的 prompt 控制、私有程式庫、自選模型。Jared Friedman 補充了一個歷史觀察：真正觸發個人電腦革命的，是人們擁有了可以自由實驗的電腦。

Pete 在最後做了一個他顯然很在意的澄清。他說他每次看到 AI 被框架成「取代人類」的敘事，都會很不舒服，因為這完全不符合他的實際經驗。從大型主機到個人電腦，再到網際網路，科技發展的主線一直是個人賦權。每一次技術躍進都讓更多人獲得了更多能力。AI 也會走同樣的路，它會消除那些讓工作痛苦的重複性勞動，讓人們能做到以前做不到的事。

但 Garry 加了一個重要的但書：這個結果不是自動發生的。企業預設是階層式管理、預設是限制存取權限、預設是領導層才有最好的工具。要走向個人賦權的那個未來，需要有人刻意做出不同的選擇。而正在看這集節目的人，就是那些會把這些選擇寫進社會結構裡的人。