你的 AI 管家該長什麼樣?Dreamer 的 Sidekick 示範了 Agent 的下一步
Dreamer 平台上的 Sidekick 不只是聊天機器人,它能記住你是誰、幫你建 App、讓不同 Agent 互相合作。從自動完成的待辦清單到 25 分鐘建出的會議 App,Dreamer 展示了 AI Agent 從「工具」變成「個人作業系統」的可能性。

本文整理自《Latent Space: The AI Engineer Podcast》2026 年 3 月播出的單集。
{{< youtube TvmxWWfiYWI >}}
{{< spotify "episode/1mYToOvlWpXWuSQ9YShJ0H" >}}
{{< apple-podcast "tw/podcast/dreamer-the-personal-agent-os-david-singleton/id1674008350?i=1000756395181" >}}
那個「會自己完成的待辦清單」
OpenAI 執行長阿特曼(Sam Altman)曾經公開說過,他最想要的 AI 應用,就是一個「會自己完成的待辦清單」。這個需求聽起來很簡單,實際上非常難做。一個待辦事項可能是「回覆某封 email」,可能是「幫我研究某個競品」,也可能是「把某個人介紹給另一個人」。每一項的「完成」意味著不同的動作、不同的工具、不同的判斷。你需要一個 AI 系統,不只能理解任務,還能存取你的各種工具和資料,並且在你不盯著它的時候自主運作。
在 Dreamer 平台上,這種待辦清單已經有人做出來了。Dreamer 共同創辦人暨執行長 David Singleton 在 Latent Space 的訪談中描述了一個真實案例:一位使用者在 Dreamer 上建了一個「魔法待辦清單」Agent,每當他加入一個新項目,Agent 就會啟動一個子任務去推進那件事。有時候 Agent 會直接完成(例如發一封 email),有時候會做完研究後幫他準備好下一步。更關鍵的是,這位使用者把會議記錄工具 Granola 接上去之後,發生了一件很魔幻的事:他在會議中口頭承諾要做的事情,會自動出現在待辦清單上,然後清單會自動嘗試完成它。他在一個會議裡說要幫某人介紹一位招募候選人,結果他的招募 Agent 自動接手,在他開完會之前就處理好了。
這個案例的意義超過「實現阿特曼的願望清單」。它展示了一種全新的 AI 互動模式:多個 Agent 在同一個平台上,透過一個「交通警察」角色的個人助手互相協作,在你不在場的時候就把複雜的跨工具任務搞定了。
25 分鐘建一個會議 App
Singleton 在節目上做了一個即時展示,讓觀眾看到 Dreamer 的實際運作。他選了一個很巧妙的例子:一個會議 App。所有去過大型科技會議的人都知道,會議 App 幾乎都做得很差,花了大把錢請代理商做,結果功能陽春、體驗糟糕,而且活動結束就沒用了。Singleton 說他在兩場會議之間,花了 25 分鐘就用 Dreamer 做了一個 AI Engineer Conference 的會議 App。
這個 App 可以搜尋講者、瀏覽議程、手動把有興趣的場次加到個人行程表。但最關鍵的功能是「幫我規劃」。點下去之後,Sidekick 會解析整個會議議程,問你對哪些主題有興趣(例如 Agent、程式碼生成、推理與強化學習),然後針對每一個時段,從你可以去的場次中挑出最適合你的那一場。Sidekick 不只看議程描述,還會參考它對你的記憶,知道你平常對什麼領域特別關注。整個排程過程大約 30 到 40 秒,完成後你就有一份完全客製化的會議行程,不會有時段衝突。
這個展示真正想傳達的訊息不是「做 App 很快」,而是 Dreamer 平台上的應用天生就帶有智慧。傳統的 App 是靜態的:資料進去、介面呈現出來、你手動操作。Dreamer 上的應用是動態的:它能理解你的需求、存取外部資料、在背景執行 LLM 推理,然後給你一個量身定做的結果。而且因為 Dreamer 託管了一切(資料庫、LLM 呼叫、身份驗證),你做完一個 App 就可以立刻分享給別人用,不需要去搞 API key、資料庫服務商、部署流程。
滑雪旅行 App:為「此刻」而生的軟體
Singleton 展示的第二個案例更日常:一個滑雪旅行 App。他跟朋友去 Big Sky 滑雪之前,在 Dreamer 上做了一個小應用,整合了即時的纜車狀態(透過社群開發者建的 SkiBum 工具)、天氣預報、住宿資訊、當地餐廳推薦(由一位熟悉 Big Sky 的朋友提供的資料),以及最實用的功能:分帳。整趟旅程中,每個人把自己花的錢記進去,旅程結束後一鍵結算,系統告訴你誰該付誰多少錢。
這個例子點出了 Dreamer 想解決的一類問題:「為此刻而生」的軟體。這種軟體只在特定的時間段有用,過了就不需要了。傳統的軟體開發模式很難處理這種需求,因為開發成本跟軟體的使用壽命不成正比。但如果建一個功能完整的小應用只需要跟 AI 對話幾十分鐘,那麼為一趟三天的滑雪旅行做一個專屬 App 就完全合理了。Singleton 透過 iMessage 把連結分享給朋友,他們甚至不需要是 Dreamer 的會員,就能在手機上使用這個 App。
這種「短命軟體」的概念,其實正好接上了 vibe coding(氣氛式寫程式)的趨勢:不追求完美和永續,而是追求快速解決當下的具體問題。差別在於,Dreamer 提供了一個完整的執行環境,讓這些 vibe coded 的小應用不只停留在本地的原型階段,而是能真正被分享和使用。
記憶:AI Agent 最難的課題
如果說 Agent 的執行能力(做事)已經有了不錯的解決方案,那「記住你是誰」這件事仍然是整個產業的痛點。Singleton 在訪談中非常坦誠地分享了 Dreamer 在記憶系統上的演進過程。
最早期,他們用了業界最常見的做法:把大量事實放進向量資料庫,用 embedding 做 RAG(檢索增強生成)。這個方案能用,但帶來了超出必要的複雜度。他們也嘗試過知識圖譜(knowledge graph),結果同樣不理想。Singleton 沒有詳細透露現在用的是什麼系統,只說「跟你在其他產品上看到的類似」,但他們有不只一個人專門負責記憶功能的研發,而且這是他們持續投入最多的領域之一。
記憶的價值在具體場景中特別明顯。Singleton 舉了一個自己的例子:他在 Dreamer 上用了一個「週末活動規劃」Agent,某天早上它推薦他帶小孩去舊金山市中心看聖乃德里克節(St. Patrick's Day)遊行。為什麼?因為 Sidekick 的記憶裡知道他是愛爾蘭人。這個資訊不是他特別告訴「週末活動規劃」Agent 的,而是 Sidekick 在日常互動中學到的,然後在適當的時機分享給了這個 Agent。這種跨 Agent 的個人化體驗,只有在平台層級有統一的記憶系統時才做得到。
我的觀察:LLM 缺乏 taste,人類的角色是什麼
訪談最後,Singleton 被問到一個開放性問題:你最希望 LLM 能做到但目前還做不到的事情是什麼?他的回答不是什麼技術指標,而是一個更抽象但也更根本的概念:taste(品味)。
他觀察到一個很具體的問題:如果你用不同的 AI 模型各做一個待辦清單 App,他光看介面就能猜出是哪個模型做的。每個模型都有自己的「風格」,但這些風格都缺乏真正的個性和審美判斷。他用「AI generic slop」(AI 生成的通用垃圾)這個詞來描述這種現象。Dreamer 團隊花了大量功夫在模板、prompt 和執行框架上注入自己的品味,才讓平台上產出的應用不會看起來千篇一律。但這靠的是人類的審美判斷,不是模型本身的能力。
前 Instagram 共同創辦人 Mike Krieger 最近也說了類似的話:AI 時代最稀缺的資源不是算力,而是 taste。當所有人都能用 AI 建出一個功能完整的 App 時,決定誰的 App 會被使用者喜歡的,是設計的品味、對使用者需求的深度理解、對細節的執著。
這對 AI 產業的從業者來說是個該注意的訊號。我們投入了大量精力去討論模型的推理能力、context window 的大小、benchmark 分數的高低,但 Singleton 提醒我們,在「讓 AI 做出人類真正想要的東西」這件事上,最後一哩路不是技術問題,而是人文問題。你必須理解人、理解他們的動機、理解什麼是「令人愉悅的」。這種能力目前還無法從訓練資料中學到,量化它更是困難重重。但對於任何想在 AI Agent 時代做出差異化產品的團隊來說,培養 taste 可能比追逐最新的模型版本更重要。