AI slop 不是新問題、Token-maxing 是雜訊:Liz Reid 給 Google 內部的三個提醒

Google 搜尋副總裁 Liz Reid 在 Bloomberg Odd Lots 上拆解三個常被誤讀的 AI 焦慮:AI slop 早就有人類版(Mahalo 木琴文 15 年前就在做)、Meta 的 Token-maxing 排行榜是雜訊不是目標、未來介面不會收斂成單一聊天框。她對 AI 過度樂觀的反論,比擁抱論還清醒。

AI slop 不是新問題、Token-maxing 是雜訊:Liz Reid 給 Google 內部的三個提醒

本文整理自 Bloomberg《Odd Lots》Podcast 2026 年 4 月 23 日播出的單集,受訪者為 Google 搜尋副總裁 Liz Reid。本系列共三篇,這是第三篇談 AI slop、Token-maxing 與未來介面的三個誤讀。第一篇談擴張論與廣告辯護,第二篇談使用者從關鍵字轉向自然語言的最大行為轉向。

{{< youtube DP8qe2Qo2-s >}}

{{< apple-podcast "tw/podcast/googles-liz-reid-on-who-will-own-search-in-a-world-of-ai/id1056200096?i=1000763214881" >}}


「AI 出現之前,slop 早就有了」:木琴文的 15 年前奇觀

Tracy Alloway 在訪談一開始就拋出一個很多媒體人最關心的疑慮:AI 生成的低品質內容,所謂的「AI slop」,會不會把搜尋結果汙染到無法使用?這個焦慮在過去兩年幾乎變成科技圈的共識:模型成本越低、生成速度越快,垃圾文章就越多,最後使用者打開 Google 看到的只剩下 AI 量產的廢話。Reid 給出的答案出乎意料地冷靜,她直接說:「AI slop 之前,就已經有 slop 了。」

這句話聽起來像在替 AI 開脫,但她的論述其實是反向的:問題從來不是「誰在生成垃圾」,而是「Google 怎麼排除垃圾」。她指出 Google 二十多年的核心能力其實只有一件事,叫做排序。「我們爬的網頁比我們建立索引的網頁多得多,建立索引的網頁裡,又有非常多永遠不會出現在搜尋結果裡。」這幾層篩選機制是 Google 對抗 slop 的真正防線,跟內容是人類寫的還是 AI 寫的無關。生成端的成本變低,過濾端只要持續變強就不會崩潰。

Joe Wiesenthal 接著補了一段非常精采的歷史回憶,徹底打破「AI slop 是新現象」這個迷思。他提到 Jason Calacanis 在 2009 年創辦的新創公司 Mahalo。Mahalo 的商業模式幾乎可以被視為「人類版 AI slop 工廠」:他們付錢給人類寫手量產低品質的「教學文」,主題涵蓋一切可以被搜尋的長尾關鍵字,目的純粹就是堵在 Google 結果頁的前面、騙到流量、變現廣告。

這集訪談最逗趣的時刻就出現在這裡。Joe 跟 Tracy 一起回憶 Mahalo 那篇被流傳成業界笑柄的「How to Play the Xylophone」(如何彈奏木琴)文章。Joe 念出他記得的步驟:「第一步,決定你想不想學彈木琴。第二步,買一個木琴。第三步,學讀樂譜。」Tracy 聽完當場大笑,現場錄音可以聽到她笑到差點接不下去。這個荒謬的真實案例證明了一件事:人類 15 年前就用同樣低成本、同樣量產、同樣靠關鍵字湊數的方式在製造 slop,差別只在於當年是用付錢給人類、現在用 AI 自動生成。

Reid 的論點被這個歷史對照徹底鞏固。她說 Google 對抗低品質內容的努力是「持續性的工程」,因為製造 slop 永遠都會有財務動機,無論技術介質怎麼變。她形容這場戰役從來沒有結束的一天,但這也正是 Google 的優勢所在:他們在這場戰役裡已經投入了 20 多年的肌肉。OpenAI、Anthropic 這類純 AI 公司即使生成端比 Google 強,也還沒有打過任何一場「過濾大規模對抗性垃圾」的戰役。

Token-maxing:當 KPI 變成下水道,雜訊就會被放大

訪談中段轉到了一個讓 Reid 露出近年罕見銳利態度的話題。Joe 引述了商業媒體 The Information 最近的一篇報導,揭露 Meta 內部建立了一個「Token 使用量排行榜」,把每個員工每天用了多少 AI 工具、消耗多少 token 全部排出來、公開比拼。這個做法在矽谷掀起一波討論:有人說這是擁抱 AI 的合理量化;有人說這是把員工逼瘋的反向激勵。Reid 的反應比較像是後者。

她直接拆穿這個邏輯的脆弱:「所有的代理指標如果被當成終極目標,最後都會壞掉。」她解釋的場景非常具體:如果你把 token 消耗量當成績效指標,員工就會去想辦法「燒 token」。最容易發生的是「設計一些什麼也沒做的背景任務、把模型推論掛在那裡空轉」這種純粹為了刷指標的行為。最後排行榜上看起來大家都很努力用 AI,但實際的工作產出、工作品質沒有任何提升,組織的真實 AI 採用率反而被這個排行榜給扭曲。

不過 Reid 也沒有完全否定這類排行榜的價值。她的態度是相當成熟的:「這是一個有雜訊的訊號,但它確實是一個訊號。所以你應該去看它、把它當作『哪裡值得進一步調查』的線索。但你不應該把它當成最終的判決。」她舉了一個比較合理的使用方式:如果你的團隊裡有一個人完全沒有用 AI 工具、token 消耗量明顯偏低,這值得你去找他聊一聊,看看是不是有需要訓練、是不是有他卡關的地方。但你不應該根據這個數字直接給出績效評鑑。

這個觀點對任何在做 AI 內部採用的公司都很重要。她實際上在說:領導力的價值是「在代理指標上加上判斷」。如果一個 KPI 簡單到 LLM 都能算,那它就不該是領導者的最終決策依據。Reid 用了一個含蓄但精準的話術:「這需要領導力,需要判斷力。」這句話在她整集訪談裡反覆出現,也許是她對矽谷當下這股「用排行榜管理一切」的浪潮最直接的反論。

她順帶補了一個細節:實驗本身是有價值的。「我們希望大家有機會去實驗這些工具,因為你必須先用過、知道它能做什麼,才能想出更好的工作方式。」但實驗的價值不是用 token 數量來衡量的,是用「你最後改變了多少工作方式」來衡量。這兩者之間的差距,就是領導力該補的位置。

未來介面:別期待單一聊天框,反而期待形式因子的繼續分化

訪談接近尾聲時,Joe 跟 Tracy 拋出一個所有 AI 觀察者都在問的問題:未來 5 到 10 年,使用者還會打開 Google.com 這個網頁、輸入一個查詢嗎?還是所有事情都會變成跟 AI 對話、跟個人代理對話?Reid 的答案是相當保留的:「不要說 5 年,現在連 1 年的預測都很難。」但她接下來給出的觀察其實比一個直接的預測更有重量。

她的核心論點是:歷史上每一次形式因子(form factor)的演進,都不是「新介面殺掉舊介面」,而是「新介面加進來,跟舊介面共存」。她舉的對照很清楚:筆電沒有殺掉桌機,手機沒有殺掉筆電,智慧手錶沒有殺掉手機,AR 眼鏡也不會殺掉手錶。每一次新介面進場,整個生態多了一個選項,但舊選項依然有它的角色。她預期 AI 介面也會走同樣的路:未來會有更多介面共存,但不會有一個「萬能聊天框」殺掉所有其他形式。

她拿 Google 自己的產品線當佐證。「YouTube 跟 Google 搜尋都是搜尋產品,可是它們從來沒有合併成一個。為什麼?因為它們各自服務不同的需求、不同的使用情境。」她接著舉 Chrome 跟 Google App 的並存:在手機上同一個使用者會在 Chrome 跟 Google App 之間切換,看似冗餘,但其實兩者各有各的最佳使用場景。「太早把不同產品合併在一起的風險是,你最後變成『每件事都做得還可以、沒有一件事做得特別好』。」

Reid 在這段對話裡甚至允許自己短暫地科幻一下。她半玩笑地說:「也許 5 年後會有第三個產品,把 Google.com 跟 Gemini 都取代掉。也許那時候你跟你的個人代理講話,個人代理代你跟所有產品溝通,你不直接跟任何產品互動。」這句話聽起來像是在預示某種「個人代理時代」的到來,但她緊接著又收回那個過度樂觀的姿態:「我不知道,誰也不知道。」

她對「聊天介面萬能」這個假設的反論特別精彩。她舉一個任何用過 LLM 的人都有共鳴的例子:「假設我給你一個有 10 個項目的清單,我希望你幫我把第 10 項的標題拿掉,因為太長了。在聊天介面裡你要怎麼指示?你要打『請刪除清單第 10 項那個過長的標題』,模型還可能聽錯。但在傳統的圖形介面裡,這只是一個直接點擊跟刪除的動作。」

這個對比點出了聊天介面的根本侷限:對於需要「精確操作、空間定位、直接視覺回饋」的任務,聊天反而是個爛介面。Reid 認為未來的設計是「對的任務用對的介面」,不是「全部都丟給聊天」。她講了一句相當有畫面的話:「未來的資訊存取會更個人化、更動態、更環境感知,但絕對不會是一個尺寸適合所有人的單一介面。」

三個提醒拼起來:對 AI 樂觀派的清醒提示

把 Liz Reid 在這集訪談對「AI slop」、「Token-maxing」、「未來介面」的三個觀點拼起來看,會發現一個有趣的共同點。她對 AI 的態度其實非常擁抱,畢竟她是 Google 搜尋副總裁、整集都在替 AI Overview 辯護。但她對「AI 帶來的變化要怎麼解讀」這件事,反而比一般的 AI 樂觀派更冷靜、更有歷史感。這三個提醒其實是同一個底層思路的三個面向。

第一個提醒是「歷史上的 slop 早就存在」。AI slop 不是新現象,是舊現象換了介質。當你把這個視角拿來看其他 AI 焦慮,比方「AI 會讓社群媒體變得更糟」、「AI 會讓詐騙更氾濫」、「AI 會讓深偽影片崩壞信任」,你會發現大部分擔憂的本質都是「過去就存在的問題現在變得更便宜更快」。問題的核心在於對抗那個問題的機制夠不夠強,不在於介質本身。Google 有 20 多年的排序肌肉,所以對 AI slop 相對淡定;其他公司、其他平台、其他生態系不見得有同樣的肌肉,這才是真正該擔心的事。

第二個提醒是「代理指標被當作目標就會壞掉」。Token-maxing 的故事是個經典的 Goodhart's law 案例:當一個衡量指標被拿來當作目標,它就不再是好的衡量指標。這個觀察適用於 AI 時代很多被狂熱推崇的指標:使用者跟 AI 對話的次數、AI 工具的滲透率、模型 API 的呼叫量、prompt 的長度。這些都是潛在的代理指標,都需要領導力在上面加上判斷。Reid 的話是:「需要判斷力。」這句話在自動化年代特別值錢。

第三個提醒是「介面不會收斂」。這個觀察直接打臉「AGI 來了之後一個聊天框搞定一切」這個浪漫的敘事。Reid 用了形式因子歷史、聊天介面侷限、Google 自家多產品線並存三個證據,把這個假設拆得相當徹底。實務上的意義是:投入到「單一萬能介面」的賭注可能很危險,因為使用者會繼續分化、會繼續為不同任務挑不同工具、會繼續對「直接視覺操作」這類非聊天介面有需求。

這三個提醒整體拼出 Reid 看 AI 的姿態:不否認重大變化,也不被當下的浪潮帶著走。她在訪談最後給出一個輕描淡寫但意味深長的結語,回應 Tracy 對 AI slop 的擔憂:「我相信 AI 也會生產出比過去人類版本好得多的東西。整個生態的平均品質會上升,這是好事。我們的工作是確保『平均品質上升』這件事真的兌現,而不是被那些製造廉價內容的人吃掉。」

訪談結束前,Joe 給 Tracy 跟自己做了一個小結。他說,整集訪談他覺得 Reid 最有力的論點不是「使用者會留在 Google」,而是「AI 把整個查詢量打開了一個新層次」這件事。Tracy 也接著補:「在這之前我都沒想過搜尋的總量是會擴張的。」這個收尾呼應了本系列第一篇談到的擴張論。當所有人擔心 AI 會吃掉舊生意時,少數人問的是「AI 會不會打開新生意」。Liz Reid 給的這三個提醒,正是這個少數派視角下的延伸:不要被表面的恐慌帶著走,不要把代理指標當作目標,不要押注一個介面通吃所有任務。在 AI 變化最快的這個時刻,這種冷靜也許比熱情更稀缺。