AI 技術前沿

被 Google 解僱之後：Stochastic Parrots 背後的人與 AI 倫理之爭

Stochastic Parrots 論文的四位作者中，兩位被 Google 解僱，一位被迫用化名署名。但她們沒有停下來。Gebru 創辦了獨立研究機構，Mitchell 成了 Hugging Face 的首席倫理科學家，Bender 在華盛頓大學繼續戳破 AI 泡沫。這篇論文不只改變了 AI 倫理的方向，它引爆了 AI 領域最重要的一場思想之爭：我們應該擔心的是未來的超級智能，還是現在正在發生的傷害？

2021 年 2 月 28 日 · 來源： ACM Digital Library

被 Google 解僱之後：Stochastic Parrots 背後的人與 AI 倫理之爭

本文為「AI 經典文獻回顧」系列第十二篇（下），聚焦 Stochastic Parrots 論文作者群的故事、Google 解僱事件，以及這篇論文如何引爆 AI 倫理 vs AI 安全的思想之爭。上篇見〈當鸚鵡學會說話：一篇讓兩位作者丟掉工作的 AI 論文〉。

封面圖

一個名字裡的抗議

打開 Stochastic Parrots 論文的作者列，你會看到四個名字：

Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell.

最後那個名字不是亂碼。那是 Margaret Mitchell——Google AI 倫理團隊的共同負責人。

故事是這樣的。論文投稿到 FAccT 會議後，Google 的內部審查流程介入了。Google 要求 Mitchell 撤回署名——畢竟論文在批評大型語言模型，而 Google 正在花數十億美元建造大型語言模型。Mitchell 沒有撤回署名。她換了一個名字。

Shmargaret Shmitchell。

這是一種非常特殊的抗議方式。技術上，她服從了——論文上沒有出現 Margaret Mitchell 這個名字。但任何讀到這個名字的人都知道這是誰。就像一個孩子被爸媽要求道歉，嘟著嘴說「對不起」——字面上道歉了，但所有人都聽得出他一點都不覺得自己錯。

一個名字，同時完成了服從和反抗。

但事情遠遠不止一個名字。

Google 解僱事件：完整的時間線

10 月：審查開始

2020 年 10 月，Stochastic Parrots 論文提交到 ACM FAccT 2021 會議接受同行審查。同時，按照 Google 的規定，所有員工發表的論文都需要通過公司內部審查。

這套審查流程本來是為了防止員工洩漏商業機密。但在這個案例中，它被用來審查一篇批評公司核心業務方向的論文。

11 月：不通過

11 月下旬，Google 的研究管理層通知 Timnit Gebru：論文未通過內部審查。理由有兩條。

第一，論文「未充分引用 Google 在減少語言模型偏見方面的工作」。翻譯成白話就是：你批評大型語言模型有問題，但沒有提到我們正在解決這些問題。

第二，論文對環境成本的描述「過於片面」。翻譯成白話就是：你說訓練大模型很耗能，但沒有提到我們在節能方面的努力。

Google 給了兩個選項：撤回論文，或者移除所有 Google 員工的署名。

12 月 2 日：那封郵件

Gebru 不同意。她向管理層提出要求：告訴她具體是誰做出了這個審查決定，以及完整的理由。如果不能給出滿意的答案，她會考慮離開。

同一天，她發了一封內部郵件給 Google Brain Women and Allies 郵件列表。郵件的內容不只是關於論文審查。她寫到了自己作為黑人女性在 Google 的經歷、公司在多元化承諾上的落差、以及她對研究自由被壓制的沮喪。

12 月 2-3 日：「辭職」還是解僱？

Google 的回應很快，但不是 Gebru 期待的那種。

Google AI 負責人 Jeff Dean 和他的副手 Megan Kacholia 將 Gebru 那封帶有條件的郵件解讀為「辭職」。他們接受了這個「辭職」，並立即終止了 Gebru 的系統存取權限和公司帳號。

Gebru 說她從來沒有辭職。她設定了條件，等待回應——結果回應是被鎖在門外。

Jeff Dean 隨後發了一封內部信解釋這個決定。信中說，論文「忽略了太多相關研究」，「只看到負面，不提我們已經在做的改進」。這封信被洩漏給媒體，引發了風暴。

12 月 4 日起：風暴

超過 2,278 名 Google 員工簽署了一封連署信支持 Gebru。另外有 3,114 名外部學者和業界人士加入聯署。連署信要求 Google 公開說明解僱決定的依據、承諾保護研究自由、以及加強對邊緣化群體員工的保護。

這不是 Google 第一次面對員工抗議——2018 年的 Project Maven 軍事合約抗議、2018 年的性騷擾罷工都曾經引起巨大關注。但 Gebru 事件的特殊之處在於：被解僱的是一位研究 AI 倫理的黑人女性，而且解僱的原因直接跟她的研究內容有關。

這看起來不像是一個「程序爭議」。這看起來像是：公司不想聽到壞消息，所以解僱了送信的人。

2021 年 1 月：Mitchell 被調查

Gebru 被解僱後，Mitchell 開始公開為她辯護。Google 隨後對 Mitchell 展開內部調查。調查的觸發點是：Mitchell 在自己的 Google 企業信箱中搜尋與 Gebru 事件相關的通訊。Google 把這視為「違反公司安全政策」。

2021 年 2 月 19 日：Mitchell 被解僱

Mitchell 被 Google 正式解僱。官方理由是在自動化調查中被偵測到違反安全規範。

一個 AI 倫理團隊的共同負責人，因為在自己的信箱裡搜尋跟同事被解僱有關的郵件，而被解僱。

2021 年 3 月：論文發表

論文在 FAccT 2021 正式發表。此時 Gebru 已經離開 Google 三個月，Mitchell 離開一個月。

四位作者中有兩位因為這篇論文失去了工作。然後這篇論文成了 AI 倫理領域被引用最多的文獻之一。

四位作者的故事

Emily M. Bender：語言學家看 AI

Emily Bender 是華盛頓大學語言學系的冠名講座教授，也是這篇論文的通訊作者。

在一個被工程師和電腦科學家主導的領域裡，Bender 的身份很特殊：她是語言學家。她研究的不是怎麼造模型，而是語言本身。這讓她看到了工程師們看不到的東西。

2019 年，她提出了一個後來被稱為「Bender Rule」的主張：NLP 論文在描述研究時，必須標明研究的是什麼語言。聽起來理所當然？在 Bender 之前，整個 NLP 領域習慣性地把「英語」當成「語言」的代名詞。一篇論文說自己在研究「語言理解」，其實只研究了英語——但沒有人覺得需要特別說明。

2020 年，她和語言學家 Alexander Koller 發表了「章魚測試」的思想實驗（我們在上一篇已經詳細介紹過），從第一原理論證了為什麼統計語言模型不可能真正理解語言。

到了 Stochastic Parrots 論文，她把這些學術論點集中起來，形成了一個針對大型語言模型的系統性批判。

Bender 是這個故事裡唯一沒有失去工作的人——因為她在大學，不在 Google。

2026 年 2 月，Bender 仍然在華盛頓大學，繼續做同樣的事。她在兩週前（2 月 10 日）剛在 UW Kane Hall 做了一場演講，題目是〈在「AI」時代抵抗去人性化：人文學的視角〉。她出版了一本書：《The AI Con: How to Fight Big Tech's Hype and Create the Future We Want》。她在 2025 年 3 月跑去電腦歷史博物館，跟 OpenAI 的研究者公開辯論「LLM 到底有沒有理解語言」。

五年了，她還在問同一個問題。這個問題還是沒有被回答。

Timnit Gebru：從 Google 街景車到被 Google 解僱

Gebru 的故事比論文本身更戲劇性。

她出生在衣索比亞的亞的斯亞貝巴，成長於紅色恐怖之後的不穩定年代，15 歲移民到美國。在史丹佛大學攻讀博士期間，她做了一個令人難忘的研究：用 Google 街景車拍攝的 5,000 萬張照片，加上電腦視覺演算法，預測美國各社區的收入水準、種族構成和政治傾向。

這個研究同時證明了兩件事。一方面，AI 可以揭示社會結構中的不平等——你可以從一個社區停的車看出那裡住著什麼人。另一方面，同樣的技術也可以被用於監控和歧視。

2018 年，她和 Joy Buolamwini 合作發表了 Gender Shades 研究，發現商用人臉辨識系統對深膚色女性的辨識錯誤率高達 34.7%——而對淺膚色男性只有 0.8%。這個研究直接促使 IBM、Microsoft 和 Amazon 改善了它們的人臉辨識技術，甚至讓 Amazon 暫停了向執法機構出售人臉辨識服務。

同年，她提出了 Datasheets for Datasets 的概念——數據集應該附帶「數據說明書」，就像電子零件有規格書一樣，記載數據的來源、收集方法、潛在偏見。

她在 2018 年加入 Google，與 Mitchell 共同領導 Ethical AI 團隊。然後在 2020 年 12 月被解僱。

被解僱之後，Gebru 在 2021 年 12 月創辦了 DAIR Institute（Distributed Artificial Intelligence Research Institute）——一個獨立於大型科技公司的 AI 研究機構，專注於 AI 對邊緣化社群的影響。

到了 2025 年，她獲得了 NISO 的 Miles Conrad 終身成就獎。她被西班牙 El País 報紙列為科技界十大最具影響力的思想家之一。她正在撰寫一本回憶錄兼宣言：《The View from Somewhere》——標題暗指一種與矽谷「客觀中立」敘事對立的立場：每個觀點都來自某個位置，假裝沒有立場本身就是一種立場。

Margaret Mitchell：Model Cards 和化名

Mitchell 在 Google 之前就已經是 AI 倫理領域的重要研究者。她在 Aberdeen 大學拿到計算語言學博士，在 Microsoft Research 工作過，然後在 2017 年加入 Google。

她最重要的學術貢獻是 Model Cards for Model Reporting（2019）——提出 ML 模型應該附帶一張「模型卡片」，記載它的訓練數據、預期用途、效能限制、已知偏見。這個概念後來被 Hugging Face 大規模採用。現在你去 Hugging Face 上看任何一個模型，附帶的那張說明文件，概念源頭就是 Mitchell 的 Model Cards 論文。

被 Google 解僱後，Mitchell 加入了 Hugging Face，擔任 Chief Ethics Scientist。2023 年，她被《時代》雜誌選入 TIME100 AI——AI 領域最具影響力的一百人。

Shmargaret Shmitchell 這個名字，某種意義上比本名更出名。每次有人在學術會議上引用這篇論文、念到那個化名，都是在提醒所有人：Google 曾經試圖讓她消失。

Angelina McMillan-Major：被遺忘的第三位

McMillan-Major 是四位作者中最低調的。她是 Bender 在華盛頓大學的博士生，研究方向是 NLP 數據集的社會影響和語言正義。在論文中，她主要負責訓練數據偏差的分析部分——也就是論文的第二個風險論點。

她在這場風暴中沒有被解僱，因為她不在 Google 工作。但她也沒有像 Bender、Gebru、Mitchell 那樣成為公眾人物。在 AI 倫理的公眾敘事中，McMillan-Major 是那個做了重要工作、但很少被提到的人。

AI 倫理 vs AI 安全：一場至今未決的思想之爭

Stochastic Parrots 論文最深遠的影響，可能不是它對大型語言模型的批評本身，而是它引爆的一場思想之爭。

這場爭論的兩邊，代表了兩種完全不同的「AI 風險觀」。

一邊：AI 倫理派

Gebru、Bender 和 Mitchell 代表的立場很清楚：AI 的真正風險是現在正在發生的傷害。

偏見的自動化。監控技術的擴散。數據勞工被剝削。環境被破壞。邊緣化群體的聲音被壓制。這些不是假想的未來場景——它們正在發生，有具體的受害者，有可以追溯的責任鏈條。

這一派認為，把注意力放在「未來的超級智能」上，是一種精心設計的轉移焦點。你叫人擔心五十年後的終結者，他就不會追問你今天的演算法為什麼歧視黑人。

另一邊：AI 安全/對齊派

另一邊是 Anthropic、DeepMind 的安全研究者、以及更廣泛的 AI 對齊社群。他們的立場也很清楚：AI 的最大風險是未來可能出現的超級智能系統。

如果 Scaling Laws 是對的（我們在系列第十篇介紹了為什麼很多人相信它是對的），那麼遲早會出現遠超人類能力的 AI 系統。確保這些系統的行為符合人類價值觀——也就是「對齊」問題——是一個需要提前數十年研究的課題。

這一派認為，只關注「當下的傷害」固然重要，但如果不解決對齊問題，所有當下的修補在長期來看都是微不足道的。

TESCREAL：一個名字裡的批判

2023 年，Gebru 和哲學家 Émile P. Torres 共同提出了一個縮寫：TESCREAL。

Transhumanism, Extropianism, Singularitarianism, Cosmism, Rationalism, Effective Altruism, Longtermism.

超人類主義、外熵主義、技術奇點主義、宇宙主義、理性主義、有效利他主義、長期主義。

Gebru 和 Torres 的論點是：這些看似不同的意識形態其實共享一個核心信念——科技能夠（也應該）超越人類的生物限制，而當下的犧牲可以用未來的宏大願景來合理化。他們追溯了這些思想與 20 世紀優生學的歷史關聯，指出它們在矽谷 AI 圈構成了主導思潮。

TESCREAL 框架是對 AI 安全/對齊社群最尖銳的批判。它的意思是：你們口中的「保護人類免於超級 AI 的威脅」，其實是一套宗教式的意識形態，讓你們能以「拯救世界」的名義忽略正在發生的具體傷害。

2023 年暫停 AI 公開信：衝突白熱化

這場辯論在 2023 年 3 月達到了高潮。Future of Life Institute 發起了一封公開信，呼籲暫停比 GPT-4 更強大的 AI 系統開發至少六個月。超過三萬人連署，包括 Elon Musk 和一大批 AI 研究者。

Gebru 和 Bender 的反應很激烈。

Gebru 說，這封信放大了「未來反烏托邦的科幻場景」，卻完全忽略了 AI 當下正在造成的真實傷害。更諷刺的是，信中呼籲暫停「比 GPT-4 更強的模型」——但對 GPT-4 本身已經展現的偏見、幻覺、環境成本隻字未提。言下之意是：GPT-4 沒問題，只是再大就危險了。

Bender 說，這封信「充斥 AI 炒作」，而且誤用了她的研究。她的研究指向的是當下部署中的具體問題，不是假想中的未來末日。

DAIR Institute 發表了聯合聲明：AI 的傷害是真實的、正在發生的，來自當下部署自動化系統的企業和個人。監管應該聚焦於透明度、問責制、以及防止剝削性的勞動行為——而不是科幻小說裡的場景。

倫理團隊的命運

如果 Stochastic Parrots 論文是一封預言信，那麼 2023 年發生的事就是預言成真。

2023 年 3 月，Microsoft 裁撤了整個 AI Ethics and Society 團隊——大約七個人。時間點很有意思：正好是 Microsoft 全力押注 OpenAI、準備把 AI 塞進所有產品的時候。公司說他們還有一個 Responsible AI Office 在設定政策準則。但批評者指出：沒有了實際參與產品設計的倫理團隊，政策就只是一張紙。

2023 年 11 月，Meta 解散了 Responsible AI 團隊。成員被分散到 Generative AI 部門和 ML 基礎設施單位。Meta 的說法是「把負責任 AI 的理念融入每個團隊」。翻譯成白話就是：不需要一群人專門來說「不」了。

加上 2020 年底 Google 的 Ethical AI 團隊在 Gebru 和 Mitchell 離開後被重組、影響力大幅縮減，三大科技公司的 AI 倫理團隊在三年內全部被邊緣化或裁撤。

這完美驗證了 Stochastic Parrots 的一個隱含論點：當商業利益和倫理研究衝突時，倫理研究會被犧牲。不是因為倫理不重要，而是因為它妨礙了更重要的東西——營收。

2026 年 2 月：她們在哪裡

站在 2026 年 2 月回望，最值得注意的是：四位作者都沒有停下來。

Emily Bender 在華盛頓大學繼續教書和研究。她兩週前才在 Kane Hall 做了一場關於「在 AI 時代抵抗去人性化」的演講。她的書《The AI Con》在挑戰整個 AI 炒作敘事。她還在問同一個問題：語言模型到底有沒有理解語言？

Timnit Gebru 領導著 DAIR Institute，研究 AI 對非洲和全球南方社群的影響。她獲得了 NISO 的終身成就獎。她在寫回憶錄。她和 Torres 的 TESCREAL 框架正在成為批判矽谷意識形態的標準工具。

Margaret Mitchell 在 Hugging Face 擔任 Chief Ethics Scientist。她推動的 Model Cards 概念已經成為 AI 產業的標準做法。2023 年獲選 TIME100 AI。

被解僱、被邊緣化、被嘲笑為「反進步」、被指控「不懂技術」——五年之後，她們不只沒有消失，反而在各自的位置上建立了不受科技公司控制的發聲管道。

從 Scaling Laws 到 Stochastic Parrots：這個系列的轉折點

我們在第十篇和第十一篇中，看到了 AI 的一種敘事：更大的模型更強、規模遵循冪律、這是通往通用智能的道路。Kaplan 用數學畫出了這條路，Gwern 用文字賦予它信仰。

Stochastic Parrots 是這個系列中第一篇從根本上挑戰這個敘事的文獻。

它不是用更好的數學來反駁 Scaling Laws（那是 Chinchilla 在 2022 年做的事，我們後面會介紹）。它用的是一個完全不同的框架——不問「模型能做多好」，而問「模型做好的成本是什麼、由誰承擔」。不問「表現曲線會不會繼續上升」，而問「你衡量的那個表現到底代表了什麼」。

這就是為什麼一位語言學家看見了物理學家沒看見的東西。Kaplan 研究的是模型的損失函數——一個數學量。Bender 研究的是語言——一種人類現象。同一個模型，從不同的窗口望進去，看到的是完全不同的東西。

在這個系列接下來的文章中，我們會看到 AI 領域如何試圖同時回應這兩種視角。Chain-of-Thought Prompting 試圖讓模型「思考」而不只是「預測」。InstructGPT 用人類反饋來對齊模型行為——某種程度上是對 Stochastic Parrots 偏見批評的技術回應。Constitutional AI 則試圖讓安全隨規模一起擴展。

但 Bender 和 Gebru 可能會說：技術方案解決不了權力結構的問題。你可以讓鸚鵡學會避免說冒犯的話，但牠還是一隻鸚鵡。

這個爭論，在 2026 年，還遠遠沒有結束。