被 Google 解僱之後:Stochastic Parrots 背後的人與 AI 倫理之爭
Stochastic Parrots 論文的四位作者中,兩位被 Google 解僱,一位被迫用化名署名。但她們沒有停下來。Gebru 創辦了獨立研究機構,Mitchell 成了 Hugging Face 的首席倫理科學家,Bender 在華盛頓大學繼續戳破 AI 泡沫。這篇論文不只改變了 AI 倫理的方向,它引爆了 AI 領域最重要的一場思想之爭:我們應該擔心的是未來的超級智能,還是現在正在發生的傷害?

本文為「AI 經典文獻回顧」系列第十二篇(下),聚焦 Stochastic Parrots 論文作者群的故事、Google 解僱事件,以及這篇論文如何引爆 AI 倫理 vs AI 安全的思想之爭。上篇見〈當鸚鵡學會說話:一篇讓兩位作者丟掉工作的 AI 論文〉。

一個名字裡的抗議
打開 Stochastic Parrots 論文的作者列,你會看到四個名字:
Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell.
最後那個名字不是亂碼。那是 Margaret Mitchell——Google AI 倫理團隊的共同負責人。
故事是這樣的。論文投稿到 FAccT 會議後,Google 的內部審查流程介入了。Google 要求 Mitchell 撤回署名——畢竟論文在批評大型語言模型,而 Google 正在花數十億美元建造大型語言模型。Mitchell 沒有撤回署名。她換了一個名字。
Shmargaret Shmitchell。
這是一種非常特殊的抗議方式。技術上,她服從了——論文上沒有出現 Margaret Mitchell 這個名字。但任何讀到這個名字的人都知道這是誰。就像一個孩子被爸媽要求道歉,嘟著嘴說「對不起」——字面上道歉了,但所有人都聽得出他一點都不覺得自己錯。
一個名字,同時完成了服從和反抗。
但事情遠遠不止一個名字。
Google 解僱事件:完整的時間線
10 月:審查開始
2020 年 10 月,Stochastic Parrots 論文提交到 ACM FAccT 2021 會議接受同行審查。同時,按照 Google 的規定,所有員工發表的論文都需要通過公司內部審查。
這套審查流程本來是為了防止員工洩漏商業機密。但在這個案例中,它被用來審查一篇批評公司核心業務方向的論文。
11 月:不通過
11 月下旬,Google 的研究管理層通知 Timnit Gebru:論文未通過內部審查。理由有兩條。
第一,論文「未充分引用 Google 在減少語言模型偏見方面的工作」。翻譯成白話就是:你批評大型語言模型有問題,但沒有提到我們正在解決這些問題。
第二,論文對環境成本的描述「過於片面」。翻譯成白話就是:你說訓練大模型很耗能,但沒有提到我們在節能方面的努力。
Google 給了兩個選項:撤回論文,或者移除所有 Google 員工的署名。
12 月 2 日:那封郵件
Gebru 不同意。她向管理層提出要求:告訴她具體是誰做出了這個審查決定,以及完整的理由。如果不能給出滿意的答案,她會考慮離開。
同一天,她發了一封內部郵件給 Google Brain Women and Allies 郵件列表。郵件的內容不只是關於論文審查。她寫到了自己作為黑人女性在 Google 的經歷、公司在多元化承諾上的落差、以及她對研究自由被壓制的沮喪。
12 月 2-3 日:「辭職」還是解僱?
Google 的回應很快,但不是 Gebru 期待的那種。
Google AI 負責人 Jeff Dean 和他的副手 Megan Kacholia 將 Gebru 那封帶有條件的郵件解讀為「辭職」。他們接受了這個「辭職」,並立即終止了 Gebru 的系統存取權限和公司帳號。
Gebru 說她從來沒有辭職。她設定了條件,等待回應——結果回應是被鎖在門外。
Jeff Dean 隨後發了一封內部信解釋這個決定。信中說,論文「忽略了太多相關研究」,「只看到負面,不提我們已經在做的改進」。這封信被洩漏給媒體,引發了風暴。
12 月 4 日起:風暴
超過 2,278 名 Google 員工簽署了一封連署信支持 Gebru。另外有 3,114 名外部學者和業界人士加入聯署。連署信要求 Google 公開說明解僱決定的依據、承諾保護研究自由、以及加強對邊緣化群體員工的保護。
這不是 Google 第一次面對員工抗議——2018 年的 Project Maven 軍事合約抗議、2018 年的性騷擾罷工都曾經引起巨大關注。但 Gebru 事件的特殊之處在於:被解僱的是一位研究 AI 倫理的黑人女性,而且解僱的原因直接跟她的研究內容有關。
這看起來不像是一個「程序爭議」。這看起來像是:公司不想聽到壞消息,所以解僱了送信的人。
2021 年 1 月:Mitchell 被調查
Gebru 被解僱後,Mitchell 開始公開為她辯護。Google 隨後對 Mitchell 展開內部調查。調查的觸發點是:Mitchell 在自己的 Google 企業信箱中搜尋與 Gebru 事件相關的通訊。Google 把這視為「違反公司安全政策」。
2021 年 2 月 19 日:Mitchell 被解僱
Mitchell 被 Google 正式解僱。官方理由是在自動化調查中被偵測到違反安全規範。
一個 AI 倫理團隊的共同負責人,因為在自己的信箱裡搜尋跟同事被解僱有關的郵件,而被解僱。
2021 年 3 月:論文發表
論文在 FAccT 2021 正式發表。此時 Gebru 已經離開 Google 三個月,Mitchell 離開一個月。
四位作者中有兩位因為這篇論文失去了工作。然後這篇論文成了 AI 倫理領域被引用最多的文獻之一。
四位作者的故事
Emily M. Bender:語言學家看 AI
Emily Bender 是華盛頓大學語言學系的冠名講座教授,也是這篇論文的通訊作者。
在一個被工程師和電腦科學家主導的領域裡,Bender 的身份很特殊:她是語言學家。她研究的不是怎麼造模型,而是語言本身。這讓她看到了工程師們看不到的東西。
2019 年,她提出了一個後來被稱為「Bender Rule」的主張:NLP 論文在描述研究時,必須標明研究的是什麼語言。聽起來理所當然?在 Bender 之前,整個 NLP 領域習慣性地把「英語」當成「語言」的代名詞。一篇論文說自己在研究「語言理解」,其實只研究了英語——但沒有人覺得需要特別說明。
2020 年,她和語言學家 Alexander Koller 發表了「章魚測試」的思想實驗(我們在上一篇已經詳細介紹過),從第一原理論證了為什麼統計語言模型不可能真正理解語言。
到了 Stochastic Parrots 論文,她把這些學術論點集中起來,形成了一個針對大型語言模型的系統性批判。
Bender 是這個故事裡唯一沒有失去工作的人——因為她在大學,不在 Google。
2026 年 2 月,Bender 仍然在華盛頓大學,繼續做同樣的事。她在兩週前(2 月 10 日)剛在 UW Kane Hall 做了一場演講,題目是〈在「AI」時代抵抗去人性化:人文學的視角〉。她出版了一本書:《The AI Con: How to Fight Big Tech's Hype and Create the Future We Want》。她在 2025 年 3 月跑去電腦歷史博物館,跟 OpenAI 的研究者公開辯論「LLM 到底有沒有理解語言」。
五年了,她還在問同一個問題。這個問題還是沒有被回答。
Timnit Gebru:從 Google 街景車到被 Google 解僱
Gebru 的故事比論文本身更戲劇性。
她出生在衣索比亞的亞的斯亞貝巴,成長於紅色恐怖之後的不穩定年代,15 歲移民到美國。在史丹佛大學攻讀博士期間,她做了一個令人難忘的研究:用 Google 街景車拍攝的 5,000 萬張照片,加上電腦視覺演算法,預測美國各社區的收入水準、種族構成和政治傾向。
這個研究同時證明了兩件事。一方面,AI 可以揭示社會結構中的不平等——你可以從一個社區停的車看出那裡住著什麼人。另一方面,同樣的技術也可以被用於監控和歧視。
2018 年,她和 Joy Buolamwini 合作發表了 Gender Shades 研究,發現商用人臉辨識系統對深膚色女性的辨識錯誤率高達 34.7%——而對淺膚色男性只有 0.8%。這個研究直接促使 IBM、Microsoft 和 Amazon 改善了它們的人臉辨識技術,甚至讓 Amazon 暫停了向執法機構出售人臉辨識服務。
同年,她提出了 Datasheets for Datasets 的概念——數據集應該附帶「數據說明書」,就像電子零件有規格書一樣,記載數據的來源、收集方法、潛在偏見。
她在 2018 年加入 Google,與 Mitchell 共同領導 Ethical AI 團隊。然後在 2020 年 12 月被解僱。
被解僱之後,Gebru 在 2021 年 12 月創辦了 DAIR Institute(Distributed Artificial Intelligence Research Institute)——一個獨立於大型科技公司的 AI 研究機構,專注於 AI 對邊緣化社群的影響。
到了 2025 年,她獲得了 NISO 的 Miles Conrad 終身成就獎。她被西班牙 El País 報紙列為科技界十大最具影響力的思想家之一。她正在撰寫一本回憶錄兼宣言:《The View from Somewhere》——標題暗指一種與矽谷「客觀中立」敘事對立的立場:每個觀點都來自某個位置,假裝沒有立場本身就是一種立場。
Margaret Mitchell:Model Cards 和化名
Mitchell 在 Google 之前就已經是 AI 倫理領域的重要研究者。她在 Aberdeen 大學拿到計算語言學博士,在 Microsoft Research 工作過,然後在 2017 年加入 Google。
她最重要的學術貢獻是 Model Cards for Model Reporting(2019)——提出 ML 模型應該附帶一張「模型卡片」,記載它的訓練數據、預期用途、效能限制、已知偏見。這個概念後來被 Hugging Face 大規模採用。現在你去 Hugging Face 上看任何一個模型,附帶的那張說明文件,概念源頭就是 Mitchell 的 Model Cards 論文。
被 Google 解僱後,Mitchell 加入了 Hugging Face,擔任 Chief Ethics Scientist。2023 年,她被《時代》雜誌選入 TIME100 AI——AI 領域最具影響力的一百人。
Shmargaret Shmitchell 這個名字,某種意義上比本名更出名。每次有人在學術會議上引用這篇論文、念到那個化名,都是在提醒所有人:Google 曾經試圖讓她消失。
Angelina McMillan-Major:被遺忘的第三位
McMillan-Major 是四位作者中最低調的。她是 Bender 在華盛頓大學的博士生,研究方向是 NLP 數據集的社會影響和語言正義。在論文中,她主要負責訓練數據偏差的分析部分——也就是論文的第二個風險論點。
她在這場風暴中沒有被解僱,因為她不在 Google 工作。但她也沒有像 Bender、Gebru、Mitchell 那樣成為公眾人物。在 AI 倫理的公眾敘事中,McMillan-Major 是那個做了重要工作、但很少被提到的人。
AI 倫理 vs AI 安全:一場至今未決的思想之爭
Stochastic Parrots 論文最深遠的影響,可能不是它對大型語言模型的批評本身,而是它引爆的一場思想之爭。
這場爭論的兩邊,代表了兩種完全不同的「AI 風險觀」。
一邊:AI 倫理派
Gebru、Bender 和 Mitchell 代表的立場很清楚:AI 的真正風險是現在正在發生的傷害。
偏見的自動化。監控技術的擴散。數據勞工被剝削。環境被破壞。邊緣化群體的聲音被壓制。這些不是假想的未來場景——它們正在發生,有具體的受害者,有可以追溯的責任鏈條。
這一派認為,把注意力放在「未來的超級智能」上,是一種精心設計的轉移焦點。你叫人擔心五十年後的終結者,他就不會追問你今天的演算法為什麼歧視黑人。
另一邊:AI 安全/對齊派
另一邊是 Anthropic、DeepMind 的安全研究者、以及更廣泛的 AI 對齊社群。他們的立場也很清楚:AI 的最大風險是未來可能出現的超級智能系統。
如果 Scaling Laws 是對的(我們在系列第十篇介紹了為什麼很多人相信它是對的),那麼遲早會出現遠超人類能力的 AI 系統。確保這些系統的行為符合人類價值觀——也就是「對齊」問題——是一個需要提前數十年研究的課題。
這一派認為,只關注「當下的傷害」固然重要,但如果不解決對齊問題,所有當下的修補在長期來看都是微不足道的。
TESCREAL:一個名字裡的批判
2023 年,Gebru 和哲學家 Émile P. Torres 共同提出了一個縮寫:TESCREAL。
Transhumanism, Extropianism, Singularitarianism, Cosmism, Rationalism, Effective Altruism, Longtermism.
超人類主義、外熵主義、技術奇點主義、宇宙主義、理性主義、有效利他主義、長期主義。
Gebru 和 Torres 的論點是:這些看似不同的意識形態其實共享一個核心信念——科技能夠(也應該)超越人類的生物限制,而當下的犧牲可以用未來的宏大願景來合理化。他們追溯了這些思想與 20 世紀優生學的歷史關聯,指出它們在矽谷 AI 圈構成了主導思潮。
TESCREAL 框架是對 AI 安全/對齊社群最尖銳的批判。它的意思是:你們口中的「保護人類免於超級 AI 的威脅」,其實是一套宗教式的意識形態,讓你們能以「拯救世界」的名義忽略正在發生的具體傷害。
2023 年暫停 AI 公開信:衝突白熱化
這場辯論在 2023 年 3 月達到了高潮。Future of Life Institute 發起了一封公開信,呼籲暫停比 GPT-4 更強大的 AI 系統開發至少六個月。超過三萬人連署,包括 Elon Musk 和一大批 AI 研究者。
Gebru 和 Bender 的反應很激烈。
Gebru 說,這封信放大了「未來反烏托邦的科幻場景」,卻完全忽略了 AI 當下正在造成的真實傷害。更諷刺的是,信中呼籲暫停「比 GPT-4 更強的模型」——但對 GPT-4 本身已經展現的偏見、幻覺、環境成本隻字未提。言下之意是:GPT-4 沒問題,只是再大就危險了。
Bender 說,這封信「充斥 AI 炒作」,而且誤用了她的研究。她的研究指向的是當下部署中的具體問題,不是假想中的未來末日。
DAIR Institute 發表了聯合聲明:AI 的傷害是真實的、正在發生的,來自當下部署自動化系統的企業和個人。監管應該聚焦於透明度、問責制、以及防止剝削性的勞動行為——而不是科幻小說裡的場景。
倫理團隊的命運
如果 Stochastic Parrots 論文是一封預言信,那麼 2023 年發生的事就是預言成真。
2023 年 3 月,Microsoft 裁撤了整個 AI Ethics and Society 團隊——大約七個人。時間點很有意思:正好是 Microsoft 全力押注 OpenAI、準備把 AI 塞進所有產品的時候。公司說他們還有一個 Responsible AI Office 在設定政策準則。但批評者指出:沒有了實際參與產品設計的倫理團隊,政策就只是一張紙。
2023 年 11 月,Meta 解散了 Responsible AI 團隊。成員被分散到 Generative AI 部門和 ML 基礎設施單位。Meta 的說法是「把負責任 AI 的理念融入每個團隊」。翻譯成白話就是:不需要一群人專門來說「不」了。
加上 2020 年底 Google 的 Ethical AI 團隊在 Gebru 和 Mitchell 離開後被重組、影響力大幅縮減,三大科技公司的 AI 倫理團隊在三年內全部被邊緣化或裁撤。
這完美驗證了 Stochastic Parrots 的一個隱含論點:當商業利益和倫理研究衝突時,倫理研究會被犧牲。不是因為倫理不重要,而是因為它妨礙了更重要的東西——營收。
2026 年 2 月:她們在哪裡
站在 2026 年 2 月回望,最值得注意的是:四位作者都沒有停下來。
Emily Bender 在華盛頓大學繼續教書和研究。她兩週前才在 Kane Hall 做了一場關於「在 AI 時代抵抗去人性化」的演講。她的書《The AI Con》在挑戰整個 AI 炒作敘事。她還在問同一個問題:語言模型到底有沒有理解語言?
Timnit Gebru 領導著 DAIR Institute,研究 AI 對非洲和全球南方社群的影響。她獲得了 NISO 的終身成就獎。她在寫回憶錄。她和 Torres 的 TESCREAL 框架正在成為批判矽谷意識形態的標準工具。
Margaret Mitchell 在 Hugging Face 擔任 Chief Ethics Scientist。她推動的 Model Cards 概念已經成為 AI 產業的標準做法。2023 年獲選 TIME100 AI。
被解僱、被邊緣化、被嘲笑為「反進步」、被指控「不懂技術」——五年之後,她們不只沒有消失,反而在各自的位置上建立了不受科技公司控制的發聲管道。
從 Scaling Laws 到 Stochastic Parrots:這個系列的轉折點
我們在第十篇和第十一篇中,看到了 AI 的一種敘事:更大的模型更強、規模遵循冪律、這是通往通用智能的道路。Kaplan 用數學畫出了這條路,Gwern 用文字賦予它信仰。
Stochastic Parrots 是這個系列中第一篇從根本上挑戰這個敘事的文獻。
它不是用更好的數學來反駁 Scaling Laws(那是 Chinchilla 在 2022 年做的事,我們後面會介紹)。它用的是一個完全不同的框架——不問「模型能做多好」,而問「模型做好的成本是什麼、由誰承擔」。不問「表現曲線會不會繼續上升」,而問「你衡量的那個表現到底代表了什麼」。
這就是為什麼一位語言學家看見了物理學家沒看見的東西。Kaplan 研究的是模型的損失函數——一個數學量。Bender 研究的是語言——一種人類現象。同一個模型,從不同的窗口望進去,看到的是完全不同的東西。
在這個系列接下來的文章中,我們會看到 AI 領域如何試圖同時回應這兩種視角。Chain-of-Thought Prompting 試圖讓模型「思考」而不只是「預測」。InstructGPT 用人類反饋來對齊模型行為——某種程度上是對 Stochastic Parrots 偏見批評的技術回應。Constitutional AI 則試圖讓安全隨規模一起擴展。
但 Bender 和 Gebru 可能會說:技術方案解決不了權力結構的問題。你可以讓鸚鵡學會避免說冒犯的話,但牠還是一隻鸚鵡。
這個爭論,在 2026 年,還遠遠沒有結束。