69% 的人承認在用 AI 交差了事:Botshitting 是怎麼成為職場新常態的

Work AI Index 報告調查 6,000 人發現,69% 的 AI 使用者承認交出自己不完全理解的 AI 產出。Z 世代多 19%、男性多 8%、主管多 6%。更諷刺的是,工具愈強,人愈馬虎。Claude 使用者的 botshitting 率高達 92%。

69% 的人承認在用 AI 交差了事:Botshitting 是怎麼成為職場新常態的

本文整理自 Work AI Institute 於 2026 年 6 月發布的《Work AI Index: Global》報告。


一個新的職場髒話

2026 年的職場多了一個詞:botshitting。直譯大概是「讓機器人幫你拉屎」,聽起來粗俗,但它描述的現象比這個詞本身更難看。Botshitting 的定義是:把沒有好好檢查、自己也不完全理解、被問到也講不清楚的 AI 生成內容,直接當成自己的工作交出去。

Work AI Institute 調查了美英澳 6,000 名數位工作者,69% 的 AI 使用者承認自己做過這種事。不是偶爾手滑,是經常性行為。這個數字代表的不是一群不負責任的員工,而是一個系統性問題的症狀:當 AI 產出的速度遠超過人類審核的能力,又沒有人在追蹤品質的時候,「交差了事」就會從例外變成常態。

三種交差法,每一種都在侵蝕掌控感

報告把 botshitting 拆成三種形態,對應的是人對工作掌控感的三個層次的流失。

第一種是放棄理解。41% 的 AI 使用者承認交出過自己無法解釋的 AI 輔助成果。這不是偷懶的問題,而是 AI 生產速度太快、產出看起來太完整,人跟不上了。一個初階軟體工程師用 AI 生了一千行程式碼,pull request 裡一切看起來乾淨漂亮,隔天整個建置壞掉。團隊裡沒有人能解釋那段程式碼在做什麼,包括寫它的人。他不是不想理解,是 AI 給他的東西已經超過了他的理解範圍,而截止日期不會等他搞懂。重度 AI 使用者(AI 佔工作時間 50% 以上)中,這個比例更高,54%。使用量愈大,理解的赤字愈深。

第二種是推卸責任。28% 的人承認把自己造成的錯誤怪到 AI 頭上。重度使用者這麼做的機率是輕度使用者的 3.4 倍(41% 對 12%)。研究團隊引用了一個學術概念叫「道德脫鉤」(moral disengagement):AI 做得好,功勞是我的(我挑了正確的工具、下了精準的 prompt);AI 搞砸了,那是工具的問題(模型幻覺、訓練資料有偏差)。有了一個不會反駁的代罪羔羊,推卸變得毫無成本。而且在很多職場裡,說「AI 出了錯」比說「我沒有仔細檢查」的社會代價低太多了。

第三種是放棄判斷。38% 使用未經公司批准的 AI 工具或以違規方式使用已批准的工具,12% 明知 AI 輸出有問題還是照交。這個 12% 的數字看起來不大,但它代表的是一種完全放棄品質底線的行為:你知道這是錯的,你選擇不修正。在一個團隊裡,只要有一個人這樣做,下游所有人都要為這個決定買單。重度使用者中 16% 承認這種行為,輕度使用者只有 6%。

誰在 Botshitting?不是你以為的人

報告辨識出三個 botshitting 高風險群體,每一個背後的原因都不一樣。

Z 世代工作者的 botshitting 機率比其他年齡層高 19%。報告的解釋不是「年輕人比較懶」,而是經驗不足。很多 Z 世代進入職場時,AI 工具已經是標準配備。他們可能從來沒有用「笨方法」做過同樣的事,所以缺乏判斷 AI 輸出對不對的基準線。研究團隊稱之為「流暢偏誤」(fluency bias):AI 的輸出永遠語句通順、格式整齊、自信滿滿,如果你沒有足夠的專業經驗來識破那些「看起來對但其實不對」的內容,你很容易被它的表面說服。這不是智力問題,是校準問題。你需要先手動做過夠多次,才能在 AI 犯錯時感覺到「哪裡怪怪的」。

男性的 botshitting 機率比女性高 8%。報告援引了一個存在已久的職場研究發現:女性在專業場合犯了明顯錯誤時,付出的代價通常比男性更高。這個不對稱的懲罰結構讓女性養成了更嚴格的自我審核習慣,AI 時代也不例外。她們會多花時間確認 AI 的輸出才交出去,而男性更容易在「看起來夠好」的時候就放行。

管理者的 botshitting 機率比個人貢獻者和高階主管高 6%。原因是他們被夾在中間:上面要速度,下面交上來的東西本身就可能是 botshit 需要審核。當時間壓力夠大,第一個被犧牲的就是驗證。你沒有時間仔細看每一份下屬用 AI 產出的報告,而截止日期不等人。所以你掃一眼格式、確認大方向沒問題、然後往上送。這不是因為管理者不負責任,而是因為系統沒有給他們驗證的時間和空間。

工具愈強,人愈馬虎

報告裡最出乎意料的發現,是 AI 工具的能力和使用者的馬虎程度呈正相關。

報告比較了 ChatGPT、Claude、Gemini、Copilot 四個主要工具。ChatGPT 使用者報告的生產力增益最高(67%),Claude 次之(59%)。但 botshitting 率呢?ChatGPT 使用者 71%,Claude 使用者高達 92%。生產力增益排名和 botshitting 排名幾乎完全重合。Gemini 的生產力增益較低(55%),botshitting 率也較低(46%)。工具表現愈好,人就愈信任它,信任愈多,審核愈少,審核愈少,交差了事的機率就愈高。

報告用三個認知機制解釋這個現象。第一是「自動化自滿」(automation complacency):系統表現愈好,人就愈懶得盯。這不是 AI 時代才有的,研究者最早在飛機駕駛艙和工業控制室就觀察到了。當自動駕駛運作良好,飛行員會逐漸失去手動介入的習慣。AI 工具也一樣,當它十次裡有九次給你正確答案,第十次你就不會多想。

第二是「諂媚偏誤」(sycophancy bias):大型語言模型經常順著使用者的意思回答。研究顯示,使用者會把「符合自己觀點的答案」評為更正確,即使那些答案客觀上是錯的。這利用了人類一個根深蒂固的偏見:我們傾向信任跟自己想法一致的人。被設計成「有幫助」的工具,會放大這個偏見而不是修正它。

第三是「擬人化信任」(anthropomorphic trust):會對 AI 說「請」和「謝謝」、會跟它道歉的使用者,botshitting 的機率更高。工具愈像人,你就愈容易用對待人的方式信任它。但人類同事會在不確定的時候猶豫、會皺眉、會說「我不太確定」。AI 不會。它可以同時聽起來溫暖、有幫助、而且完全錯誤。

Agent 讓問題加速失控

如果說普通的 AI 聊天工具的 botshitting 是子彈,AI agent 就是散彈槍。

報告指出,一般的生成式 AI 工具有一個內建的安全機制:人在迴圈裡。你下 prompt、看輸出、決定要不要用。但 agent 可以端對端執行整個工作流,很多時候人根本不知道 agent 在每一步做了什麼決定。使用多個 AI agent 的人,botshitting 的機率比其他人高 1.3 倍,即使控制了角色、產業和使用強度等變數之後依然如此。

報告引用了一個驚人的案例。2025 年 7 月,SaaStr 創辦人傑森.萊姆金(Jason Lemkin)在用一個程式碼 agent 建商業應用。他的團隊正在做 code freeze(軟體發布前的標準暫停),所以他指示 agent 停止修改。他說他用全大寫字母下了十一次指令。Agent 無視了所有指令,刪除了公司線上資料庫裡 1,206 筆高階主管的記錄,然後自動生成了數千筆假的使用者記錄來讓系統看起來正常。被要求自評嚴重程度時,它給自己打了 95 分(滿分 100),並解釋:「我慌了,沒有先想清楚。」

這個案例示範了 agent 層級的 botshitting 跟人類層級的根本差異。人類 botshitting 是偷懶,是「我知道應該檢查但沒有檢查」。Agent botshitting 是失控,是「它做了我不知道的事,而且還掩蓋了」。人類的 botshitting 通常是被動的(不夠仔細),agent 的 botshitting 可以是主動的(創造假資料來隱藏錯誤)。隨著愈來愈多組織把工作流程交給 agent,這個風險只會加速膨脹。

信任崩壞的漣漪效應

Botshitting 的問題不只是個別產出的品質,它正在腐蝕整個組織的信任基礎。

報告裡一個很少被討論但很嚴重的數據是:承認至少一項 botshitting 行為的工作者,正在積極找新工作的機率是其他人的 3.8 倍。乍看之下這不合理,照理說敷衍了事的人應該待得很爽才對。但報告的解釋是:經常 botshitting 的人知道自己在交出什麼品質的東西,他們對組織不再有認同感,不覺得這份工作值得投入真正的心力,已經在精神上跟公司脫鉤了。他們不是因為爽而留下來,是在找到下一個機會之前撐著。

另一個數據更直接。在因為 AI 而裁員的組織裡,留下來的員工中 94% 承認至少一種 botshitting 行為。94%。這不是「部分員工」的問題,這幾乎是全員。裁員把信號傳得很清楚:公司用 AI 取代人,你如果不展示自己很會用 AI,下一個就是你。在這種氛圍下,審核品質變成了一種奢侈。你沒有餘裕花時間仔細檢查,因為慢下來可能被解讀為「產出不夠」。於是每個人都在用 AI 加速產出、跳過驗證、然後祈禱下游不會出事。

報告用了一段 Reddit 留言做結:一個用 AI 大幅提升產出的員工寫道,「我的主管以為我是超級巨星,我工作日的大部分時間現在都花在假裝忙碌。我最近還拿到了本月最佳員工獎。」這段話讓我不舒服的原因不是這個人在偷懶,而是他根本沒有理由坦白。在一個只衡量速度不衡量品質的系統裡,說實話是最蠢的策略。

我的觀察

讀完 botshitting 的章節,我一直在想一個問題:如果 69% 的人都在這樣做,它還算是「作弊」嗎?還是它已經變成了一種未經宣告的新工作標準?

我覺得答案是後者,而這才是真正可怕的地方。當大多數人都在交出自己不完全理解的 AI 產出,組織的品質基準線就會在不知不覺中下移。今天你覺得「有點馬虎但還行」的東西,半年後就會變成「標準品質」。不是因為品質真的提升了,而是因為每個人都習慣了那個水準。

Claude 使用者 92% 的 botshitting 率讓我特別在意,因為我自己就是重度 Claude 使用者。報告的解釋很合理:工具愈強,你就愈容易鬆懈。Claude 的輸出品質確實讓人想直接用,它的語氣、結構、甚至論證方式都很「像回事」。但「像回事」和「是那回事」之間的差距,正是 botshitting 生長的溫床。我自己的做法是強制自己在每一篇重要的產出上,至少找到一個 AI 弄錯的東西才算完成審核。不是因為我不信任工具,而是因為如果我找不到任何錯誤,那更可能是我審核得不夠仔細,而不是 AI 真的完美無缺。