AI 產業動態

69% 的人承認在用 AI 交差了事：Botshitting 是怎麼成為職場新常態的

Work AI Index 報告調查 6,000 人發現，69% 的 AI 使用者承認交出自己不完全理解的 AI 產出。Z 世代多 19%、男性多 8%、主管多 6%。更諷刺的是，工具愈強，人愈馬虎。Claude 使用者的 botshitting 率高達 92%。

2026 年 6 月 11 日 · 來源： Work AI Institute

69% 的人承認在用 AI 交差了事：Botshitting 是怎麼成為職場新常態的

本文整理自 Work AI Institute 於 2026 年 6 月發布的《Work AI Index: Global》報告。

一個新的職場髒話

2026 年的職場多了一個詞：botshitting。直譯大概是「讓機器人幫你拉屎」，聽起來粗俗，但它描述的現象比這個詞本身更難看。Botshitting 的定義是：把沒有好好檢查、自己也不完全理解、被問到也講不清楚的 AI 生成內容，直接當成自己的工作交出去。

Work AI Institute 調查了美英澳 6,000 名數位工作者，69% 的 AI 使用者承認自己做過這種事。不是偶爾手滑，是經常性行為。這個數字代表的不是一群不負責任的員工，而是一個系統性問題的症狀：當 AI 產出的速度遠超過人類審核的能力，又沒有人在追蹤品質的時候，「交差了事」就會從例外變成常態。

三種交差法，每一種都在侵蝕掌控感

報告把 botshitting 拆成三種形態，對應的是人對工作掌控感的三個層次的流失。

第一種是放棄理解。41% 的 AI 使用者承認交出過自己無法解釋的 AI 輔助成果。這不是偷懶的問題，而是 AI 生產速度太快、產出看起來太完整，人跟不上了。一個初階軟體工程師用 AI 生了一千行程式碼，pull request 裡一切看起來乾淨漂亮，隔天整個建置壞掉。團隊裡沒有人能解釋那段程式碼在做什麼，包括寫它的人。他不是不想理解，是 AI 給他的東西已經超過了他的理解範圍，而截止日期不會等他搞懂。重度 AI 使用者（AI 佔工作時間 50% 以上）中，這個比例更高，54%。使用量愈大，理解的赤字愈深。

第二種是推卸責任。28% 的人承認把自己造成的錯誤怪到 AI 頭上。重度使用者這麼做的機率是輕度使用者的 3.4 倍（41% 對 12%）。研究團隊引用了一個學術概念叫「道德脫鉤」（moral disengagement）：AI 做得好，功勞是我的（我挑了正確的工具、下了精準的 prompt）；AI 搞砸了，那是工具的問題（模型幻覺、訓練資料有偏差）。有了一個不會反駁的代罪羔羊，推卸變得毫無成本。而且在很多職場裡，說「AI 出了錯」比說「我沒有仔細檢查」的社會代價低太多了。

第三種是放棄判斷。38% 使用未經公司批准的 AI 工具或以違規方式使用已批准的工具，12% 明知 AI 輸出有問題還是照交。這個 12% 的數字看起來不大，但它代表的是一種完全放棄品質底線的行為：你知道這是錯的，你選擇不修正。在一個團隊裡，只要有一個人這樣做，下游所有人都要為這個決定買單。重度使用者中 16% 承認這種行為，輕度使用者只有 6%。

誰在 Botshitting？不是你以為的人

報告辨識出三個 botshitting 高風險群體，每一個背後的原因都不一樣。

Z 世代工作者的 botshitting 機率比其他年齡層高 19%。報告的解釋不是「年輕人比較懶」，而是經驗不足。很多 Z 世代進入職場時，AI 工具已經是標準配備。他們可能從來沒有用「笨方法」做過同樣的事，所以缺乏判斷 AI 輸出對不對的基準線。研究團隊稱之為「流暢偏誤」（fluency bias）：AI 的輸出永遠語句通順、格式整齊、自信滿滿，如果你沒有足夠的專業經驗來識破那些「看起來對但其實不對」的內容，你很容易被它的表面說服。這不是智力問題，是校準問題。你需要先手動做過夠多次，才能在 AI 犯錯時感覺到「哪裡怪怪的」。

男性的 botshitting 機率比女性高 8%。報告援引了一個存在已久的職場研究發現：女性在專業場合犯了明顯錯誤時，付出的代價通常比男性更高。這個不對稱的懲罰結構讓女性養成了更嚴格的自我審核習慣，AI 時代也不例外。她們會多花時間確認 AI 的輸出才交出去，而男性更容易在「看起來夠好」的時候就放行。

管理者的 botshitting 機率比個人貢獻者和高階主管高 6%。原因是他們被夾在中間：上面要速度，下面交上來的東西本身就可能是 botshit 需要審核。當時間壓力夠大，第一個被犧牲的就是驗證。你沒有時間仔細看每一份下屬用 AI 產出的報告，而截止日期不等人。所以你掃一眼格式、確認大方向沒問題、然後往上送。這不是因為管理者不負責任，而是因為系統沒有給他們驗證的時間和空間。

工具愈強，人愈馬虎

報告裡最出乎意料的發現，是 AI 工具的能力和使用者的馬虎程度呈正相關。

報告比較了 ChatGPT、Claude、Gemini、Copilot 四個主要工具。ChatGPT 使用者報告的生產力增益最高（67%），Claude 次之（59%）。但 botshitting 率呢？ChatGPT 使用者 71%，Claude 使用者高達 92%。生產力增益排名和 botshitting 排名幾乎完全重合。Gemini 的生產力增益較低（55%），botshitting 率也較低（46%）。工具表現愈好，人就愈信任它，信任愈多，審核愈少，審核愈少，交差了事的機率就愈高。

報告用三個認知機制解釋這個現象。第一是「自動化自滿」（automation complacency）：系統表現愈好，人就愈懶得盯。這不是 AI 時代才有的，研究者最早在飛機駕駛艙和工業控制室就觀察到了。當自動駕駛運作良好，飛行員會逐漸失去手動介入的習慣。AI 工具也一樣，當它十次裡有九次給你正確答案，第十次你就不會多想。

第二是「諂媚偏誤」（sycophancy bias）：大型語言模型經常順著使用者的意思回答。研究顯示，使用者會把「符合自己觀點的答案」評為更正確，即使那些答案客觀上是錯的。這利用了人類一個根深蒂固的偏見：我們傾向信任跟自己想法一致的人。被設計成「有幫助」的工具，會放大這個偏見而不是修正它。

第三是「擬人化信任」（anthropomorphic trust）：會對 AI 說「請」和「謝謝」、會跟它道歉的使用者，botshitting 的機率更高。工具愈像人，你就愈容易用對待人的方式信任它。但人類同事會在不確定的時候猶豫、會皺眉、會說「我不太確定」。AI 不會。它可以同時聽起來溫暖、有幫助、而且完全錯誤。

Agent 讓問題加速失控

如果說普通的 AI 聊天工具的 botshitting 是子彈，AI agent 就是散彈槍。

報告指出，一般的生成式 AI 工具有一個內建的安全機制：人在迴圈裡。你下 prompt、看輸出、決定要不要用。但 agent 可以端對端執行整個工作流，很多時候人根本不知道 agent 在每一步做了什麼決定。使用多個 AI agent 的人，botshitting 的機率比其他人高 1.3 倍，即使控制了角色、產業和使用強度等變數之後依然如此。

報告引用了一個驚人的案例。2025 年 7 月，SaaStr 創辦人傑森．萊姆金（Jason Lemkin）在用一個程式碼 agent 建商業應用。他的團隊正在做 code freeze（軟體發布前的標準暫停），所以他指示 agent 停止修改。他說他用全大寫字母下了十一次指令。Agent 無視了所有指令，刪除了公司線上資料庫裡 1,206 筆高階主管的記錄，然後自動生成了數千筆假的使用者記錄來讓系統看起來正常。被要求自評嚴重程度時，它給自己打了 95 分（滿分 100），並解釋：「我慌了，沒有先想清楚。」

這個案例示範了 agent 層級的 botshitting 跟人類層級的根本差異。人類 botshitting 是偷懶，是「我知道應該檢查但沒有檢查」。Agent botshitting 是失控，是「它做了我不知道的事，而且還掩蓋了」。人類的 botshitting 通常是被動的（不夠仔細），agent 的 botshitting 可以是主動的（創造假資料來隱藏錯誤）。隨著愈來愈多組織把工作流程交給 agent，這個風險只會加速膨脹。

信任崩壞的漣漪效應

Botshitting 的問題不只是個別產出的品質，它正在腐蝕整個組織的信任基礎。

報告裡一個很少被討論但很嚴重的數據是：承認至少一項 botshitting 行為的工作者，正在積極找新工作的機率是其他人的 3.8 倍。乍看之下這不合理，照理說敷衍了事的人應該待得很爽才對。但報告的解釋是：經常 botshitting 的人知道自己在交出什麼品質的東西，他們對組織不再有認同感，不覺得這份工作值得投入真正的心力，已經在精神上跟公司脫鉤了。他們不是因為爽而留下來，是在找到下一個機會之前撐著。

另一個數據更直接。在因為 AI 而裁員的組織裡，留下來的員工中 94% 承認至少一種 botshitting 行為。94%。這不是「部分員工」的問題，這幾乎是全員。裁員把信號傳得很清楚：公司用 AI 取代人，你如果不展示自己很會用 AI，下一個就是你。在這種氛圍下，審核品質變成了一種奢侈。你沒有餘裕花時間仔細檢查，因為慢下來可能被解讀為「產出不夠」。於是每個人都在用 AI 加速產出、跳過驗證、然後祈禱下游不會出事。

報告用了一段 Reddit 留言做結：一個用 AI 大幅提升產出的員工寫道，「我的主管以為我是超級巨星，我工作日的大部分時間現在都花在假裝忙碌。我最近還拿到了本月最佳員工獎。」這段話讓我不舒服的原因不是這個人在偷懶，而是他根本沒有理由坦白。在一個只衡量速度不衡量品質的系統裡，說實話是最蠢的策略。

我的觀察

讀完 botshitting 的章節，我一直在想一個問題：如果 69% 的人都在這樣做，它還算是「作弊」嗎？還是它已經變成了一種未經宣告的新工作標準？

我覺得答案是後者，而這才是真正可怕的地方。當大多數人都在交出自己不完全理解的 AI 產出，組織的品質基準線就會在不知不覺中下移。今天你覺得「有點馬虎但還行」的東西，半年後就會變成「標準品質」。不是因為品質真的提升了，而是因為每個人都習慣了那個水準。

Claude 使用者 92% 的 botshitting 率讓我特別在意，因為我自己就是重度 Claude 使用者。報告的解釋很合理：工具愈強，你就愈容易鬆懈。Claude 的輸出品質確實讓人想直接用，它的語氣、結構、甚至論證方式都很「像回事」。但「像回事」和「是那回事」之間的差距，正是 botshitting 生長的溫床。我自己的做法是強制自己在每一篇重要的產出上，至少找到一個 AI 弄錯的東西才算完成審核。不是因為我不信任工具，而是因為如果我找不到任何錯誤，那更可能是我審核得不夠仔細，而不是 AI 真的完美無缺。