企業AI專案九成五做不到上線:20億獨角獸CEO的實戰診斷

Invisible Technologies 執行長 Matt Fitzpatrick 曾在麥肯錫帶領千人工程團隊,做了十年企業AI落地。他指出不到5%的AI專案做到上線,背後有四大瓶頸:資料髒亂、好的定義不清、流程沒有重新設計、以及最關鍵的缺乏業務主導權。真正做出成果的企業都有一個共同特徵:由業務長官而非技術長官來主導。

企業AI專案九成五做不到上線:20億獨角獸CEO的實戰診斷

本文整理自《AI and the Future of Work》2026 年 5 月播出的單集。

{{< youtube OUmaY1gkZZc >}}


做了十年企業AI的人,怎麼看這波熱潮

「每次你去聽一個 AI 論壇,台上五個人都在說明年所有工作都會消失。這完全不切實際。」說這話的是 Matt Fitzpatrick,Invisible Technologies 執行長。這家公司 2025 年完成一億美元融資,估值突破 20 億美元,被 Inc. 5000 評為 2024 年成長最快的 AI 公司第二名,營收從前一年翻倍到 1.34 億美元。

Fitzpatrick 的底氣來自他的履歷。加入 Invisible Technologies 之前,他在麥肯錫(McKinsey)待了 12 年,擔任 QuantumBlack Labs 全球負責人,帶領超過一千名工程師為全球企業部署 AI 與資料方案。普林斯頓大學政治學學士、華頓商學院 MBA,他橫跨了顧問端和新創實戰端兩個截然不同的世界。

他在節目中直言,過去十年在企業端推動 AI 的經驗告訴他,目前媒體上讀到的大部分 AI 敘事都是炒作。模型效能在過去兩年確實提升了六到七成,但真正的難題在於「讓企業用起來」。他和各大企業高層交流時,會問一個很簡單的問題:你們有幾個 AI 專案真正上線、產生實質影響?答案幾乎都是個位數。那個「不到 5% 做到上線」的統計,在他看來完全符合現實。

問題出在哪裡?Fitzpatrick 歸納為四個瓶頸。

第一個瓶頸:三十年的資料沉積層

沒有乾淨的資料,就不可能做出能用的 AI。這聽起來像老生常談,但 Fitzpatrick 用了一個有畫面感的比喻:企業的資料就像三十年堆積起來的沉積層。全球 70% 的企業軟體已經超過 20 年歷史,資料高度碎片化,散落在數十個系統裡。最基本的問題是,同一個客戶在十個系統裡可能有十個不同的 ID,沒有統一識別碼。你想用 AI 來做客戶分析或流程自動化,第一步就卡住了,因為機器根本不知道這十筆紀錄指的是同一個人。

他舉了自家客戶 Swiss Gear(瑞士軍刀品牌的行李箱部門)的案例來說明。Swiss Gear 需要預測每年數百個 SKU 的訂購量,訂太多會堆積庫存,訂太少會錯失營收,這是一個直接影響損益的預測問題。過去他們的預測流程仰賴手動作業,資料散落在不同部門的系統裡。Invisible 用自家的資料平台 Neuron 進場整合,光是清理和串接資料這一步,就在幾週內產生了大約 700 張資料表。有了乾淨的資料基底,他們才能建出預測模型,將能精準預測的 SKU 數量提高了一倍。

這個案例的重點不是模型多厲害,而是整理資料花的力氣有多大。多數企業低估了資料清理的工程量和複雜度。Fitzpatrick 直言,資料問題是企業 AI 最大的技術障礙,尤其對大型企業來說,幾十年累積的系統碎片根本不是一個 POC 能解決的。

第二個瓶頸:怎麼定義「好」?

機器學習時代有一個相對清楚的範式。你做一個信用評分模型,回測歷史資料,模型說核准或拒絕,準確率可以量化。但生成式 AI 改變了遊戲規則,因為它的產出往往是長篇文本,而判斷一段文本是「好」還是「不好」,遠比判斷一個數字是對是錯來得困難。

Fitzpatrick 舉了一個具體的例子。假設你讓 AI 產出一份商業租賃合約,長達上百頁。你怎麼判斷這份文件是「好的」?哪些條款有法律風險?哪些用語在語意上有歧義?這不是單一指標能衡量的問題,它需要法律專家逐條審閱,對照具體的評估標準來判斷每一段的品質。

這正是 Invisible Technologies 的核心業務之一。他們有 110 萬名專家組成的人才市場,其中約 30% 擁有碩士或博士學歷。這些專家為 AI 模型的輸出制定評估標準(rubric),然後逐一審閱模型產出。Fitzpatrick 把這個過程稱為「基於人類回饋的強化學習」(RLHF),強調它遠超過簡單的資料標註。一個法律專家會審閱 AI 生成的租約,一個計算生物學的博士會用印地語評估模型在該領域的表現。而且知識本身也在變化,GLP-1 類藥物問世前後的醫療知識脈絡已經不同,模型必須持續學習。他說這是一趟二十年的旅程,不是做一次就結束的事。

第三個瓶頸:只加 AI 不改流程,等於白做

Fitzpatrick 用了一個工廠的比喻。假設你在生產線上導入 AI,讓每個人每天省下 12 分鐘。整條產線的效率提升了嗎?並沒有。你只是讓工人多了 12 分鐘可以休息。工廠的產能、良率、交期完全沒有改變。

他觀察到大多數企業的做法是把 AI「塞進」現有的工作流程,而不是問一個更根本的問題:如果我今天從零開始設計這個流程,該怎麼做?前者是局部優化,後者才是真正的流程再造。以商業信貸流程為例,很多銀行的做法是在現有的審核流程裡加入 AI 輔助,但流程本身還是二十年前設計的。真正該做的是重新思考:我需要哪些資訊來做一筆信貸決策?這些資訊流怎麼走最快?AI 在哪些環節介入,人在哪些環節把關?

這也是新創公司在 AI 採用上遠遠領先傳統企業的原因。Fitzpatrick 引述了一個讓他印象深刻的數據:在新創公司,每位員工使用的 AI token 量大約是傳統企業的七倍。原因很簡單,新創公司沒有歷史包袱,從第一天就圍繞 AI 來設計工作流程。傳統企業則是在舊流程上疊床架屋,AI 只是被當成一個附加功能,而不是核心架構的一部分。

最關鍵的瓶頸:這是誰的案子?

前三個瓶頸講完之後,Fitzpatrick 把火力集中到他認為最重要的問題:業務主導權。

他描述了一個在大企業裡反覆出現的場景。技術團隊負責 AI,業務團隊負責營運。這兩邊被刻意分開。IT 的角色是「提供工具、跑資料」,業務的角色是「做生意」。AI 專案被丟給技術團隊去執行,但技術團隊不了解業務痛點,業務團隊也不願意承擔技術專案的營運責任。結果就是一座獨立的塔,和實際的業務需求毫無關係,在裡面自轉。

這就是為什麼「我們有幾百個正在進行的專案,但沒有一個上線」這種話反覆出現。沒有業務負責人願意為結果負責,就沒有東西能推到生產環境。

Fitzpatrick 說他判斷一家公司能不能在 AI 上做出成果,問幾個簡單的問題就知道了:你們的業務 KPI 是什麼?誰是這個計畫的業務負責人?工程師有沒有和業務團隊坐在一起?如果對方一開口就在討論「我們正在評估要用哪個平台」,那基本上就會原地打轉,因為他們不是從業務目標出發,而是從技術選型開始。技術選型本身永遠不會有標準答案。

真正做出成果的企業,都有一個共同特徵:由上而下,CEO 或資深業務主管直接主導,設定明確的 KPI,不糾結在技術問題上。把工程師和業務人員放在一起,讓他們共同面對同一個業務問題。這聽起來很簡單,但 Fitzpatrick 在過去十年見到的企業裡,能做到這一點的少之又少。

我的觀察

Fitzpatrick 的診斷並不新奇。BCG 的徐瑞廷去年在臺灣講的「10-20-70 法則」說的是同一件事:10% 是演算法,20% 是 IT 基礎設施,水面下的 70% 全是流程、人才和文化問題。但 Fitzpatrick 的價值在於他的雙重身份,在麥肯錫幫大企業做了十年顧問,然後跳到新創第一線操刀。他不是在簡報室裡診斷問題,而是在生產線上解決問題。

「三十年的沉積層」這個比喻放到臺灣特別有感。臺灣的製造業和金融業在數位化這件事上跟全球一樣,堆了幾十年的舊系統,資料散落在 ERP、CRM、各種自建工具裡。很多企業做 AI POC 做得很開心,但一到要上線,就發現資料品質根本撐不住。

不過 Fitzpatrick 點出的「業務主導」,可能是對臺灣企業最有價值的提醒。臺灣很多公司的 AI 計畫是由資訊部門或數位轉型辦公室發起,但最終要用 AI 的是業務單位。如果業務主管不願意對結果負責,這個案子就很難走出實驗室。下次看到公司宣布「啟動 AI 轉型計畫」的新聞,不妨留意一個細節:領導這個計畫的是技術長,還是營運長?答案可能就預告了結局。