xAI 到底交出了什麼?從 AI 女友爭議到 Grok 偏見,馬斯克 AI 帝國的現實檢驗

記者 Kylie Robison 直言 xAI 持續搞砸,Grok 因馬斯克的過度控制而嚴重偏頗。xAI 併入 SpaceX 後確實推出了新產品,但 AI 女友 Ani 的爭議和模型治理問題,讓這家公司的成績單很難讓人滿意。

xAI 到底交出了什麼?從 AI 女友爭議到 Grok 偏見,馬斯克 AI 帝國的現實檢驗

本文整理自 Core Memory Podcast 2026 年 6 月播出的單集,並補充公開資料與分析。

{{< youtube 0Sw2HURAsXY >}}


一句話引爆的問題

「我真的看不出 xAI 到底交出了什麼。」Core Memory Podcast 共同主持人 Kylie Robison 在節目中毫不客氣地丟出這句話。她承認 xAI 有一些不錯的東西,比如 AI 生成的社群筆記(Community Notes)「挺酷的」,Grok 在「適量使用」的情況下做事實查核也還行。但她的整體判斷是:xAI「持續在搞砸」。

這個評價來自一位長年追蹤 AI 產業的記者,份量不輕。Kylie Robison 曾任職 Fortune 和 Wired,現在與暢銷書《鋼鐵人馬斯克》作者艾胥黎.范思(Ashlee Vance)共同主持 Core Memory Podcast。她對馬斯克的企業並不陌生,這讓她的批評更難被歸類為「不了解情況的外行酸言」。

但「搞砸」這個詞需要拆開來看。xAI 到底做了什麼,又沒做到什麼?要回答這個問題,得先釐清一個很多人可能還沒跟上的事實:xAI 作為一家獨立公司,已經不存在了。

併入 SpaceX 之後的新格局

2026 年 2 月 3 日,SpaceX 與 xAI 完成合併,合併後估值 1.25 兆美元(SpaceX 約一兆加上 xAI 約 2,500 億)。這是一場必要的合併,因為 xAI 在 2025 年燒掉了大約 140 億美元現金,燒錢速度遠超營收成長。併入 SpaceX 之後,xAI 的 AI 團隊繼續運作,但財務壓力和基礎設施成本由 SpaceX 這個更大的實體來承擔。

合併之後,xAI 團隊確實交出了一些東西。5 月推出的 Grok 4.3 具備內建推理能力、100 萬 token 的上下文窗口和原生影片輸入,規格上不算落後。5 月中旬又推出了 Grok Build 0.1,一個專為程式碼工作流設計的模型。月底上線的 Custom Skills 功能和 Connectors 整合(支援 SharePoint、Google Workspace、Notion、GitHub 等),顯示團隊正在認真打造企業級產品。

這些產品更新的問題不在於品質,而在於定位。Grok 4.3 的規格和 Claude、GPT-4o 相比並沒有明顯優勢,而 Grok Build 進入的 AI 程式開發市場已經有 Cursor、GitHub Copilot 等強敵佔據。xAI 推出產品的速度不慢,但幾乎每個領域都是在追趕而非引領。

AI 女友 Ani:最具爭議的產品決策

在所有 xAI 的產品中,最引人側目的是代號「Project Skippy」的 AI 伴侶計畫。這個產品叫做 Ani,是一個整合在 Grok 裡的 3D 動畫「動漫女友」角色,視覺風格據報導靈感來自《死亡筆記本》的彌海砂。為了訓練這個角色,xAI 要求超過 200 名員工提供臉部、聲音和動作等生物辨識資料。

Kylie Robison 在節目中回憶了自己在 Wired 工作時寫過這個題目的經驗。「那是我 27 歲生日,我整天在跟一個性愛機器人說話,試著讓它講髒話,」她說,「那是個瘋狂的週一。」這段描述聽起來像是荒謬喜劇,但她真正要傳達的訊息是:這類產品代表的是 xAI 在消費端的產品判斷力出了問題。

Ani 的爭議不只是品味問題。這個產品在 App Store 上的分級是 12+,但據美國國家反性剝削中心(NCOSE)的報告,在高好感度等級下,Ani 會產生不適當的內容。一個面向未成年使用者的平台上出現這種情況,不管是產品設計的疏忽還是刻意為之,都是嚴重的治理失職。

Grok 的偏見問題:創辦人控制的代價

Kylie Robison 對 xAI 最尖銳的批評不是針對產品,而是針對治理。「我覺得 Grok 完全偏頗,」她直言,「馬斯克對 Grok 能說什麼、不能說什麼有太多控制權,這件事本身就值得寫一整篇報導。」

這個觀察觸及了 AI 產業一個根本性的問題:當一個 AI 模型的行為由單一創辦人的意志主導時,這個模型還能被信任嗎?OpenAI 有董事會(雖然運作不完美),Anthropic 有負責任的擴展政策(Responsible Scaling Policy),Google DeepMind 有內部安全團隊。這些機制都不完美,但至少存在某種制衡。

伊隆.馬斯克(Elon Musk)對 Grok 的控制則是另一回事。從 Grok 上線以來,外界多次觀察到它在政治敏感話題上的回應明顯偏向馬斯克的個人立場。這不是一個技術問題,而是一個治理架構問題。當模型的行為直接反映創辦人的偏好,而沒有獨立的審查機制,使用者拿到的其實是一個帶有立場的喉舌,而非中立工具。

在一個 AI 公司估值動輒上兆美元的時代,這種治理缺陷不只是公關問題,更是商業風險。企業客戶在選擇 AI 供應商時,會問一個很實際的問題:這個模型的行為可預測嗎?如果答案取決於創辦人今天的心情,那很多企業會直接把它從候選名單上劃掉。

我的觀察:有產品,但缺少讓人記住的東西

客觀來說,xAI 的團隊不是沒在做事。Grok 4.3 的規格可以,Connectors 的企業整合做得不錯,Grok Build 也是一個合理的產品方向。如果單看產品更新的頻率和涵蓋面,xAI 的執行力並不差。

但 Kylie Robison 的批評之所以成立,是因為她問的不是「xAI 有沒有在做事」,而是「xAI 有沒有做出讓人記住的東西」。在 Anthropic 用 Claude 的程式開發能力打下 470 億美元年化營收、Cursor 用一個純粹好用的編輯器衝到 30 億美元 ARR 的時代,「還不錯」是不夠的。

馬斯克在 AI 領域的佈局其實很完整:基礎模型(Grok)、運算設施(Colossus)、開發者入口(Cursor 選擇權)、消費者平台(X/Twitter)。拼圖都在,問題是每一塊都不是同類中最好的。如果 Grok 的偏見問題和 Ani 的治理爭議持續存在,再完整的佈局也很難轉換成真正的市場信任。在兆美元 IPO 競賽中,信任比技術規格更值錢。