AI 產業動態

算力極化：當 1% 的人擁有自己的資料中心

Thinking Machines 推出永遠在線的「互動模型」，讓 AI 持續監看螢幕、鏡頭和語音，但這需要 100 倍算力。Lightmatter 用光子晶片解決互聯瓶頸，StarCloud 把資料中心搬上太空，而 Jason Calacanis 警告：算力將成為新的貧富分界線。

2026 年 6 月 3 日 · 來源： This Week in AI

本文整理自《This Week in AI》2026 年 5 月播出的第 13 集。

AI 不再等你打字

前 OpenAI 技術長米拉．穆拉蒂（Mira Murati）創辦的 Thinking Machines，五月中旬發布了一個叫「互動模型」（Interaction Model）的研究預覽。乍看之下，又是一個即時語音 AI。Demo 影片裡，AI 糾正使用者「açaí」的發音，還指出巴西莓碗來自巴西而非阿根廷。節目主持人 Jason Calacanis 的反應很直白：「這不就是地表最煩人的人被複製出來了嗎？」

但 Arena 執行長 Anastasios Angelopoulos 指出，表面的即時糾錯不是重點，底層架構才是。傳統 AI 是回合制的：你打一段文字，按下送出，等模型回覆。這個流程的問題在於，「回合」和「時間」是脫鉤的。第一個回合可能只花五秒，第二個回合可能跑兩小時。在等待的過程中，你沒辦法自然地打斷 AI，AI 也沒辦法打斷你。Thinking Machines 做的事情是把「時間本身」切成毫秒級的微回合，每隔幾毫秒就把所有輸入打包送進模型，不管是語音、影像、沉默還是肢體動作。

這等於重新定義了人機互動的粒度。TML Interaction Small 是一個 2,760 億參數的混合專家模型（Mixture of Experts），實際運行時只有 120 億參數活躍，負責前台的即時互動。後台還有一個比較慢的推理模型，專門處理工具呼叫和深度思考。Angelopoulos 用發布-訂閱（pub-sub）架構來比喻：前台的互動模型可以隨時產生後台代理（agent），後台代理完成任務後把結果回傳，前台再無縫整合進正在進行的對話。你跟 AI 說話的同時，背景可能已經有三四個代理在跑不同的任務。

為什麼這很重要？因為它解決了一個真正的痛點。StarCloud 執行長 Philip Johnston 的雙胞胎兄弟在倫敦經營 AI 語音客服公司，他的觀察很精準：客戶滿意度跟「你有沒有被騙到覺得對方是真人」直接掛鉤。目前所有模型只要一被打斷就會整個停住，這是最明顯的破綻。Lightmatter 執行長 Nick Harris 則提到家裡有小孩的人都體驗過，在車上跟 Grok 對話被小孩打斷，AI 就直接當機的窘境。互動模型的時間切片架構，讓 AI 第一次有可能像人類一樣處理打斷，而不是把對話砍掉重來。

永遠在線的代價：100 倍算力

不過，Calacanis 想到了更遠的應用場景。語音打斷只是起點，真正的突破在於 AI 同時監看你的螢幕和鏡頭。他描述了一個畫面：AI 看到你在 Google 試算表裡選取了第二列，不等你開口就自動算出平均值和總計。或者 AI 連線到牧場的監視器，邊看畫面邊對你耳語：「北邊有一群土狼。」這已經不是聊天機器人，而是一個永遠跟在你身邊的數位夥伴。

Harris 聽到這裡直接給出了數字。目前全球 AI 基礎設施在 2026 年底前會上線數十吉瓦（GW）的算力。如果要讓 15 億周活躍使用者都用上永遠在線的多模態 AI，需要把這個數字乘以 100。也就是從數十吉瓦跳到數百吉瓦，甚至上千吉瓦。Harris 的說法很直接：「這個速度的電力建設，不可能發生。」每一次使用者打斷 AI、切換話題，後台就要產生新的代理，持續消耗運算資源。這跟現在的文字輸入模式完全不同。文字輸入是離散的、有間隔的；永遠在線是連續的、不間斷的。

這引出了一個尖銳的現實：只有極少數人能用得起這種 AI。Harris 觀察到，Google 和 Anthropic 的內部工程師和高層，已經生活在這個未來裡了。他們有專屬的大規模算力叢集，能跑任何想跑的實驗和推論。但要把同樣的體驗推廣到所有人，以目前的電網、硬體和互聯技術，根本做不到。算力不是軟體，不能用複製貼上來擴張。它需要實體的晶片、實體的電力、實體的冷卻系統。

光子晶片與太空電網

面對 100 倍的算力缺口，這集節目的兩位來賓恰好各自代表一條解決路線。Harris 的 Lightmatter 做的是光子互聯晶片，用光而非電來傳輸 GPU 之間的資料。他用了一個很有畫面感的類比：一顆 Lightmatter 晶片的頻寬，相當於連接北美和歐洲的海底光纜，每秒數百太位元（Tb/s），等於 20 萬戶家庭的頻寬，而這只是一顆晶片。Harris 認為，當 AI 叢集規模達到數十萬顆 GPU，真正的性能瓶頸不在單顆晶片有多快，而在晶片之間怎麼連接。光子互聯是目前唯一能跟上這種規模的技術，他預估 2028 年左右，光學互聯系統會開始大規模商用。

Johnston 的 StarCloud 走的是另一條路：把資料中心搬到太空。StarCloud 2 預計七個月後發射，搭載第一批 NVIDIA Blackwell GPU 進入軌道，發電量約 10 千瓦，是第一顆衛星的 100 倍。而 NVIDIA 正在跟 StarCloud 聯合設計一款叫 Space Rubin 1 的太空專用晶片，黃仁勳（Jensen Huang）在 GTC 大會上親自介紹，用的就是 StarCloud 1 的部署影片開場。Space Rubin 1 為軌道環境做了三項最佳化：大幅降低質量、提高散熱容忍度、內建輻射屏蔽。比起 2024 年 11 月發射 H100 時需要手工拆掉一半重量、更換散熱器、加裝防護層，新晶片從設計階段就考慮了太空需求。

太空資料中心的經濟邏輯建立在一個地球上不存在的條件：永恆的陽光。StarCloud 的衛星飛在晨昏太陽同步軌道上，永遠處在晝夜交界線上方，不會經歷夜晚。這意味著電池容量只需要地面太陽能專案的千分之一，因為根本不需要儲電過夜。沒有雲層遮蔽、沒有季節性日照差異，也不需要購買和許可土地。Johnston 指出，土地成本是北美新建太陽能專案中最大的開支。數字上來看，大約 200 個網球場面積的太陽能板可以產生 10 百萬瓦的算力，一趟 Starship 能載 50 個這樣的節點。StarCloud 已經向 FCC 提交了一個 88,000 顆衛星的星座申請，總部署容量約 20 吉瓦。

新的貧富分界線

技術解方在路上，但短期內算力仍然稀缺。Calacanis 由此提出了一個他認為還沒有人認真討論過的概念：「算力極化」（polarization of compute）。他的邏輯很直白：過去 1% 的富人比你多的是私人飛機、豪宅、傭人。未來他們比你多的，是一座價值 1,000 萬美元的個人資料中心，建在自家車庫或附屬建築裡，配上太陽能板和電池組。這座資料中心讓他們的知識工作生產力變成超人級別，而你還在排隊等雲端推論。

Calacanis 甚至算了一筆帳。就算不花 1,000 萬，花 25 萬美元買五台 Mac Studio 疊起來，每台約 1.5 萬美元，共 7.5 萬美元，就能讓一個人在任何知識工作任務上碾壓對手。加上永遠在線的互動模型，這個人等於隨時有一個看得到他看到的一切、聽得到他聽到的一切的 AI 夥伴。這種優勢會自我強化：更多算力帶來更好的洞察，更好的洞察帶來更多財富，更多財富買更多算力。

Harris 同意個人算力分配的趨勢「一定會發生」，但他也提出反面力量。開源模型是最大的民主化工具。根據 Angelopoulos 在 Arena 的評測資料，中國的 DeepSeek 4、Kimi 2.6 等開源模型雖然落後美國頂尖專有模型約兩個季度，但差距並沒有繼續擴大，而是穩定維持。六個月前差距縮小的速度比現在快，目前趨於穩定。這意味著「好到夠用」的模型不會只有富人用得起，電腦科學社群裡有一群人正拼命確保 AI 模型保持開放。

不過 Harris 也指出了另一個更驚人的場景：科學研究的贏者全拿。如果一個實體能獨佔一個巨型算力叢集來攻克癌症治療，那這個突破的價值是無限的。算力極化不只是富人用 AI 回信比你快的問題，而是誰先掌握足夠的算力，誰就可能先解開人類最困難的科學問題。Johnston 認為雲端效率最終會勝過本地算力，但 Calacanis 的論點依然成立：在雲端資源有限的過渡期，誰願意為算力付最多錢，誰就先拿到超人級 AI 的入場券。