算力極化:當 1% 的人擁有自己的資料中心
Thinking Machines 推出永遠在線的「互動模型」,讓 AI 持續監看螢幕、鏡頭和語音,但這需要 100 倍算力。Lightmatter 用光子晶片解決互聯瓶頸,StarCloud 把資料中心搬上太空,而 Jason Calacanis 警告:算力將成為新的貧富分界線。

本文整理自《This Week in AI》2026 年 5 月播出的第 13 集。
AI 不再等你打字
前 OpenAI 技術長米拉.穆拉蒂(Mira Murati)創辦的 Thinking Machines,五月中旬發布了一個叫「互動模型」(Interaction Model)的研究預覽。乍看之下,又是一個即時語音 AI。Demo 影片裡,AI 糾正使用者「açaí」的發音,還指出巴西莓碗來自巴西而非阿根廷。節目主持人 Jason Calacanis 的反應很直白:「這不就是地表最煩人的人被複製出來了嗎?」
但 Arena 執行長 Anastasios Angelopoulos 指出,表面的即時糾錯不是重點,底層架構才是。傳統 AI 是回合制的:你打一段文字,按下送出,等模型回覆。這個流程的問題在於,「回合」和「時間」是脫鉤的。第一個回合可能只花五秒,第二個回合可能跑兩小時。在等待的過程中,你沒辦法自然地打斷 AI,AI 也沒辦法打斷你。Thinking Machines 做的事情是把「時間本身」切成毫秒級的微回合,每隔幾毫秒就把所有輸入打包送進模型,不管是語音、影像、沉默還是肢體動作。
這等於重新定義了人機互動的粒度。TML Interaction Small 是一個 2,760 億參數的混合專家模型(Mixture of Experts),實際運行時只有 120 億參數活躍,負責前台的即時互動。後台還有一個比較慢的推理模型,專門處理工具呼叫和深度思考。Angelopoulos 用發布-訂閱(pub-sub)架構來比喻:前台的互動模型可以隨時產生後台代理(agent),後台代理完成任務後把結果回傳,前台再無縫整合進正在進行的對話。你跟 AI 說話的同時,背景可能已經有三四個代理在跑不同的任務。
為什麼這很重要?因為它解決了一個真正的痛點。StarCloud 執行長 Philip Johnston 的雙胞胎兄弟在倫敦經營 AI 語音客服公司,他的觀察很精準:客戶滿意度跟「你有沒有被騙到覺得對方是真人」直接掛鉤。目前所有模型只要一被打斷就會整個停住,這是最明顯的破綻。Lightmatter 執行長 Nick Harris 則提到家裡有小孩的人都體驗過,在車上跟 Grok 對話被小孩打斷,AI 就直接當機的窘境。互動模型的時間切片架構,讓 AI 第一次有可能像人類一樣處理打斷,而不是把對話砍掉重來。
永遠在線的代價:100 倍算力
不過,Calacanis 想到了更遠的應用場景。語音打斷只是起點,真正的突破在於 AI 同時監看你的螢幕和鏡頭。他描述了一個畫面:AI 看到你在 Google 試算表裡選取了第二列,不等你開口就自動算出平均值和總計。或者 AI 連線到牧場的監視器,邊看畫面邊對你耳語:「北邊有一群土狼。」這已經不是聊天機器人,而是一個永遠跟在你身邊的數位夥伴。
Harris 聽到這裡直接給出了數字。目前全球 AI 基礎設施在 2026 年底前會上線數十吉瓦(GW)的算力。如果要讓 15 億周活躍使用者都用上永遠在線的多模態 AI,需要把這個數字乘以 100。也就是從數十吉瓦跳到數百吉瓦,甚至上千吉瓦。Harris 的說法很直接:「這個速度的電力建設,不可能發生。」每一次使用者打斷 AI、切換話題,後台就要產生新的代理,持續消耗運算資源。這跟現在的文字輸入模式完全不同。文字輸入是離散的、有間隔的;永遠在線是連續的、不間斷的。
這引出了一個尖銳的現實:只有極少數人能用得起這種 AI。Harris 觀察到,Google 和 Anthropic 的內部工程師和高層,已經生活在這個未來裡了。他們有專屬的大規模算力叢集,能跑任何想跑的實驗和推論。但要把同樣的體驗推廣到所有人,以目前的電網、硬體和互聯技術,根本做不到。算力不是軟體,不能用複製貼上來擴張。它需要實體的晶片、實體的電力、實體的冷卻系統。
光子晶片與太空電網
面對 100 倍的算力缺口,這集節目的兩位來賓恰好各自代表一條解決路線。Harris 的 Lightmatter 做的是光子互聯晶片,用光而非電來傳輸 GPU 之間的資料。他用了一個很有畫面感的類比:一顆 Lightmatter 晶片的頻寬,相當於連接北美和歐洲的海底光纜,每秒數百太位元(Tb/s),等於 20 萬戶家庭的頻寬,而這只是一顆晶片。Harris 認為,當 AI 叢集規模達到數十萬顆 GPU,真正的性能瓶頸不在單顆晶片有多快,而在晶片之間怎麼連接。光子互聯是目前唯一能跟上這種規模的技術,他預估 2028 年左右,光學互聯系統會開始大規模商用。
Johnston 的 StarCloud 走的是另一條路:把資料中心搬到太空。StarCloud 2 預計七個月後發射,搭載第一批 NVIDIA Blackwell GPU 進入軌道,發電量約 10 千瓦,是第一顆衛星的 100 倍。而 NVIDIA 正在跟 StarCloud 聯合設計一款叫 Space Rubin 1 的太空專用晶片,黃仁勳(Jensen Huang)在 GTC 大會上親自介紹,用的就是 StarCloud 1 的部署影片開場。Space Rubin 1 為軌道環境做了三項最佳化:大幅降低質量、提高散熱容忍度、內建輻射屏蔽。比起 2024 年 11 月發射 H100 時需要手工拆掉一半重量、更換散熱器、加裝防護層,新晶片從設計階段就考慮了太空需求。
太空資料中心的經濟邏輯建立在一個地球上不存在的條件:永恆的陽光。StarCloud 的衛星飛在晨昏太陽同步軌道上,永遠處在晝夜交界線上方,不會經歷夜晚。這意味著電池容量只需要地面太陽能專案的千分之一,因為根本不需要儲電過夜。沒有雲層遮蔽、沒有季節性日照差異,也不需要購買和許可土地。Johnston 指出,土地成本是北美新建太陽能專案中最大的開支。數字上來看,大約 200 個網球場面積的太陽能板可以產生 10 百萬瓦的算力,一趟 Starship 能載 50 個這樣的節點。StarCloud 已經向 FCC 提交了一個 88,000 顆衛星的星座申請,總部署容量約 20 吉瓦。
新的貧富分界線
技術解方在路上,但短期內算力仍然稀缺。Calacanis 由此提出了一個他認為還沒有人認真討論過的概念:「算力極化」(polarization of compute)。他的邏輯很直白:過去 1% 的富人比你多的是私人飛機、豪宅、傭人。未來他們比你多的,是一座價值 1,000 萬美元的個人資料中心,建在自家車庫或附屬建築裡,配上太陽能板和電池組。這座資料中心讓他們的知識工作生產力變成超人級別,而你還在排隊等雲端推論。
Calacanis 甚至算了一筆帳。就算不花 1,000 萬,花 25 萬美元買五台 Mac Studio 疊起來,每台約 1.5 萬美元,共 7.5 萬美元,就能讓一個人在任何知識工作任務上碾壓對手。加上永遠在線的互動模型,這個人等於隨時有一個看得到他看到的一切、聽得到他聽到的一切的 AI 夥伴。這種優勢會自我強化:更多算力帶來更好的洞察,更好的洞察帶來更多財富,更多財富買更多算力。
Harris 同意個人算力分配的趨勢「一定會發生」,但他也提出反面力量。開源模型是最大的民主化工具。根據 Angelopoulos 在 Arena 的評測資料,中國的 DeepSeek 4、Kimi 2.6 等開源模型雖然落後美國頂尖專有模型約兩個季度,但差距並沒有繼續擴大,而是穩定維持。六個月前差距縮小的速度比現在快,目前趨於穩定。這意味著「好到夠用」的模型不會只有富人用得起,電腦科學社群裡有一群人正拼命確保 AI 模型保持開放。
不過 Harris 也指出了另一個更驚人的場景:科學研究的贏者全拿。如果一個實體能獨佔一個巨型算力叢集來攻克癌症治療,那這個突破的價值是無限的。算力極化不只是富人用 AI 回信比你快的問題,而是誰先掌握足夠的算力,誰就可能先解開人類最困難的科學問題。Johnston 認為雲端效率最終會勝過本地算力,但 Calacanis 的論點依然成立:在雲端資源有限的過渡期,誰願意為算力付最多錢,誰就先拿到超人級 AI 的入場券。