一個機架跑 15 萬個 Agent:Intel 發表 Xeon 6 Plus,要翻轉 GPU 獨大的資料中心

Intel 執行長陳立武在 COMPUTEX 2026 發表 Xeon 6 Plus 處理器,搭載 288 顆效率核心與 576MB 快取,採用 Intel 18A 製程。Intel 主張 agentic AI 正把 CPU 與 GPU 的算力比從 1:8 拉回接近 1:1,一個 32U 機架可同時運行 15 萬個 agent,並攜手鴻海推出 RackScale 開放架構藍圖。

一個機架跑 15 萬個 Agent:Intel 發表 Xeon 6 Plus,要翻轉 GPU 獨大的資料中心

本文整理自 COMPUTEX 2026 Intel CEO Keynote,2026 年 5 月播出。

{{< youtube SJ-VzWpgQ5s >}}


Intel 的核心命題:Agent 消耗千倍 token,CPU 需求正在爆發

「Agent 現在消耗的 token 數量,是傳統單次推論的一千倍。」Intel 執行長陳立武(Lip-Bu Tan)在 COMPUTEX 2026 主題演講上丟出這個數字。這不只是技術細節,而是 Intel 整場演講的論述核心。陳立武要說的是:當 AI 從「你問我答」進入 agentic 時代,agent 不只是呼叫大型語言模型產生回應,還要讀寫檔案、執行程式碼、跑單元測試、抓取網頁資料。這些工作天生就是 CPU 的地盤,不是 GPU 的。

Intel 資料中心主管 Kevork 在台上直接點明這個轉變的幅度。傳統推論的 CPU 對 GPU 算力比大約是 1 比 8,GPU 吃掉絕大部分運算資源。但在 agentic AI 的工作流程中,這個比例正在往 1 比 1 甚至 CPU 反超的方向移動。如果這個觀察為真,過去兩年「買越多 GPU 越好」的資料中心投資邏輯就需要修正。Intel 的這場 Computex 演講,就是在為這個修正提供論述和產品。

x86 的五十年底氣與 IDC 背書

陳立武把論述基礎建立在一個第三方數據上:根據 IDC 的預測,到 2030 年,每裝設十台伺服器中,有八台仍然是 x86 架構。不管 ARM 架構和各種客製晶片喊了多少年要「取代 x86」,在企業級資料中心裡,x86 的裝機基數依然大到無法忽視。

Intel 應對這個局面的策略是雙核心路線。P-core 追求極致的單執行緒效能,適合需要把頻率拉高的運算密集任務。E-core 追求能效比,用更低的功耗塞進更多核心數。這兩種核心不只用在伺服器,也同時覆蓋 PC 和邊緣裝置的產品線。陳立武在台上明確宣示:「在我的帶領下,我們將致力於打造全世界最好的 CPU 核心,確保最吃運算的工作負載在 x86 上跑得最好。」這句話放在 Intel 過去幾年在製程和產品上接連失利的背景下,更像是對內部和市場的重新承諾,而不只是 CEO 的標準豪語。

而 x86 在資料中心跑了快五十年。5G 基地台、企業資料庫、雲端服務,這些「讓世界持續運轉」的基礎工作負載,未來五年預計會讓資料中心的總功耗從 80 吉瓦成長到 100 吉瓦。這些工作負載對效能、安全、穩定性的要求極高,不是隨便換個架構就能搬得動的。Intel 的言下之意很清楚:你的 GPU 伺服器再酷,這些基本盤還是要靠 x86。

Xeon 6 Plus:288 顆 E-core、576MB 快取、18A 製程

就是在「基礎工作負載持續成長、agentic AI 又爆發新需求」的雙重壓力下,Intel 在 Computex 正式發表了 Xeon 6 Plus。

這顆處理器採用 Intel 18A 製程技術製造,每顆搭載 288 顆 E-core,配上 576MB 的 L3 快取。這些數字在 Intel 的產品歷史中前所未見。Kevork 在台上特別強調 18A 是 Intel 自家製程,這一點對正在重建代工事業信譽的 Intel 格外重要,等於拿自家最旗艦的資料中心產品來證明製程能力。

規格之外,Kevork 把 Xeon 6 Plus 的定位說得直接:這是為了密度和效率而生的處理器。它讓合作夥伴能把伺服器做得更緊湊,在同樣的機架空間裡塞進更多運算能力。ODM 合作夥伴從 Computex 當週起就開始出貨 Xeon 6 Plus 的方案,涵蓋完整機架到單一伺服器的各種設計。Xeon 6 Plus 和先前已上市的 P-core 版 Xeon 6 形成互補:需要高頻效能的選 P-core,需要高密度低功耗的選 E-core,企業可以根據自己的工作負載混搭。

放在更大的產業脈絡裡,Intel 選了一個聰明的出手時機。全球資料中心的基礎工作負載正在成長,企業同時需要為 AI 準備新的基礎設施,但預算不可能全部砸在 GPU 上。Xeon 6 Plus 的訴求很直接:你的 AI 策略不能只有 GPU,CPU 密度同樣關鍵。

現場展示:agentic 工作流程把 CPU-GPU 比例翻轉了

整場演講最有說服力的環節,是 Intel 展示工程師 John 在台上做的 side-by-side 比較。

左邊螢幕是傳統的 AI 推論場景:使用者要求模型「寫一個呼叫 OpenAI 相容 API 的 Python 函式」。模型接收提示、推理、生成程式碼、回傳結果。整個過程 GPU 吃掉將近七成的運算資源,CPU 只佔不到三成。螢幕上方的比例滑桿清楚顯示 7 比 1,GPU 壓倒性主導。

右邊螢幕切到 agentic AI 的工作流程。同樣的任務,但 agent 不是「一次性回答」,而是像工程師一樣分步驟執行。Pipeline 的每個階段用不同顏色標示:綠色是 GPU 工作,藍色是 CPU 工作。程式碼的靜態檢查(linting)跑在 Xeon 6 Plus 的 E-core 上,網頁抓取和編譯跑在 Xeon 6 的 P-core 上,單元測試又回到 E-core。每個任務自動分配到最適合的核心類型。這次螢幕上方的比例滑桿翻轉了:接近 1 比 1,而且偏向 CPU 這一側。

從單一任務拉到機架規模,數字更誇張。每顆 Xeon 6 Plus 有 288 核心,雙路伺服器就是 576 核心。一個 32U 的機架空間可以塞超過 36,000 顆核心。Kevork 說這樣的機架配置可以同時跑最多 15 萬個 agent。「各位在場的 CIO,好消息:你們買的那些很貴的 GPU,現在可以獲得更高的利用率了。」這句話精準打中企業 IT 採購的痛點。GPU 很貴,但 agentic AI 工作流程中有大量非 GPU 的工作。如果 CPU 能承擔這些任務,GPU 就能專注在它真正擅長的事情上,整體投資效率反而提高。

RackScale Blueprints:與鴻海聯手把機架級設計標準化

光有處理器不夠,Intel 還想把整個機架級別的設計標準化。陳立武宣布了 RackScale Blueprints 計畫,一套基於開放標準的機架級參考設計,讓企業不需要從頭自己規劃,就能快速部署 AI 基礎設施。

Computex 展場上展示了兩種藍圖。一種以效能為導向,搭載 Xeon 6 P-core,適合需要高單執行緒效能的工作負載。另一種以 agent 密度為導向,搭載 Xeon 6 Plus E-core,就是前面展示的那個能跑 15 萬個 agent 的配置。兩種藍圖都採用開放標準,企業不會被綁定在單一廠商的專有方案上。

鴻海產品長 Jerry Xiao 上台宣布深化與 Intel 的合作。雙方將共同開發、整合並商業化基於 Intel Xeon 處理器的 RackScale AI 基礎設施方案。Jerry Xiao 強調鴻海和 Intel 已經合作了幾十年,從 AI 伺服器到資料中心到邊緣運算都有涉獵,這次的 RackScale 合作是雙方關係的下一個里程碑。陳立武的說法是,Intel 不相信「一體適用」的做法,每家企業的工作負載不同,基礎設施的需求也不同,RackScale Blueprints 的目標是提供選擇,而不是強迫接受單一方案。

我的觀察:Intel 最有結構性的一次反擊

Intel 這次在 Computex 上的論述,是過去兩年被 NVIDIA 壓著打之後,最有結構的一次反擊。核心命題清晰:agentic AI 不等於 GPU 運算,CPU 在整個工作流程中的角色正在回升。

但這個論述能不能成立,取決於幾個前提。第一,agentic AI 是否真的會成為主流的企業 AI 使用模式?目前看起來趨勢確實往這個方向走,從 OpenAI 到 Anthropic 到各家雲端廠商都在推 agent 框架,但實際的企業端採用速度還有待觀察。第二,「CPU-GPU 比例回歸 1:1」這個說法是基於特定的 agentic 工作流程展示,不是所有 AI 應用都長這樣。訓練仍然是 GPU 的天下,大量的推論工作也還是 GPU 佔優勢。

不過 Intel 這次的策略定位確實聰明。它不是要取代 GPU,而是在論證「你需要更多 CPU 來搭配 GPU」。對已經擁有大量 x86 伺服器的企業來說,這個說法比「全部換成 GPU 叢集」更容易接受,預算壓力也更小。RackScale Blueprints 搭配鴻海的製造能力,提供了一條從「現有基礎設施」過渡到「AI 就緒基礎設施」的務實路徑。Intel 能不能靠這個論述重回資料中心的核心位置,答案取決於 agentic AI 在企業端的滲透速度。如果 agent 真的成為 AI 應用的主流型態,Intel 的這步棋就走對了。