桌上跑一兆參數模型:NVIDIA DGX Station 與 Intel Crescent Island 的硬體路線之爭

NVIDIA 發表 DGX Station for Windows,搭載 GB300 Grace Blackwell Ultra 超級晶片,748GB 記憶體可在桌上型電腦執行一兆參數模型。同日 Intel 揭露 Crescent Island GPU,以 LPDDR5X 取代 HBM,單機最高可達 3.8TB GPU 記憶體,兩家走出截然不同的企業 AI 推論路線。

桌上跑一兆參數模型:NVIDIA DGX Station 與 Intel Crescent Island 的硬體路線之爭

同一天、同一個 Computex 2026 會場,NVIDIA 和 Intel 端出了各自對企業 AI 推論的答案,但走的路線截然不同。

NVIDIA 把資料中心等級的超級電腦塞進桌面工作站,Intel 則用一張 PCIe 卡,試圖讓現有伺服器也能承接大規模 AI 推論。兩條路線的共同目標只有一個:讓企業把 AI 工作負載從雲端搬回自己的辦公室。

NVIDIA DGX Station:桌上型電腦跑一兆參數模型

NVIDIA 在 GTC 台北發表了 DGX Station for Windows,稱它是「全球第一台桌上型 AI 超級電腦」。這台與微軟密切合作開發的工作站,搭載 NVIDIA 自家的 GB300 Grace Blackwell Ultra 桌面超級晶片,是把資料中心用的 Grace Blackwell 平台客製化成桌面版本。一顆 Blackwell Ultra GPU 加一顆 Grace CPU,透過 NVLink C2C 高速互連,提供 20 petaflops 的 FP4 運算效能和最高 748GB 的統一記憶體。

748GB 記憶體是什麼概念?它足以在本機上跑一兆參數的前沿模型,或同時支撐數百個平行運作的 AI 代理。這台工作站瞄準的痛點很明確:大量企業的日常工程工作在 Windows 上進行,但高運算量的 AI 工作(模型訓練、微調、大規模推論)卻得推到 Linux 雲端資料中心。DGX Station 要消除這個摩擦,讓團隊在自己桌上就能做這些事。

如果基本配置還不夠力,可以外掛一張 RTX Pro 6000 Blackwell 工作站 GPU 做光線追蹤和物理模擬。多台 DGX Station 之間也能透過 ConnectX-8 SuperNIC 串聯成叢集,把算力堆上去。NVIDIA 預計第四季上市,定價方面只給了一個暗示,用 Techmeme Ride Home 主持人 Brian McCullough 的話說:「大概會很瘋狂。」

OpenShell:用作業系統管 AI 代理,不靠提示詞

DGX Station 和 RTX Spark 共用的一項關鍵技術是 OpenShell 代理執行環境。NVIDIA 在這裡做了一個很明確的宣示:要管控 AI 代理的行為和安全性,不能只靠系統提示詞,因為提示詞太容易被繞過。

OpenShell 是開源的,整合了 Windows 的安全原語和容器技術,為每個 AI 代理建立獨立的沙盒環境。在這種架構下,代理的安全和隱私策略由作業系統層級強制執行。企業管理員可以用微軟既有的裝置管理工具來集中管控所有代理的行為邊界,避免代理覆寫企業政策或洩漏憑證。Windows Subsystem for Linux 則確保跟 Linux 工具鏈的相容性。

這個設計反映了業界正在形成的共識:當 AI 代理從實驗走向生產,「靠提示詞管安全」這條路愈來愈站不住腳。OpenShell 代表的是另一個方向,把安全責任從模型的行為層下移到作業系統的基礎設施層。對企業來說,這比「在 system prompt 裡多寫幾條規則」可靠得多。

Intel Crescent Island:用 LPDDR5X 繞過 HBM 瓶頸

Intel 在同一天揭露了 Crescent Island 資料中心 GPU 的更多細節。這張卡建構在 Intel 的 Xe3P 架構上,Intel 直接把它定位為「專為 AI 代理打造」,支援從 FP4 推論到 FP64 科學計算的完整精度範圍。

Crescent Island 最大膽的設計決策是記憶體選擇:不用 HBM,不用 GDDR,選擇了 LPDDR5X。Intel 的參考設計搭配 160GB LPDDR5X,但架構允許合作夥伴擴充到 480GB。其原理是用一條 640 位元的匯流排連接 20 顆 LPDDR5X 記憶體模組,以 10.7Gbps 的速度提供約 684GB/s 的頻寬。三星已經有現成的 24GB 模組可以支援完整配置。

為什麼選 LPDDR5X?Intel 的算盤很清楚。HBM 是目前 AI 加速器供應鏈中最大的瓶頸,產能幾乎被 NVIDIA 包走,而且需要昂貴的先進封裝技術(例如台積電的 CoWoS)。改用 LPDDR5X,Intel 同時繞過了產能和封裝兩個限制,在成本和供貨上取得更大的彈性。代價是頻寬比 HBM 低,但 Intel 的論點是:對推論工作負載來說,記憶體容量比頻寬更重要。大量 AI 資料可以直接放在 GPU 旁邊,減少資料搬移的開銷。

從部署角度看,Crescent Island 是一張 350 瓦的 PCIe 卡,氣冷散熱,可以直接插進標準的 4U 或 5U 伺服器機架,不需要液冷改裝。八張配滿 480GB 的卡裝在一台伺服器裡,就有 3.84TB 的 GPU 記憶體,足以跑超大模型或大量小型 AI 代理群。Intel 預計 2026 下半年上市,但還沒公布任何實際運算效能數據,也沒有透露晶片的製造工廠。

我的觀察

NVIDIA 和 Intel 的這兩個產品,代表了企業 AI 推論的兩種截然不同的哲學。NVIDIA 走極致整合路線:一台桌上型工作站、一個超級晶片、748GB 記憶體,定價「大概很瘋狂」,但什麼都幫你搞定。Intel 走務實路線:一張 PCIe 卡、氣冷散熱、插進現有伺服器就能用,靠 LPDDR5X 壓低成本和供應鏈風險。

Intel 的 LPDDR5X 賭注是我覺得最有意思的部分。避開 HBM 不只是省錢,而是在供應鏈層面開闢了一條不被 NVIDIA 鎖死的路。如果 Crescent Island 的推論效能確實夠用,它可能會在那些買不到或買不起 NVIDIA 產品的企業中找到市場。但 Intel 得先拿出實際效能數據,目前連基本的吞吐量指標都還沒公布,讓人很難評估它到底能不能跟 NVIDIA 搶生意。記憶體容量的帳面數字好看是一回事,實際推論速度才是企業買單的根據。