Agent 不睡覺,還會自我複製:Arm 執行長解釋為什麼 CPU 市場正在翻倍
Arm 執行長 Rene Haas 在 Computex 2026 指出,agentic AI 正以「GPU 產 token、CPU 調度 token」的模式重塑運算架構。他預測 CPU 需求將成長 4 到 10 倍,五年內 CPU 市場規模將從 1,200 億美元翻倍到 2,000 億美元以上。

本文整理自 Arm 執行長 Rene Haas 於 Computex 2026 的主題演講(2026 年 6 月 2 日)。
{{< youtube aEvEoDJoJQY >}}
「Agent 不睡覺,而且 agent 會生出更多 agent,那些 agent 又會生出更多 agent。」Arm 執行長 Rene Haas 在 Computex 2026 的舞台上,用這句話解釋了一個正在改寫整個半導體產業預測模型的現象。過去兩年,AI 產業的注意力幾乎全部集中在 GPU 上,但 Haas 在這場演講裡做了一件事:把聚光燈轉向 CPU,並且給出了為什麼 CPU 市場即將翻倍的完整論述。
GPU 是工廠,CPU 是調度中心
理解 Haas 的論點,需要先釐清 GPU 和 CPU 在 AI 系統中各自扮演什麼角色。GPU(以及各種 XPU 加速器)是「token 工廠」,不管是訓練階段的學習運算,還是推論階段的 token 輸出,這些加速器的設計目的就是盡可能快速、高效地生產 token。NVIDIA 的 Grace Blackwell 系統號稱能產出全球最低成本的 token,這正是 GPU 端的軍備競賽。
但 token 生產出來之後呢?這些 token 需要被分發、管理、編排、送到正確的目的地。在 agentic AI 的架構裡,一個 agent 可能同時呼叫多個工具、讀取多個資料來源、跟其他 agent 協調任務,每一個步驟都涉及大量的邏輯運算和資源調度。這些工作不是 GPU 擅長的,而是 CPU 的地盤。Haas 用一個簡單的類比說清了這個分工:GPU 負責把貨物生產出來,CPU 負責整個物流系統的調度。
關鍵在於,agent 跟人類使用 AI 的模式完全不同。人類跟聊天機器人互動,是一來一回的節奏:點一下、等一下、看結果,然後決定下一步。Agent 不是這樣運作的。Agent 會持續思考、使用工具、閱讀資料、再思考、規劃、嘗試,可能連續工作數分鐘、數小時、甚至數天。而且一個 agent 會產生子 agent,子 agent 又產生更多子 agent,形成指數級的運算需求。每一個 agent 都需要 CPU 來做調度,GPU 產出的 token 愈多,CPU 的調度壓力就愈大。
4 倍只是起點
Haas 把時間拉回三月底的「Arm Everywhere」活動。在那場活動上,Arm 展示了一張 OpenClaw 的 GitHub 星星成長曲線圖,跟 Linux 和 Kubernetes 的成長軌跡做對比。Linux 和 Kubernetes 的成長已經很驚人了,但 OpenClaw 的曲線幾乎是「超越拋物線」的垂直起飛。這張圖讓 Arm 意識到 agentic 平台的爆發速度遠超預期。
基於這個觀察,Arm 在三月提出了一個大膽的預測:未來在相同的功耗範圍內,需要的 CPU 核心數量將是現在的四倍。Haas 坦承,這個數字公布後被追問了無數次「你怎麼算出來的」。但他說,沒過多久,產業界自己開始引用更大的倍數:4 倍、8 倍、甚至 10 倍的說法都冒了出來。確切的倍率很難預測,因為你面對的是「成長率的成長率的成長率」,但方向很清楚,這個數字只會愈來愈大,不會縮小。
推動這波成長的不只是技術趨勢,而是真實的商業需求。Haas 點名了 Snowflake、Salesforce、ServiceNow 這些 SaaS 公司正在大舉開發 agent 功能,Anthropic 的 Claude Code 和 OpenAI 的 Codex 則代表了開發工具領域的 agentic 爆發。這些都不是實驗室裡的概念驗證,而是已經在產生營收的商業產品。當 token 生成變得有利可圖,每個人都想生成更多 token。Token 量暴增又需要更多 agent 來處理,更多 agent 又需要更多 CPU 來調度。這個飛輪一旦轉起來,就停不下來了。
2,000 億美元的 CPU 市場
三月的活動上,Haas 還丟出了另一個數字:五年內 CPU 的可定址市場(TAM)將超過 1,000 到 1,200 億美元。這個數字在當時被媒體、投資人和分析師質疑「太激進」。Haas 在 Computex 上回顧這段歷史,語氣裡帶著幾分「我跟你們說了吧」的意味。
「快轉到現在,大家在討論的數字已經接近那個數字的兩倍,甚至更大。」他說得很直接。如果三月的 1,200 億美元被認為太樂觀,那麼不到三個月後產業共識已經翻倍到 2,000 億美元以上,這本身就說明了 agentic AI 對運算需求的衝擊速度。
Haas 的邏輯鏈很清晰:更多 token 被產出,代表更多資訊被使用;更多資訊被使用,代表更多 agentic 活動;更多 agentic 活動,代表更多 CPU 需求。這不是線性成長,而是複合成長。每一個環節都在加速下一個環節,形成自我強化的循環。Arm 的答案就是 AGI CPU,一顆專為這種 agentic 調度工作負載設計的處理器。但不管用的是 Arm、x86 還是其他架構,CPU 需求的爆發是整個產業都在經歷的。
從 iPod 到 Agent:第三次運算革命
Haas 在演講中花了不少時間回溯 Arm 的歷史,但這不只是公關話術。他在建立一個論述框架:Arm 經歷過的每一次技術爆發,都跟某種新型運算需求的出現有關。2000 年代初期,Creative 和 Diamond Rio 的 MP3 播放器用的是 Arm 晶片,只能裝 256 首歌。然後 iPod 出現了,靠著 PortalPlayer 設計的 Arm 晶片成為現象級產品。接著是 2008 年的 iPhone,帶動了整個行動運算革命,Arm 的出貨量從此進入全新的數量級。
Haas 說,iPhone 引爆的行動革命是 Arm 歷史上「最重要的時期」。他把 OpenClaw 的拋物線成長曲線跟當年行動裝置的爆發做類比,暗示 agentic AI 就是下一個同等量級的轉折點。如果行動革命讓全球有了數十億支智慧手機,每支都跑 Arm 晶片,那麼 agentic AI 革命會讓全球有數十億個 agent,每個都需要 CPU 來運作。
這個類比是否成立,還有待驗證。但從數字來看,Haas 的論述至少有一個堅實的基礎:三個月前被嫌太激進的預測,現在看起來反而太保守了。
我的觀察:GPU 敘事遮蔽了 CPU 真相
過去兩年的 AI 敘事幾乎被 GPU 壟斷了。NVIDIA 的市值衝上全球第一,每一場 AI 討論都圍繞著算力、顯卡、訓練叢集。但 Haas 在這場演講裡點出了一個被嚴重忽略的事實:agentic AI 不只是 GPU 的故事,它同樣是 CPU 的故事,甚至可能更是 CPU 的故事。
這個觀點的說服力在於邏輯很簡單。GPU 產出 token,但 token 產出之後的所有事情,分發、管理、編排,都是 CPU 的工作。Agent 的數量成長是指數級的,每一個 agent 都要消耗 CPU 資源。當 NVIDIA 把 token 生成的成本壓到愈來愈低,反而會刺激更多 agent 被部署,進一步推高 CPU 的需求。這是一個 GPU 愈強、CPU 愈忙的關係,聽起來出乎意料,但邏輯完全說得通。
對台灣來說,這不只是產業分析。如果 CPU 市場真的在五年內翻倍到 2,000 億美元,而 Arm 伺服器 CPU 百分之百在台灣製造,那麼台灣供應鏈在這波 agentic AI 浪潮中的角色,可能比大多數人意識到的還要關鍵。