高通 CEO 在 COMPUTEX 宣告「代理元年」:手機不再是中心,Dragonfly 進軍資料中心
高通執行長艾蒙在 COMPUTEX 2026 主題演講中宣告「2026 是代理元年」,發表 Dragonfly 資料中心品牌。他認為 AI 代理將取代手機成為數位生態系中心,並以 token 經濟學論證分散式 AI 的必然性,預測全球 token 需求到 2030 年將成長 40 倍。

本文整理自 COMPUTEX 2026 高通主題演講,2026 年 6 月 1 日。
{{< youtube BH6pg0LY8Fw >}}
代理取代手機,成為數位生態系的新中心
高通執行長艾蒙(Cristiano Amon)在 COMPUTEX 2026 開場就丟出一顆震撼彈:「2026 是代理元年。」他認為 AI 已經從回答問題的工具,進化成能夠自主行動的系統。代理會自己更新你的行程、標記需要決策的事項、在你還沒想到之前就先替你處理好待辦事項。這不是漸進式的微調,是整個人機互動模式的重塑。艾蒙開場先感謝了台灣的供應商和開發夥伴,特別點名台積電是「這趟旅程中不可思議的夥伴」,接著用整場 47 分鐘的演講只做一件事:說明 AI 將如何改變邊緣端的每一台裝置。
但艾蒙真正想說的不只是代理很厲害。他的核心論點更激進:手機不再是你數位生活的中心了。過去十多年,所有的穿戴裝置、智慧家電、藍牙耳機,都是圍繞著手機打轉的。手機是太陽,其他裝置是行星。但在代理時代,這個太陽系的中心換人了。代理本身成為中心,手機跟所有其他裝置一樣,都只是代理的「端點」。「代理不會被困在單一生態系裡,」艾蒙強調。如果代理真的能跨裝置、跨平台自由移動,那麼 Apple 的 iOS 圍牆花園、Google 的 Android 生態系,這些過去十年最堅固的商業護城河,都可能開始鬆動。
艾蒙用一組簡單的數字框定了這場變革的規模:全球約 60 億支手機、20 億台 PC、20 億個穿戴裝置(他稱之為「個人 AI 裝置」,是穿戴裝置的進化)、5 億輛聯網汽車。加起來超過 100 億台裝置,全部都需要為代理時代重新設計。他提到智慧眼鏡是特別自然的代理介面,因為它靠近你的眼睛、嘴巴和耳朵,能看你所看、聽你所聽。演講中展示的示範影片也印證了這一點:代理從手機跳到筆電,再跳到智慧家居,不被任何單一裝置綁住。
手機撐不住一整天,加上代理只會更慘
為什麼現有裝置不夠用?艾蒙的解釋很直白:現在所有裝置都是為「人操作」設計的。你打開 app、滑網頁、傳訊息,每一個動作都由你發起。但代理完全不同,它全天候在背景運作,持續推理、協調多個任務、存取感測器資料來理解你的情境。這代表未來的裝置需要同時服務兩個「人格」:一個是人類使用者,一個是 AI 代理。兩者在同一台硬體上同時運行,但需求天差地遠。人類用手機是間歇性的,代理則是永不停歇的。
「如果你的手機現在光是你自己用就撐不到一整天,」艾蒙問,「那你和代理同時用的時候會怎樣?」這是一個非常實際的工程難題。這對硬體設計帶來三個具體要求。首先,需要極為強大且省電的 CPU 來負責任務編排(orchestration),因為代理需要持續地規劃、拆解、協調各種任務。其次,需要高運算密度的 NPU 和 GPU 來在本地執行 AI 模型,很多推理等不了雲端回應。第三,需要豐富的感測器資料持續提供情境,否則代理根本無法理解你在做什麼、在哪裡、需要什麼。
艾蒙直言,這些要求意味著裝置架構需要從頭來過,不是在現有設計上修修補補就能解決的。他指出高通在手機產業做了 30 年,早就習慣在有限的電池容量裡榨出最大運算效能,這個經驗就是高通的核心優勢。目前 Snapdragon 平台上已經有 OpenClaw、Hermes 等代理編排器原生運行,Claude Desktop 也在 Snapdragon PC 上原生執行。Google 的 Gemini Intelligence 正進入 Android,Microsoft 也在做類似的事,甚至 Humane 都在 Snapdragon 上開發完整的代理作業系統。艾蒙的結論是:這將觸發「產業史上規模最大的裝置升級潮之一」。
Token 是 AI 的新貨幣,而且正在百倍膨脹
艾蒙用了一個巧妙的框架來解釋為什麼這場升級不可避免:token 經濟學。他把 AI 的演進分成三個層級。第一級是對話式 AI,一問一答,每次互動大約消耗 1 萬個 token。第二級是推理型 AI,多輪對話加上思維鏈,每個任務大約 10 萬 token,增加了一個數量級。第三級就是代理型 AI,自主執行多步驟任務、呼叫多個工具,每個任務大約 100 萬 token,而且還在持續增長。「兩個世代,token 需求增加了 100 倍,」艾蒙說。
放到全球尺度來看更驚人。2026 年,全球每 10 秒的 token 需求估計是 317 億個。到 2030 年,同樣 10 秒的需求預估是 1.27 兆個,成長 40 倍。年度總量會達到「千京」(quintillions)等級,艾蒙自己都笑了,說「我不知道怎麼唸這個數字,就說它是四個 gazillion 好了」。
關鍵差異在於:代理產生 token 的速度是機器速度,不是人類速度。過去 SaaS 軟體的客戶端是為人類操作設計的,人類打字、點擊、思考的速度決定了 token 的生成速率。但代理不需要思考時間,它會以運算能力允許的最快速度產生和消耗 token。這個根本性的差異,意味著不管你在資料中心建多少運算能力,都不可能單靠雲端滿足所有需求。
這就是艾蒙的殺手論證:分散式 AI 不是選項,是必然。他用兩個現場示範來佐證。第一個是 Claude Code 程式撰寫工作負載,透過智慧編排器在裝置端和雲端之間動態分配任務,結果省下約 140 萬個 token,成本降低 60%,輸出結果完全相同。第二個是用 Snapdragon 建立網頁的任務,分散式執行比純雲端少用 30% 的 token。「不用再爭了,抵抗是徒勞的,」艾蒙直言。他用了一個很接地氣的比喻:你手機上大概有 200 個 app 塞在各種資料夾裡,如果要你逐一列出每個 app 的運算是在手機本地跑還是在雲端跑,根本是不可能的任務。但每個人都知道兩者缺一不可,把手機開飛航模式就知道了。AI 代理的運算也會以同樣的方式自然地分配到最有效率的地方。
從汽車到機器人到 6G:代理無所不在
代理不只改變個人裝置,也正在重塑物理世界的運算架構。艾蒙描述了汽車的兩層智慧:座艙裡是你的個人代理,跟著你從手機、眼鏡一路延伸到車內,提供個人化體驗;道路上則是物理 AI,用攝影機、雷達和地圖進行感知、規劃和行動。他稱之為從「軟體定義車輛」到「AI 定義車輛」的演進。現場展示了一段車載示範:駕駛經過一家花店時,車上的攝影機捕捉到店面資訊,代理立刻查出營業時間和商品種類,無縫整合到車內對話中。兩層智慧以一個整合系統的方式運作,物理感測器的資料同時是駕駛 AI 和個人代理的輸入。
機器人領域更是把運算推到了極限。艾蒙描述了一個三層運算架構:最底層是即時執行,像人類抓東西沒抓穩會本能地再抓一次,這種反射不需要「思考」;中間是動作與環境理解;最上層是推理。重點是,這三層運算不能全塞在一顆「機器人大腦」裡,必須分散到中央運算、動作控制和致動器各自的子系統中。高通目前與 Vinmotion、Neura Robotics 合作,平台涵蓋自主移動機器人、工業機械手臂、四足機器人、人形機器人和無人機,並預告即將公布與 Figure AI 的合作細節。艾蒙也指出工業 AI「不是需求不夠,而是解決方案還沒成熟」,從零售、倉儲到智慧城市,需求龐大,但技術成熟度才是瓶頸。
最具未來感的是 6G 的願景。艾蒙將 6G 描述為「為 AI 時代原生設計的第一代無線技術」,有三個支柱:連接、分散式運算和感測。其中「感測」最具變革性:每一個無線連接都像汽車上的雷達一樣運作,當你把數億個即時連接同時進行三角定位,就能建構出不只是一個街區、一座城市,而是整個國家的即時數位雙生。無人機偵測、低空經濟管理、自動化交通管理都是直接的應用場景。「6G 會讓我們每個人都變成這個世界裡的行走攝影機,」艾蒙說。這些即時感測資料會成為所有端點裝置上代理的情境輸入,把物理世界和 AI 系統連成完整的迴路。
Dragonfly:從 2 毫瓦到 2000 千瓦,最後一塊拼圖
演講的最後,艾蒙揭曉了真正的硬新聞:高通正式發表 Dragonfly,全新的資料中心產品品牌。他透露高通已經在與超大規模雲端業者和全球合作夥伴進行實際部署,但刻意保留了技術細節。「我真希望能告訴你們所有的產品路線圖,但那是 6 月 24 日投資人日的事,」艾蒙說。COMPUTEX 先放出品牌名稱和概念,三週後的投資人日才揭露具體規格和路線圖,既維持了話題熱度,也給了華爾街一個明確的期待。
Dragonfly 的發布有清楚的策略意義。高通一直在推廣「運算連續體」(Compute Continuum)的概念:從功耗不到 2 毫瓦的 AI 耳機搭配微功率 Wi-Fi,到手機、PC、汽車、機器人,一路往上延伸。但這條線過去在資料中心斷掉了。Dragonfly 補上了最後一塊,讓高通的產品組合涵蓋「運算連續體的每一個層級」,從次毫瓦一路到 2000 千瓦等級。
艾蒙在結尾預測,代理驅動的裝置升級潮「可能是產業所見過最大規模的升級週期之一」。代理已經在商用裝置上運行,不是未來式,是現在式。而高通的定位就是在這個從耳機到資料中心的完整光譜上,在每一個層級都提供最佳的每瓦效能。
我的觀察:token 經濟學是高通最聰明的一步棋
這場演講最讓我注意的,不是 Dragonfly 的發布(畢竟還沒有具體規格),而是艾蒙建構論述的方式。
「Token 是 AI 的新貨幣」這個說法,表面上在描述產業趨勢,實際上是在替高通的全產品線創造一個統一的需求敘事。NVIDIA 的黃仁勳用「FLOPS」和「AI 工廠」來論證你永遠需要更多 GPU。艾蒙用「token」來論證你需要在每一個運算層級都部署 AI 晶片,從耳機到資料中心無一例外。兩套框架都很聰明,但服務的是完全不同的商業邏輯:NVIDIA 要你把預算集中在資料中心,高通要你把預算分散到每一台裝置上。
「每瓦效能」是這場演講反覆出現的主題,本質上是高通對 NVIDIA 的不對稱作戰。高通很清楚,在資料中心的絕對運算能力上,它短期內不可能超越 NVIDIA。但省電?做了 30 年手機晶片的公司,在能源效率上確實有底氣。艾蒙的論點是:當代理讓 token 需求暴增 100 倍,能源就會成為瓶頸,而這時候每瓦效能比絕對效能更重要。這個說法有沒有道理?有的。但高通並非第一次挑戰資料中心市場。2018 年的 Centriq 伺服器處理器就是一次高調進場、安靜退場的紀錄。這次有什麼不同?艾蒙說已經有超大規模業者在部署,但在 6 月 24 日投資人日公布具體數字之前,這仍然是一張還沒翻開的牌。
不管 Dragonfly 最終成績如何,艾蒙這場演講替高通畫出了一張很清晰的戰略地圖:代理時代需要無所不在的 AI 運算,而高通是唯一一家從耳機做到資料中心的公司。這個定位能否兌現,2026 下半年就會開始見分曉。