人腦只要 20 瓦,為什麼 AI 卻需要百萬倍電力?

Unconventional AI 創辦人 Naveen Rao 在 Sequoia AI Ascent 2026 演講中指出,AI 正在兩三年內撞上能源牆。人腦只用 20 瓦就能完成複雜智慧任務,而現代 AI 系統卻消耗數十億瓦。他主張從非線性動力學出發,用物理本身來運算,可能是突破效率瓶頸的關鍵。

人腦只要 20 瓦,為什麼 AI 卻需要百萬倍電力?

本文整理自 Sequoia Capital《Training Data》2026 年 5 月播出的 AI Ascent 2026 演講。

{{< youtube Zw1J5pJJMGw >}}


封面圖

松鼠的 10 毫瓦 vs. 全球最強超級電腦

你有沒有想過,一隻松鼠從一根樹枝跳到另一根,需要多少電力?Unconventional AI 創辦人暨執行長 Naveen Rao 在 Sequoia Capital 的 AI Ascent 2026 活動上給出了答案:不到 10 毫瓦,大約是你口袋裡手機耗電量的百分之一。松鼠要在風中判斷距離、調整姿態、精準落地,這些複雜的即時運算,全靠不到 10 毫瓦完成。但目前最強大的電腦系統,投入遠超這個數字的能量,都還做不到同樣的事情。

Rao 擁有一個罕見的背景組合:史丹佛大學電機工程學位、布朗大學神經科學博士,在高通做過神經型態機器研究,後來創辦了 AI 晶片公司 Nervana Systems(2016 年被 Intel 收購),又創辦了 AI 訓練平台 MosaicML(2023 年被 Databricks 以 13 億美元收購)。兩間公司都成功出場後,他做了一件出乎很多人意料的事:回頭挑戰電腦運算的最底層假設。

「我思考這個問題已經 30 年了,」Rao 在演講中說。他所謂的「問題」,不是怎麼讓 AI 模型更聰明,也不是怎麼讓訓練更有效率,而是一個更根本的問題:我們用來跑 AI 的電腦,從一開始就設計錯了嗎?

一道令人不安的算術

Rao 在演講中擺出了一組數字,簡單到讓人不舒服。全球有大約 80 億人,每個人的大腦消耗大約 20 瓦,所以全人類的大腦加起來,大約用掉 160 億瓦(160 GW)。全球目前的發電容量大約是 9,000 億瓦,美國大約佔其中的 1,000 億瓦。這些電力要供應暖氣、電動車、工廠、所有日常生活所需。

問題在這裡。現在 AI 訓練和推論已經消耗了好幾個十億瓦級的電力。如果 AI 的需求繼續成長,兩到四年內,全球的電力供應就會開始不夠用。這不是十年後的問題,是兩三年後就要面對的現實。就算我們蓋了核融合反應爐、到太空去發電,基本的物理限制還是存在。

但再看一次那組數字:全人類的大腦只需要 160 億瓦,就運作出了科學、藝術、語言、文明。一隻獼猴的大腦不到 1 瓦,就能在叢林裡靈活生存。一隻昆蟲只用幾毫瓦,就展現出複雜的社會行為。生物系統用極少的能量做到了極複雜的智慧,這是一個「存在證明」:高效率的智慧,是物理上可行的。不是理論,是自然界已經做到的事實。

80 年來沒有人質疑的假設

既然生物系統這麼有效率,為什麼我們的電腦這麼耗電?Rao 的答案很直接:因為我們 80 年來一直在用一套為完全不同目的設計的架構。

現代電腦的核心是馮紐曼架構(Von Neumann architecture)。它的運作方式是:把資料從記憶體搬到處理器,做一個運算,再把結果搬回記憶體。每一步都要搬,每搬一次都燒電。數位抽象層、浮點數、矩陣運算,這些都是 1940 年代定下來的規則,沿用至今。Rao 反問:「在科技業裡,有多少東西存在了 80 年?」

這裡有一個容易被忽略的事實。NVIDIA 在 GPU 運算市場上持續領先,這是大家都知道的。但如果仔細看「每瓦運算效能」這個指標,進步其實相當有限。Rao 指出,GPU 的成本確實降低了,因為製造和封裝技術進步了。但真正的能源效率,也就是「每完成一次浮點運算加上記憶體存取,需要消耗多少電」,改善幅度非常小,幾乎停滯。

這意味著我們不是在面對一個可以靠漸進改良解決的問題。就算把現有架構做到極致,距離生物系統的效率還有大約三個數量級的差距。要關閉這個差距,需要從根本改變「運算是什麼」這件事。

讓物理本身「算」出答案

Rao 的方案簡單到讓人意外:與其用數學去模擬物理,不如讓物理直接替你算。

在大腦裡,神經元之間的互動不是矩陣乘法。神經元透過時間變化的非線性動力學來交換資訊,這個過程本身就是「運算」。大腦的運算不是嚴格的一和零,在數位電腦裡,一個 bit 出錯,整個系統可能崩潰。但大腦是隨機的、容錯的、動態的。

Rao 用一個叫做「倉本同步」(Kuramoto synchronization)的概念來解釋。想像一排節拍器放在同一塊板子上,各自隨機開始擺動,但因為透過板子的物理耦合,它們會逐漸同步。這就是一個動力系統自然收斂的例子。沒有人下指令讓它們同步,是物理本身驅動了這個過程。

Unconventional AI 的做法是把這種振盪器的耦合做成可訓練的。當耦合關係可以調整,系統就能在狀態空間裡走出各種不同的軌跡。Rao 在演講中展示了一個範例:用這套動力系統的模型來做影像生成。從隨機狀態開始,在時間點 t=1 用反向傳播修正誤差,之後就讓系統自然運行。系統會自動收斂到有意義的影像,貓、馬、各種類別,因為它已經學會在自己的狀態空間裡導航。

「如果你從這場演講只帶走一件事,」Rao 說,「那就是我們用物理的時間軸來做運算,而現有的運算架構不是這樣做的。」這是關鍵差異:在傳統電腦裡,狀態是「顯式」的,必須不斷寫入和讀取記憶體。在這套新系統裡,狀態是「隱式」的,內建在物理過程中。不用搬資料,就不用燒那些搬資料的電。

我的觀察:「2D 光刻的極限」,說的不就是台積電?

Rao 在演講中提到一個概念:「2D 光刻的極限」是目前運算效率天花板的主要限制之一。他估計,就算把 2D 晶片製程推到極致,距離生物系統的效率還有好幾個數量級。

這句話聽在臺灣人耳裡,應該特別有感。因為全球把 2D 光刻推到極致做得最好的公司,就是台積電。我們擅長的是在既有典範內做到最好:更細的製程、更高的良率、更密的電晶體。但 Rao 在質疑的不是製程能力,而是這整個典範本身。

這不是說台積電或數位晶片的製造能力會過時。至少在可見的未來,數位運算仍然是主流,台積電的角色不會動搖。但如果運算真的開始從「數位邏輯」朝向「類比動力系統」移動,那所需的製造能力、設計工具、驗證方法可能都會不同。台積電在先進封裝(特別是 3D IC)方面的佈局,某種程度上已經在回應「超越 2D」的需求。問題是,如果下一波效率革命來自完全不同的運算基礎,臺灣的半導體生態系有沒有準備好?

這不是危言聳聽。Rao 的公司在概念提出兩個月內就拿到 4.75 億美元的種子輪投資,估值 45 億美元。領投的 a16z、Lightspeed、Sequoia,加上 Jeff Bezos 的個人投資,這不是對一個模糊概念的小額試探,而是矽谷最頂尖的投資人用真金白銀表態:他們認真地相信,運算的下一個典範轉移已經開始了。