零 GPU 實驗室打敗 OpenAI Whisper:李宏毅與台灣 AI 生態系的突圍之路
台大副教授李宏毅坦言實驗室「一張 A100 都沒有」,卻靠借來的 16 張 H100 訓練出打敗 OpenAI Whisper 的語音模型。同場亮相的還有全球首座 GB300 超算與 Token Factory 算力平台,聯發科蔡力行則罕見反思台灣系統工程短板。

本文整理自 2026 年 5 月 28 日 NVIDIA GTC Taipei Pre-Game Show 直播。
{{< youtube b1EaoN2CnCE >}}
「不要說 H100,我們一張 A100 都沒有」
在 GTC 台北會前秀的最後一個座談環節,台大電機系副教授李宏毅上台說的第一件事,就讓全場氣氛一變。「不要說 H100,我們一張 A100 都沒有,我們什麼運算資源都沒有。」這位在 YouTube 上擁有超過 20 萬訂閱者的機器學習教授,一句話揭露了台灣頂尖大學 AI 研究的算力窘境。
這不是個案。台灣的大學長期以來缺乏高階 GPU 資源,研究者必須靠產學合作或政府計畫才能取得有限的運算能力。相較於美國的大型實驗室動輒數萬張 GPU 的叢集,台灣學術界的起跑線離得很遠。但李宏毅接下來的故事,卻是一個漂亮的反轉。
透過與 NVIDIA 的合作,李宏毅的團隊借用了 16 張 H100 GPU,在這個有限的算力基礎上訓練出兩個引人注目的成果。第一個是台大的 NTU Cool 語音辨識系統,專門針對校園課程中常見的中英夾雜場景設計,辨識準確度超越 OpenAI 的 Whisper,速度更達到最佳商用模型的五倍。第二個是 DESTA 語音語言模型,僅使用 5,000 小時的訓練資料,效能就超越了阿里巴巴的千問 2(Qwen2),而千問 2 的訓練資料量是它的一百倍。
1% 的資料量,更好的結果
一百分之一的資料量,卻達到更好的效果,靠的是什麼?李宏毅的答案是演算法的創新。當你沒有幾萬張 GPU 可以暴力堆資料時,你被迫要找更聰明的方法,用更少的資源做出更好的東西。這恰恰是台灣學術界在資源受限環境下磨練出來的能力。
李宏毅進一步提出了一個挑戰性的預測:五年後,開發 AI 模型的工作可能由另一個 AI 來完成。他的實驗室已經看到 AI 解決複雜數學問題、生成新演算法的案例。如果這個趨勢持續,「知道怎麼訓練模型」的技能價值會逐漸下降。真正稀缺的是另一種能力:知道要訓練什麼、為什麼要訓練、怎麼評估結果。他濃縮成一句話:「未來的世界,想做什麼比會做什麼重要。」
這對台灣的 AI 人才培育方向有直接的啟示。目前多數課程聚焦在技術面:怎麼寫程式碼、怎麼訓練模型、怎麼調參數。但如果 AI 本身能處理這些技術細節,真正需要的人才反而是能定義問題、理解領域需求、持續監控系統品質的人。醫師知道什麼症狀需要注意,工程師知道什麼品質指標重要,農學家知道什麼土壤條件需要監測,這些領域專家可能才是 AI 時代最稀缺的資源。
全球首座 GB300 超算在台灣
李宏毅的算力困境即將迎來轉機。鴻海旗下的亞灣超算(Visionbay.ai)執行長姚延宗在同一場座談中宣布,台灣即將啟用全球第一座搭載 NVIDIA GB300 的超算中心 Vision Bay。這不只是一座硬體設施,更是台灣主權 AI 策略的核心基礎建設。
主權 AI 的邏輯很直白:台灣企業在半導體、製造、醫療等領域擁有豐富的專業知識和資料,但過去因為缺乏本地先進算力,這些資料不是閒置浪費,就是得送到境外處理。Vision Bay 要做的,就是提供一個讓台灣企業能在本地安全運算的平台,讓關鍵資料不必出境。
姚延宗也指出,產業的競合關係正在重組。一年多前鴻海宣布進入 AI 資料中心產業時,許多 CSP(雲端服務供應商)客戶確實有疑慮。但 GPU 持續短缺讓 CSP 開始願意合作而非競爭,加上企業希望將資本支出(CapEx)轉為營運支出(OpEx),專業算力業者恰好能承接這個需求。就像 PC 時代 OEM 最終把工廠交給 ODM/EMS,AI 產業的分工也正在重新定義。
GPU 變自來水:Token Factory 的想像
GMI Cloud 執行長葉威延則從另一個角度闡述算力民主化的願景。他指出,目前企業要直接使用 GPU,需要同時具備基礎設施人才、研究人才、預訓練專家、後訓練專家和推論工程師,門檻高到絕大多數企業根本跨不過去。更麻煩的是 GPU 本身就不穩定,維運難度極高。
葉威延提出的解方是「Token Factory」:把 GPU 虛擬化為模型服務,整合超過一百種模型(語音、影片、圖像、語言),讓企業不需管理叢集,只需思考「我要拿 AI 做什麼」。他觀察到產業正從訓練階段轉向推論階段,目前確定起飛的兩個賽道是程式碼生成(Anthropic 的成長速度極快)和影像模型。推論階段最需要的不是超大規模叢集,而是穩定、多元、隨選隨用的服務。
他也點出台灣可以填補的人才缺口:底層的機房 DevOps、Kubernetes 管理和大規模網路工程,中層的推論優化與降本提速,上層的應用架構師。台灣的硬體王國在韌體和系統底層有現成的工程能力,只需要引導到正確的方向。
蔡力行的誠實反思
在所有講者中,聯發科副董事長蔡力行的一段發言或許最需要被記住。他在座談的綜合討論中直言,台灣在 IC 設計和零組件方面的底層實力很強,但在系統層級的軟硬體整合能力上「還需要更加的努力」。因為不夠理解軟體架構,台灣設計的 IC 常會出現 mismatch,浪費大量時間修正,錯失上市時機。
這不是客氣的自謙,而是親身經驗的體悟。蔡力行說,和 NVIDIA 合作 GB10 的過程讓他深刻感受到,軟體架構必須從一開始就引導硬體設計,不能等硬體做完再來套軟體。華碩董事長施崇棠也呼應這個觀點,強調 Agentic AI 時代要做到最前沿,必須貫穿整個 full stack,從算力、記憶體頻寬到應用層的設計思維,任何一環斷掉整個系統都會打折扣。
施崇棠還坦言,中國大陸在 AI 開源模型和深度研究方面的進展「非常快」,台灣必須謙虛面對現實並加速補強。這種公開承認對手優勢的態度,在台灣科技業高層的公開場合並不常見,也讓這段對話格外有分量。
想做什麼比會做什麼重要
李宏毅的那句「想做什麼比會做什麼重要」,我認為是這整場兩小時會前秀最精準的總結。它同時適用於個人、企業和國家。對個人,技術能力會被 AI 追平,但問對問題的能力不會。對企業,能不能用 AI 不再是差異化因素,知不知道拿 AI 解決什麼問題才是。對台灣,半導體和硬體的優勢依然堅實,但蔡力行和施崇棠的反思提醒我們:如果不補上系統工程和軟體思維的短板,台灣在 AI 時代可能成為「做得最好的零件供應商」,卻不是定義遊戲規則的人。
從零 GPU 打敗 Whisper 到全球首座 GB300 超算,台灣 AI 生態系的拼圖正在一片一片補上。但差的那幾片,搞不好才是最關鍵的。