AI 產業動態

零 GPU 實驗室打敗 OpenAI Whisper：李宏毅與台灣 AI 生態系的突圍之路

台大副教授李宏毅坦言實驗室「一張 A100 都沒有」，卻靠借來的 16 張 H100 訓練出打敗 OpenAI Whisper 的語音模型。同場亮相的還有全球首座 GB300 超算與 Token Factory 算力平台，聯發科蔡力行則罕見反思台灣系統工程短板。

2026 年 6 月 1 日 · 來源： NVIDIA GTC Taipei 2026

零 GPU 實驗室打敗 OpenAI Whisper：李宏毅與台灣 AI 生態系的突圍之路

本文整理自 2026 年 5 月 28 日 NVIDIA GTC Taipei Pre-Game Show 直播。

「不要說 H100，我們一張 A100 都沒有」

在 GTC 台北會前秀的最後一個座談環節，台大電機系副教授李宏毅上台說的第一件事，就讓全場氣氛一變。「不要說 H100，我們一張 A100 都沒有，我們什麼運算資源都沒有。」這位在 YouTube 上擁有超過 20 萬訂閱者的機器學習教授，一句話揭露了台灣頂尖大學 AI 研究的算力窘境。

這不是個案。台灣的大學長期以來缺乏高階 GPU 資源，研究者必須靠產學合作或政府計畫才能取得有限的運算能力。相較於美國的大型實驗室動輒數萬張 GPU 的叢集，台灣學術界的起跑線離得很遠。但李宏毅接下來的故事，卻是一個漂亮的反轉。

透過與 NVIDIA 的合作，李宏毅的團隊借用了 16 張 H100 GPU，在這個有限的算力基礎上訓練出兩個引人注目的成果。第一個是台大的 NTU Cool 語音辨識系統，專門針對校園課程中常見的中英夾雜場景設計，辨識準確度超越 OpenAI 的 Whisper，速度更達到最佳商用模型的五倍。第二個是 DESTA 語音語言模型，僅使用 5,000 小時的訓練資料，效能就超越了阿里巴巴的千問 2（Qwen2），而千問 2 的訓練資料量是它的一百倍。

1% 的資料量，更好的結果

一百分之一的資料量，卻達到更好的效果，靠的是什麼？李宏毅的答案是演算法的創新。當你沒有幾萬張 GPU 可以暴力堆資料時，你被迫要找更聰明的方法，用更少的資源做出更好的東西。這恰恰是台灣學術界在資源受限環境下磨練出來的能力。

李宏毅進一步提出了一個挑戰性的預測：五年後，開發 AI 模型的工作可能由另一個 AI 來完成。他的實驗室已經看到 AI 解決複雜數學問題、生成新演算法的案例。如果這個趨勢持續，「知道怎麼訓練模型」的技能價值會逐漸下降。真正稀缺的是另一種能力：知道要訓練什麼、為什麼要訓練、怎麼評估結果。他濃縮成一句話：「未來的世界，想做什麼比會做什麼重要。」

這對台灣的 AI 人才培育方向有直接的啟示。目前多數課程聚焦在技術面：怎麼寫程式碼、怎麼訓練模型、怎麼調參數。但如果 AI 本身能處理這些技術細節，真正需要的人才反而是能定義問題、理解領域需求、持續監控系統品質的人。醫師知道什麼症狀需要注意，工程師知道什麼品質指標重要，農學家知道什麼土壤條件需要監測，這些領域專家可能才是 AI 時代最稀缺的資源。

全球首座 GB300 超算在台灣

李宏毅的算力困境即將迎來轉機。鴻海旗下的亞灣超算（Visionbay.ai）執行長姚延宗在同一場座談中宣布，台灣即將啟用全球第一座搭載 NVIDIA GB300 的超算中心 Vision Bay。這不只是一座硬體設施，更是台灣主權 AI 策略的核心基礎建設。

主權 AI 的邏輯很直白：台灣企業在半導體、製造、醫療等領域擁有豐富的專業知識和資料，但過去因為缺乏本地先進算力，這些資料不是閒置浪費，就是得送到境外處理。Vision Bay 要做的，就是提供一個讓台灣企業能在本地安全運算的平台，讓關鍵資料不必出境。

姚延宗也指出，產業的競合關係正在重組。一年多前鴻海宣布進入 AI 資料中心產業時，許多 CSP（雲端服務供應商）客戶確實有疑慮。但 GPU 持續短缺讓 CSP 開始願意合作而非競爭，加上企業希望將資本支出（CapEx）轉為營運支出（OpEx），專業算力業者恰好能承接這個需求。就像 PC 時代 OEM 最終把工廠交給 ODM/EMS，AI 產業的分工也正在重新定義。

GPU 變自來水：Token Factory 的想像

GMI Cloud 執行長葉威延則從另一個角度闡述算力民主化的願景。他指出，目前企業要直接使用 GPU，需要同時具備基礎設施人才、研究人才、預訓練專家、後訓練專家和推論工程師，門檻高到絕大多數企業根本跨不過去。更麻煩的是 GPU 本身就不穩定，維運難度極高。

葉威延提出的解方是「Token Factory」：把 GPU 虛擬化為模型服務，整合超過一百種模型（語音、影片、圖像、語言），讓企業不需管理叢集，只需思考「我要拿 AI 做什麼」。他觀察到產業正從訓練階段轉向推論階段，目前確定起飛的兩個賽道是程式碼生成（Anthropic 的成長速度極快）和影像模型。推論階段最需要的不是超大規模叢集，而是穩定、多元、隨選隨用的服務。

他也點出台灣可以填補的人才缺口：底層的機房 DevOps、Kubernetes 管理和大規模網路工程，中層的推論優化與降本提速，上層的應用架構師。台灣的硬體王國在韌體和系統底層有現成的工程能力，只需要引導到正確的方向。

蔡力行的誠實反思

在所有講者中，聯發科副董事長蔡力行的一段發言或許最需要被記住。他在座談的綜合討論中直言，台灣在 IC 設計和零組件方面的底層實力很強，但在系統層級的軟硬體整合能力上「還需要更加的努力」。因為不夠理解軟體架構，台灣設計的 IC 常會出現 mismatch，浪費大量時間修正，錯失上市時機。

這不是客氣的自謙，而是親身經驗的體悟。蔡力行說，和 NVIDIA 合作 GB10 的過程讓他深刻感受到，軟體架構必須從一開始就引導硬體設計，不能等硬體做完再來套軟體。華碩董事長施崇棠也呼應這個觀點，強調 Agentic AI 時代要做到最前沿，必須貫穿整個 full stack，從算力、記憶體頻寬到應用層的設計思維，任何一環斷掉整個系統都會打折扣。

施崇棠還坦言，中國大陸在 AI 開源模型和深度研究方面的進展「非常快」，台灣必須謙虛面對現實並加速補強。這種公開承認對手優勢的態度，在台灣科技業高層的公開場合並不常見，也讓這段對話格外有分量。

想做什麼比會做什麼重要

李宏毅的那句「想做什麼比會做什麼重要」，我認為是這整場兩小時會前秀最精準的總結。它同時適用於個人、企業和國家。對個人，技術能力會被 AI 追平，但問對問題的能力不會。對企業，能不能用 AI 不再是差異化因素，知不知道拿 AI 解決什麼問題才是。對台灣，半導體和硬體的優勢依然堅實，但蔡力行和施崇棠的反思提醒我們：如果不補上系統工程和軟體思維的短板，台灣在 AI 時代可能成為「做得最好的零件供應商」，卻不是定義遊戲規則的人。

從零 GPU 打敗 Whisper 到全球首座 GB300 超算，台灣 AI 生態系的拼圖正在一片一片補上。但差的那幾片，搞不好才是最關鍵的。