a16z:「根本沒有所謂的 coding model」,Cursor 的逆襲與 AGI-complete 命題

a16z 合夥人 Martin Casado 提出一個顛覆直覺的觀點:專用 coding model 之所以失敗,是因為每一個真實世界的任務都是 AGI-complete 的。他以 Cursor 為例,說明從應用層往下建模型是可行的逆向路徑。本文同時探討 World Labs 的空間智慧願景、a16z 投資前沿模型的「獨一無二創辦人」策略,以及為什麼 AI 公司的公眾敘事與真相之間存在巨大落差。

a16z:「根本沒有所謂的 coding model」,Cursor 的逆襲與 AGI-complete 命題

本文整理自《Latent Space》2026 年 2 月播出的單集。

{{< youtube p1k7TiAFqdE >}}

{{< spotify "episode/6JAES2xHRoqNUH8iqNAdkl" >}}

{{< apple-podcast "tw/podcast/latent-space-the-ai-engineer-podcast/id1674008350?i=1000750521188" >}}


封面圖

沒有所謂的 coding model

a16z 合夥人 Martin Casado 在 Latent Space Podcast 上說了一句話,做 AI coding 工具的團隊值得停下來想很久。他說:根本不存在所謂的 coding model。這不是一個東西。你是在跟另一個「人」說話,它碰巧擅長寫程式,但它必須什麼都會。

這個觀點直接挑戰了過去兩年 AI 業界一個廣泛的假設:既然 coding 是 AI 最成功的應用場景之一,那麼打造專門為 coding 最佳化的模型,應該會比通用模型表現更好。不少公司和研究團隊投入了大量資源在這個方向上。但結果呢?專用 coding model 幾乎全部失敗了。

Martin Casado 的解釋觸及了一個更深層的命題:每一個真實世界的任務,本質上都是 AGI-complete 的。什麼意思?你以為你在用 AI 寫程式,但實際的對話中,寫程式碼只是一部分。你在問合規問題,在搜尋網路上的文件,在討論系統架構的歷史脈絡,在進行腦力激盪,在釐清需求。一次典型的 coding session,可能有一半以上的時間跟「寫程式碼」這件事無關。

這就是為什麼最通用、最強大的模型,往往在 coding 任務上也表現最好。原因不在於它被特別訓練成寫程式很厲害,而在於寫程式這件事本身就需要廣泛的知識和推理能力。一個只懂程式語法但不懂商業邏輯的模型,寫出來的程式碼不會是你要的。反過來,一個能理解你的業務需求、知道合規要求、了解技術演進歷史的模型,即使它的程式碼生成能力略遜,給出的整體解決方案反而更有用。

Swyx 提出了一個有趣的反駁:在人類世界中,我們確實區分「bedside manner」(溝通能力)和技術能力。最好的醫生不只是技術好,還要能跟病人溝通。AI 會不會也需要這種分工?Martin Casado 沒有否認這一點,但他堅持認為,在目前的技術水準下,通用模型的優勢壓倒性地大過任何專用模型的窄向優勢。除非你能在保持通用能力的同時做到窄向最佳化,否則犧牲廣度來換取深度是不划算的。

Cursor:從應用層往下建模型的逆向路徑

如果通用模型總是贏,那在模型之上建應用的公司還有活路嗎?Martin Casado 用 Cursor 的案例說明了一條可行的逆向路徑。

多數前沿模型公司的策略是「從上往下」:先建好模型,然後往應用層延伸。ChatGPT 是這樣,Claude Code 也是這樣。Cursor 走了相反的路。它先做了一個出色的程式碼編輯器產品,累積了龐大的使用者基礎和使用資料,然後用這些資料往下建了自己的模型。Martin Casado 提到,Cursor 用大約前沿實驗室百分之一的成本,建出了一個接近最先進水準的 coding model。有一段時間,它甚至是全世界最多人使用的 coding model。

這個案例證明了「應用層先行」的策略行得通。Cursor 的護城河不只來自模型,它同時擁有一個龐大的開發者工具市場,這個市場本身的價值跟模型能力無關。即使哪天有人做出一個更好的 coding model,Cursor 的編輯器體驗、外掛生態系、累積的使用者習慣,都是獨立的競爭優勢。

Martin Casado 特別推崇 Cursor 創辦人 Michael Truell 的策略:低調、專注執行、不理會外界噪音。在 AI 產業的媒體敘事極度嘈雜的環境中,Cursor 幾乎不發聲。他們不上 Podcast 自我宣傳,不在 X 上跟人論戰。就是埋頭做產品。Martin Casado 認為這是目前所有 AI 創辦人應該效法的態度,因為「噪音太燙了」。花時間去管理外界的敘事,不如把時間花在做出更好的產品。

World Labs 與空間智慧:語言之外的 AI 前沿

Martin Casado 另一個花了不少篇幅討論的投資是 World Labs。這家公司由史丹佛教授李飛飛(Fei-Fei Li)創立,專注在 3D 場景生成的基礎模型,核心技術是 Gaussian Splats(高斯潑濺)。Martin Casado 對這家公司的投入不只在錢上面,他本人親自參與了 World Labs 的開源渲染函式庫 spark.js 的開發。

從投資的角度,World Labs 的價值主張非常清楚。目前製作一個 3D 場景需要 1 萬到 3 萬美元的人工成本和數週的時間。如果生成式 3D 能把這個成本降低三到五個數量級,降到不到一美元,那就像 DALL-E 對平面設計產業的衝擊一樣,會釋放出一個巨大的市場。但 3D 場景的需求遠超平面圖像,因為遊戲、影視、建築、工業設計、機器人模擬都需要大量的 3D 內容。

更有趣的是圍繞「空間智慧」的認知科學討論。李飛飛的觀點是,語言不夠精確,無法完整描述空間中的導航和互動。人腦有獨立的空間認知系統和語言系統,運作方式不同。這暗示著光靠語言模型可能永遠無法真正理解三維空間,你需要專門的空間基礎模型。Swyx 反駁了這一點:Google DeepMind 用一個大型語言模型就在國際數學奧林匹克中拿了金牌,而數學推理看起來也需要「空間直覺」。這個辯論沒有定論,但它指向了一個根本問題:AI 到底需要多少不同類型的模型,還是一個足夠強大的通用模型就能處理一切?

Martin Casado 分享了他個人用 AI 寫 spark.js 的體驗。他是資深工程師,但已經好多年沒有寫過生產級的程式碼了。過去不是算法能力不夠,而是「啟動能量」太高:你得學一堆框架的 API、搞懂各種建構工具的設定、處理依賴管理。這些瑣碎的工程苦差事把有經驗的技術人推離了一線開發。但現在 AI 幫你處理了所有這些「framework bullshit」(他的原話)。他可以專注在演算法設計、效能調校、架構決策這些真正重要的事情上。AI 把他拉回了第一線。

a16z 投資前沿模型的邏輯:「獨一無二的創辦人」

Sarah Wang 談到 a16z 投資前沿模型公司的核心策略,她稱之為「N-of-One Founders」(獨一無二的創辦人)。重點不是泛泛地說「我們投資好的創辦人」,而是一個很具體的判斷:在 AI 發展的此刻,特定的個人能夠在他們的領域中產生無可替代的影響力。AI 安全領域,Ilya Sutskever 就是 SSI 的理由;強化學習領域,約翰.舒曼(John Schulman)就是 Thinking Machines 的理由;3D 視覺領域,李飛飛就是 World Labs 的理由。

Sarah Wang 的第二個前提是,前沿模型市場不是零和遊戲。她拿 ElevenLabs 當例子:市場上出現了無數個競爭者的音訊模型,ElevenLabs 始終維持了領導地位。專業化能創造持久的價值,即使通用模型也在進步。而且一旦發生能力突破,營收的跟進速度是前所未有的快。有一家她不能點名的公司,產品正式上線後數週內,營收就達到了數千萬美元。

談到 Thinking Machines 這家由穆拉蒂(Mira Murati,前 OpenAI 技術長)和舒曼共同創辦的公司,Sarah Wang 在媒體報導紛擾之際態度很明確:a16z 比以往任何時候都更看好這家公司。2026 年會是關鍵的一年,團隊已經回到工作崗位好幾週了。Martin Casado 藉這個話題做了一個更廣泛的評論:他從業以來,從來沒有看過公眾認知跟真相之間的落差如此巨大。每一家 AI 公司在社群媒體上的形象,跟擁有董事會席位的人實際看到的,幾乎是兩個世界。

他用了一個生動的描述:這些創辦人不只在打真實的戰爭,他們同時還在跟「幽靈」搏鬥。真實世界的挑戰已經夠多了,他們還得分心去應對 X 上那些半真半假、以訛傳訛的敘事。Martin Casado 的建議跟他對 Cursor 的讚美一致:閉嘴,做事。在噪音這麼大的時候,花在管理敘事上的每一分鐘,都是從產品開發偷來的時間。

我的觀察:「每個任務都是 AGI-complete」的切身體會

Martin Casado 說「沒有所謂的 coding model」,每一個用 Claude 或 GPT 寫過程式的開發者應該都有切身體會。你打開 Claude Code 開始一個新專案,一開始確實是在寫程式碼。但很快你發現自己在問它:「這個 API 的 rate limit 是多少?」「這種資料處理方式有沒有 GDPR 的合規問題?」「這個架構在負載高的時候會不會有瓶頸?」「幫我寫一下這個功能的使用者文件。」沒有一個是純粹的「coding 問題」,每一個都需要廣泛的知識。

這對臺灣想做 AI 工具的團隊是一個重要的啟示。如果你正在考慮打造一個「專門為某個程式語言最佳化的 coding model」,Martin Casado 的觀察暗示你可能在走一條死路。使用者在乎的不是模型寫 Python 的能力強了 3%,而是模型能不能理解他的完整需求、能不能在 coding 之外也給出有用的建議。

Cursor 的成功路徑反而更值得臺灣團隊參考。不要試圖從零建一個前沿模型來跟 OpenAI 和 Anthropic 正面對決。找到一個特定的應用場景,把產品做到極致,累積使用者和資料,然後如果規模夠大,再考慮往下建自己的模型。這個「應用層先行,模型層跟進」的策略,在資源有限的環境下是更理性的選擇。先活下來,再談壯大。