35 人做到 2 億美元 ARR:Fal 的極致精實執行力,每人年營收 600 萬美元

生成式媒體平台 Fal 只用 35 人團隊就創造超過 2 億美元年營收,每人貢獻約 600 萬美元。工程負責人解析這種前所未見的營收密度如何實現,以及為什麼精實團隊在 AI 時代反而是最大優勢。

35 人做到 2 億美元 ARR:Fal 的極致精實執行力,每人年營收 600 萬美元

本文整理自 Open Source Startup Podcast 2026 年 4 月播出的單集。

{{< spotify "episode/2JFv8eAHGbo6UY9XJT1xaP" >}}

{{< apple-podcast "tw/podcast/e194-fals-bet-on-generative-media/id1548524534?i=1000764562135" >}}


每人年營收 600 萬美元,這在新創界前所未見

在矽谷,大家都說 AI 會讓小團隊做到大事。但實際數字是多少?Fal 工程負責人巴圖漢.塔斯卡亞(Batuhan Taskaya)給出了一個讓人停下來重算的答案:每人年營收可以達到 500 到 600 萬美元。

Fal 是一家生成式媒體雲端平台,為開發者提供圖像、影片和音訊模型的推論 API。2025 年 10 月,這家公司的 ARR 已經超過 2 億美元。12 月完成 Sequoia 領投的 1.4 億美元 D 輪,估值 45 億美元。客戶名單包括 Adobe、Shopify、Canva、Quora 這些大公司。而完成這一切的團隊,只有大約 35 到 40 人。

塔斯卡亞在訪談中直接說,這種營收密度「在新創界前所未見」。他認為這不是偶然,而是 AI 時代精實團隊的結構性優勢。Fal 從 2021 年成立以來就刻意維持小規模,即使在營收爆發成長期也沒有大規模招聘。這個策略讓他們得以在 2022 年底用六個人完成從資料工具到生成式媒體平台的徹底轉型,如果當時有 60 個人,這種轉向幾乎不可能發生。


六個人的豪賭:閉關九個月的轉型故事

Fal 最初是一個 Python 資料轉換工具,做的是 Databricks 生態系的邊緣產品。2022 年,Stable Diffusion 和 ChatGPT 同時爆發,團隊面臨一個選擇:繼續在資料工具市場慢慢磨,還是跳進 AI 推論。

當時的團隊只有六個人,但這反而成為優勢。塔斯卡亞回憶,他們評估了語言模型、嵌入模型、圖像模型三個方向。語言模型已經有 OpenAI 的強勢 API,還有多家拿了 B 輪的競爭者。但圖像模型的 API 市場幾乎是空白。有些業者提供服務,本質上只是把模型塞進 Docker 容器再包一層 HTTP 端點,不能擴展、效能差、成本高。對一個六人團隊來說,選擇沒有巨頭佔位的市場是唯一合理的策略。

他們用了九個月閉關開發。這段期間同時做了三件事:重建底層基礎設施、開發效能優化的推論引擎、以及找到前兩個付費客戶。九個月拿到兩個客戶聽起來很慢,但這兩個客戶在幾個月內就把 Fal 的 ARR 從零推到 100 萬美元。團隊算了一筆帳:如果繼續做資料工具,要賣多少 SaaS 授權才能達到同樣的營收?數字一比,答案太明顯了。

轉型公開宣布後,成長曲線陡峭得驚人。一年內從 100 萬到 1000 萬,再一年從 1000 萬到 1 億,然後繼續翻倍。而團隊規模幾乎沒有等比例增長。


上千個 Slack 頻道:工程師直接面對客戶的 GTM 策略

35 人團隊要服務 Adobe 和 Canva 這種等級的客戶,怎麼做到?答案不是傳統的企業銷售部隊,而是一種「工程師即服務」的模式。

塔斯卡亞透露,Fal 目前有上千個 Slack 頻道,每個頻道對應一個客戶。頻道裡不是客服人員,而是工程師。客戶的工程團隊可以直接和 Fal 的工程師討論技術問題,從模型選擇到效能調校到客製化需求。這種深度整合讓客戶不只是「用一個 API」,而是把 Fal 當成自己團隊的延伸。

這個模式在 Fal 的早期客戶群尤其有效。最初的客戶多是 AI 原生的新創公司,他們自己知道要用什麼模型、什麼設定,只需要一個可靠、快速、划算的推論平台。但當 Fal 開始接觸企業客戶後,需求變得更複雜。一家沒用過任何圖像模型的企業可能面對平台上 600 多個模型,完全不知道該從哪裡開始。這時候 Fal 的工程師會變成解決方案顧問:了解客戶的使用場景(比如服裝的虛擬試穿),推薦最適合的模型組合,甚至幫客戶做 A/B 測試來比較不同模型的轉換率。

對更大型的企業客戶,Fal 還有一個專門的「創意工程」團隊,可以幫客戶收集專屬資料集、在開源基礎模型上做後訓練,產出完全客製化的模型。塔斯卡亞舉了一個例子:一家做虛擬試穿的客戶需要的不只是「圖像生成」,而是「睡衣的虛擬試穿」這麼窄的場景。通用模型沒辦法處理這種精細度,但客戶多年累積的實拍照片是無價的訓練資料。Fal 幫他們在開源模型上微調,讓模型既保留通用能力又學會客戶獨有的視覺風格。基礎模型可以隨時換成更新更好的版本,但資料管線和微調流程是長期資產。


速度作為文化:效能工程的日常

精實團隊要能運作,每個人的產出密度必須極高。在 Fal,這體現為對效能近乎偏執的追求。塔斯卡亞的背景是編譯器工程師,他是 CPython 的核心貢獻者,做過即時編譯器和資料庫查詢引擎。這種底層系統的直覺讓他看 AI 推論的方式和多數人不同。

他描述了 Fal 初期的一個關鍵發現:用標準 PyTorch 跑圖像生成模型,GPU 的硬體利用率只有 30% 到 40%。也就是說,你付了 100% 的算力費用,實際只用了三到四成。對效能工程師來說,這簡直不可思議。Fal 團隊用了幾週時間,透過逐層 profiling 和自建 kernel,把利用率拉到 70-80%。這直接反映在客戶的體驗上:有客戶告訴他們,單純換到 Fal 的 API,使用者留存率就提升了,因為生成速度快到明顯改善了產品體驗。甚至有客戶故意把 Fal 的 API 回應速度調慢,來觀察不同速度對使用者留存的影響。

但效能優化不是一次性的工作。每一代 GPU 架構都需要重新適配:A100 到 H100 是一次大幅改變,H100 到 Blackwell 又是一次。NVIDIA 有四五十人在做推論引擎最佳化,開源社群遲早會追上來。Fal 的真正優勢在於時間差:每當一個新模型發布,他們能在最短時間內完成優化上線。開源社群可能要花幾個月才做到 80% 的效能水準,而 Fal 在第一天就能提供接近最佳的推論速度。對客戶來說,這幾個月的時間差就是產品迭代和市場佔有率的差距。


我的觀察:AI 時代的組織型態正在被改寫

Fal 的案例讓我思考一個更大的問題:AI 時代的公司,到底需要多少人?

傳統的 SaaS 公司,營收從 1 億到 10 億美元通常伴隨員工從 500 人膨脹到 5000 人。銷售、客服、產品經理、專案經理,每一層都在增加人力。但 Fal 用 35 人做到 2 億美元 ARR,等於打破了這個線性關係。而且他們的客戶不是小公司,是 Adobe 和 Shopify。

我認為這背後有結構性因素。推論即服務(Inference-as-a-Service)的商業模式天然適合精實:營收和算力使用量直接掛鉤,不需要大量人力去「說服」客戶買單。同時,「工程師面對客戶」的模式省掉了傳統企業軟體公司裡大量的中間角色。沒有業務代表、沒有客戶成功經理、沒有技術支援分層,工程師直接解決問題,效率極高但也對人才品質要求極高。再加上開源模型生態系讓 Fal 不需要養龐大的研究團隊做預訓練,人力全部集中在他們最擅長的效能工程上。三者疊加,才有了這個異常的人均營收數字。

對想在 AI 領域創業的人來說,Fal 的故事有一個意想不到的啟示:不要急著招人。塔斯卡亞說得很直接,精實讓你保有選擇權。Fal 能用六個人完成轉型,恰恰因為他們不需要說服 60 個人改變方向。在 AI 這種每 28 天就有新變化的產業裡,能快速轉向的能力可能比什麼都重要。