AI 產業動態

35 人做到 2 億美元 ARR：Fal 的極致精實執行力，每人年營收 600 萬美元

生成式媒體平台 Fal 只用 35 人團隊就創造超過 2 億美元年營收，每人貢獻約 600 萬美元。工程負責人解析這種前所未見的營收密度如何實現，以及為什麼精實團隊在 AI 時代反而是最大優勢。

2026 年 5 月 17 日 · 來源： Open Source Startup Podcast

35 人做到 2 億美元 ARR：Fal 的極致精實執行力，每人年營收 600 萬美元

本文整理自 Open Source Startup Podcast 2026 年 4 月播出的單集。

{{< apple-podcast "tw/podcast/e194-fals-bet-on-generative-media/id1548524534?i=1000764562135" >}}

每人年營收 600 萬美元，這在新創界前所未見

在矽谷，大家都說 AI 會讓小團隊做到大事。但實際數字是多少？Fal 工程負責人巴圖漢．塔斯卡亞（Batuhan Taskaya）給出了一個讓人停下來重算的答案：每人年營收可以達到 500 到 600 萬美元。

Fal 是一家生成式媒體雲端平台，為開發者提供圖像、影片和音訊模型的推論 API。2025 年 10 月，這家公司的 ARR 已經超過 2 億美元。12 月完成 Sequoia 領投的 1.4 億美元 D 輪，估值 45 億美元。客戶名單包括 Adobe、Shopify、Canva、Quora 這些大公司。而完成這一切的團隊，只有大約 35 到 40 人。

塔斯卡亞在訪談中直接說，這種營收密度「在新創界前所未見」。他認為這不是偶然，而是 AI 時代精實團隊的結構性優勢。Fal 從 2021 年成立以來就刻意維持小規模，即使在營收爆發成長期也沒有大規模招聘。這個策略讓他們得以在 2022 年底用六個人完成從資料工具到生成式媒體平台的徹底轉型，如果當時有 60 個人，這種轉向幾乎不可能發生。

六個人的豪賭：閉關九個月的轉型故事

Fal 最初是一個 Python 資料轉換工具，做的是 Databricks 生態系的邊緣產品。2022 年，Stable Diffusion 和 ChatGPT 同時爆發，團隊面臨一個選擇：繼續在資料工具市場慢慢磨，還是跳進 AI 推論。

當時的團隊只有六個人，但這反而成為優勢。塔斯卡亞回憶，他們評估了語言模型、嵌入模型、圖像模型三個方向。語言模型已經有 OpenAI 的強勢 API，還有多家拿了 B 輪的競爭者。但圖像模型的 API 市場幾乎是空白。有些業者提供服務，本質上只是把模型塞進 Docker 容器再包一層 HTTP 端點，不能擴展、效能差、成本高。對一個六人團隊來說，選擇沒有巨頭佔位的市場是唯一合理的策略。

他們用了九個月閉關開發。這段期間同時做了三件事：重建底層基礎設施、開發效能優化的推論引擎、以及找到前兩個付費客戶。九個月拿到兩個客戶聽起來很慢，但這兩個客戶在幾個月內就把 Fal 的 ARR 從零推到 100 萬美元。團隊算了一筆帳：如果繼續做資料工具，要賣多少 SaaS 授權才能達到同樣的營收？數字一比，答案太明顯了。

轉型公開宣布後，成長曲線陡峭得驚人。一年內從 100 萬到 1000 萬，再一年從 1000 萬到 1 億，然後繼續翻倍。而團隊規模幾乎沒有等比例增長。

上千個 Slack 頻道：工程師直接面對客戶的 GTM 策略

35 人團隊要服務 Adobe 和 Canva 這種等級的客戶，怎麼做到？答案不是傳統的企業銷售部隊，而是一種「工程師即服務」的模式。

塔斯卡亞透露，Fal 目前有上千個 Slack 頻道，每個頻道對應一個客戶。頻道裡不是客服人員，而是工程師。客戶的工程團隊可以直接和 Fal 的工程師討論技術問題，從模型選擇到效能調校到客製化需求。這種深度整合讓客戶不只是「用一個 API」，而是把 Fal 當成自己團隊的延伸。

這個模式在 Fal 的早期客戶群尤其有效。最初的客戶多是 AI 原生的新創公司，他們自己知道要用什麼模型、什麼設定，只需要一個可靠、快速、划算的推論平台。但當 Fal 開始接觸企業客戶後，需求變得更複雜。一家沒用過任何圖像模型的企業可能面對平台上 600 多個模型，完全不知道該從哪裡開始。這時候 Fal 的工程師會變成解決方案顧問：了解客戶的使用場景（比如服裝的虛擬試穿），推薦最適合的模型組合，甚至幫客戶做 A/B 測試來比較不同模型的轉換率。

對更大型的企業客戶，Fal 還有一個專門的「創意工程」團隊，可以幫客戶收集專屬資料集、在開源基礎模型上做後訓練，產出完全客製化的模型。塔斯卡亞舉了一個例子：一家做虛擬試穿的客戶需要的不只是「圖像生成」，而是「睡衣的虛擬試穿」這麼窄的場景。通用模型沒辦法處理這種精細度，但客戶多年累積的實拍照片是無價的訓練資料。Fal 幫他們在開源模型上微調，讓模型既保留通用能力又學會客戶獨有的視覺風格。基礎模型可以隨時換成更新更好的版本，但資料管線和微調流程是長期資產。

速度作為文化：效能工程的日常

精實團隊要能運作，每個人的產出密度必須極高。在 Fal，這體現為對效能近乎偏執的追求。塔斯卡亞的背景是編譯器工程師，他是 CPython 的核心貢獻者，做過即時編譯器和資料庫查詢引擎。這種底層系統的直覺讓他看 AI 推論的方式和多數人不同。

他描述了 Fal 初期的一個關鍵發現：用標準 PyTorch 跑圖像生成模型，GPU 的硬體利用率只有 30% 到 40%。也就是說，你付了 100% 的算力費用，實際只用了三到四成。對效能工程師來說，這簡直不可思議。Fal 團隊用了幾週時間，透過逐層 profiling 和自建 kernel，把利用率拉到 70-80%。這直接反映在客戶的體驗上：有客戶告訴他們，單純換到 Fal 的 API，使用者留存率就提升了，因為生成速度快到明顯改善了產品體驗。甚至有客戶故意把 Fal 的 API 回應速度調慢，來觀察不同速度對使用者留存的影響。

但效能優化不是一次性的工作。每一代 GPU 架構都需要重新適配：A100 到 H100 是一次大幅改變，H100 到 Blackwell 又是一次。NVIDIA 有四五十人在做推論引擎最佳化，開源社群遲早會追上來。Fal 的真正優勢在於時間差：每當一個新模型發布，他們能在最短時間內完成優化上線。開源社群可能要花幾個月才做到 80% 的效能水準，而 Fal 在第一天就能提供接近最佳的推論速度。對客戶來說，這幾個月的時間差就是產品迭代和市場佔有率的差距。

我的觀察：AI 時代的組織型態正在被改寫

Fal 的案例讓我思考一個更大的問題：AI 時代的公司，到底需要多少人？

傳統的 SaaS 公司，營收從 1 億到 10 億美元通常伴隨員工從 500 人膨脹到 5000 人。銷售、客服、產品經理、專案經理，每一層都在增加人力。但 Fal 用 35 人做到 2 億美元 ARR，等於打破了這個線性關係。而且他們的客戶不是小公司，是 Adobe 和 Shopify。

我認為這背後有結構性因素。推論即服務（Inference-as-a-Service）的商業模式天然適合精實：營收和算力使用量直接掛鉤，不需要大量人力去「說服」客戶買單。同時，「工程師面對客戶」的模式省掉了傳統企業軟體公司裡大量的中間角色。沒有業務代表、沒有客戶成功經理、沒有技術支援分層，工程師直接解決問題，效率極高但也對人才品質要求極高。再加上開源模型生態系讓 Fal 不需要養龐大的研究團隊做預訓練，人力全部集中在他們最擅長的效能工程上。三者疊加，才有了這個異常的人均營收數字。

對想在 AI 領域創業的人來說，Fal 的故事有一個意想不到的啟示：不要急著招人。塔斯卡亞說得很直接，精實讓你保有選擇權。Fal 能用六個人完成轉型，恰恰因為他們不需要說服 60 個人改變方向。在 AI 這種每 28 天就有新變化的產業裡，能快速轉向的能力可能比什麼都重要。