Pinecone 不只做向量資料庫了:Nexus 知識引擎如何重新定義 Agent 基礎設施

Pinecone 推出知識引擎 Nexus,從向量資料庫公司轉型為 Agent 基礎設施平台。CEO Ash Ashutosh 揭露轉型背後的故事:當公司發現主要使用者從人類變成 Agent,整個產品邏輯必須重寫。

Pinecone 不只做向量資料庫了:Nexus 知識引擎如何重新定義 Agent 基礎設施

本文整理自《AI + a16z》2026 年 5 月播出的單集。

封面圖


使用者換人了

Pinecone 花了五、六年時間定義並主導向量資料庫這個品類。它的核心價值很簡單:讓開發者能儲存和搜尋向量嵌入(vector embeddings),為 AI 應用提供語義搜尋能力。這個定位在 RAG(檢索增強生成)浪潮中讓 Pinecone 成為開發者首選,累積了超過四萬名活躍開發者。但大約在 2025 年下半年,公司內部開始注意到一個根本性的變化:系統上的查詢行為完全不像人類了。

Pinecone 執行長阿什.阿舒托什(Ash Ashutosh)在 a16z 合夥人暨 Pinecone 董事彼得.乃文(Peter Levine)的訪談中,回憶了這個發現過程。他們的系統開始收到大量重複性極高、範圍極廣的查詢,每個任務動輒發出數十次請求。分析後發現,這些查詢來自各種 AI Agent 框架。Agent 取代了人類,成為 Pinecone 的主要使用者。這不是一個漸進的轉變,而是在幾個月內突然發生的結構性位移。

這個發現迫使 Pinecone 重新思考一個根本問題:如果你的使用者不再是人類,你的產品設計邏輯還成立嗎?向量資料庫的假設是人類會評估搜尋結果的品質,決定要不要追問、要不要換個關鍵字再搜。但 Agent 沒有這層判斷力,它只會用蠻力:查了不夠就再查,查到衝突就再查更多,直到 token 預算耗盡或時間到了才停下來。結果就是任務完成率長期低於 50%,而且每個任務的成本極高。

從客戶零號開始的轉型

Pinecone 的第一個知識引擎客戶,其實是它自己。公司內部有一個叫 Askdata 的 Agent 系統,負責讓員工查詢公司各種營運資料,取代了傳統的 dashboard。這個系統連接了資料倉儲、Slack、Gong(通話記錄)、客戶管理平台等多個資料源。在傳統向量資料庫架構下,每次查詢平均需要六到十次子查詢,耗時 45 秒到兩分鐘,消耗約 40,000 個 token,而且回來的答案經常需要人工驗證。

把同一個應用遷移到 Nexus 之後,數字出現了劇烈變化:token 使用量從 40,000 降到 2,000(降幅 95%),回應時間降到 500 毫秒以內,準確率從約 68% 提升到 90% 以上。阿舒托什強調這只是第一版,還有大量優化空間。但這個內部案例已經足以讓團隊確信:問題不在模型,而在資料系統的架構假設從根本上就錯了。

第二個驗證場景是客戶服務。一個典型的問題是「這個產品還在保固期嗎?」,Agent 需要查客戶記錄、銷售記錄、產品規格三個不同系統。在傳統架構下,這個看似簡單的問題可能觸發數十次查詢。在 Nexus 架構下,知識引擎已經針對「保固查詢」這個任務做了情境編譯,知道需要哪些欄位、哪些資料源的哪些片段,直接給出結構化回答。

Nexus 的產品架構

Nexus 的架構可以拆成三個層次。最底層仍然是 Pinecone 的向量資料庫,這是資料儲存和基礎檢索的引擎,扮演的角色相當於作業系統中的硬碟。中間層是知識引擎本身,負責 Context Compiling(情境編譯)和情境管理。最上層是 NoQL 查詢介面,提供 Agent 與知識引擎之間的標準化溝通協定。

Context Compiling 是 Nexus 最核心的差異化能力。傳統的 ETL pipeline 做一次性的資料搬運,而 Context Compiling 是一個持續的、迭代的編譯過程。你提供原始資料和預期的輸出範本,系統會自動找出最佳的資料拆解和重組方式,產生全新的資料結構(artifacts)。這些 artifacts 是專門為特定任務設計的,同一份原始資料可以為不同任務產生完全不同的 artifacts。比如一家醫院的資料,帳單任務和醫師查詢會得到完全不同的知識結構。

NoQL 則解決了「Agent 怎麼告訴知識引擎它要什麼」的問題。它定義了六個參數,涵蓋三個維度:意圖(我要查什麼、資料範圍)、效能(時間預算)、治理(存取權限、可解釋性要求)。Pinecone 把 NoQL 定位為開放標準,類比 SQL 之於資料庫的歷史角色。短期計畫是透過開發者社群和 Agent 框架合作推廣,中期目標是推動成為產業標準。

商業模式與生態系統

Pinecone 的定價策略也隨著產品轉型而改變。傳統向量資料庫按基礎設施計費(讀寫次數、儲存量),Nexus 的定價則會更貼近任務導向:知識如何被策展、如何被提取、任務完成的成效。阿舒托什承認定價模型還在迭代,但方向很明確,就是從「你用了多少基礎設施」轉向「你完成了多少任務」。

配合 Nexus 的上市,Pinecone 同時宣布了幾個動作。首先是向量資料庫本身的大幅降價,降低 Agent 時代「千倍查詢量」的經濟門檻。其次是推出 Pinecone Marketplace,提供預建的知識引擎解決方案,讓企業可以直接使用現成的垂直應用(或作為藍圖來客製化),而不需要從零建起。Marketplace 上會同時有 Pinecone 自建的方案和第三方夥伴的方案。

阿舒托什描繪的願景是:未來一個開發者要建垂直 AI 應用,不需要自己搞資料庫、不需要建 ETL pipeline、不需要寫知識檢索邏輯。他只需要指定資料源在哪、任務是什麼、期望的輸出長什麼樣,Nexus 處理其餘 85% 的髒活。開發者可以把全部心力放在垂直領域的商業邏輯上。

我的觀察

Pinecone 的這步棋很大膽。向量資料庫市場競爭激烈,Weaviate、Qdrant、Milvus 等開源方案不斷侵蝕 Pinecone 的市場份額。從向量資料庫升維到知識引擎,等於在競爭者還在打價格戰的時候,直接把戰場搬到更高的抽象層。如果 Nexus 的效能數據站得住腳,後進者要追趕的就不只是一個資料庫,而是一整套情境編譯和知識管理的能力。

比較值得觀察的風險是:NoQL 能否真的成為開放標準。歷史上,由單一廠商推動的「開放標準」最後往往變成該廠商的護城河。Pinecone 說 NoQL 可以搭配任何底層資料庫使用,但 Nexus 本身綁定 Pinecone 的向量資料庫。這個區分是否能在實務中成立,要看其他廠商是否願意實作 NoQL,以及開發者社群是否買單。不過單就產品策略而言,這是一步看到趨勢就果斷轉型的棋,比死守向量資料庫品類等著被商品化,勇氣和判斷力都值得肯定。