AI 技術前沿

1 億筆醫病對話的飛輪效應：Abridge 如何打造醫療 AI 的「無形空調」

Abridge 工程主管 Chai Asawa 揭露醫療 AI 的產品設計哲學：最好的 AI 是你感覺不到它存在的那種。從模型星座策略到三層個性化架構，一家處理 1 億筆臨床對話的公司如何在品質、延遲、成本三角中找到最佳解。

2026 年 5 月 30 日 · 來源： Latent Space Podcast

本文整理自 Latent Space Podcast 2026 年 5 月播出的單集。

{{< apple-podcast "tw/podcast/latent-space-the-ai-engineer-podcast/id1674008350?i=1000767833040" >}}

醫療 AI 的空調哲學

「我們希望產品像空調一樣。」這是 Abridge 產品副總裁 Janie Lee 在 Latent Space Podcast 上用的比喻。空調最成功的時候，就是你完全忘記它存在的時候。你不會每五分鐘抬頭看一眼空調在幹嘛，你只是感覺到房間溫度很舒適。如果空調每隔幾分鐘就發出嗶嗶聲問你「要不要調低兩度？」，你大概會想把它拆了。

這個比喻精準地捕捉了醫療 AI 產品設計中最核心的矛盾：你手上有非常有價值的資訊，但你不能隨便打斷使用者。醫師看診時只有 15 分鐘，面對的是一位正在描述自己病情的真實病人。這不是在辦公室回覆 Slack 訊息的場景。任何中斷都有代價，而且代價可能遠超過你提供的價值。

Abridge 的工程主管 Chai Asawa 把這個設計理念推得更遠。他說 Abridge 從創立的第一天起就是一個「環境智慧」（ambient intelligence）的產品。它不需要醫師主動操作，不需要點按鈕或切換介面。它只是安靜地在背景中監聽對話、分析內容、準備好在適當時機提供幫助。Asawa 認為，這其實是所有 AI 產品最終應該走向的形態，而 Abridge 只是因為醫療場景的特殊性，比其他人更早走到了這一步。

超過 90% 的警報被忽略

空調哲學不是憑空冒出來的。它是從一個血淋淋的教訓中學到的：醫療界已經有太多失敗的「主動通知」案例。

現有的臨床決策支援系統最大的問題就是警報疲勞（alert fatigue）。根據 Lee 引用的數據，醫療環境中超過 90% 的系統警報被直接忽略。醫師對彈窗通知已經產生了條件反射式的關閉動作，不管內容是什麼都先按掉再說。這不是因為醫師不負責任，而是因為絕大多數警報都是低品質的雜訊。「這兩種藥物可能有不良反應」，但其實那個風險在臨床上根本不重要，或者醫師已經考慮過了。

Asawa 從工程師的視角分析這個問題時，指出了兩個根本原因。第一是技術層面的：過去的警報系統缺乏足夠的上下文，它不知道這位病人的完整病史、不知道醫師已經考慮過哪些因素、不知道這次就診的具體目的。沒有上下文的警報就是雜訊。第二是時機層面的：就算內容是對的，在錯誤的時間點出現也等於白搭。醫師正在跟病人討論一個情緒敏感的話題時，螢幕突然跳出一個與當下無關的提醒，只會讓人更煩。

Abridge 的策略是從「反應式警報」轉向「主動式智慧」。具體來說，與其在看診過程中不斷彈出通知，不如在醫師走進診間之前就把準備工作做好。系統可以自動摘要這位病人最近幾次的就診紀錄，根據這次掛號的主訴，預先整理出醫師可能需要討論的議題。醫師拿著這份摘要走進診間，而不是走進去之後才被系統一件一件告知。

真正需要在看診過程中介入的時刻，是像事前授權這樣的場景：如果病人離開了再處理，就得等上好幾週。這種情況下，系統的介入不是干擾，而是在對的時間點提供了關鍵的決策支援。區別在於，介入的品質必須非常高，而且必須是可執行的具體建議，不是模糊的警告。

1 億筆對話就是 1 億條 Agent Trace

Abridge 目前累計處理的醫病對話已經接近一億筆。這個數字本身很驚人，但更值得注意的是 Asawa 對這些資料的詮釋方式。他不把它們叫做「訓練資料」或「語料庫」，而是叫做「agent trace」。

這個概念很有意思。在 AI Agent 的世界裡，trace 指的是一個 agent 執行任務時完整的操作紀錄，包括它接收到什麼輸入、做了什麼判斷、採取了什麼行動、得到了什麼結果。而醫病對話恰恰就是醫療場景中最核心的「trace」。醫師（agent）接收到病人的症狀描述（輸入），結合自己的醫學知識和過往經驗做出判斷（推理），然後給出診斷和治療方案（行動）。

這種資料在 Abridge 出現之前，從來沒有被大規模、系統性地記錄和分析過。醫師的臨床判斷過程，那些在腦海中快速運轉的推理鏈，傳統上只存在於醫師的經驗中，隨著退休或離職就消失了。現在 Abridge 把這些「隱性知識」變成了可以學習的資料。

這就是 Abridge 資料飛輪的核心邏輯。產品被使用得越多，收集到的對話就越多。對話越多，模型在特定專科、特定場景上的表現就越好。表現越好，更多醫療體系願意採用。更多採用又帶來更多對話。而且這個飛輪有一個天然的防禦性：這些資料是高度專有的、受嚴格隱私法規保護的，其他公司很難複製。

隱私問題當然是繞不過去的。Abridge 建立了自動去識別化（de-identification）的模型，能從臨床逐字稿中移除所有受保護的個人健康資訊（PHI）。去識別化是單向的，不可逆轉。清洗過的資料才能用於模型訓練和評估。Asawa 承認，這意味著在多個概率系統疊加的情況下，你得先對去識別化模型本身建立足夠的信心。但一旦建立了這個基礎，後續的資料利用就有了堅實的合規保障。

快思慢想：模型星座的實戰策略

當你每週處理數百萬筆對話，而且要在即時對話中提供決策支援，「用最貴的模型、燒最多的 token」這種策略就完全不現實了。Asawa 用「模型星座」來描述 Abridge 的技術架構：不同的模型負責不同的任務，根據複雜度和緊迫性動態調配。

這跟康納曼的「快思慢想」（Thinking, Fast and Slow）框架異曲同工。快速、便宜的小模型負責第一線的分類和篩選，快速判斷這個對話片段是否包含需要進一步分析的內容。只有在觸發特定條件時，才會把任務交給更大、更智慧的模型進行深度推理。這樣做不只是為了省錢，也是為了降低延遲。在即時對話的場景中，你不能讓系統花 30 秒思考，因為醫師和病人已經往下講了。

但 Asawa 也坦承，這些「巧妙的工程技巧」可能不是五年後的最佳解。AI 模型的能力邊界（Pareto frontier）一直在移動。今天需要用多個模型協作才能完成的任務，明天可能一個模型就能搞定。他的策略是：密切追蹤第三方模型提供商的發展方向，理解它們在哪些面向會變得更強（例如 agentic 能力、程式碼生成），然後把自有資源集中在那些第三方模型不太可能覆蓋的領域。

一個具體的例子是轉錄和語者分離（diarization）。這些是 Abridge 的核心場景，用自有資料後訓練出來的模型可以做得比通用模型更準確、更快、更便宜。但在通用的醫學知識推理上，讓第三方的大型模型持續進步反而對 Abridge 有利，因為消費者查詢中有大量是醫療相關的，模型提供商自然會在訓練中投入更多醫療資料。

三層個性化：從兩個空格到整個醫療體系

AI 生成的臨床筆記如果讀起來不像是這位醫師自己寫的，醫師就不會用。Asawa 把這個問題比喻為更廣義的「AI slop」（AI 垃圾內容）：缺乏上下文的 AI 輸出，就是 slop。但 Abridge 擁有豐富的上下文，所以有條件做到真正的個性化。

Lee 把個性化拆成三個層次。第一層是個人層面。每位醫師對筆記的格式都有非常具體的偏好：有人喜歡項目符號，有人堅持段落格式。有人要求簡潔，有人需要詳盡。甚至到了「我要求句子之間有兩個空格，否則我拒絕使用」的程度。Abridge 的回饋頻道裡充滿了這種高度個人化的要求，而且團隊必須認真對待，因為對醫師來說，病歷是他們工作的直接產物，代表他們的專業判斷和照護品質。

第二層是專科層面。心臟科的筆記和皮膚科的筆記長得完全不一樣，不只是內容不同，連結構、邏輯、需要記錄的重點都不同。一份「好的」心臟科筆記必須包含哪些元素？什麼樣的內容才能確保它符合計費標準？這些評估基準需要逐一建立，每個專科都是一套獨立的體系。Abridge 目前支援超過 50 個專科，每一個的評估集都是「辛苦掙來的」（hard-earned），Lee 這樣說。

第三層是醫療體系層面。大型醫療機構通常花了數年甚至數十年建立自己的臨床實務指引。它們想要的不是一套通用的 AI 建議，而是把自己的指引嵌入到 AI 的決策邏輯中。當一位醫師在看診時收到提示，這個提示應該反映的是這家醫院認為最佳的做法，而不是某個通用的醫學教科書建議。Lee 認為，當醫療體系願意把這些專有資料託付給 Abridge，就代表一種深度的信任關係，同時也是競爭對手很難複製的護城河。

這三層個性化的共同基礎，是 Abridge 從使用者編輯行為中持續學習的能力。每一次醫師修改 AI 產生的筆記，都是一筆訓練資料。把某個詞換掉、把某段移除、調整某個格式，這些編輯動作累積起來就形成了一個持續進化的個性化引擎。

從電子病歷到臨床智慧層

Abridge 跟電子病歷系統（EHR）的關係，是理解這家公司定位的關鍵。醫師每天大部分時間都泡在 EHR 裡，任何新工具如果不能深度整合進 EHR，就等於要求醫師多開一個視窗、多點幾下滑鼠。在一個每次就診只有 15 分鐘、醫師連上廁所的時間都得精打細算的環境裡，多出來的任何操作步驟都是被淘汰的理由。

所以 Abridge 投入了大量精力跟主要的 EHR 供應商建立合作關係，透過 API 實現資料的雙向流通。Lee 說得很直白：能不能做到深度互通，是醫療體系決定要不要用你的先決條件。這不是加分項，是入場券。

但 Abridge 的野心不止於此。Asawa 把 EHR 比喻為一個檔案系統，而 Abridge 則是在這個檔案系統之上建立的智慧層。EHR 擅長的是儲存和管理結構化的臨床資料，但它不擅長也不打算擁有的東西很多：保險公司的理賠政策分析、跨機構的臨床試驗配對、即時的臨床決策支援。Abridge 把自己定位在這個空間裡，作為連接醫療服務提供者、保險公司和藥廠的「臨床智慧層」。

這個定位的潛力在於，同一筆醫病對話可以同時服務多個利害關係人。醫師需要知道病歷是否完整。病人需要知道下一步該做什麼。保險公司需要確認治療是否符合給付標準。藥廠想知道某個藥物為什麼沒有被開立，或者哪些病人適合參加新的臨床試驗。目前這些需求各自依賴不同的系統和流程來處理。Abridge 的願景是用同一個平台、同一個對話資料來源，把所有這些需求整合在一起。

聽起來很宏大，但別忘了它的起點：一位心臟科醫師不想在睡衣裡寫病歷。有時候最好的技術願景，就是從最具體的痛點長出來的。