醫師每週花 20 小時寫病歷,Abridge 用 AI 把事前授權從 45 天壓到即時
美國醫療 AI 公司 Abridge 從「幫醫師寫筆記」進化為「臨床智慧層」,估值從 27.5 億飆升至 53 億美元。產品副總裁 Janie Lee 與工程主管 Chai Asawa 拆解三幕劇策略:省時間、省成本、救命,以及為什麼 80-20 法則在醫療場景行不通。

本文整理自 Latent Space Podcast 2026 年 5 月播出的單集。
{{< youtube vUARtyOvh5U >}}
{{< spotify "episode/7sXRzbVyUHpKUe061mXG8w" >}}
{{< apple-podcast "tw/podcast/latent-space-the-ai-engineer-podcast/id1674008350?i=1000767833040" >}}
「睡衣時間」:美國醫療體系最貴的加班
美國的醫師有一個苦澀的術語叫「睡衣時間」(pajama time)。指的是醫師下班回家、換上睡衣後,還得坐在電腦前花好幾個小時補寫當天的病歷。這不是偶爾發生的事,而是每天的日常。根據 Abridge 產品副總裁 Janie Lee 的說法,醫師每週花在文件作業上的時間高達 10 到 20 小時。換算下來,一位醫師每週有兩到三個整天在做行政工作,而不是看病。
這個問題的代價遠超過加班費。美國正面臨嚴重的醫師短缺,而現有醫師卻把大量時間花在鍵盤上而不是病人身上。Abridge 內部有一個 Slack 頻道叫「Love Stories」,專門收集使用者回饋。裡面的故事不是「提升了效率」這種抽象描述,而是非常具體的人生轉折:有醫師說終於可以回家跟孩子吃晚餐了,有人說因此延後了退休,甚至有人說這救了他的婚姻。當一個軟體產品能讓使用者說出「我們不用離婚了」,你知道它解決的痛點有多深。
Abridge 就是從這個痛點切入的。2018 年由心臟科醫師 Shiv Rao 在匹茲堡創辦,一開始的定位很單純:用 AI 把醫病對話自動轉換成結構化的臨床筆記,讓醫師不用再花大把時間手動寫病歷。但八年後的今天,這家公司已經不只是一個「語音轉文字」工具了。
膝蓋痛的 MRI:一個讓人秒懂的場景
要理解 Abridge 正在做的事,最好的方式是聽 Janie Lee 講的這個故事。
你因為膝蓋痛去看醫生,醫師判斷你需要做 MRI。你離開診間,以為一切都在進行中。結果四個禮拜後接到電話:「抱歉,你的 MRI 沒有被保險核准,你要不要再回來一趟?」這個流程叫做事前授權(Prior Authorization),是美國醫療體系中最令人抓狂的行政關卡之一。保險公司要求醫師在執行特定檢查或治療前,先提交申請證明其必要性。這個流程通常需要 45 天,涉及 20 多個接觸點,而且經常因為缺少某項資訊而被退件。
Abridge 的做法是:在病人還沒離開診間之前就搞定這件事。系統在醫師看診的同時,即時分析對話內容,比對病人的保險方案(比如加州的 Aetna 計畫),找出該方案要求的核准條件。假設 Aetna 要求六項條件,Abridge 已經從電子病歷中確認了其中四項(之前的就診紀錄、用藥歷史等),剩下兩項需要醫師在當場確認:病人是否做過物理治療?疼痛是否持續超過六週?
系統會在適當的時機提示醫師:「在病人離開之前,請確認這兩個問題,這樣 MRI 就能在他離開前獲得核准。」不是用那種讓人煩躁的彈窗警告,而是安靜地、在對的時間點提供對的資訊。Lee 用了一個精準的比喻:「我們希望產品像空調一樣,在背景中運作,讓一切變得更好。」
這個場景之所以重要,是因為它同時解決了三個問題:省下醫師的時間(不用事後補件)、省下醫療體系的錢(減少退件和重複就診),以及最關鍵的,病人不用等 45 天才知道自己能不能做 MRI。
三幕劇:從省時間到救命
Abridge 把自己的發展分成三幕。第一幕是省時間,就是最初的臨床文件自動化。第二幕是幫醫療體系省錢和賺錢。第三幕是改善病人的治療結果。聽起來像標準的企業願景包裝,但背後的邏輯其實很扎實。
第二幕的核心在於,醫療體系正面臨史上最低的營運利潤率。健保給付持續壓縮,人事成本持續上升,再加上各種法規要求。在這個背景下,Abridge 的文件自動化不只是讓醫師輕鬆一點,而是直接影響帳單品質。一份完整、精確的病歷文件,能確保醫療體系拿到應得的給付。如果文件不完整,計費團隊就得回頭查問,整個流程的成本就上去了。Lee 強調,對財務長來說,光是「省時間」不夠,他們要看到每一塊錢的投資對應多少營收回報。
第三幕則是利用 Abridge 獨特的資料優勢。這家公司的產品每週被打開數百萬次,涵蓋看診前、中、後的完整流程。當你擁有這麼大量的臨床對話資料,能做的事情就遠遠超過寫筆記了。臨床決策支援、臨床試驗配對、用藥建議,這些都是下一步。而且 Abridge 的產品已經部署在 250 多個醫療體系中,客戶包括 UPMC(12,000 名臨床醫師)、梅約診所、Northwell Health 等頂級機構。
資本市場顯然也買帳。2025 年 2 月的 Series D 估值是 27.5 億美元,四個月後的 Series E 就跳到 53 億美元,由 a16z 領投。2026 年 4 月又追加了 3.16 億美元。這個成長速度在醫療科技領域非常罕見。
模型星座與資料飛輪
讓事前授權的場景真正運作起來,技術上的挑戰遠比想像中複雜。Chai Asawa(臨床決策支援工程主管,前 Glean 創始工程師)把這個問題拆成三個維度:品質、延遲、成本。
品質要夠高,因為錯誤的警報等於沒有警報。醫療界已經有嚴重的「警報疲勞」問題,超過 90% 的系統警報被醫師直接忽略。如果 Abridge 的提示也跟那些雜訊一樣,醫師根本不會理你。延遲要夠低,因為這一切要在病人還在診間的時候完成,而不是事後通知。成本要可控,因為當你每週處理數百萬筆對話時,用最貴的模型燒 token 是不可能持續的。
Abridge 的解法是所謂的「模型星座」(constellation of models)策略。快速、便宜的小模型負責前端分類和初步判斷,遇到複雜的推理任務才交給更強大的模型處理。Asawa 用「快思慢想」來比喻這個架構。同時,Abridge 手上有一個極其獨特的資料集:超過一億筆醫病對話。Asawa 把這些對話稱為「agent trace」,因為它完整記錄了醫療場景中最關鍵的互動過程。用這些資料做後訓練,能讓模型在特定任務上比通用模型更準確、更快、更便宜。
他也觀察到一個有趣的趨勢:所有模型底層都在變成「coding agent」。這對 Abridge 是好消息,因為電子病歷系統(EHR)本質上就是一個巨大的檔案系統,裡面存放著大量結構化和非結構化的資料。如果 AI 模型越來越擅長操作檔案系統、讀取和寫入資料,那它們處理 EHR 的能力也會跟著提升。Abridge 不需要自己從頭訓練這些能力,只需要提供正確的工具和上下文。
80-20 法則在這裡行不通
在一般的消費者軟體或企業軟體中,「做到 80% 就夠好了」是常見的產品策略。先把主要場景覆蓋,邊緣案例以後再說。但在醫療 AI 中,這個邏輯不成立。Lee 直接點破:「80-20 在這裡不管用。」
原因很現實:如果系統漏掉一個藥物過敏的警告,後果可能是致命的。如果一份病歷缺少關鍵資訊導致計費錯誤,一筆失誤就能吃掉 30 筆交易的利潤,跟 Lee 之前在房地產科技公司 Opendoor 做定價模型時的經驗一模一樣。這不是「出了錯道歉一下」就能解決的問題。
這種高標準直接影響了 Abridge 的開發文化。公司內部有一個叫「LFD」的流程,全稱是「Look at the F***ing Data」。這個略帶粗魯的名字反映了一個深刻的洞察:在機器學習的世界裡,人們很容易只看指標在往上走就覺得一切順利,而忽略了實際產出的品質。LFD 要求團隊必須手動檢視 AI 的輸出,確保它不只是在統計意義上「正確」,而是在臨床意義上也站得住腳。
Abridge 還有一個獨特的角色叫「臨床科學家」(clinician scientist)。這些人同時擁有醫學學位和深厚的技術背景,被嵌入到每個產品團隊中。公司內部戲稱他們為「突變人」(mutants),因為同時具備這兩種能力的人確實非常稀少。他們的存在確保了評估標準不是由工程師或產品經理拍腦袋決定的,而是由真正懂臨床實務的人來把關。一個心臟科的「好筆記」長什麼樣?什麼樣的文件才算「可計費」?這些判斷需要深厚的專科知識,而且不同專科之間差異巨大。
週末 Demo 跟大規模上線是兩個世界
訪談中最發人深省的一段話來自 Lee 對產品開發方法論的反思。在 AI 圈,「快速原型、快速迭代」幾乎是不容質疑的信條。PRD(產品需求文件)被視為過時的官僚產物,應該被原型取代。但 Lee 公開持不同意見。
她的論點是:在軟體成本趨近於零的時代,真正稀缺的不是實作能力,而是判斷力。原型可以在一個週末做出來,但它捕捉不到醫療場景的全部複雜性,包含安全合規、邊緣案例、系統整合、資料契約。更重要的是,當你可以什麼都做的時候,「該不該做」變成了比「能不能做」更關鍵的問題。這個功能是否加深我們的護城河?如果明天 20 個競爭對手也做了同樣的東西,我們的獨特優勢在哪裡?這些問題在一個炫酷的原型裡找不到答案。
「週末 demo 跟在最大的醫療體系上線運作,中間是一道巨大的鴻溝。」Lee 這句話很好地總結了她的觀點。她並不反對原型,而是認為原型應該在清晰的策略思考之後才啟動。先想清楚為什麼要做,再用原型來驗證怎麼做。
Asawa 補充了一個工程師的角度:有時候他其實更想看到清晰的書面規格,而不是一個模糊的原型。判斷力和書寫的清晰度,這些東西不會因為 AI 的進步而過時。在一個所有東西都在快速變化的環境裡,反而更需要這種穩定的錨點。
這場對話讓我想到一個更大的命題:醫療 AI 可能是所有 AI 應用場景中標準最高的。但也正因為標準高,從這裡鍛造出來的方法論、評估框架和開發文化,很可能會回過頭來影響整個 AI 產業。Lee 自己也說,她原本以為醫療會是 AI 創新的末班車,但現在她認為,最難的 AI 問題反而會在這裡率先被解決,因為別無選擇。