Abridge：医疗 AI 领域的临床智能层构建者

来源

原始链接：https://www.latent.space/p/abridge?utm_source=post-email-title&publication_id=1084089&post_id=197417280&utm_campaign=email-post-title&isFreemail=true&r=27lk8i&triedRedirect=true&utm_medium=email
来源类型：网页正文 / 访谈逐字稿
来源标题：Abridge：医疗 AI 领域的临床智能层构建者

整体判断

这篇访谈最值得看的地方，不是 Abridge 做了一个医疗记录工具，而是它展示了垂直 AI 产品逐步演化为行业智能层的路径：先占住一个高频、高上下文、高信任的根工作流，再把同一份上下文向文档、决策支持、支付、患者沟通、临床试验等多个工作流外溢。

Abridge 的关键启发是：医疗 AI 的壁垒不只在模型，也不只在合规，而在它把真实医患对话、电子病历、保险政策、医院流程、医生偏好和评估体系编织成一个可运行的上下文系统。这里的 AI 产品更像一个能在领域文件系统里工作的 Agent，而不是一个会总结对话的模型。

1. 真正有壁垒的 AI 应用，先占住高上下文工作流

Abridge 2018 年成立，早于 ChatGPT 的应用爆发。它最初切入临床文档：听诊疗对话，生成病历，减轻医生的文书负担。LLM 不是这个产品的起点，而是把一个已经打磨过的高信任工作流放大。

Abridge 并不是从套一层 GPT 开始的。在应用层 AI 公司大爆发之前，它已经花了几年时间，在医疗里最需要上下文、也最重要的流程之一，也就是患者与医生的对话里建立信任。

最初的切口是临床文档：听取就诊过程，生成病历，让医生少花时间在电子病历系统上，多花时间面对患者。

因为他们已经理解医生如何写病历、医院如何采购、电子病历如何集成、医生如何校验输出，以及一次就诊中缺失的上下文如何传导到计费、预授权、质量和随访，LLM 的采用变成了工作流的倍增器。

Abridge 预计今年支持 8000 万次以上医患对话，覆盖美国 250 个大型复杂医疗系统，支持 28 种以上语言和 50 多个专科。

兴趣匹配度高。这个案例说明，垂直 AI 的核心入口往往不是模型能力最炫的位置，而是系统里最稳定、最重、最有上下文复利的工作流。先占住工作流，模型升级才会变成倍增器。

2. 医患对话是医疗系统的根事件

Abridge 把医患对话看成医疗中最重要的工作流，因为诊断、治疗、理赔、支付、质量管理和随访都从这里派生出来。它的路径也从省医生时间，扩展到为医疗系统省钱和赚钱，最终改善患者结果。

医生每周要花 10 到 20 小时做文档工作。他们把下班后穿着睡衣在家补病历的时间叫作睡衣时间。

患者与医生之间的对话，可能是医疗里最重要的工作流：护理在这里发生，也在这里被接收。

如果想想 GDP 中约 20% 流向医疗，几乎所有东西都是这场对话的衍生物：理赔、支付、诊断、治疗。

同一场对话可以服务很多利益相关方：医生要知道文档是否完整反映了护理；患者想知道刚才到底发生了什么、下一步该做什么；支付方想知道护理是否合理合规；药企也可能想知道某种药为什么没有被正确使用，或者是否有合适的临床试验候选人。

兴趣匹配度高。这里可以抽象成一个产品判断：找到系统中的原子事件。一个事件如果能派生出多条业务链路，它就不是普通输入，而是智能层的事件源。

3. 上下文为王，但医疗场景要求上下文可评估、可上线、可控风险

Chai 从 Glean 来到 Abridge，把临床决策支持看成一种搜索和上下文工程问题。模型本身很强，但只有上下文才能让模型投入工作。医疗的特殊性在于错误可能致命，因此 eval、渐进式上线和风险控制不是附属流程，而是产品本体的一部分。

每一波产品浪潮里都会出现相似模式。在 Agent 时代也是如此。关键洞察是：模型很强，但上下文才是王道，上下文让模型能真正投入工作。

Abridge 在很多方面像医疗版 Glean，但医疗场景的严肃性完全不同：下行风险极高，有些情况下可能是致命的。

在企业搜索里答错一个问题，多数时候不是世界末日；但在医疗里，如果给患者开了会过敏的药，后果就完全不同。

从第一天开始做任何新产品或功能时，我们就会问：什么叫做好？临床安全只是基本门槛，之后还要看风格、完整性，以及这份笔记能不能支持计费。

目标是把评估流程从几个月缩短到几周，再缩短到几天。其中一部分是真正的科学和机器学习问题，另一大部分是艰苦的运营工作。

兴趣匹配度高。这是汉松关注的 Agent 产品化核心问题：高质量上下文工程不是堆更多资料，而是把上下文、评估、发布节奏、专家判断和隐私处理做成一套闭环系统。

4. AI 最好的形态不一定是更会说话，而是像空调一样减少干扰

医疗软件里提醒泛滥，超过 90% 的提醒会被忽略。Abridge 的产品哲学是让 AI 在后台持续改善体验，只在确实重要且必须当下介入时打断医生。它也不急于把 AI 做成诊室里的第三个声音。

医疗里的提醒非常臭名昭著，超过 90% 的提醒都会被忽略。

他们希望产品像空调一样：始终在背景中让事情变好，但只有在临床风险很高、现在介入比之后介入重要得多时，才真正打断用户。

与其在医生和患者进行严肃敏感对话时不断弹窗，不如在医生进房间前帮他准备好：总结最近上下文，并根据本次来访原因提示应该讨论的事项。

患者和医生现在并不想在诊室里出现第三个声音，至少不是一个字面意义上的声音。

兴趣匹配度高。这是人机共生设计里很重要的反直觉点：更主动、更拟人、更实时，不总是更好。高风险协作场景里，AI 的最佳角色常常是低干扰的上下文准备者和关键时刻的提醒者。

5. EHR 可以被看作 Agent 的文件系统

访谈里最适合抽象成通用方法论的一句话，是把电子健康记录 EHR 看作 Agent 的文件系统。医疗信息太多，无法一次性塞进模型上下文窗口；产品要解决的是让 Agent 能像操作文件系统一样读取、整理、使用这些领域数据。

现在越来越清楚的是，几乎每个 Agent 底层都像是一个编码 Agent。

如果你把 EHR 看成一个文件系统，它就是存放大量医疗信息的地方。

这些信息太多，放不进今天模型的上下文窗口；但产品又必须有效使用这些上下文。

如果 Agent 能像操作文件系统一样读取、整理、使用这些数据，模型公司的 Agent 能力进步就会直接让我们受益。

兴趣匹配度很高。这句话可以迁移到很多行业：业务系统不只是数据库或 RAG 知识库，而是 Agent 可导航、可调用、可修改的工作环境。垂直 AI 产品的基础设施工作，是把领域环境改造成 Agent 能工作的文件系统。

6. 预授权案例：AI 的价值是把几周后的失败前置到当场解决

MRI 预授权案例很好地说明临床智能层的价值。传统流程中，患者几周后才知道保险不批；如果 AI 能在患者还在房间里时结合病历、保险规则、州别政策和临床证据给出指导，就能把几周甚至几个月后的失败压缩到分钟级。

预授权是护理被延迟的典型例子；好的 AI 有机会减少世界中的延迟。

要让这个例子成立，需要整合电子病历里的患者上下文，包括既往化验、既往影像；还要知道患者的保险方，并收集不同州的支付方政策。

有些支付方政策在网页上，有些藏在非结构化的 50 页 PDF 文件里。这些让问题很难，但也正是护城河。

如果能把 AI 和解决问题的能力提前到患者还在房间里的时刻，就能把就诊后通常需要几周甚至几个月的流程，压缩到几分钟或实时。

兴趣匹配度高。这不是生成式 AI 的文本价值，而是 workflow timing 的重排：把后置失败前置成实时决策。AI 改造流程的关键，经常是改变问题出现的时间点。

7. 高风险行业可能最早逼出严肃的 AI 工程方法

很多人会以为医疗监管重、风险高，所以 AI 落地会慢。访谈给出一个相反判断：正因为医疗无法接受 80/20，团队被迫更早解决 eval、延迟、多步骤工作流、隐私、质量和上线门槛这些硬问题。

我原来担心医疗是高度监管行业，但让我惊讶的是，这里也有很多有利的监管顺风。

政府非常希望系统之间互操作，让 Agent 能够访问这些信息。FDA 在 1 月也更新了临床决策支持指导，比 2022 年版本更向前看。

正因为医疗风险高、难度大，一些最难的 AI 问题反而会在这里最先被解决。

80/20 在这里行不通。零错误评估、多步骤工作流、极低容错率，这些创新必须发生，否则产品根本不能发布。

兴趣匹配度高。这能改写一个常见问题：AI 最先进的工程实践，也许不会只来自玩具场景和低风险生产力工具，而会来自医疗、金融、法律这类高约束行业。约束越硬，越能逼出真正可复用的方法论。

8. PRD 没死；软件变便宜后，清晰判断反而更贵

Janie 反对 PRD 已死的流行说法。Abridge 试过更原型优先的方法，但医疗产品太复杂，原型无法表达数据约束、战略优先级、客户实施、安全合规和边界条件。AI 让做 demo 更便宜，也让判断该不该做更重要。

我们尝试过切换到更原型优先的方式，但产品太复杂、太细腻，原型很难捕捉完整复杂度。

一个原型可以看起来很酷，但它回答不了：这是不是我们现在最该解决的问题？如果 20 个竞争对手也做了，我们的赢面在哪里？

在软件变得很便宜、噪声变得很多的世界里，清晰的书面表达比以往更重要。

从周末 demo 到能在最大型医疗系统中运行，中间有巨大鸿沟；安全、合规、边界情况、实施细节，都必须被写下来。

兴趣匹配度很高。这句话很适合接到 AI coding 和上下文工程：PRD 也许不再只是传统文档，但会变成模型、团队和系统共享的上下文文件。AI 降低了实现成本，却提高了定义问题、筛选机会和表达边界的价值。