跳到正文
汉松札记
返回

Abridge:医疗 AI 领域的临床智能层构建者

AI Highlight

来源

Abridge:医疗 AI 领域的临床智能层构建者

整体判断

这篇访谈最值得看的地方,不是 Abridge 做了一个医疗记录工具,而是它展示了垂直 AI 产品逐步演化为行业智能层的路径:先占住一个高频、高上下文、高信任的根工作流,再把同一份上下文向文档、决策支持、支付、患者沟通、临床试验等多个工作流外溢。

Abridge 的关键启发是:医疗 AI 的壁垒不只在模型,也不只在合规,而在它把真实医患对话、电子病历、保险政策、医院流程、医生偏好和评估体系编织成一个可运行的上下文系统。这里的 AI 产品更像一个能在领域文件系统里工作的 Agent,而不是一个会总结对话的模型。

1. 真正有壁垒的 AI 应用,先占住高上下文工作流

Abridge 2018 年成立,早于 ChatGPT 的应用爆发。它最初切入临床文档:听诊疗对话,生成病历,减轻医生的文书负担。LLM 不是这个产品的起点,而是把一个已经打磨过的高信任工作流放大。

Abridge 并不是从套一层 GPT 开始的。在应用层 AI 公司大爆发之前,它已经花了几年时间,在医疗里最需要上下文、也最重要的流程之一,也就是患者与医生的对话里建立信任。

最初的切口是临床文档:听取就诊过程,生成病历,让医生少花时间在电子病历系统上,多花时间面对患者。

因为他们已经理解医生如何写病历、医院如何采购、电子病历如何集成、医生如何校验输出,以及一次就诊中缺失的上下文如何传导到计费、预授权、质量和随访,LLM 的采用变成了工作流的倍增器。

Abridge 预计今年支持 8000 万次以上医患对话,覆盖美国 250 个大型复杂医疗系统,支持 28 种以上语言和 50 多个专科。

兴趣匹配度高。这个案例说明,垂直 AI 的核心入口往往不是模型能力最炫的位置,而是系统里最稳定、最重、最有上下文复利的工作流。先占住工作流,模型升级才会变成倍增器。

2. 医患对话是医疗系统的根事件

Abridge 把医患对话看成医疗中最重要的工作流,因为诊断、治疗、理赔、支付、质量管理和随访都从这里派生出来。它的路径也从省医生时间,扩展到为医疗系统省钱和赚钱,最终改善患者结果。

医生每周要花 10 到 20 小时做文档工作。他们把下班后穿着睡衣在家补病历的时间叫作睡衣时间。

患者与医生之间的对话,可能是医疗里最重要的工作流:护理在这里发生,也在这里被接收。

如果想想 GDP 中约 20% 流向医疗,几乎所有东西都是这场对话的衍生物:理赔、支付、诊断、治疗。

同一场对话可以服务很多利益相关方:医生要知道文档是否完整反映了护理;患者想知道刚才到底发生了什么、下一步该做什么;支付方想知道护理是否合理合规;药企也可能想知道某种药为什么没有被正确使用,或者是否有合适的临床试验候选人。

兴趣匹配度高。这里可以抽象成一个产品判断:找到系统中的原子事件。一个事件如果能派生出多条业务链路,它就不是普通输入,而是智能层的事件源。

3. 上下文为王,但医疗场景要求上下文可评估、可上线、可控风险

Chai 从 Glean 来到 Abridge,把临床决策支持看成一种搜索和上下文工程问题。模型本身很强,但只有上下文才能让模型投入工作。医疗的特殊性在于错误可能致命,因此 eval、渐进式上线和风险控制不是附属流程,而是产品本体的一部分。

每一波产品浪潮里都会出现相似模式。在 Agent 时代也是如此。关键洞察是:模型很强,但上下文才是王道,上下文让模型能真正投入工作。

Abridge 在很多方面像医疗版 Glean,但医疗场景的严肃性完全不同:下行风险极高,有些情况下可能是致命的。

在企业搜索里答错一个问题,多数时候不是世界末日;但在医疗里,如果给患者开了会过敏的药,后果就完全不同。

从第一天开始做任何新产品或功能时,我们就会问:什么叫做好?临床安全只是基本门槛,之后还要看风格、完整性,以及这份笔记能不能支持计费。

目标是把评估流程从几个月缩短到几周,再缩短到几天。其中一部分是真正的科学和机器学习问题,另一大部分是艰苦的运营工作。

兴趣匹配度高。这是汉松关注的 Agent 产品化核心问题:高质量上下文工程不是堆更多资料,而是把上下文、评估、发布节奏、专家判断和隐私处理做成一套闭环系统。

4. AI 最好的形态不一定是更会说话,而是像空调一样减少干扰

医疗软件里提醒泛滥,超过 90% 的提醒会被忽略。Abridge 的产品哲学是让 AI 在后台持续改善体验,只在确实重要且必须当下介入时打断医生。它也不急于把 AI 做成诊室里的第三个声音。

医疗里的提醒非常臭名昭著,超过 90% 的提醒都会被忽略。

他们希望产品像空调一样:始终在背景中让事情变好,但只有在临床风险很高、现在介入比之后介入重要得多时,才真正打断用户。

与其在医生和患者进行严肃敏感对话时不断弹窗,不如在医生进房间前帮他准备好:总结最近上下文,并根据本次来访原因提示应该讨论的事项。

患者和医生现在并不想在诊室里出现第三个声音,至少不是一个字面意义上的声音。

兴趣匹配度高。这是人机共生设计里很重要的反直觉点:更主动、更拟人、更实时,不总是更好。高风险协作场景里,AI 的最佳角色常常是低干扰的上下文准备者和关键时刻的提醒者。

5. EHR 可以被看作 Agent 的文件系统

访谈里最适合抽象成通用方法论的一句话,是把电子健康记录 EHR 看作 Agent 的文件系统。医疗信息太多,无法一次性塞进模型上下文窗口;产品要解决的是让 Agent 能像操作文件系统一样读取、整理、使用这些领域数据。

现在越来越清楚的是,几乎每个 Agent 底层都像是一个编码 Agent。

如果你把 EHR 看成一个文件系统,它就是存放大量医疗信息的地方。

这些信息太多,放不进今天模型的上下文窗口;但产品又必须有效使用这些上下文。

如果 Agent 能像操作文件系统一样读取、整理、使用这些数据,模型公司的 Agent 能力进步就会直接让我们受益。

兴趣匹配度很高。这句话可以迁移到很多行业:业务系统不只是数据库或 RAG 知识库,而是 Agent 可导航、可调用、可修改的工作环境。垂直 AI 产品的基础设施工作,是把领域环境改造成 Agent 能工作的文件系统。

6. 预授权案例:AI 的价值是把几周后的失败前置到当场解决

MRI 预授权案例很好地说明临床智能层的价值。传统流程中,患者几周后才知道保险不批;如果 AI 能在患者还在房间里时结合病历、保险规则、州别政策和临床证据给出指导,就能把几周甚至几个月后的失败压缩到分钟级。

预授权是护理被延迟的典型例子;好的 AI 有机会减少世界中的延迟。

要让这个例子成立,需要整合电子病历里的患者上下文,包括既往化验、既往影像;还要知道患者的保险方,并收集不同州的支付方政策。

有些支付方政策在网页上,有些藏在非结构化的 50 页 PDF 文件里。这些让问题很难,但也正是护城河。

如果能把 AI 和解决问题的能力提前到患者还在房间里的时刻,就能把就诊后通常需要几周甚至几个月的流程,压缩到几分钟或实时。

兴趣匹配度高。这不是生成式 AI 的文本价值,而是 workflow timing 的重排:把后置失败前置成实时决策。AI 改造流程的关键,经常是改变问题出现的时间点。

7. 高风险行业可能最早逼出严肃的 AI 工程方法

很多人会以为医疗监管重、风险高,所以 AI 落地会慢。访谈给出一个相反判断:正因为医疗无法接受 80/20,团队被迫更早解决 eval、延迟、多步骤工作流、隐私、质量和上线门槛这些硬问题。

我原来担心医疗是高度监管行业,但让我惊讶的是,这里也有很多有利的监管顺风。

政府非常希望系统之间互操作,让 Agent 能够访问这些信息。FDA 在 1 月也更新了临床决策支持指导,比 2022 年版本更向前看。

正因为医疗风险高、难度大,一些最难的 AI 问题反而会在这里最先被解决。

80/20 在这里行不通。零错误评估、多步骤工作流、极低容错率,这些创新必须发生,否则产品根本不能发布。

兴趣匹配度高。这能改写一个常见问题:AI 最先进的工程实践,也许不会只来自玩具场景和低风险生产力工具,而会来自医疗、金融、法律这类高约束行业。约束越硬,越能逼出真正可复用的方法论。

8. PRD 没死;软件变便宜后,清晰判断反而更贵

Janie 反对 PRD 已死 的流行说法。Abridge 试过更原型优先的方法,但医疗产品太复杂,原型无法表达数据约束、战略优先级、客户实施、安全合规和边界条件。AI 让做 demo 更便宜,也让判断该不该做更重要。

我们尝试过切换到更原型优先的方式,但产品太复杂、太细腻,原型很难捕捉完整复杂度。

一个原型可以看起来很酷,但它回答不了:这是不是我们现在最该解决的问题?如果 20 个竞争对手也做了,我们的赢面在哪里?

在软件变得很便宜、噪声变得很多的世界里,清晰的书面表达比以往更重要。

从周末 demo 到能在最大型医疗系统中运行,中间有巨大鸿沟;安全、合规、边界情况、实施细节,都必须被写下来。

兴趣匹配度很高。这句话很适合接到 AI coding 和上下文工程:PRD 也许不再只是传统文档,但会变成模型、团队和系统共享的上下文文件。AI 降低了实现成本,却提高了定义问题、筛选机会和表达边界的价值。


订阅 AI Highlight

分享这篇文章:


上一篇
Replit CEO 访谈:AI 原生开发者与后提示时代
下一篇
Demis Hassabis:AGI 倒计时与 AI Agent 时代