跳到正文
汉松札记
返回

未来属于领域专用 Agent 高亮

AI Highlight

来源

未来属于领域专用 Agent 高亮

文本来源是 AI Engineer 频道视频《未来属于领域专用 Agent》的中文可读转写稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用 workflow,而不是做普通摘要。

一、评估、反馈与故障闭环

背景

这组高亮抓住《未来属于领域专用 Agent》里最值得保留的反馈闭环:Agent 系统的可靠性主要来自可观测、可复现、可评分的外部结构,而不是一次性把 prompt 写得更漂亮。

然后,它需要与一个 Google Workspace agent 通信,可以在里面做各种事情。我可以说:“嘿,今年我的顶级销售人员都有谁?

比如说,我有一个主 agent 在运行,但我想用 Nano Banana 来生成图像,而我的主模型是 GLM 5.2。那你可以有一个工具,它本身就是一个 prompt,如果能这样做就太酷了。

所以,大型实验室已经意识到,为了创建一个有效的聊天界面,更不用说大型 agent,它需要

兴趣匹配度很高。它对应汉松持续关注的 Agent 工程化主线:把非确定性系统放进可反馈、可回归、可复盘的闭环里,真正的壁垒在 harness、eval、trace 和人类分诊。

二、上下文、记忆与检索边界

背景

这里讨论的是 Agent 能否拿到正确材料的问题。对汉松有价值的点在于,它把上下文从背景信息变成系统的运行材料:可索引、可缓存、可审计,也可被重新组织。

部分原因在于,如果你想想上下文的工作方式,当我做出某个决定时,我不需要拥有整个对话的上下文。相反,我的主协调层只需要问 Gmail:“嘿,帮我拿 Debbie 的最后一封邮件。

你知道,主 agent 不需要拥有所有关于 GDPR 的 45 兆字节上下文,所以我们把它做成一个独立的子 agent。然后,也许法律团队还需要一个 OSHA 合规 agent,这也非常复杂,所以它也有一个独立的。

system prompt、工具、skill,所有这些都是最终进入 agent 上下文的东西。

兴趣匹配度很高。这是上下文工程的核心问题:不是给模型更多字,而是让模型在正确边界内获得正确材料,并让材料本身可维护、可验证、可复用。

三、工具、系统与工程约束

背景

这组摘录偏工程实现。它关心的不是模型能力的抽象上限,而是工具、接口、基础设施和生产约束如何决定 Agent 最终能不能稳定工作。

如果我需要把公司的工具接入另一个 agent,MCP 是个好方法。但它在提供其他价值方面还没有被证明很出色。

所以,每个 agent 都应该有自己的小沙箱文件系统。另外,每个 agent 都应该有一个沙箱化的代码执行环境。

然后,另一种类型的工具可以是另一个完整的 agent——一个完整的领域专用 agent 可以就是其中一个工具。这就是工具层。

兴趣匹配度高。这里能迁移到实际团队建设:工具选择、数据流、权限、成本、延迟和部署形态,往往比单点模型参数更能决定系统上限。

四、人类判断、组织与协作方式

背景

这部分把人放回系统设计里。Agent 越强,越需要人类承担领域判断、目标选择、风险边界和协作组织,而不是把全部责任交给模型。

我不认为我是第一个说出”领域专用 agent”这个词的人,当然也不是第一个有这个想法的人。但这就是我想和你们谈的——专门针对特定领域的 agent。

“然后它就可以去找我们的差旅 agent 开始订票了。这大概就是这种方式的运作思路。

这不会是涓涓细流,它会迅速加速,并成为 agent 生态系统的主要玩家之一。而 2027 年,我认为基本上就是多 agent 编排(multi-agent orchestration)之年。

兴趣匹配度高。它符合汉松的人机共生框架:AI 承担生成和探索,人类承担判断、责任、品味和组织设计,把人的稀缺性放在更高杠杆的位置。

五、Prompt、规格与行为设计

背景

这里的重点是行为设计。Prompt 不是一句魔法咒语,而是一套分层约束、规格、角色、语气和上下文组合出来的系统界面。

然后,在模型之上有一个 system prompt,它告诉模型自己在宏观世界中的角色,有点像它的人生目标。然后,我们有工具——它实际上能做的事情,能产生的效果。

所以,你不仅通过 token 效率获得了显著的成本降低,还因为可以使用更小的语言模型,甚至非语言模型,而进一步降低成本。你可以使用图像生成和扩散模型,可以为更小的任务使用各种其他模型。

我们可以做的是,有一个小小的 agent,它的 system prompt 是专门为 Figma agent 而写的。它对 Figma 了如指掌,知道所有上下文、所有 API、所有正确的点击位置、要做的事情、鼠标移动,等等一切。

兴趣匹配度很高。它把 prompt 从技巧提升为系统设计问题,适合沉淀到汉松的 AI 协作和 agent workflow 方法论里。

整体判断

这篇内容最值得保留的是它把《未来属于领域专用 Agent》从一次视频分享转成了可迁移的系统判断。核心素材集中在评估、反馈与故障闭环、上下文、记忆与检索边界、工具、系统与工程约束。对汉松后续写作和团队实践来说,它可以作为 AI Agent 工程化素材库的一块:不是追逐单个工具功能,而是持续追问系统如何获得上下文、如何被评估、如何进入生产闭环,以及人类判断应该放在哪些关键节点。


订阅 AI Highlight

分享这篇文章:


上一篇
构建优秀 Agent 技能:缺失的手册高亮
下一篇
构建系统,而不是代码高亮