来源

原始链接：https://www.youtube.com/watch?v=spNAUEgq_A8
来源类型：视频逐字稿
来源标题：未来属于领域专用 Agent

未来属于领域专用 Agent 高亮

文本来源是 AI Engineer 频道视频《未来属于领域专用 Agent》的中文可读转写稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用 workflow，而不是做普通摘要。

一、评估、反馈与故障闭环

背景

这组高亮抓住《未来属于领域专用 Agent》里最值得保留的反馈闭环：Agent 系统的可靠性主要来自可观测、可复现、可评分的外部结构，而不是一次性把 prompt 写得更漂亮。

然后，它需要与一个 Google Workspace agent 通信，可以在里面做各种事情。我可以说：“嘿，今年我的顶级销售人员都有谁？

比如说，我有一个主 agent 在运行，但我想用 Nano Banana 来生成图像，而我的主模型是 GLM 5.2。那你可以有一个工具，它本身就是一个 prompt，如果能这样做就太酷了。

所以，大型实验室已经意识到，为了创建一个有效的聊天界面，更不用说大型 agent，它需要

兴趣匹配度很高。它对应汉松持续关注的 Agent 工程化主线：把非确定性系统放进可反馈、可回归、可复盘的闭环里，真正的壁垒在 harness、eval、trace 和人类分诊。

二、上下文、记忆与检索边界

背景

这里讨论的是 Agent 能否拿到正确材料的问题。对汉松有价值的点在于，它把上下文从背景信息变成系统的运行材料：可索引、可缓存、可审计，也可被重新组织。

部分原因在于，如果你想想上下文的工作方式，当我做出某个决定时，我不需要拥有整个对话的上下文。相反，我的主协调层只需要问 Gmail：“嘿，帮我拿 Debbie 的最后一封邮件。

你知道，主 agent 不需要拥有所有关于 GDPR 的 45 兆字节上下文，所以我们把它做成一个独立的子 agent。然后，也许法律团队还需要一个 OSHA 合规 agent，这也非常复杂，所以它也有一个独立的。

system prompt、工具、skill，所有这些都是最终进入 agent 上下文的东西。

兴趣匹配度很高。这是上下文工程的核心问题：不是给模型更多字，而是让模型在正确边界内获得正确材料，并让材料本身可维护、可验证、可复用。

三、工具、系统与工程约束

背景

这组摘录偏工程实现。它关心的不是模型能力的抽象上限，而是工具、接口、基础设施和生产约束如何决定 Agent 最终能不能稳定工作。

如果我需要把公司的工具接入另一个 agent，MCP 是个好方法。但它在提供其他价值方面还没有被证明很出色。

所以，每个 agent 都应该有自己的小沙箱文件系统。另外，每个 agent 都应该有一个沙箱化的代码执行环境。

然后，另一种类型的工具可以是另一个完整的 agent——一个完整的领域专用 agent 可以就是其中一个工具。这就是工具层。

兴趣匹配度高。这里能迁移到实际团队建设：工具选择、数据流、权限、成本、延迟和部署形态，往往比单点模型参数更能决定系统上限。

四、人类判断、组织与协作方式

背景

这部分把人放回系统设计里。Agent 越强，越需要人类承担领域判断、目标选择、风险边界和协作组织，而不是把全部责任交给模型。

我不认为我是第一个说出”领域专用 agent”这个词的人，当然也不是第一个有这个想法的人。但这就是我想和你们谈的——专门针对特定领域的 agent。

“然后它就可以去找我们的差旅 agent 开始订票了。这大概就是这种方式的运作思路。

这不会是涓涓细流，它会迅速加速，并成为 agent 生态系统的主要玩家之一。而 2027 年，我认为基本上就是多 agent 编排（multi-agent orchestration）之年。

兴趣匹配度高。它符合汉松的人机共生框架：AI 承担生成和探索，人类承担判断、责任、品味和组织设计，把人的稀缺性放在更高杠杆的位置。

五、Prompt、规格与行为设计

背景

这里的重点是行为设计。Prompt 不是一句魔法咒语，而是一套分层约束、规格、角色、语气和上下文组合出来的系统界面。

然后，在模型之上有一个 system prompt，它告诉模型自己在宏观世界中的角色，有点像它的人生目标。然后，我们有工具——它实际上能做的事情，能产生的效果。

所以，你不仅通过 token 效率获得了显著的成本降低，还因为可以使用更小的语言模型，甚至非语言模型，而进一步降低成本。你可以使用图像生成和扩散模型，可以为更小的任务使用各种其他模型。

我们可以做的是，有一个小小的 agent，它的 system prompt 是专门为 Figma agent 而写的。它对 Figma 了如指掌，知道所有上下文、所有 API、所有正确的点击位置、要做的事情、鼠标移动，等等一切。

兴趣匹配度很高。它把 prompt 从技巧提升为系统设计问题，适合沉淀到汉松的 AI 协作和 agent workflow 方法论里。

整体判断

这篇内容最值得保留的是它把《未来属于领域专用 Agent》从一次视频分享转成了可迁移的系统判断。核心素材集中在评估、反馈与故障闭环、上下文、记忆与检索边界、工具、系统与工程约束。对汉松后续写作和团队实践来说，它可以作为 AI Agent 工程化素材库的一块：不是追逐单个工具功能，而是持续追问系统如何获得上下文、如何被评估、如何进入生产闭环，以及人类判断应该放在哪些关键节点。