跳到正文
汉松札记
返回

你无法提示整个房间:AI 最后无法取代的技能高亮

AI Highlight

来源

你无法提示整个房间:AI 最后无法取代的技能高亮

文本来源是 AI Engineer 频道视频《你无法提示整个房间:AI 最后无法取代的技能》的中文可读转写稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用 workflow,而不是做普通摘要。

一、评估、反馈与故障闭环

背景

这组高亮抓住《你无法提示整个房间:AI 最后无法取代的技能》里最值得保留的反馈闭环:Agent 系统的可靠性主要来自可观测、可复现、可评分的外部结构,而不是一次性把 prompt 写得更漂亮。

AI 热潮之前,我们最聪明的人在写代码;但现在,我们需要把最聪明的人转向客户,转向业务问题。我们需要花更多时间决定构建什么,因为这才是昂贵的部分。

始终把价值放在心里:我们如何创造价值,我们正在创造什么价值,你的客户在寻找什么价值,支撑它的底层流程是什么,你如何围绕它设计一个系统,让这个系统最好地支撑价值和流程,以及过程中需要哪些流程变化。

把这些打包交给 AI,当然还要加上验收标准,因为你可以基于验收标准推导测试用例,这样你就能建立一个很好的 setup,并得到很好的结果。然后,如果你把这些 user stories 连接起来,像雏菊链一样串起来,它就能让你创建一个连贯的系统。

兴趣匹配度很高。它对应汉松持续关注的 Agent 工程化主线:把非确定性系统放进可反馈、可回归、可复盘的闭环里,真正的壁垒在 harness、eval、trace 和人类分诊。

二、上下文、记忆与检索边界

背景

这里讨论的是 Agent 能否拿到正确材料的问题。对汉松有价值的点在于,它把上下文从背景信息变成系统的运行材料:可索引、可缓存、可审计,也可被重新组织。

当我们和系统打交道、思考想要构建什么时,我总喜欢问这四个问题。第一,这是谁的问题?

这样我们得到的就不是一匹更快的马,而是一辆车,一个比原来好一个量级的变化。

当时大概有 21 个 agent 想法,其中 17 个后来被放弃了,因为它们实际没有创造业务价值。要么我们没有数据访问权限,要么构建它本身就没有意义。

兴趣匹配度很高。这是上下文工程的核心问题:不是给模型更多字,而是让模型在正确边界内获得正确材料,并让材料本身可维护、可验证、可复用。

三、工具、系统与工程约束

背景

这组摘录偏工程实现。它关心的不是模型能力的抽象上限,而是工具、接口、基础设施和生产约束如何决定 Agent 最终能不能稳定工作。

所以我们通常从价值出发,先理解价值是如何产生的,什么构成价值,当前流程如何流动,支撑这个流程的底层架构是什么,然后你才能开始真正的设计工作。

一旦你有了带有主干流程的 story map,并且理解在每一步里客户和用户正在做什么,你就能帮助他们在自己的流程中继续推进。这里有一张支持系统的 user story map:联系、分诊、解决,然后最终关闭一个 case。

所以,这是老技能,但处在新的经济结构下,并且它代表着向分析师工具箱的真实转移。

兴趣匹配度高。这里能迁移到实际团队建设:工具选择、数据流、权限、成本、延迟和部署形态,往往比单点模型参数更能决定系统上限。

四、人类判断、组织与协作方式

背景

这部分把人放回系统设计里。Agent 越强,越需要人类承担领域判断、目标选择、风险边界和协作组织,而不是把全部责任交给模型。

因为你可以 prompt 你的代码,可以 prompt 你的 AI,可以 prompt 你的整份规格说明,但你无法 prompt 这个房间。

比如第一个或第二个 user story 可以写成:作为一个支持负责人,我需要按紧急程度排序打开 case,这样任何升级问题都不会漏掉。要确保每个 user story 都覆盖这些要素,并且最好用这种格式来写,因为 AI 很擅长模式识别,而它确实在 user story 结构上接受过训练,因为这是非常知名、也非常常用的一套写法。

借助这张图,你可以理解流程的不同阶段,然后在每个阶段下面捕捉 user stories。它本来就应该保持在相对高的层级,这样你能看到全局,然后决定第一版要构建并发布什么,例如捕捉意图、分类紧急程度、起草一个有依据的回答,再把它记录到 system of record 里。

兴趣匹配度高。它符合汉松的人机共生框架:AI 承担生成和探索,人类承担判断、责任、品味和组织设计,把人的稀缺性放在更高杠杆的位置。

五、Prompt、规格与行为设计

背景

这里的重点是行为设计。Prompt 不是一句魔法咒语,而是一套分层约束、规格、角色、语气和上下文组合出来的系统界面。

这会回到人的能力,回到你能不能和房间里的人一起工作,因为你无法 prompt 整个房间。你可以 prompt 你的 AI。

在过去 13 年的职业生涯里,我一直是业务、IT 和开发者之间的桥梁。一开始我写测试、功能设计和规格说明,后来也自己实现它们。

还要确保把真正的 subject matter experts 移到更面向客户、面向 client 的角色或位置,让他们能对构建什么产生实际影响。

兴趣匹配度很高。它把 prompt 从技巧提升为系统设计问题,适合沉淀到汉松的 AI 协作和 agent workflow 方法论里。

整体判断

这篇内容最值得保留的是它把《你无法提示整个房间:AI 最后无法取代的技能》从一次视频分享转成了可迁移的系统判断。核心素材集中在评估、反馈与故障闭环、上下文、记忆与检索边界、工具、系统与工程约束。对汉松后续写作和团队实践来说,它可以作为 AI Agent 工程化素材库的一块:不是追逐单个工具功能,而是持续追问系统如何获得上下文、如何被评估、如何进入生产闭环,以及人类判断应该放在哪些关键节点。


订阅 AI Highlight

分享这篇文章:


上一篇
从研究到现实:把前沿 ML 研究带入生产高亮
下一篇
你的 Agent 在生产环境失败了。祝你好运复现它高亮