跳到正文
汉松札记
返回

Prompt 就是平台高亮

AI Highlight

来源

Prompt 就是平台高亮

文本来源是 AI Engineer 频道视频《Prompt 就是平台》的中文可读转写稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用 workflow,而不是做普通摘要。

一、评估、反馈与故障闭环

背景

这组高亮抓住《Prompt 就是平台》里最值得保留的反馈闭环:Agent 系统的可靠性主要来自可观测、可复现、可评分的外部结构,而不是一次性把 prompt 写得更漂亮。

因此,当 agent 写出了错误算法时,我们可以复现让它失败的精确 execution,agent 也可以基于这条 trace 修复算法。

如果 read 是 stale,trace 会说这是 stale,并告诉你拿到了什么,以及最新 value 是什么。这些信息对算法来说是 forbidden 的,但对 agent 来说极其有用。

我们不再问 agent 能不能构建生产系统,而是问:agent 需要什么,才能先设计系统,再构建系统?

兴趣匹配度很高。它对应汉松持续关注的 Agent 工程化主线:把非确定性系统放进可反馈、可回归、可复盘的闭环里,真正的壁垒在 harness、eval、trace 和人类分诊。

二、上下文、记忆与检索边界

背景

这里讨论的是 Agent 能否拿到正确材料的问题。对汉松有价值的点在于,它把上下文从背景信息变成系统的运行材料:可索引、可缓存、可审计,也可被重新组织。

一旦这些决策被写下来,agent 确实能够实现生产系统。这条路可行,但它也暴露了局限:agent 帮助我们构建了系统,却没有帮助我们设计系统。

我们只需要向 agent 提出请求。到这个时候,prompt 就是平台。

agent 需要哪些工具,才能把这件事做好,而不是直接摔倒?agent 依赖反馈,尤其是即时且明确的反馈。

兴趣匹配度很高。这是上下文工程的核心问题:不是给模型更多字,而是让模型在正确边界内获得正确材料,并让材料本身可维护、可验证、可复用。

三、工具、系统与工程约束

背景

这组摘录偏工程实现。它关心的不是模型能力的抽象上限,而是工具、接口、基础设施和生产约束如何决定 Agent 最终能不能稳定工作。

我们不再要求 agent 直接从 abstract spec 跳到 concrete implementation,而是在中间插入一个 artifact:concrete specification。这个 concrete specification 是和 agent 交互推导出来的,但 human 仍然是主要驱动者。

接下来,我们会用运行在 NATS.io 上的 Resonate 来探索我们的 agentic engineering 实践:我们如何从 specification 走向 implementation?

所以我们给 agent 提供了一个 deterministic simulation environment,并给了它一个不同的任务:不要构建生产系统,构建一个 simulated implementation。simulated implementation 不是产品,它是 executable design。

兴趣匹配度高。这里能迁移到实际团队建设:工具选择、数据流、权限、成本、延迟和部署形态,往往比单点模型参数更能决定系统上限。

四、人类判断、组织与协作方式

背景

这部分把人放回系统设计里。Agent 越强,越需要人类承担领域判断、目标选择、风险边界和协作组织,而不是把全部责任交给模型。

从单一的 abstract specification 出发,agent 通过 simulation 设计并构建平台,路线是 concrete specification,再到 concrete implementation。

agent 不只是学到系统错了,还学到系统为什么错。用这种方法,agent 得以弥合这道鸿沟。

这些不是 Resonate 的概念,而是目标平台的概念。因此,设计问题变成了:我们如何只使用这些 primitive 来表达 Resonate protocol?

兴趣匹配度高。它符合汉松的人机共生框架:AI 承担生成和探索,人类承担判断、责任、品味和组织设计,把人的稀缺性放在更高杠杆的位置。

五、Prompt、规格与行为设计

背景

这里的重点是行为设计。Prompt 不是一句魔法咒语,而是一套分层约束、规格、角色、语气和上下文组合出来的系统界面。

但对我们想做的事情来说,这还不够,因为我们并不是要从一份 specification 生成一个 implementation。

但今天我想转向 specification 本身,更重要的是,agent 如何参与系统的 specification,而不仅仅是构建或验证系统。

于是流程变成:abstract specification、simulation implementation、concrete specification,然后是 concrete implementation。这就是 agent 向上游移动的时刻。

兴趣匹配度很高。它把 prompt 从技巧提升为系统设计问题,适合沉淀到汉松的 AI 协作和 agent workflow 方法论里。

整体判断

这篇内容最值得保留的是它把《Prompt 就是平台》从一次视频分享转成了可迁移的系统判断。核心素材集中在评估、反馈与故障闭环、上下文、记忆与检索边界、工具、系统与工程约束。对汉松后续写作和团队实践来说,它可以作为 AI Agent 工程化素材库的一块:不是追逐单个工具功能,而是持续追问系统如何获得上下文、如何被评估、如何进入生产闭环,以及人类判断应该放在哪些关键节点。


订阅 AI Highlight

分享这篇文章:


上一篇
Miranda 假说:Hamilton 如何毒化 Persona 评测高亮
下一篇
从研究到现实:把前沿 ML 研究带入生产高亮