跳到正文
汉松札记
返回

日志就是 Agent 高亮

AI Highlight

来源

日志就是 Agent 高亮

文本来源是 AI Engineer 频道视频《日志就是 Agent》的中文可读转写稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用 workflow,而不是做普通摘要。

一、评估、反馈与故障闭环

背景

这组高亮抓住《日志就是 Agent》里最值得保留的反馈闭环:Agent 系统的可靠性主要来自可观测、可复现、可评分的外部结构,而不是一次性把 prompt 写得更漂亮。

因为你会停止把 log 当成系统排出的废气,而是把它当成系统本身。这非常重要。

这一点非常重要,因为真实世界中的 agent 系统必须以这种方式承受真实故障:worker 会崩溃,机器会重启,sandbox 会消失,工具调用会 timeout,provider 会失败,用户会连接。

但关键点在于,compaction 不是魔法,它也不会推翻日志就是 agent 这个主张。compaction 是有损的。

兴趣匹配度很高。它对应汉松持续关注的 Agent 工程化主线:把非确定性系统放进可反馈、可回归、可复盘的闭环里,真正的壁垒在 harness、eval、trace 和人类分诊。

二、上下文、记忆与检索边界

背景

这里讨论的是 Agent 能否拿到正确材料的问题。对汉松有价值的点在于,它把上下文从背景信息变成系统的运行材料:可索引、可缓存、可审计,也可被重新组织。

如果它运行在别人的基础设施上,受他们的策略约束,并且可以被他们的系统查询,他们就不只是托管你的 agent。他们拥有它。

Claude Code 和 Codex 会把这些混乱的 JSONL 文件写到本地磁盘;即使在 Claude SDK 模式下,这些写入也是 fire-and-forget,也就是说,如果因为某种原因写入失败,数据就没了。OpenCode 是另一个例子,它们把状态存在 SQLite 文件里,GitHub 上有很多 issue 都在讨论状态损坏和数据丢失。

多年以来,数据库看起来像一种不透明的系统,里面有表、索引和物化视图,难以推理。但每个严肃数据库的底层都有一个 log。

兴趣匹配度很高。这是上下文工程的核心问题:不是给模型更多字,而是让模型在正确边界内获得正确材料,并让材料本身可维护、可验证、可复用。

三、工具、系统与工程约束

背景

这组摘录偏工程实现。它关心的不是模型能力的抽象上限,而是工具、接口、基础设施和生产约束如何决定 Agent 最终能不能稳定工作。

所以,这正是当你的 agent 架构里 log 不是 agent 时会出现的迹象。当 log 是 agent 时,executor 可以失败。

这很重要,因为这意味着 agent 的身份不绑定在 runtime、模型或工具上。那些东西都只是在解释 log,并向 log 追加内容。

一个 worker 可以 claim 一个 session,读取 log,把 agent 向前推进一步,写入结果,然后完全消失。之后任何其他 worker 都可以接手。

兴趣匹配度高。这里能迁移到实际团队建设:工具选择、数据流、权限、成本、延迟和部署形态,往往比单点模型参数更能决定系统上限。

四、人类判断、组织与协作方式

背景

这部分把人放回系统设计里。Agent 越强,越需要人类承担领域判断、目标选择、风险边界和协作组织,而不是把全部责任交给模型。

既然我们已经确立 log 就是 agent,那么最强形式的 lock-in 并不是模型 lock-in。模型可以替换。

每个 agent 都可以在每一轮从 log 重建自己的状态,而且不需要绑定到任何单台机器或任何单个 worker。这让 failover 变得很简单,也让扩展只变成增加更多 worker 的问题。

不同模型可能需要 log 的不同投影,不同 runtime 可能需要不同 schema,但这些都只是工程问题。它们不是身份问题。

兴趣匹配度高。它符合汉松的人机共生框架:AI 承担生成和探索,人类承担判断、责任、品味和组织设计,把人的稀缺性放在更高杠杆的位置。

五、Prompt、规格与行为设计

背景

这里的重点是行为设计。Prompt 不是一句魔法咒语,而是一套分层约束、规格、角色、语气和上下文组合出来的系统界面。

这些东西当然重要,它们会和角色交互,也会运行这个角色,但它们都不是你的角色。你的角色是数据。

今天,agent 再次被当作复杂而不透明的系统,里面装着模型、prompt 和工具调用。但对于一个持久 session 来说,log 应该是一等公民。

但 log 的职责是记录 agent 做了什么、看到了什么、什么发生了变化,以及它继续运行需要什么。它存储这个身份,这就是它的目的。

兴趣匹配度很高。它把 prompt 从技巧提升为系统设计问题,适合沉淀到汉松的 AI 协作和 agent workflow 方法论里。

整体判断

这篇内容最值得保留的是它把《日志就是 Agent》从一次视频分享转成了可迁移的系统判断。核心素材集中在评估、反馈与故障闭环、上下文、记忆与检索边界、工具、系统与工程约束。对汉松后续写作和团队实践来说,它可以作为 AI Agent 工程化素材库的一块:不是追逐单个工具功能,而是持续追问系统如何获得上下文、如何被评估、如何进入生产闭环,以及人类判断应该放在哪些关键节点。


订阅 AI Highlight

分享这篇文章:


上一篇
有失忆症的天才高亮
下一篇
构建一个自主工程组织高亮