跳到正文
汉松札记
返回

GitHub 的 AI 编程压力测试:Agent 时代的软件平台重构

AI Highlight

来源

【Agent 速度正在冲击按人类节奏设计的软件系统】

背景:这篇访谈的底层问题是:AI coding agent 让代码产量、提交频率、构建次数和权限检查同时放大,GitHub 这类平台开始承受一种新的系统压力。

coding agent 带来的变化不是更多人提交更多代码这么简单。它提高了代码提交的最低频率,提高了谁能提交代码、多久提交一次、每次提交多少代码的基线,也让 CI/CD、开源维护、审查信任和基础设施可用性一起被拉到极限。

GitHub 过去按人类开发者的速度设计:人写代码、开 PR、跑构建、等审查。现在机器把这些动作压缩到更高频率,系统必须回答一个新问题:现有软件协作制度能不能吸收机器速度。

兴趣匹配度高。它把 AI 编程的瓶颈从模型能力转移到协作制度和基础设施承载力:真正被测试的不是代码生成,而是整个软件生产系统。

【高价值 AI workflow 是先回看,再决策】

背景:Kyle 对自己使用 AI 的描述很关键。他没有把 AI 当成写博客或生成文案的工具,而是把它当成公司上下文的回放器。

他会让 agent 看当天所有 PR、公开发布内容、过去三个月的工作、Obsidian 笔记、会议转录、Slack 讨论,再综合出这一周真正发生了什么,以及接下来应该怎么行动。

对他来说,AI 的价值不只是向前生成,而是形成一个向后递归的回路:先看发生过什么,再决定下一步做什么。远程组织里很多信息不会自然出现在办公室走廊里,所以更需要机器帮助回看上下文。

兴趣匹配度高。这和个人知识系统、团队经营、AI 协作都直接相关。Agent 最强的用法往往不是即时问答,而是跨资料源做历史上下文回放。

【AI 落地不要强迫人换工具,而要接入既有工作流】

背景:GitHub 内部推广 AI 的原则很朴素:不要求员工学习一套新工具,而是让 AI 读懂员工已经在用的地方。

GitHub 不想让员工为了使用 AI 改变工作方式。他们把 skills、CLI、MCP 和现有系统连接起来,让 AI 读取 GitHub、Teams、Email、Slack 里的工作材料,再把发现发布回 GitHub issues 或 discussions,继续在人原有的协作场里推进。

Slack 之所以还在 GitHub 内部存在,是因为多年的 ChatOps、命令和工作流都已经嵌入其中。现实路径不是迁移到一个统一平台,而是在碎片化工具之上加一层上下文和动作编排。

兴趣匹配度高。这是做 AI 产品和组织落地的基本判断:AI adoption 的关键通常不是新入口,而是尊重既有行为,把上下文层接进去。

【大型万能 Skill 正在让位于微型原子 Skill】

背景:访谈中关于 skills 的部分很贴近你现在对 Hermes skills 的理解。GitHub 的经验是,试图完成完整报告的巨型 skill 很快会变脆。

他们正在结束那种巨大、精美、看起来完整的 skill。更好的方式是把 skill 做得很小,只把一件事做好,然后像积木一样组合。完整说明书由团队一起拼出来,而不是把所有流程都塞进一个脆弱的大文件。

总结也不是一个通用动作。给分析师的总结、给客户会议的总结、给市场团队的总结,判断标准完全不同。真正需要编码的是具体受众、语境、输出期待和判断标准。

兴趣匹配度高。这条几乎可以直接写进 skill 设计原则:主 skill 走热路径,低频细节拆出去;原子能力稳定,组合逻辑按场景变化。

【Agent 时代的 PR 问题,本质是信任编码】

背景:当 agent 写代码、另一个 agent 审代码、人最后只扫一眼时,PR 的核心问题从代码差异变成了信任链路。

未来可能有 80% 的 PR 来自 agent。问题不只是 PR 界面怎么变,也不只是验证材料变多,而是我们仍然要回答:我为什么相信这个变更可以合并。

星标、提交数、账号年龄这类信号都可以被游戏化。更可靠的方式是让项目把自己脑中的信任启发式写成规则:谁提交过被接受的 PR、账号绑定了什么社会身份、项目对贡献者有什么历史判断,再用 Actions 或 agentic workflow 自动执行。

兴趣匹配度高。它把 AI code review 从工具问题推进到制度问题:每个团队都需要把隐性的信任标准显式化、规则化、自动化。

【Agent 执行环境必须从便利工具升级为安全基础设施】

背景:GitHub 的历史里一直有任意代码执行的问题。AI agent 让这个问题变得更高频、更自动,也更难靠人工直觉兜底。

从早期替用户跑任意 Ruby 代码,到现在把工作流尽量容器化、隔离化,GitHub 的方向是在为 agent 的代码执行建立新的安全层。工具调用、云端 agent、小型 VM、容器和权限边界,都会成为 AI 编程平台的基础设施。

Actions 名义上是 CI/CD,但现实里已经成了通用计算层:side project、爬虫、批处理、自动化脚本都在上面跑。agent 越多,PR 越多,构建越多,CPU 就越先成为瓶颈。行业总盯 GPU,但 AI coding 也会制造巨大的传统计算压力。

兴趣匹配度高。这是 agent infra 的硬核视角:agent 不是只会写代码,它还会运行代码。执行层的隔离、可复现性、资源调度和权限设计会成为生产级 AI coding 的分水岭。

【AI 增长改变的是工作单元,不只是请求量】

背景:GitHub 的宕机压力不只是 14 倍增长这么简单。Kyle 讲得更细:系统过去假设每条管道里的工作尺寸相对稳定,现在这个假设失效了。

过去 GitHub 的扩容思路很清楚:数据库做垂直扩容,服务做水平扩容。现在进入一种对角线扩容状态:CPU、数据库、队列、权限系统、monorepo、PR 体积一起变化,继续给旧架构加钱已经不够,必须打开运行了十几年的服务,重新定义规则。

他们曾经按某个规模做测试,但 AI 曲线起来后,一些维度上的压力接近 N 的三次方。agent 放大的不是单个指标,而是提交体积、并发任务、构建次数、上下文读取、权限检查这些向量的组合。

兴趣匹配度高。这条是做容量规划和系统设计时很有价值的提醒:AI 时代的规模问题,常常是工作单元语义变化,而不是流量曲线简单上升。

【Copilot 的重心从补全模型转向统一 Agent Runtime】

背景:GitHub Copilot 的叙事也在变。早期核心是代码补全和微调,模型快速进步后,护城河开始转向运行时、编排和上下文。

Copilot 现在更像一套底层 SDK、harness 和 runtime:CLI、桌面端、云端 agent、安全修复、issue 处理、文档扫描都可以运行在同一套 agent 基础设施上。真正的问题不再只是生成代码,而是如何把 coding agent 放进整个软件开发生命周期。

GitHub 想解决的最终问题是:让 GitHub 能像 Kyle、某个团队或某个项目希望的方式行动。规则、记忆、依赖、开源上下文、团队方法变化,都应该进入系统,而不是每次靠人重新说明。

兴趣匹配度高。它把 AI 编程工具的竞争点说清楚了:补全只是入口,长期价值在 runtime、任务编排、上下文持久化、团队偏好和工作流一致性。

【真正有趣的是 Ambient AI,而不是又一个聊天助手】

背景:访谈后段最重要的判断是,软件开发从来不是单线写代码任务。下一代 AI 需要理解开发之外的一切上下文。

Kyle 期待的不是另一个助手,而是一种环境智能:当他实现一个功能时,系统知道相关规格文档、邮件、线上讨论、团队判断、业务优先级和流行趋势,并把这些信息纳入实现决策。

真正有价值的连接,是让 AI 使用个人和团队积累下来的品味、判断和专业经验。代码资产有特殊性,但更底层地看,所有工作材料都是上下文。

兴趣匹配度高。这条和你长期关注的上下文工程、人机共生、个人 AI、OpenClaw / Hermes 方向高度一致。未来的 agent 不只是接任务写代码,而是把分散上下文变成可执行判断力。

【AI Agent 需要新的操作系统与沙箱】

背景:OpenClaw 在访谈里被当成一个象征:它代表一种懂你、有你信息、还能使用电脑的 agent。这个形态会反过来要求操作系统重构安全边界。

在工作设备上运行这种 agent,问题不只是应用层能力,而是操作系统级沙箱。企业需要一种可以访问工作资产、能替人操作电脑、又不会让员工因为权限失控而出事故的 agent 运行环境。

操作系统也要重新理解自己:以后使用电脑的不只是人,还有 agent。栈要一路下探到云、硅层、推理计算和 agentic workload,回答究竟需要什么类型的计算、隔离和治理。

兴趣匹配度高。这是 AI OS 的现实版本:它不是概念包装,而是权限、沙箱、身份、上下文、工作设备和底层计算共同组成的新基础设施问题。

整体评价:兴趣匹配度很高。这篇最值得保留的不是 GitHub 的产品发布,而是它把 AI coding 的二阶问题讲得很完整:agent 让工作单元变大、让旧协作制度承压、让 PR 信任需要重新编码、让 Actions 变成通用计算层、让 Copilot 从补全转向 runtime,也让所有工作材料都变成上下文。对 AI coding、团队 agent workflow、Hermes skills 设计和个人上下文工程都有直接参考价值。


订阅 AI Highlight

分享这篇文章:


上一篇
Satya Nadella 2026:AI 平台战略与企业 Agent 的价值重构
下一篇
Lenny 社群智慧:创业融资、Vibe Coding 与 Agent 数据语义层