跳到正文
汉松札记
返回

Claude Code 团队如何重构研发管理

AI Highlight

来源

Claude Code 团队管理经验高亮

文本来源是 28 分钟 YouTube 演讲逐字稿,演讲者是 Anthropic Claude Code 与 Claude.ai 工程和产品负责人 Fiona Fung。内容核心不是 Claude Code 的功能展示,而是当 AI coding 把编码吞吐量大幅抬高后,研发团队的瓶颈、流程、组织结构和管理动作如何跟着重构。按汉松兴趣画像,以下高亮优先保留机制解释、反常识判断和可复用 workflow。

一、编码不再是瓶颈,瓶颈迁移到验证、评审和协作边界

背景

Fiona 的核心判断很直接:过去多年,软件工程流程默认编码带宽昂贵,所以规划、设计文档、排期、所有权和评审都围绕节省工程时间展开。Claude Code 团队看到的变化是,编码和原型吞吐量被 AI 放大后,真正卡住团队的地方变成了代码是否正确、谁来评审、如何维护、跨职能伙伴和安全边界能否跟上。

多年来,工程带宽一直是昂贵资源,很多软件交付流程都是围绕节省编码时间设计的。现在在 Claude Code 团队里,编码已经很少是最慢的部分,吞吐量也变得完全不同。

当瓶颈从写代码转移出去,新的瓶颈会出现在验证、代码评审、跨职能协作和安全上。团队开始不断追问:这段代码正确吗?谁来评审?它之后如何维护?

很多流程不会自己消失。团队往往只会在旧流程上继续叠新流程,直到需要再发明一套优先级排序来管理这些流程。

兴趣匹配度很高。这是 AI coding 管理里的底层转向:团队优化目标从提高编码效率,迁移到提高判断、验证、维护和协调的效率。对汉松当前管理 AI 团队尤其相关,因为真正的管理动作不是推动大家多用工具,而是重新识别瓶颈在哪里。

二、规划从长周期路线图转向 JIT planning,技术争论要让代码说话

背景

Claude Code 团队减少了长周期设计和产品评审,把更多讨论放进 PR 和原型里。这里的反常识点是:当构建成本下降,争论本身变成昂贵动作。过去需要白板会讨论的技术方案,现在可以生成多个 PR,让团队直接比较 API 实现、调用方影响和维护成本。

她刚加入时也想做六个月路线图,但三个月后很多事情已经变化。于是团队转向刚好够用、刚好及时的规划方式,因为原型和代码生成已经不再是过去那个瓶颈。

一次重构争论里,她本来想把同事拉进会议室白板讨论,后来意识到现在可以直接生成三种不同 PR。这样讨论的对象不只是 API 怎么实现,也包括每个方案会如何影响所有调用方。

当构建变得便宜,争论就变得昂贵。Claude Code 团队减少了每次写代码前都要先写设计文档的仪式,更多时候是:有想法就去做原型,讨论发生在 PR 和可运行方案里。

兴趣匹配度高。这里可以抽象成一个可复用 workflow:对高不确定性的工程判断,不先写长文档争辩,而是并行生成几个候选实现,用真实 diff、真实调用方影响和真实测试结果来压缩争论成本。

三、代码评审的核心问题变成:哪里信任 Claude,哪里必须保留人类判断

背景

Fiona 没有把 AI code review 描述成全自动替代人类,而是给出一个更实用的分层:格式、lint、普通 PR 反馈、补测试、部分 bug fix 可以交给 Claude;法律、安全、信任边界、产品品味和高风险判断仍然需要专家。重点不是人类是否退场,而是把人类判断放到最值钱的位置。

Claude Code 团队大量使用 Claude 做代码评审,也让它处理样式、lint、PR 反馈、补测试和一些 bug 修复。Claude 甚至可以照看 PR,在完整提交前先修掉一批问题。

真正的问题是:哪些地方可以高度信任 Claude,哪些地方仍然需要人类。法律评审、风险容忍度、信任边界、安全敏感代码,仍然要拉专家进来。

产品感和品味也需要人类。她提到曾让 Claude 把终端里的 Claude 做成节日雪人,结果设计伙伴指出它看起来像 Mr. Peanut。最后选择了更简单的冰蓝和雪花方案。

兴趣匹配度很高。这和汉松长期关心的 AI 共生一致:AI 承担机械性检查和初级修复,人类承担判断、边界、责任和品味。管理者要设计的不是自动化比例,而是决策分层:哪些判断可以机器化,哪些判断必须由有上下文的人来签字。

四、团队画像从原始吞吐量转向产品感、创造力和深系统能力

背景

当模型提高了普通编码吞吐量,招聘和团队构成也要换权重。Fiona 说 Claude Code 团队更重视两类工程师:一类是有产品感的 creative builder,能从问题出发快速迭代出体验;另一类是有深系统能力的人,能处理分布式系统、远程执行、可靠性等 hard parts。相对地,单纯原始产码速度的价值下降。

Claude Code 团队重点看两类工程师:一类是有产品感的创造型 builder,看到问题后会想做出产品来解决,并持续迭代体验;另一类是深系统专家,因为要构建 Claude Code Remote 这类能力,仍然需要很硬的分布式系统能力。

她会较少把权重放在原始吞吐量上,因为模型已经显著提升了这部分效率。

角色边界正在变模糊。PM 会写代码,设计师和非工程角色也能参与工程;工程师也能借助 Claude 去完成过去更偏内容设计或表达设计的任务。

兴趣匹配度高。这个判断可以直接用于 AI 时代团队能力模型:AI 普及后,普通执行力被放大,稀缺性转移到问题感、产品感、领域判断、系统边界和可靠性能力。对管理者来说,招聘标准和晋升标准都要跟着变。

五、管理者要重新进入产品和代码现场,dogfooding 成为组织能力

背景

Fiona 对组织形态的判断很强:Claude Code 团队尽量保持扁平,经理也要先从 IC 开始,亲自 dogfood、写代码、理解产品和团队工作方式。她认为这在过去很难,因为管理者脱离代码后,内部工具和工作流变化太快;但 Claude Code 降低了重新进入现场的成本。

她希望 Claude Code 的每个经理都先以 IC 身份开始,先在团队里建立技术信用,也真正学会怎样成为有效工程师。

过去她在 Meta 时会尝试每年做一个 PR,只是为了保持和工程现场的连接。但内部工具和流程变化很快,经常刚学会一个命令,它就已经变了。现在她甚至不用记 git 命令,直接让 Claude 帮她处理。

对 Claude Code 团队来说,重度 dogfooding 是做出好产品的关键。领导者即使不能长期写大量代码,也必须持续使用自己的产品。

兴趣匹配度很高。这对汉松的管理处境很贴:AI coding 让技术 leader 重新获得进入代码现场的能力。管理者不用回到过去那种亲自承包实现的角色,但可以用 AI 降低上下文恢复成本,保持对产品、代码和团队真实工作流的触感。

六、代码库成为新的事实源,文档和规格要进入 repo

背景

Claude Code 团队把代码库视为事实源,用本地 repo 和 Claude 回答客户问题,减少文档滞后的问题。她没有否定规格文档,而是建议把有价值的 specs 放进 repo,让 Claude 能拿代码和规格互相校验。

在 Claude Code 团队里,代码就是事实源。她回答客户问题时,会打开本地仓库,让 Claude 结合代码库直接帮她理解和回应。

这样可以减少文档落后于代码的问题。如果团队已经有很好的规格文档,就把它们提交到仓库里,让 Claude 帮忙检查代码执行是否符合规格预期。

代码所有权也变得模糊。与其问谁写了这段代码,不如追问你真正想解决的问题:是找回归原因、找专家回答客户问题,还是获得上下文。不同问题可以设计不同自动化。

兴趣匹配度很高。这是上下文工程的组织版本:把真实状态、规格、历史决策和验证逻辑放到模型可访问、可检索、可执行的位置。团队知识管理的目标从写给人看,变成同时服务人和 agent。

七、团队级 rollout:少数强制原则,加上 pod 自主适配

背景

Fiona 没有把 Claude Code 团队的做法包装成统一流程,而是区分团队必须遵守的原则和每个 pod 可以自主适配的部分。强制原则包括全员使用 Claude Code、尽可能 Claudify,以及明确允许杀掉旧流程。具体 triage、standup、on-call 和先自动化哪个 workflow,则交给不同 pod 决定。

Claude Code 团队的核心原则会定期更新,因为团队会反复问:这个原则还在服务它当初要服务的目的吗?

原则之一不是每个工程师使用 Claude Code,而是每个 Claude Code 团队成员都使用 Claude Code,包括跨职能伙伴。

另一个原则是尽可能 Claudify:如果你正在做某件事,就问有没有办法让 Claude 帮你做,尤其是验证和更早发现问题。

她最喜欢的原则是:明确授权团队杀掉旧流程。比如过去团队有 standup 和周进度表,后来意识到可以做一个 standup script,让 Claude 汇总大家的状态。

兴趣匹配度高。这是比较成熟的组织变革方法:不把流程细节一刀切,而是固定少数方向性原则,让 pod 在本地问题里自适应。对 AI 团队尤其重要,因为工具能力变化太快,强流程容易快速过期。

八、度量不要停在 AI 生成代码比例,要回到用户价值和系统可靠性

背景

Fiona 提到三个可观察指标:onboarding ramp-up time、PR cycle time、Claude-assisted commits。但她也提醒,代码生成比例不是最终目标。真正要看的是用户产品是否更好、质量和可靠性是否更强,以及新的瓶颈是否转移到 CI、产品基础设施或 review pipeline。

团队可以观察 onboarding ramp-up time 是否明显缩短,新人、设计师或 PM 能多快开始有效贡献。

PR cycle time 缩短也值得看,但它同时可能暴露新瓶颈:当代码吞吐量变大,产品基础设施、构建系统和 CI 是否还能跟上。

Claude-assisted commit 上升是信号,但不要只看生成了多少代码。最终还是要回到你想让产品为用户解决什么问题,以及质量和可靠性是否一起提升。

兴趣匹配度很高。这可以避免 AI adoption KPI 走偏。更好的指标组合应该同时覆盖:人进入系统的速度、交付链路的流速、验证系统的承载力、最终用户价值和可靠性,而不是只汇报有多少代码由 AI 生成。

九、可带回团队的动作:挑最吵、最贵、最讨厌的流程做审计

背景

演讲最后给了一个很实用的切入点:不要一开始就全量重构组织,而是挑一个噪音最大、最昂贵、大家最不期待的 workflow,问它是否仍然服务原目的,能否自动化,或者能否直接取消。她举了一个 50 人周会的例子:大家只有轮到自己汇报时抬头,其余时间都在电脑上。一个为什么还要开这个会的问题,就足以推动取消。

挑一个最吵的 workflow。它可以是最昂贵的、你自己最害怕做的,或者团队最不期待的。问:它还在服务原来的目的吗?

有个团队曾经每周开一个 50 人的大型 review,成本很高。她发现大家只有轮到自己汇报时才抬头,其他时间都在看电脑。于是她只是问:我们为什么还在开这个会?最后这个会被取消了。

对任何流程,都可以问三个方向:能不能自动化,能不能改成 Claude 辅助,或者它已经没有必要存在。

兴趣匹配度很高。这是可以直接执行的管理动作:从一个高噪音流程开始做局部审计,避免抽象谈 AI 变革。对汉松的小团队,可以先拿周会、PR review、需求评审、客户反馈整理、上线检查这类流程做实验。

整体判断

这场演讲的价值在于,它把 AI coding 从个人效率工具推进到研发组织重构。Fiona 的核心逻辑可以压缩成一句话:当编码吞吐量不再是主要约束,团队的管理系统必须围绕新的瓶颈重新设计。新的稀缺资源不是会不会写代码,而是能否判断什么值得做、如何验证、谁来承担风险、怎样让团队知识变成 agent 可用的上下文,以及如何持续杀掉已经过期的流程。

对汉松来说,最值得带走的不是某个 Claude Code 功能,而是三个团队动作:第一,重新画出当前研发链路的瓶颈地图;第二,把技术争论尽量转成可运行 PR 或 prototype;第三,给团队一个显式许可,定期清理旧流程,并优先自动化最吵、最贵、最讨厌的那一个。


订阅 AI Highlight

分享这篇文章:


上一篇
对话姚顺宇:从理论物理到 AI 的跨界探索与行业洞察
下一篇
Dario 与 Daniela:Agent 组织化与产品节奏