来源

原始链接：https://www.youtube.com/watch?v=igO8iyca2_g
来源类型：视频逐字稿
来源标题：AI 时代研发团队的重构：Anthropic Claude Code 团队的管理经验分享

Claude Code 团队管理经验高亮

文本来源是 28 分钟 YouTube 演讲逐字稿，演讲者是 Anthropic Claude Code 与 Claude.ai 工程和产品负责人 Fiona Fung。内容核心不是 Claude Code 的功能展示，而是当 AI coding 把编码吞吐量大幅抬高后，研发团队的瓶颈、流程、组织结构和管理动作如何跟着重构。按汉松兴趣画像，以下高亮优先保留机制解释、反常识判断和可复用 workflow。

一、编码不再是瓶颈，瓶颈迁移到验证、评审和协作边界

背景

Fiona 的核心判断很直接：过去多年，软件工程流程默认编码带宽昂贵，所以规划、设计文档、排期、所有权和评审都围绕节省工程时间展开。Claude Code 团队看到的变化是，编码和原型吞吐量被 AI 放大后，真正卡住团队的地方变成了代码是否正确、谁来评审、如何维护、跨职能伙伴和安全边界能否跟上。

多年来，工程带宽一直是昂贵资源，很多软件交付流程都是围绕节省编码时间设计的。现在在 Claude Code 团队里，编码已经很少是最慢的部分，吞吐量也变得完全不同。

当瓶颈从写代码转移出去，新的瓶颈会出现在验证、代码评审、跨职能协作和安全上。团队开始不断追问：这段代码正确吗？谁来评审？它之后如何维护？

很多流程不会自己消失。团队往往只会在旧流程上继续叠新流程，直到需要再发明一套优先级排序来管理这些流程。

兴趣匹配度很高。这是 AI coding 管理里的底层转向：团队优化目标从提高编码效率，迁移到提高判断、验证、维护和协调的效率。对汉松当前管理 AI 团队尤其相关，因为真正的管理动作不是推动大家多用工具，而是重新识别瓶颈在哪里。

二、规划从长周期路线图转向 JIT planning，技术争论要让代码说话

背景

Claude Code 团队减少了长周期设计和产品评审，把更多讨论放进 PR 和原型里。这里的反常识点是：当构建成本下降，争论本身变成昂贵动作。过去需要白板会讨论的技术方案，现在可以生成多个 PR，让团队直接比较 API 实现、调用方影响和维护成本。

她刚加入时也想做六个月路线图，但三个月后很多事情已经变化。于是团队转向刚好够用、刚好及时的规划方式，因为原型和代码生成已经不再是过去那个瓶颈。

一次重构争论里，她本来想把同事拉进会议室白板讨论，后来意识到现在可以直接生成三种不同 PR。这样讨论的对象不只是 API 怎么实现，也包括每个方案会如何影响所有调用方。

当构建变得便宜，争论就变得昂贵。Claude Code 团队减少了每次写代码前都要先写设计文档的仪式，更多时候是：有想法就去做原型，讨论发生在 PR 和可运行方案里。

兴趣匹配度高。这里可以抽象成一个可复用 workflow：对高不确定性的工程判断，不先写长文档争辩，而是并行生成几个候选实现，用真实 diff、真实调用方影响和真实测试结果来压缩争论成本。

三、代码评审的核心问题变成：哪里信任 Claude，哪里必须保留人类判断

背景

Fiona 没有把 AI code review 描述成全自动替代人类，而是给出一个更实用的分层：格式、lint、普通 PR 反馈、补测试、部分 bug fix 可以交给 Claude；法律、安全、信任边界、产品品味和高风险判断仍然需要专家。重点不是人类是否退场，而是把人类判断放到最值钱的位置。

Claude Code 团队大量使用 Claude 做代码评审，也让它处理样式、lint、PR 反馈、补测试和一些 bug 修复。Claude 甚至可以照看 PR，在完整提交前先修掉一批问题。

真正的问题是：哪些地方可以高度信任 Claude，哪些地方仍然需要人类。法律评审、风险容忍度、信任边界、安全敏感代码，仍然要拉专家进来。

产品感和品味也需要人类。她提到曾让 Claude 把终端里的 Claude 做成节日雪人，结果设计伙伴指出它看起来像 Mr. Peanut。最后选择了更简单的冰蓝和雪花方案。

兴趣匹配度很高。这和汉松长期关心的 AI 共生一致：AI 承担机械性检查和初级修复，人类承担判断、边界、责任和品味。管理者要设计的不是自动化比例，而是决策分层：哪些判断可以机器化，哪些判断必须由有上下文的人来签字。

四、团队画像从原始吞吐量转向产品感、创造力和深系统能力

背景

当模型提高了普通编码吞吐量，招聘和团队构成也要换权重。Fiona 说 Claude Code 团队更重视两类工程师：一类是有产品感的 creative builder，能从问题出发快速迭代出体验；另一类是有深系统能力的人，能处理分布式系统、远程执行、可靠性等 hard parts。相对地，单纯原始产码速度的价值下降。

Claude Code 团队重点看两类工程师：一类是有产品感的创造型 builder，看到问题后会想做出产品来解决，并持续迭代体验；另一类是深系统专家，因为要构建 Claude Code Remote 这类能力，仍然需要很硬的分布式系统能力。

她会较少把权重放在原始吞吐量上，因为模型已经显著提升了这部分效率。

角色边界正在变模糊。PM 会写代码，设计师和非工程角色也能参与工程；工程师也能借助 Claude 去完成过去更偏内容设计或表达设计的任务。

兴趣匹配度高。这个判断可以直接用于 AI 时代团队能力模型：AI 普及后，普通执行力被放大，稀缺性转移到问题感、产品感、领域判断、系统边界和可靠性能力。对管理者来说，招聘标准和晋升标准都要跟着变。

五、管理者要重新进入产品和代码现场，dogfooding 成为组织能力

背景

Fiona 对组织形态的判断很强：Claude Code 团队尽量保持扁平，经理也要先从 IC 开始，亲自 dogfood、写代码、理解产品和团队工作方式。她认为这在过去很难，因为管理者脱离代码后，内部工具和工作流变化太快；但 Claude Code 降低了重新进入现场的成本。

她希望 Claude Code 的每个经理都先以 IC 身份开始，先在团队里建立技术信用，也真正学会怎样成为有效工程师。

过去她在 Meta 时会尝试每年做一个 PR，只是为了保持和工程现场的连接。但内部工具和流程变化很快，经常刚学会一个命令，它就已经变了。现在她甚至不用记 git 命令，直接让 Claude 帮她处理。

对 Claude Code 团队来说，重度 dogfooding 是做出好产品的关键。领导者即使不能长期写大量代码，也必须持续使用自己的产品。

兴趣匹配度很高。这对汉松的管理处境很贴：AI coding 让技术 leader 重新获得进入代码现场的能力。管理者不用回到过去那种亲自承包实现的角色，但可以用 AI 降低上下文恢复成本，保持对产品、代码和团队真实工作流的触感。

六、代码库成为新的事实源，文档和规格要进入 repo

背景

Claude Code 团队把代码库视为事实源，用本地 repo 和 Claude 回答客户问题，减少文档滞后的问题。她没有否定规格文档，而是建议把有价值的 specs 放进 repo，让 Claude 能拿代码和规格互相校验。

在 Claude Code 团队里，代码就是事实源。她回答客户问题时，会打开本地仓库，让 Claude 结合代码库直接帮她理解和回应。

这样可以减少文档落后于代码的问题。如果团队已经有很好的规格文档，就把它们提交到仓库里，让 Claude 帮忙检查代码执行是否符合规格预期。

代码所有权也变得模糊。与其问谁写了这段代码，不如追问你真正想解决的问题：是找回归原因、找专家回答客户问题，还是获得上下文。不同问题可以设计不同自动化。

兴趣匹配度很高。这是上下文工程的组织版本：把真实状态、规格、历史决策和验证逻辑放到模型可访问、可检索、可执行的位置。团队知识管理的目标从写给人看，变成同时服务人和 agent。

七、团队级 rollout：少数强制原则，加上 pod 自主适配

背景

Fiona 没有把 Claude Code 团队的做法包装成统一流程，而是区分团队必须遵守的原则和每个 pod 可以自主适配的部分。强制原则包括全员使用 Claude Code、尽可能 Claudify，以及明确允许杀掉旧流程。具体 triage、standup、on-call 和先自动化哪个 workflow，则交给不同 pod 决定。

Claude Code 团队的核心原则会定期更新，因为团队会反复问：这个原则还在服务它当初要服务的目的吗？

原则之一不是每个工程师使用 Claude Code，而是每个 Claude Code 团队成员都使用 Claude Code，包括跨职能伙伴。

另一个原则是尽可能 Claudify：如果你正在做某件事，就问有没有办法让 Claude 帮你做，尤其是验证和更早发现问题。

她最喜欢的原则是：明确授权团队杀掉旧流程。比如过去团队有 standup 和周进度表，后来意识到可以做一个 standup script，让 Claude 汇总大家的状态。

兴趣匹配度高。这是比较成熟的组织变革方法：不把流程细节一刀切，而是固定少数方向性原则，让 pod 在本地问题里自适应。对 AI 团队尤其重要，因为工具能力变化太快，强流程容易快速过期。

八、度量不要停在 AI 生成代码比例，要回到用户价值和系统可靠性

背景

Fiona 提到三个可观察指标：onboarding ramp-up time、PR cycle time、Claude-assisted commits。但她也提醒，代码生成比例不是最终目标。真正要看的是用户产品是否更好、质量和可靠性是否更强，以及新的瓶颈是否转移到 CI、产品基础设施或 review pipeline。

团队可以观察 onboarding ramp-up time 是否明显缩短，新人、设计师或 PM 能多快开始有效贡献。

PR cycle time 缩短也值得看，但它同时可能暴露新瓶颈：当代码吞吐量变大，产品基础设施、构建系统和 CI 是否还能跟上。

Claude-assisted commit 上升是信号，但不要只看生成了多少代码。最终还是要回到你想让产品为用户解决什么问题，以及质量和可靠性是否一起提升。

兴趣匹配度很高。这可以避免 AI adoption KPI 走偏。更好的指标组合应该同时覆盖：人进入系统的速度、交付链路的流速、验证系统的承载力、最终用户价值和可靠性，而不是只汇报有多少代码由 AI 生成。

九、可带回团队的动作：挑最吵、最贵、最讨厌的流程做审计

背景

演讲最后给了一个很实用的切入点：不要一开始就全量重构组织，而是挑一个噪音最大、最昂贵、大家最不期待的 workflow，问它是否仍然服务原目的，能否自动化，或者能否直接取消。她举了一个 50 人周会的例子：大家只有轮到自己汇报时抬头，其余时间都在电脑上。一个为什么还要开这个会的问题，就足以推动取消。

挑一个最吵的 workflow。它可以是最昂贵的、你自己最害怕做的，或者团队最不期待的。问：它还在服务原来的目的吗？

有个团队曾经每周开一个 50 人的大型 review，成本很高。她发现大家只有轮到自己汇报时才抬头，其他时间都在看电脑。于是她只是问：我们为什么还在开这个会？最后这个会被取消了。

对任何流程，都可以问三个方向：能不能自动化，能不能改成 Claude 辅助，或者它已经没有必要存在。

兴趣匹配度很高。这是可以直接执行的管理动作：从一个高噪音流程开始做局部审计，避免抽象谈 AI 变革。对汉松的小团队，可以先拿周会、PR review、需求评审、客户反馈整理、上线检查这类流程做实验。

整体判断

这场演讲的价值在于，它把 AI coding 从个人效率工具推进到研发组织重构。Fiona 的核心逻辑可以压缩成一句话：当编码吞吐量不再是主要约束，团队的管理系统必须围绕新的瓶颈重新设计。新的稀缺资源不是会不会写代码，而是能否判断什么值得做、如何验证、谁来承担风险、怎样让团队知识变成 agent 可用的上下文，以及如何持续杀掉已经过期的流程。

对汉松来说，最值得带走的不是某个 Claude Code 功能，而是三个团队动作：第一，重新画出当前研发链路的瓶颈地图；第二，把技术争论尽量转成可运行 PR 或 prototype；第三，给团队一个显式许可，定期清理旧流程，并优先自动化最吵、最贵、最讨厌的那一个。

Claude Code 团队如何重构研发管理

来源