跳到正文
汉松札记
返回

Satya Nadella 2026:AI 平台战略与企业 Agent 的价值重构

AI Highlight

来源

【平台的判断标准:让生态获得比平台自身更多的价值】

背景:Satya 把 Microsoft 的 AI 战略放回平台公司的一条老原则里:平台不是只捕获价值,而是让开发者和企业在平台上形成自己的智能层。

平台的定义,不是它自己捕获多少价值,而是它能让围绕平台的人创造出多少额外价值。无论是 AI 原生公司还是传统企业,都应该能作为一等参与者,指向自己创造出来的 AI。

这也是整个开发者大会的承诺:你和我们一起构建,就能基于自己的数据得到属于你的智能。否则开发者大会就只是在单一模型的祭坛前膜拜,那就不再是开发者大会。

兴趣匹配度高。它把 AI 平台竞争从模型强弱拉到生态结构:真正的 AI 平台要允许企业把自己的数据、工具、评估和上下文复合进去,形成可持续的 frontier intelligence。

【模型不是全部,关键是围绕模型的爬坡脚手架】

背景:访谈里多次出现 hill climb。Satya 的重点不是单个模型,而是企业如何围绕模型建立可迭代的系统。

关键不是只拿一个通用模型,而是从干净谱系的模型出发,再围绕它搭建爬坡脚手架。企业可以基于这个脚手架训练自己的专家系统,积累强化学习环境、执行轨迹和私有评估。

前沿并不只是使用最新最大模型。加入时间维度后,可以先用强模型完成任务并收集轨迹,再让一个 5B 推理模型达到更高表现。

兴趣匹配度高。这是很强的机制解释:能力提升来自模型、轨迹、反馈、私有 eval 和工具环境形成的闭环,而不是单纯追逐更大模型。它对企业 Agent、垂直智能体、小模型成本优化都有迁移价值。

【真正的 IP 可能是私有 eval,而不是公开 benchmark】

背景:Satya 明确把 eval、trace 和 harness 放到企业控制权的核心位置。公开榜单可以被刷满,私有评估才决定企业能否持续爬坡。

每家公司最大的知识产权,可能是自己的私有评测集:你可以用它驱动前沿模型持续爬坡,同时不泄露执行轨迹。

一个简单的酸性测试是:你有一个私有 eval,现在用模型 A。如果换成模型 B 仍然能继续提升,你就掌握了控制权;如果不能,你就没有掌握控制权。

兴趣匹配度高。它给 AI 原生公司和企业 AI 落地提供了一个硬判断:护城河不是绑定某个模型,而是掌握能跨模型迁移的 eval、context、tools、harness 和 traces。

【企业 Agent 的核心 harness:模型、数据、工具、上下文的闭环】

背景:这组摘录直接命中上下文工程。Satya 说企业级 harness 需要同时定义模型、数据和工具,并让三者形成可训练、可评估、可执行的循环。

企业级 harness 应该定义模型、数据和工具,并让三者形成循环。工具要渐进式暴露,以提高 token 效率;还要用丰富上下文喂给系统,因为我们过去两年学到的硬课是:为了让计划高效执行,准备上下文层本身就是魔法发生的地方。

你可以使用 GitHub harness,也可以使用自己的 harness;重点是用你的工具、多模型和上下文一起训练。真正的价值来自 harness、工具和模型一起爬坡。

兴趣匹配度高。这段把 Agent 成败从 prompt 设计推进到系统设计:工具暴露、上下文准备、模型选择、trace 收集、eval 闭环,合在一起才是可运行的企业 Agent 平台。

【编程 Agent 成功后,反而需要重建 IDE 和协作界面】

背景:Satya 对 coding agent 的观察很具体:当 Agent 会话数量上来后,人类的认知负荷会反弹,聊天窗口也会成为瓶颈。

代码 Agent 已经有效到一个程度,以至于我们必须重建 IDE。上百个 Agent 会话把认知负荷重新转移回人类;单纯聊天作为唯一产物也不够,所以需要新的画布和界面。

在一个完全 agentic 的世界里,软件和 UI 仍然重要。你需要知道这些 autopilot 夜里代表你做了什么,它们是否真的按你的身份和授权完成了工作。

兴趣匹配度高。它对编程 Agent 产品形态很关键:Agent 越强,人越需要新的监督、审查、汇总和授权界面。AI coding 的瓶颈会从补全能力转向多会话管理和认知负载管理。

【人类资本 × token 资本:企业价值藏在协作轨迹里】

背景:Satya 把组织里的 AI 资产理解为人和 agent 共同工作的 traces。企业知识不再只存在于文档和老员工脑子里,而是逐步变成可学习的轨迹。

未来公司会同时拥有大量 token 资本和人类资本,真正的问题是如何让两者复利。在 Teams 里,一边是 agents 在工作,一边是人在工作,二者之间的轨迹会成为企业创造价值的重要上下文。

这些人与 agent 协作的轨迹,不是用来训练通用模型,而是训练“公司老兵 agent”。过去人力资本很难放进资产负债表,因为隐性知识无法捕获;现在 agents 可能让它被记录、学习和复用。

兴趣匹配度高。这是人机共生与知识管理的交叉点:组织级 Agent 记忆的价值不在多存文档,而在长期捕获人、任务、决策、工具调用和结果之间的关系。

【SaaS 不会简单消失,而会被拆包重组】

背景:访谈里对“软件终结”的回答很克制。Satya 没有说 SaaS 会被 AI 全部替代,而是说过去的封装方式会被重新拆开。

过去 SaaS 的做法是:定义数据模型,加入业务逻辑,再套上 UI。现在要重新审视这套垂直封装。底层数据模型、实体关系、语义模型和业务逻辑仍然很有价值,问题是如何拆开并以新的方式重新组合。

M365 里的邮件、Teams、Word、Excel、PowerPoint、SharePoint,过去只服务各自应用;现在它们可以作为公司最重要、但过去从未真正被当作数据库使用的数据库。

兴趣匹配度高。它比“AI 终结软件”更可操作:AI 应用工程的机会在于识别哪些 schema、semantic model、business logic 可以作为 Agent workflow 的稳定基座,再通过 Work IQ 这类上下文层重新组合。

【把工作上提一层:从执行任务到构建会执行任务的 Agentic System】

背景:Azure 网络团队的例子是全文最强的组织工作流案例。它不是降本增效口号,而是把团队的工作重新定义为元工作。

Azure 网络团队意识到,如果不重新概念化工作,扩张根本行不通。于是他们说:我们的工作不是做 Azure 网络,而是构建一个能做 Azure 网络的 Agentic System。

后来他们要的不是更多人头,而是更多 token。也就是说,他们把自己的工作变成了元工作;元工作现在成了他们的新工作。

兴趣匹配度高。这是 Agent 系统对组织形态的直接改变:高杠杆团队不再只是执行某类工作,而是把那类工作建模、工具化、自动化、可观察化,然后持续改进这个执行系统。

【教育与角色的变化:作用域变大,但概念理解仍然关键】

背景:访谈后段把工程角色和教育放在一起看。AI 会扩大通才的作用域,但不会让概念学习失效。

LinkedIn 已经结构性地改变了一些角色,形成了“全栈建造者”这种新学科:把设计、产品管理、前端工程放在一起。每个人仍然保留自己的锋利边缘,但角色作用域变大,不再被单一岗位限制。

人们仍然需要学习概念。比如一门 AI 课会确保学生学会如何正确应用 softmax,而不是只会说“帮我修一下训练运行”。概念学习仍然关键;但激励、证书、我们如何评价证书,以及这些证书对应什么就业机会,都必须发生完整变化。

兴趣匹配度高。它对个人成长和团队建设都有启发:AI 提高的是能把产品、设计、代码、系统判断串起来的人的杠杆;同时,能让 Agent 修问题不等于理解系统,底层概念仍然决定判断质量。

整体评价

这篇访谈最值得保留的不是 Microsoft 的产品发布,而是 Satya 对 AI 平台的结构性判断:模型只是起点,企业真正要建设的是 harness、context layer、private eval、trace、tooling 和组织级 agent memory。它和你最近关注的多 Agent 协作、文件式上下文、长期运行 Agent、AI coding 管理是同一条线。

如果压缩成一句话:AI 时代的企业护城河,不是拥有一个最强模型,而是拥有一套能让模型、工具、数据、人类判断和执行轨迹持续复利的系统。


订阅 AI Highlight

分享这篇文章:


上一篇
异步 Agent 时代:从本地补全到后台编码工厂
下一篇
GitHub 的 AI 编程压力测试:Agent 时代的软件平台重构