Demis Hassabis：AGI 倒计时与 AI Agent 时代

来源

原始链接：https://mp.weixin.qq.com/s/L19Pf7Rl6LUrCWXUH2BbzA
来源类型：网页正文
来源标题：2026 谷歌 I/O 大会 Demis Hassabis 深度访谈：AGI 十年倒计时与 AI Agent 时代降临

来源：数字开物转载的 Axios 炉边对话，访谈对象为 Google DeepMind CEO Demis Hassabis。正文后半部分包含论坛广告和推荐阅读，本次高亮只取访谈主体，不纳入文末尾料。

这篇访谈最值得保留的地方，不是 Demis 再次给出 2030 年前后的 AGI 时间线，而是他把 Google DeepMind 的几条路线放在同一个框架里：AGI 不是一个单点顿悟，而是模型能力、Agent 化、模拟环境、科学发现、持续学习和可靠性共同推进后的系统跃迁。

一、AGI 的判断标准：从能力展示走向原创发现

背景：Demis 对 AGI 时间线的判断很明确，大约 2029 到 2031 年。但更有价值的是他给出的测试标准。他没有把 AGI 定义为聊天、写代码或通过某个考试，而是问模型能否在历史知识边界之外产生原创科学洞见。

如果把当前最前沿模型的知识截止时间设定在 1901 年，它能否像爱因斯坦在 1905 年那样，独立提出狭义相对论等划时代洞见？今天的 AI 显然还做不到，但未来没有理由做不到。只有达到这种创造力和认知飞跃，才称得上真正的 AGI。

兴趣匹配度高。这个标准把 AGI 从答题机器推向发现机器。它对应汉松长期关注的一个问题：智能的核心不是已知空间内的补全，而是在边界处提出新结构。

AGI 不会是一个顿悟时刻，而会是一个渐进但可能非常快速的提升过程。几年后回望，大家可能会发现 2026 或 2027 年已经是一切开始的地方。

兴趣匹配度中高。它给 AI 时代的时间感提供了一个更稳的框架：不要等一个官方宣布的奇点，要观察能力是否逐步形成可迁移、可验证、可持续的系统性改进。

二、Google 的全栈壁垒：从模型竞争变成反馈循环竞争

背景：访谈中 Demis 对 Google 竞争优势的表述很典型。他强调的不是单个模型榜单，而是从芯片、数据中心、云、前沿实验室到十亿用户产品的全栈循环。

Google 拥有从芯片、数据中心、云计算、前沿实验室，到嵌入 AI 的十亿级用户产品的完整布局。真正的优势在于不断优化这个反馈循环，让每一层相互促进。

兴趣匹配度高。这是对 AI 公司壁垒的系统性描述。AI 竞争正在从模型一次性发布，转向数据、分发、算力、产品反馈和推理成本共同构成的复利系统。

过去一年最大的飞跃发生在消费者端。Google 几乎从底层开始重写技术栈，从 AI 优先转向 AI Agent 优先，让最新模型能力能大规模进入数十亿用户每天使用的产品。

兴趣匹配度高。这里能抽出一个产品判断：Agent 不是额外功能，而是会反过来要求底层工程栈重构。真正的 Agent 化产品，需要权限、安全、上下文、工具、状态和反馈机制一起改。

三、Agent 的落地信号：从演示片段进入真实工作流

背景：Demis 认为 2026 年 Google I/O 的核心信号是 AI Agent 时代真正到来，关键动作是把 Agent 深度嵌入 Google 生态，而不是停留在单点 demo。

本届 Google I/O 最核心的一点是 AI Agent 时代已经到来。现在展示的只是冰山一角，接下来会看到 Agent 从辅助编程延伸到承担行政管理负担，并深度整合进 Workspace 等真实工作场景。

兴趣匹配度高。它和汉松关注的 Agent workflow 很贴合：Agent 的评价重点应该从会不会调用工具，转向能不能进入真实流程、接住上下文、承担长期任务。

一年后的 Google I/O，核心焦点可能是大量 AI Agent 融入真实世界，并深度嵌入工作流；另一个焦点会是现实世界 AI 在机器人领域的跨越式进展。

兴趣匹配度中高。这给后续一年观察 AI 进展提供了两个指标：软件 Agent 的工作流嵌入密度，以及具身智能是否开始从模型展示进入可部署系统。

四、系统自我演进：可验证领域会形成复利飞轮

背景：Demis 把接下来几个月到 2026 年的行业重点指向系统自我演进。他特别点名编程和数学，因为这两个领域的输出可验证，适合生成合成数据，进一步训练系统。

编程和数学的特殊性在于输出结果严谨可验证。你可以轻松判断对错，并据此生成无限量合成数据。充分证据表明，这会形成不断强化的复利飞轮，所有顶尖实验室都在这个方向重注。

兴趣匹配度高。这个判断非常适合放进 AI coding 和推理模型观察框架：能自动验证的领域，会最先进入自我改进循环；不能自动验证的领域，进展会更依赖人类品味和外部反馈。

随着 Agent 能力增强，被委派的任务越来越多，AI 在执行任务、调用工具、遵循指令和进行长期复杂规划时，必须高度一致、可监控且安全。

兴趣匹配度高。这是 Agent 工程化的硬指标：能力上限之外，还要看可靠性、可观测性、指令一致性和权限边界。没有这些，Agent 只能演示，不能托付。

五、锯齿状智能和持续学习：当前模型的根本缺陷

背景：访谈里最有机制价值的一段，是 Demis 对锯齿状智能的批评。他认为真正的通用智能应该在同一领域内保持稳定迁移，而不是换一种表述就翻车。

一个真正的 AGI 不应该在某些问题上表现惊艳，却在同领域一个本质更简单、只是表述略微偏离训练分布的问题上彻底失败。人类智力不是这样。智能不应该是参差不齐的锯齿状智能。

兴趣匹配度高。这句话可以直接变成模型评测原则：不要只看困难题上的高光表现，还要测能力在分布外表述、任务变体和长期上下文中的稳定性。

另一个巨大缺口是持续学习。模型训练结束并部署到真实环境后，如何继续学习、持续适应和进化？这直接关系到个性化体验，也关系到 AI 能否根据用户具体语境提供专属服务。

兴趣匹配度高。这和个人 AI、记忆系统、上下文工程直接相关。真正的个人智能体不是每次都重新开始，而是能把共同经历沉淀成之后行动的优势。

六、AI 赋能科学：从预测工具走向发现基础设施

背景：Demis 仍然把 AI 视为服务科学的终极工具。AlphaFold 的关键意义不仅是模型准确，而是 DeepMind 选择把所有蛋白质结构免费开放，直接把一个突破变成全球科研基础设施。

AlphaFold 足够精准也足够快速，几秒钟就能折叠一个蛋白质。与其让研究人员提交请求、一周后拿结果，不如投入算力把几亿种已知蛋白质全部折叠出来，免费放进全球可访问的数据库，让科学家像使用搜索一样访问结构数据。

兴趣匹配度高。这里最值得学的是产品化判断：当模型能力跨过阈值，最大价值不一定来自按需服务，而可能来自一次性把整个问题空间预计算并基础设施化。

AI 可以帮助顶尖专家驾驭极端复杂的海量数据，从中发现隐秘关联、洞察和深层结构。未来十年，多个停滞三四十年的科学领域会出现类似蛋白质折叠的突破。

兴趣匹配度中高。它把 AI 的最高价值场景指向科学发现，而不只是内容生成或办公自动化。对汉松的 AGI 信念来说，这是更强的正向叙事：AI 作为人类理解世界的放大器。

七、模拟、世界模型与机器人：让 AI 在长尾场景中学习

背景：Demis 对模拟技术的强调很重要。他把 AI 和模拟视为互补关系：AI 可以学习复杂物理过程，模拟也可以反过来给 AI 提供现实世界很难收集的数据。

模拟环境可以为 AI 提供极端长尾场景的数据。比如用交互式 3D 模型测试 Waymo，在十亿分之一概率的场景里观察自动驾驶反应。如果表现不好，还能继续生成数据进行迭代学习。

兴趣匹配度高。这是世界模型和 Agent 训练的关键机制：真实世界数据覆盖不了长尾，模拟环境可以让系统在可控风险下补齐经验。

天气预报展示了 AI 与模拟结合的价值。传统系统需要手动求解复杂方程，耗时长且预测窗口有限；AI 可以从现有数据中学习模拟机制，并更快预测飓风等极端天气路径。

兴趣匹配度中高。它说明 AI 的一个重要演化方向是用学习到的近似模型替代部分手工物理建模，在速度和可用性上形成新的工程边界。

整体判断

这篇访谈的主线是：Demis 眼里的 AGI 路线，不是单纯把聊天模型做大，而是把模型能力放进更大的系统里。这个系统包括 Agent 工作流、可验证领域的自我改进、持续学习、可靠执行、模拟环境、机器人和科学发现基础设施。

对汉松最有用的三个判断：

AGI 的关键测试不是会不会回答难题，而是能否在知识边界外产生可验证的原创发现。
Agent 时代的核心不是工具调用，而是产品栈、权限、安全、上下文、长期任务和可观测性一起工程化。
可验证领域会最先进入自我改进飞轮，个人 AI 和真实世界 Agent 的下一道门槛是持续学习与一致性。