跳到正文
汉松札记
返回

Demis Hassabis:AGI 倒计时与 AI Agent 时代

AI Highlight

来源

2026 谷歌 I/O Demis Hassabis 访谈:AGI 倒计时与 Agent 时代

来源:数字开物转载的 Axios 炉边对话,访谈对象为 Google DeepMind CEO Demis Hassabis。正文后半部分包含论坛广告和推荐阅读,本次高亮只取访谈主体,不纳入文末尾料。

这篇访谈最值得保留的地方,不是 Demis 再次给出 2030 年前后的 AGI 时间线,而是他把 Google DeepMind 的几条路线放在同一个框架里:AGI 不是一个单点顿悟,而是模型能力、Agent 化、模拟环境、科学发现、持续学习和可靠性共同推进后的系统跃迁。

一、AGI 的判断标准:从能力展示走向原创发现

背景:Demis 对 AGI 时间线的判断很明确,大约 2029 到 2031 年。但更有价值的是他给出的测试标准。他没有把 AGI 定义为聊天、写代码或通过某个考试,而是问模型能否在历史知识边界之外产生原创科学洞见。

如果把当前最前沿模型的知识截止时间设定在 1901 年,它能否像爱因斯坦在 1905 年那样,独立提出狭义相对论等划时代洞见?今天的 AI 显然还做不到,但未来没有理由做不到。只有达到这种创造力和认知飞跃,才称得上真正的 AGI。

兴趣匹配度高。这个标准把 AGI 从答题机器推向发现机器。它对应汉松长期关注的一个问题:智能的核心不是已知空间内的补全,而是在边界处提出新结构。

AGI 不会是一个顿悟时刻,而会是一个渐进但可能非常快速的提升过程。几年后回望,大家可能会发现 2026 或 2027 年已经是一切开始的地方。

兴趣匹配度中高。它给 AI 时代的时间感提供了一个更稳的框架:不要等一个官方宣布的奇点,要观察能力是否逐步形成可迁移、可验证、可持续的系统性改进。

二、Google 的全栈壁垒:从模型竞争变成反馈循环竞争

背景:访谈中 Demis 对 Google 竞争优势的表述很典型。他强调的不是单个模型榜单,而是从芯片、数据中心、云、前沿实验室到十亿用户产品的全栈循环。

Google 拥有从芯片、数据中心、云计算、前沿实验室,到嵌入 AI 的十亿级用户产品的完整布局。真正的优势在于不断优化这个反馈循环,让每一层相互促进。

兴趣匹配度高。这是对 AI 公司壁垒的系统性描述。AI 竞争正在从模型一次性发布,转向数据、分发、算力、产品反馈和推理成本共同构成的复利系统。

过去一年最大的飞跃发生在消费者端。Google 几乎从底层开始重写技术栈,从 AI 优先转向 AI Agent 优先,让最新模型能力能大规模进入数十亿用户每天使用的产品。

兴趣匹配度高。这里能抽出一个产品判断:Agent 不是额外功能,而是会反过来要求底层工程栈重构。真正的 Agent 化产品,需要权限、安全、上下文、工具、状态和反馈机制一起改。

三、Agent 的落地信号:从演示片段进入真实工作流

背景:Demis 认为 2026 年 Google I/O 的核心信号是 AI Agent 时代真正到来,关键动作是把 Agent 深度嵌入 Google 生态,而不是停留在单点 demo。

本届 Google I/O 最核心的一点是 AI Agent 时代已经到来。现在展示的只是冰山一角,接下来会看到 Agent 从辅助编程延伸到承担行政管理负担,并深度整合进 Workspace 等真实工作场景。

兴趣匹配度高。它和汉松关注的 Agent workflow 很贴合:Agent 的评价重点应该从会不会调用工具,转向能不能进入真实流程、接住上下文、承担长期任务。

一年后的 Google I/O,核心焦点可能是大量 AI Agent 融入真实世界,并深度嵌入工作流;另一个焦点会是现实世界 AI 在机器人领域的跨越式进展。

兴趣匹配度中高。这给后续一年观察 AI 进展提供了两个指标:软件 Agent 的工作流嵌入密度,以及具身智能是否开始从模型展示进入可部署系统。

四、系统自我演进:可验证领域会形成复利飞轮

背景:Demis 把接下来几个月到 2026 年的行业重点指向系统自我演进。他特别点名编程和数学,因为这两个领域的输出可验证,适合生成合成数据,进一步训练系统。

编程和数学的特殊性在于输出结果严谨可验证。你可以轻松判断对错,并据此生成无限量合成数据。充分证据表明,这会形成不断强化的复利飞轮,所有顶尖实验室都在这个方向重注。

兴趣匹配度高。这个判断非常适合放进 AI coding 和推理模型观察框架:能自动验证的领域,会最先进入自我改进循环;不能自动验证的领域,进展会更依赖人类品味和外部反馈。

随着 Agent 能力增强,被委派的任务越来越多,AI 在执行任务、调用工具、遵循指令和进行长期复杂规划时,必须高度一致、可监控且安全。

兴趣匹配度高。这是 Agent 工程化的硬指标:能力上限之外,还要看可靠性、可观测性、指令一致性和权限边界。没有这些,Agent 只能演示,不能托付。

五、锯齿状智能和持续学习:当前模型的根本缺陷

背景:访谈里最有机制价值的一段,是 Demis 对锯齿状智能的批评。他认为真正的通用智能应该在同一领域内保持稳定迁移,而不是换一种表述就翻车。

一个真正的 AGI 不应该在某些问题上表现惊艳,却在同领域一个本质更简单、只是表述略微偏离训练分布的问题上彻底失败。人类智力不是这样。智能不应该是参差不齐的锯齿状智能。

兴趣匹配度高。这句话可以直接变成模型评测原则:不要只看困难题上的高光表现,还要测能力在分布外表述、任务变体和长期上下文中的稳定性。

另一个巨大缺口是持续学习。模型训练结束并部署到真实环境后,如何继续学习、持续适应和进化?这直接关系到个性化体验,也关系到 AI 能否根据用户具体语境提供专属服务。

兴趣匹配度高。这和个人 AI、记忆系统、上下文工程直接相关。真正的个人智能体不是每次都重新开始,而是能把共同经历沉淀成之后行动的优势。

六、AI 赋能科学:从预测工具走向发现基础设施

背景:Demis 仍然把 AI 视为服务科学的终极工具。AlphaFold 的关键意义不仅是模型准确,而是 DeepMind 选择把所有蛋白质结构免费开放,直接把一个突破变成全球科研基础设施。

AlphaFold 足够精准也足够快速,几秒钟就能折叠一个蛋白质。与其让研究人员提交请求、一周后拿结果,不如投入算力把几亿种已知蛋白质全部折叠出来,免费放进全球可访问的数据库,让科学家像使用搜索一样访问结构数据。

兴趣匹配度高。这里最值得学的是产品化判断:当模型能力跨过阈值,最大价值不一定来自按需服务,而可能来自一次性把整个问题空间预计算并基础设施化。

AI 可以帮助顶尖专家驾驭极端复杂的海量数据,从中发现隐秘关联、洞察和深层结构。未来十年,多个停滞三四十年的科学领域会出现类似蛋白质折叠的突破。

兴趣匹配度中高。它把 AI 的最高价值场景指向科学发现,而不只是内容生成或办公自动化。对汉松的 AGI 信念来说,这是更强的正向叙事:AI 作为人类理解世界的放大器。

七、模拟、世界模型与机器人:让 AI 在长尾场景中学习

背景:Demis 对模拟技术的强调很重要。他把 AI 和模拟视为互补关系:AI 可以学习复杂物理过程,模拟也可以反过来给 AI 提供现实世界很难收集的数据。

模拟环境可以为 AI 提供极端长尾场景的数据。比如用交互式 3D 模型测试 Waymo,在十亿分之一概率的场景里观察自动驾驶反应。如果表现不好,还能继续生成数据进行迭代学习。

兴趣匹配度高。这是世界模型和 Agent 训练的关键机制:真实世界数据覆盖不了长尾,模拟环境可以让系统在可控风险下补齐经验。

天气预报展示了 AI 与模拟结合的价值。传统系统需要手动求解复杂方程,耗时长且预测窗口有限;AI 可以从现有数据中学习模拟机制,并更快预测飓风等极端天气路径。

兴趣匹配度中高。它说明 AI 的一个重要演化方向是用学习到的近似模型替代部分手工物理建模,在速度和可用性上形成新的工程边界。

整体判断

这篇访谈的主线是:Demis 眼里的 AGI 路线,不是单纯把聊天模型做大,而是把模型能力放进更大的系统里。这个系统包括 Agent 工作流、可验证领域的自我改进、持续学习、可靠执行、模拟环境、机器人和科学发现基础设施。

对汉松最有用的三个判断:

  1. AGI 的关键测试不是会不会回答难题,而是能否在知识边界外产生可验证的原创发现。
  2. Agent 时代的核心不是工具调用,而是产品栈、权限、安全、上下文、长期任务和可观测性一起工程化。
  3. 可验证领域会最先进入自我改进飞轮,个人 AI 和真实世界 Agent 的下一道门槛是持续学习与一致性。

订阅 AI Highlight

分享这篇文章:


下一篇
Anthropic Claude Code 深度访谈:Agent 工程化的下一步