前OpenAI研究负责人Bob McGrew：通往AGI的关键突破，其实已经完成

AI PM 编辑部 · 2025年06月17日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期对话中，前OpenAI首席研究官Bob McGrew给出了一个耐人寻味的判断：实现AGI所需的关键技术突破，可能已经基本完成。真正的挑战，不在于再发明“新东西”，而在于如何把现有能力组合、打磨并落地。

前OpenAI研究负责人Bob McGrew：通往AGI的关键突破，其实已经完成

在这期对话中，前OpenAI首席研究官Bob McGrew给出了一个耐人寻味的判断：实现AGI所需的关键技术突破，可能已经基本完成。真正的挑战，不在于再发明“新东西”，而在于如何把现有能力组合、打磨并落地。

为什么他说：AGI并没有“撞墙”，只是换了赛道

这一判断之所以重要，是因为它直接反驳了近一年AI圈最常见的悲观情绪——“大模型快到头了”。McGrew明确表示，他不认为行业遇到了一堵无法跨越的墙。“It’s not a wall… it’s still important. It’s just doing something different in the pipeline.”他的意思是，瓶颈确实存在，但它已经从“能不能训练更大的模型”，转移到了“如何在训练之后继续榨取价值”。

在他看来，推理能力（reasoning）的成熟正在改变进展的节奏。早期模型的能力“overhang”（能力尚未被完全利用的积累）正在被逐步消耗，一旦这部分红利被吃完，进步自然会显得更慢。但这并不意味着停滞，而是进入了一个更工程化、更精细的阶段。

这个判断背后，其实隐含着他在OpenAI时期形成的方法论：研究突破往往是跳跃式的，而产品和能力的释放，则更多依赖长期、系统性的整合工作。当外界还在等待“下一个Transformer时刻”时，他已经把注意力放在了如何让现有模型真正“会做事”。

语言接口+视觉：机器人和现实世界正在被“解锁”

如果要找一个他认为已经发生、但外界低估的变化，那就是大语言模型与现实世界的连接方式。McGrew提到：“Now that you have LLMs， you have this language interface to the robot.”这句话看似简单，却点出了过去十年AI研究积累的真正价值。

在他的描述中，语言模型相当于给机器提供了一种极低成本的任务描述接口。过去，机器人系统往往需要高度定制的指令和规则；现在，人类可以直接用自然语言描述目标。同时，强大的视觉编码器（vision encoders）让机器第一次具备了稳定理解物理世界的能力。

关键不在于某一个单点技术，而在于“the entire tech and research stack that we've built over the last 10 years”。语言、视觉、控制、训练方法，这些模块终于可以无缝拼接。这也是他反复强调“突破已经完成”的原因：基础能力齐了，剩下的是工程、集成和规模化落地的问题。

真正困难的部分：Post-training与“理解人性”

当话题转向post-training（训练之后的能力塑造），McGrew的语气明显变得谨慎。他坦言，这是当前最被低估、也最难的一环。“Can you help us unpack what's left in post-training？”这个问题背后，隐藏的是对人类偏好、价值和行为模式的深度建模。

他甚至半开玩笑地说了一句：“I’m going to say something potentially controversial… I kind of hope I’m wrong.”争议点在于，后训练阶段不再只是算法问题，而越来越依赖对“human nature”的理解。这意味着，未来的AI进步，可能需要更多跨学科的人才，而不仅是纯工程或纯研究背景。

这也解释了他为什么认为进展会变慢：不是因为算力不够，而是因为目标变得更模糊。让模型“更聪明”相对容易，让模型“更像一个可靠的合作者”，才是真正的难题。

数据、代码与安全：他眼中未来几年的主战场

在更偏应用的层面，McGrew点名了几个未来几年会持续拉开差距的方向。首先是数据，尤其是“proprietary data”。他直言不讳地表示，专有数据在后续阶段“really useful”，这也是为什么领先公司越来越重视内部数据飞轮。

其次是编码能力。他在谈到coding时强调，这会是模型真正改变生产力的核心场景之一，而且影响会在“over the next couple years”逐步显现。代码既是语言，又是可执行行动，非常符合他对“something that an AI model can actually execute”的定义。

最后是安全与日常使用。他提到自己在日常生活中已经大量使用AI，并关注这些能力如何“having it all add up to one big whole”。在他看来，安全不只是防止模型出错，而是确保这些能力被可靠地整合进真实世界。

总结

综合来看，Bob McGrew传递的核心信息并不乐观或悲观，而是冷静而现实：AGI不太可能通过某个全新发明突然降临，更可能来自对现有能力的长期打磨与组合。对从业者而言，机会正在从“追逐突破”转向“理解系统、理解人、理解落地”。这或许比任何一次算法创新，都更考验耐心。

关键词： AGI， Bob McGrew， OpenAI，大语言模型，后训练

事实核查备注：人物：Bob McGrew（前OpenAI首席研究官）、Sam Altman（对话中被提及）；公司：OpenAI；技术名词：大语言模型（LLMs）、视觉编码器（vision encoders）、post-training、reasoning、proprietary data；观点：AGI所需关键突破已基本完成、进展瓶颈转向后训练与系统整合。

返回文章列表