前OpenAI研究负责人Bob McGrew:通往AGI的关键突破,其实已经完成

AI PM 编辑部 · 2025年06月17日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期对话中,前OpenAI首席研究官Bob McGrew给出了一个耐人寻味的判断:实现AGI所需的关键技术突破,可能已经基本完成。真正的挑战,不在于再发明“新东西”,而在于如何把现有能力组合、打磨并落地。

前OpenAI研究负责人Bob McGrew:通往AGI的关键突破,其实已经完成

在这期对话中,前OpenAI首席研究官Bob McGrew给出了一个耐人寻味的判断:实现AGI所需的关键技术突破,可能已经基本完成。真正的挑战,不在于再发明“新东西”,而在于如何把现有能力组合、打磨并落地。

为什么他说:AGI并没有“撞墙”,只是换了赛道

这一判断之所以重要,是因为它直接反驳了近一年AI圈最常见的悲观情绪——“大模型快到头了”。McGrew明确表示,他不认为行业遇到了一堵无法跨越的墙。“It’s not a wall… it’s still important. It’s just doing something different in the pipeline.”他的意思是,瓶颈确实存在,但它已经从“能不能训练更大的模型”,转移到了“如何在训练之后继续榨取价值”。

在他看来,推理能力(reasoning)的成熟正在改变进展的节奏。早期模型的能力“overhang”(能力尚未被完全利用的积累)正在被逐步消耗,一旦这部分红利被吃完,进步自然会显得更慢。但这并不意味着停滞,而是进入了一个更工程化、更精细的阶段。

这个判断背后,其实隐含着他在OpenAI时期形成的方法论:研究突破往往是跳跃式的,而产品和能力的释放,则更多依赖长期、系统性的整合工作。当外界还在等待“下一个Transformer时刻”时,他已经把注意力放在了如何让现有模型真正“会做事”。

语言接口+视觉:机器人和现实世界正在被“解锁”

如果要找一个他认为已经发生、但外界低估的变化,那就是大语言模型与现实世界的连接方式。McGrew提到:“Now that you have LLMs, you have this language interface to the robot.”这句话看似简单,却点出了过去十年AI研究积累的真正价值。

在他的描述中,语言模型相当于给机器提供了一种极低成本的任务描述接口。过去,机器人系统往往需要高度定制的指令和规则;现在,人类可以直接用自然语言描述目标。同时,强大的视觉编码器(vision encoders)让机器第一次具备了稳定理解物理世界的能力。

关键不在于某一个单点技术,而在于“the entire tech and research stack that we've built over the last 10 years”。语言、视觉、控制、训练方法,这些模块终于可以无缝拼接。这也是他反复强调“突破已经完成”的原因:基础能力齐了,剩下的是工程、集成和规模化落地的问题。

真正困难的部分:Post-training与“理解人性”

当话题转向post-training(训练之后的能力塑造),McGrew的语气明显变得谨慎。他坦言,这是当前最被低估、也最难的一环。“Can you help us unpack what's left in post-training?”这个问题背后,隐藏的是对人类偏好、价值和行为模式的深度建模。

他甚至半开玩笑地说了一句:“I’m going to say something potentially controversial… I kind of hope I’m wrong.”争议点在于,后训练阶段不再只是算法问题,而越来越依赖对“human nature”的理解。这意味着,未来的AI进步,可能需要更多跨学科的人才,而不仅是纯工程或纯研究背景。

这也解释了他为什么认为进展会变慢:不是因为算力不够,而是因为目标变得更模糊。让模型“更聪明”相对容易,让模型“更像一个可靠的合作者”,才是真正的难题。

数据、代码与安全:他眼中未来几年的主战场

在更偏应用的层面,McGrew点名了几个未来几年会持续拉开差距的方向。首先是数据,尤其是“proprietary data”。他直言不讳地表示,专有数据在后续阶段“really useful”,这也是为什么领先公司越来越重视内部数据飞轮。

其次是编码能力。他在谈到coding时强调,这会是模型真正改变生产力的核心场景之一,而且影响会在“over the next couple years”逐步显现。代码既是语言,又是可执行行动,非常符合他对“something that an AI model can actually execute”的定义。

最后是安全与日常使用。他提到自己在日常生活中已经大量使用AI,并关注这些能力如何“having it all add up to one big whole”。在他看来,安全不只是防止模型出错,而是确保这些能力被可靠地整合进真实世界。

总结

综合来看,Bob McGrew传递的核心信息并不乐观或悲观,而是冷静而现实:AGI不太可能通过某个全新发明突然降临,更可能来自对现有能力的长期打磨与组合。对从业者而言,机会正在从“追逐突破”转向“理解系统、理解人、理解落地”。这或许比任何一次算法创新,都更考验耐心。


关键词: AGI, Bob McGrew, OpenAI, 大语言模型, 后训练

事实核查备注: 人物:Bob McGrew(前OpenAI首席研究官)、Sam Altman(对话中被提及);公司:OpenAI;技术名词:大语言模型(LLMs)、视觉编码器(vision encoders)、post-training、reasoning、proprietary data;观点:AGI所需关键突破已基本完成、进展瓶颈转向后训练与系统整合。