前OpenAI研究副总裁离职后,直言AGI没那么近,Scaling也快到头了
正在加载视频...
视频章节
如果你以为AGI只差算力和数据,那这期播客会让你清醒。前OpenAI研究副总裁Jerry Twerk首次系统谈及离职原因、他眼中真实的AGI时间表,以及一个让很多从业者不安的判断:强化学习和Scaling Laws,正在逼近天花板。
前OpenAI研究副总裁离职后,直言AGI没那么近,Scaling也快到头了
如果你以为AGI只差算力和数据,那这期播客会让你清醒。前OpenAI研究副总裁Jerry Twerk首次系统谈及离职原因、他眼中真实的AGI时间表,以及一个让很多从业者不安的判断:强化学习和Scaling Laws,正在逼近天花板。
离开OpenAI的人,往往说得最真
Jerry Twerk并不是“边缘人物”。作为前OpenAI研究副总裁,他亲历了推理模型、强化学习等一系列关键突破。但正因为站在系统内部,他反而比外界更早看到一些不那么乐观的信号。在播客一开始,他并没有渲染个人情绪,而是反复强调一件事:离开不是因为失败,而是因为“研究方向的重心,正在发生结构性变化”。
在OpenAI,过去几年最成功的经验是什么?答案几乎所有人都知道:更大的模型、更多的数据、更长的训练时间。Scaling Laws曾经像物理定律一样可靠。但Jerry坦言,正是这些“成功经验”,开始变成新的约束——组织、资源和目标,会不自觉地把研究者推向“继续放大已有路径”,而不是去探索那些短期内看不到回报的方向。
推理模型很重要,但它们不是通往AGI的终点
作为参与推理模型早期工作的研究者,Jerry对“AI推理”并不唱反调。但他给出的判断非常克制:推理能力的提升,更像是补齐短板,而不是打开新大陆。
在他看来,当前的推理模型在结构上仍然高度依赖已有表示和训练分布。它们可以在已知框架内做更复杂的组合,却很难真正产生“新的问题表述”。这也是为什么很多系统在benchmark上看起来很聪明,但一旦脱离熟悉任务,就显得脆弱。
他特别提到一个容易被忽略的事实:人类在推理时,会不断重塑目标本身,而不仅仅是寻找最优解。现有模型在这一步上,几乎没有真正意义上的进展。
关于AGI,他给了一个“不讨喜”的定义
当被问到AGI时间表时,Jerry没有给出年份,也没有给出“10年还是20年”的答案。他反而先质疑了问题本身:AGI的定义,对每个研究者来说都不同。
在他的定义中,AGI不是“能通过大多数考试”,也不是“在多数任务上超过人类”。真正关键的是:系统是否能自主发现问题、构建长期目标,并在极少人类干预的情况下持续学习。
基于这个标准,他的判断相当冷静:我们距离AGI还有明显缺口,而且这些缺口并不能靠简单Scaling来填平。换句话说,就算算力再翻十倍,也未必能自然涌现出这些能力。
强化学习的天花板,比很多人想象得更低
Jerry在强化学习(RL)领域的成就,让他的批评显得尤其刺耳。他直言,RL过去的成功,很大程度上来自“环境设计得足够好”。一旦环境变得开放、奖励变得稀疏,进展就会迅速放缓。
他指出一个行业内部常见但不愿明说的问题:很多RL成果,其实是工程和算力的胜利,而不是算法层面的突破。当这些红利被消耗殆尽,剩下的就是如何处理长期信用分配、不完备反馈和非平稳目标——而这些问题,几十年来都没有本质解法。
这也是他认为“继续加大RL投入未必是性价比最高选择”的原因。
真正的突破,可能不在头部实验室
一个颇具争议的观点出现在访谈中段:如果下一个范式级突破不发生在OpenAI、DeepMind这样的顶级实验室,真的重要吗?
Jerry的回答很直接:不重要。历史已经多次证明,颠覆性想法往往诞生在资源相对受限、但目标更大胆的团队中。大型实验室擅长把已有路线做到极致,但这本身就意味着路径依赖。
他甚至暗示,未来几年我们可能会看到“非主流研究方向”突然变得关键,而那些现在看起来不够‘性感’的工作,反而可能决定长期走向。
给年轻研究者的潜台词:别被共识绑架
在谈到人才生态时,Jerry没有给出具体职业建议,但话里话外的信号很清晰:当前AI领域的共识,未必是未来的真理。
他鼓励研究者去做“现在大多数人不相信、但你认为重要的事”。这听起来像鸡汤,但结合他对Scaling、RL和AGI的判断,其实是一种非常现实的风险对冲策略。当整个行业都在同一条路上狂奔时,分叉点反而更有价值。
总结
这期访谈最有价值的,不是预测AGI何时到来,而是提醒我们:哪些看似稳固的假设,正在悄然松动。对从业者来说,这意味着两件事:第一,不要把职业判断完全押注在Scaling还能持续多久;第二,尽早培养跨范式思考能力,哪怕短期内不“性感”。如果Jerry是对的,那么下一个时代的门票,可能并不在最大模型里,而在那些现在还显得有点“不合时宜”的问题中。
关键词: OpenAI, 通用人工智能, 强化学习, AI推理, Scaling Laws
事实核查备注: 需要核查:1)Jerry Twerk的具体职位是否为OpenAI研究副总裁;2)视频发布时间2026-01-29;3)其关于AGI定义与Scaling限制的表述是否为原意转述而非直接引用;4)播客频道Unsupervised Learning: Redpoint's AI Podcast的准确名称