前OpenAI研究副总裁离职后，直言AGI没那么近，Scaling也快到头了

AI PM 编辑部 · 2026年01月29日 · 12 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你以为AGI只差算力和数据，那这期播客会让你清醒。前OpenAI研究副总裁Jerry Twerk首次系统谈及离职原因、他眼中真实的AGI时间表，以及一个让很多从业者不安的判断：强化学习和Scaling Laws，正在逼近天花板。

前OpenAI研究副总裁离职后，直言AGI没那么近，Scaling也快到头了

如果你以为AGI只差算力和数据，那这期播客会让你清醒。前OpenAI研究副总裁Jerry Twerk首次系统谈及离职原因、他眼中真实的AGI时间表，以及一个让很多从业者不安的判断：强化学习和Scaling Laws，正在逼近天花板。

离开OpenAI的人，往往说得最真

Jerry Twerk并不是“边缘人物”。作为前OpenAI研究副总裁，他亲历了推理模型、强化学习等一系列关键突破。但正因为站在系统内部，他反而比外界更早看到一些不那么乐观的信号。在播客一开始，他并没有渲染个人情绪，而是反复强调一件事：离开不是因为失败，而是因为“研究方向的重心，正在发生结构性变化”。

在OpenAI，过去几年最成功的经验是什么？答案几乎所有人都知道：更大的模型、更多的数据、更长的训练时间。Scaling Laws曾经像物理定律一样可靠。但Jerry坦言，正是这些“成功经验”，开始变成新的约束——组织、资源和目标，会不自觉地把研究者推向“继续放大已有路径”，而不是去探索那些短期内看不到回报的方向。

推理模型很重要，但它们不是通往AGI的终点

作为参与推理模型早期工作的研究者，Jerry对“AI推理”并不唱反调。但他给出的判断非常克制：推理能力的提升，更像是补齐短板，而不是打开新大陆。

在他看来，当前的推理模型在结构上仍然高度依赖已有表示和训练分布。它们可以在已知框架内做更复杂的组合，却很难真正产生“新的问题表述”。这也是为什么很多系统在benchmark上看起来很聪明，但一旦脱离熟悉任务，就显得脆弱。

他特别提到一个容易被忽略的事实：人类在推理时，会不断重塑目标本身，而不仅仅是寻找最优解。现有模型在这一步上，几乎没有真正意义上的进展。

关于AGI，他给了一个“不讨喜”的定义

当被问到AGI时间表时，Jerry没有给出年份，也没有给出“10年还是20年”的答案。他反而先质疑了问题本身：AGI的定义，对每个研究者来说都不同。

在他的定义中，AGI不是“能通过大多数考试”，也不是“在多数任务上超过人类”。真正关键的是：系统是否能自主发现问题、构建长期目标，并在极少人类干预的情况下持续学习。

基于这个标准，他的判断相当冷静：我们距离AGI还有明显缺口，而且这些缺口并不能靠简单Scaling来填平。换句话说，就算算力再翻十倍，也未必能自然涌现出这些能力。

强化学习的天花板，比很多人想象得更低

Jerry在强化学习（RL）领域的成就，让他的批评显得尤其刺耳。他直言，RL过去的成功，很大程度上来自“环境设计得足够好”。一旦环境变得开放、奖励变得稀疏，进展就会迅速放缓。

他指出一个行业内部常见但不愿明说的问题：很多RL成果，其实是工程和算力的胜利，而不是算法层面的突破。当这些红利被消耗殆尽，剩下的就是如何处理长期信用分配、不完备反馈和非平稳目标——而这些问题，几十年来都没有本质解法。

这也是他认为“继续加大RL投入未必是性价比最高选择”的原因。

真正的突破，可能不在头部实验室

一个颇具争议的观点出现在访谈中段：如果下一个范式级突破不发生在OpenAI、DeepMind这样的顶级实验室，真的重要吗？

Jerry的回答很直接：不重要。历史已经多次证明，颠覆性想法往往诞生在资源相对受限、但目标更大胆的团队中。大型实验室擅长把已有路线做到极致，但这本身就意味着路径依赖。

他甚至暗示，未来几年我们可能会看到“非主流研究方向”突然变得关键，而那些现在看起来不够‘性感’的工作，反而可能决定长期走向。

给年轻研究者的潜台词：别被共识绑架

在谈到人才生态时，Jerry没有给出具体职业建议，但话里话外的信号很清晰：当前AI领域的共识，未必是未来的真理。

他鼓励研究者去做“现在大多数人不相信、但你认为重要的事”。这听起来像鸡汤，但结合他对Scaling、RL和AGI的判断，其实是一种非常现实的风险对冲策略。当整个行业都在同一条路上狂奔时，分叉点反而更有价值。

总结

这期访谈最有价值的，不是预测AGI何时到来，而是提醒我们：哪些看似稳固的假设，正在悄然松动。对从业者来说，这意味着两件事：第一，不要把职业判断完全押注在Scaling还能持续多久；第二，尽早培养跨范式思考能力，哪怕短期内不“性感”。如果Jerry是对的，那么下一个时代的门票，可能并不在最大模型里，而在那些现在还显得有点“不合时宜”的问题中。

关键词： OpenAI，通用人工智能，强化学习， AI推理， Scaling Laws

事实核查备注：需要核查：1）Jerry Twerk的具体职位是否为OpenAI研究副总裁；2）视频发布时间2026-01-29；3）其关于AGI定义与Scaling限制的表述是否为原意转述而非直接引用；4）播客频道Unsupervised Learning： Redpoint's AI Podcast的准确名称

返回文章列表