从DeepSeek震荡到AI Agent未来:David Luan的冷静判断
正在加载视频...
视频章节
这是一场少见的、没有过度渲染的AI对话。前OpenAI研究负责人、现Amazon科学家David Luan,复盘了DeepSeek引发的市场情绪波动,解释了为什么“基础模型正在被迅速商品化”,以及他如何看待AI Agent、测试时计算和通用智能的真实进展。
从DeepSeek震荡到AI Agent未来:David Luan的冷静判断
这是一场少见的、没有过度渲染的AI对话。前OpenAI研究负责人、现Amazon科学家David Luan,复盘了DeepSeek引发的市场情绪波动,解释了为什么“基础模型正在被迅速商品化”,以及他如何看待AI Agent、测试时计算和通用智能的真实进展。
DeepSeek冲击之后:市场情绪与技术现实的错位
这一年AI行业最戏剧性的瞬间之一,来自DeepSeek的突然爆火。David Luan回忆说,“there was this huge reaction to DeepSeek”,它在极短时间内引发了行业和资本市场的强烈反应。但在他看来,这更像一次集体情绪的放大,而不是技术范式的突然颠覆。
他指出,当市场逐渐理解DeepSeek的真实技术位置后,“once I think the market woke up to that now we're back to sanity”。这句话背后是一个重要判断:基础模型能力的提升已经进入高度可复制阶段。一旦某一代能力被证明可行,它很快就会变得便宜,甚至被商品化。
这也是他反复强调的趋势——“every previous ring of intelligence becomes almost so cheap as to be commoditized”。这意味着,真正的竞争优势不再来自‘有没有模型’,而来自你如何使用、组合、约束和评估这些模型。这一判断,直接为后面关于Agent和测试时计算的讨论埋下伏笔。
测试时计算浪潮:为什么模型开始“多想一会儿”
如果说训练规模扩展定义了上一阶段的大模型竞争,那么David Luan认为,当前最重要的变化来自“test time compute”。他形容这是“一波巨大的浪潮”,即模型在推理阶段投入更多计算资源,通过反复尝试来提高结果质量。
在一些任务中,这种方法已经被证明非常有效,尤其是把不同推理范式结合起来的模型。“seeing how successful these models that combine both these paradigms are”,让他对这一方向变得更乐观。但他也强调,这并不是银弹。
问题出现在那些“不可验证”的领域。对于没有明确对错标准的任务,工程师只能“force it to try over and over again to satisfy its own sense”。这不是哲学问题,而是实打实的工程挑战:如何定义停止条件?如何避免无意义的循环?这也是他反复提到的现实——在AGI宏大叙事背后,“there actually a lot of really tough engineering problems”。
从人类未做之事,到模型如何协作
在谈到研究方向时,David Luan罕见地把话题引向了‘非人类中心’的智能。他提到像Yann LeCun这样的研究者,长期关注的是“stuff that humans have never done before”,而不是简单复刻人类能力。
这种视角,也体现在他对模型交互方式的判断上。当被问及未来模型如何协作时,他明确反对把它们看成彼此独立的模块,而是认为它们会“rather than perpendicular”,形成更紧密、互补的关系。
这背后隐含的,是对系统级智能的重视:单个模型的能力提升正在放缓,但多个模型之间的协作、调用、验证,反而可能释放新的能力空间。这也是为什么,评估变得异常困难——“evaluations are so hard, measurement is so hard”,现有基准已经难以覆盖真实使用场景。
AI Agent的现实边界:为什么‘放火就走’还不可信
几乎所有AI创业者都在谈Agent,但David Luan的态度明显更谨慎。他认为,真正的转折点在于:我们什么时候敢“trust it in a fire and forget way”。而答案是——还没到。
他并不否认Agent方向的重要性,但强调可靠性远比能力更关键。即便未来出现AGI,他也提醒大家不要忽视人类关系的价值——“even a world with AGI human relationships really matter”。
这种克制的态度,也延续到他在Amazon的工作取向上。他提到,无论是研究深度还是工程落地,“both of those will remain really important”。Agent不是魔法,而是一个需要长期打磨、反复验证的系统工程。
总结
这次对话的价值,不在于给出一个确定的未来蓝图,而在于提供了一种冷静的判断框架:当基础模型迅速商品化,真正的挑战转向工程、评估和系统设计。DeepSeek、测试时计算、AI Agent,都不是孤立事件,而是同一趋势的不同侧面。对从业者来说,重要的不是追逐概念,而是理解哪些问题真的还没被解决。
关键词: DeepSeek, 测试时计算, AI Agent, 通用人工智能, David Luan
事实核查备注: 人物:David Luan、Yann LeCun;产品:DeepSeek;公司:Amazon;核心概念:test time compute(测试时计算)、AI Agent、AGI(通用人工智能);引用均来自公开视频片段的原意表达