从DeepSeek震荡到AI Agent未来：David Luan的冷静判断

AI PM 编辑部 · 2025年02月19日 · 8 阅读 · AI/人工智能

Yann LeCun AI Agent 通用人工智能 DeepSeek Amazon

正在加载视频...

视频章节

这是一场少见的、没有过度渲染的AI对话。前OpenAI研究负责人、现Amazon科学家David Luan，复盘了DeepSeek引发的市场情绪波动，解释了为什么“基础模型正在被迅速商品化”，以及他如何看待AI Agent、测试时计算和通用智能的真实进展。

从DeepSeek震荡到AI Agent未来：David Luan的冷静判断

这是一场少见的、没有过度渲染的AI对话。前OpenAI研究负责人、现Amazon科学家David Luan，复盘了DeepSeek引发的市场情绪波动，解释了为什么“基础模型正在被迅速商品化”，以及他如何看待AI Agent、测试时计算和通用智能的真实进展。

DeepSeek冲击之后：市场情绪与技术现实的错位

这一年AI行业最戏剧性的瞬间之一，来自DeepSeek的突然爆火。David Luan回忆说，“there was this huge reaction to DeepSeek”，它在极短时间内引发了行业和资本市场的强烈反应。但在他看来，这更像一次集体情绪的放大，而不是技术范式的突然颠覆。

他指出，当市场逐渐理解DeepSeek的真实技术位置后，“once I think the market woke up to that now we're back to sanity”。这句话背后是一个重要判断：基础模型能力的提升已经进入高度可复制阶段。一旦某一代能力被证明可行，它很快就会变得便宜，甚至被商品化。

这也是他反复强调的趋势——“every previous ring of intelligence becomes almost so cheap as to be commoditized”。这意味着，真正的竞争优势不再来自‘有没有模型’，而来自你如何使用、组合、约束和评估这些模型。这一判断，直接为后面关于Agent和测试时计算的讨论埋下伏笔。

测试时计算浪潮：为什么模型开始“多想一会儿”

如果说训练规模扩展定义了上一阶段的大模型竞争，那么David Luan认为，当前最重要的变化来自“test time compute”。他形容这是“一波巨大的浪潮”，即模型在推理阶段投入更多计算资源，通过反复尝试来提高结果质量。

在一些任务中，这种方法已经被证明非常有效，尤其是把不同推理范式结合起来的模型。“seeing how successful these models that combine both these paradigms are”，让他对这一方向变得更乐观。但他也强调，这并不是银弹。

问题出现在那些“不可验证”的领域。对于没有明确对错标准的任务，工程师只能“force it to try over and over again to satisfy its own sense”。这不是哲学问题，而是实打实的工程挑战：如何定义停止条件？如何避免无意义的循环？这也是他反复提到的现实——在AGI宏大叙事背后，“there actually a lot of really tough engineering problems”。

从人类未做之事，到模型如何协作

在谈到研究方向时，David Luan罕见地把话题引向了‘非人类中心’的智能。他提到像Yann LeCun这样的研究者，长期关注的是“stuff that humans have never done before”，而不是简单复刻人类能力。

这种视角，也体现在他对模型交互方式的判断上。当被问及未来模型如何协作时，他明确反对把它们看成彼此独立的模块，而是认为它们会“rather than perpendicular”，形成更紧密、互补的关系。

这背后隐含的，是对系统级智能的重视：单个模型的能力提升正在放缓，但多个模型之间的协作、调用、验证，反而可能释放新的能力空间。这也是为什么，评估变得异常困难——“evaluations are so hard， measurement is so hard”，现有基准已经难以覆盖真实使用场景。

AI Agent的现实边界：为什么‘放火就走’还不可信

几乎所有AI创业者都在谈Agent，但David Luan的态度明显更谨慎。他认为，真正的转折点在于：我们什么时候敢“trust it in a fire and forget way”。而答案是——还没到。

他并不否认Agent方向的重要性，但强调可靠性远比能力更关键。即便未来出现AGI，他也提醒大家不要忽视人类关系的价值——“even a world with AGI human relationships really matter”。

这种克制的态度，也延续到他在Amazon的工作取向上。他提到，无论是研究深度还是工程落地，“both of those will remain really important”。Agent不是魔法，而是一个需要长期打磨、反复验证的系统工程。

总结

这次对话的价值，不在于给出一个确定的未来蓝图，而在于提供了一种冷静的判断框架：当基础模型迅速商品化，真正的挑战转向工程、评估和系统设计。DeepSeek、测试时计算、AI Agent，都不是孤立事件，而是同一趋势的不同侧面。对从业者来说，重要的不是追逐概念，而是理解哪些问题真的还没被解决。

关键词： DeepSeek，测试时计算， AI Agent，通用人工智能， David Luan

事实核查备注：人物：David Luan、Yann LeCun；产品：DeepSeek；公司：Amazon；核心概念：test time compute（测试时计算）、AI Agent、AGI（通用人工智能）；引用均来自公开视频片段的原意表达

返回文章列表