LeCun直言:LLM已到天花板,下一代AI不是更大的模型

AI PM 编辑部 · 2026年05月15日 · 63 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还在等“更大参数的LLM=更聪明的AI”,这期对话可能会让你停下来重想一遍。Yann LeCun在访谈中毫不客气地指出:大语言模型正在撞墙,真正的突破来自“世界模型”。更激进的是,他判断这个转折点会在2027年前变得无法忽视。

LeCun直言:LLM已到天花板,下一代AI不是更大的模型

如果你还在等“更大参数的LLM=更聪明的AI”,这期对话可能会让你停下来重想一遍。Yann LeCun在访谈中毫不客气地指出:大语言模型正在撞墙,真正的突破来自“世界模型”。更激进的是,他判断这个转折点会在2027年前变得无法忽视。

“预测下一个词”这条路,正在走到尽头

LeCun在访谈中反复强调一个刺耳但清醒的判断:当下主流的大语言模型,本质上仍然是在做“统计补全”。它们擅长语言,却并不理解世界。

他用一个简单但残酷的现实问题点破幻觉——高质量文本数据已经接近枯竭。模型可以继续变大,但喂给它们的“营养”并不会等比例增长。这也是为什么他直言,今天的OpenAI、Anthropic,看起来更像“当年的Sun Microsystems”:技术领先、声量巨大,但所押注的范式未必是终局。

这不是唱衰LLM,而是给它们重新定位——它们是工具,是接口,但不是通往通用智能的最后一块拼图。

LeCun反复提到的“世界模型”,到底新在哪里?

“世界模型”正在成为AI圈的热词,但LeCun显然不想让它沦为又一个空洞buzzword。

他明确区分了一件事:预测像素、预测token,和理解世界结构,是三种完全不同的难度层级。早期很多自监督尝试,本质上是在做高维预测,但事实证明——单纯预测像素是一条性价比极低的路。

在LeCun的设想中,真正有价值的世界模型,必须具备三个能力:对因果关系的抽象、对物理与常识约束的内化、以及在未见过的情境中进行推演。这也是他不断强调“explicit world models”的原因——系统不是靠运气生成合理答案,而是“按构造就不可能违反世界规则”。

这一步,才是从语言智能走向机器理解的关键断层。

为什么他说:你不可能靠读书学会当医生

在谈到LLM的能力边界时,LeCun用了一个极具冲击力的类比:“你不可能只靠读书就成为医生。”

语言模型的问题并不在于“不会说”,而在于它们从未真正“做过”。没有感知、没有行动、没有与世界的闭环互动,模型就只能在符号层面打转。

这也是为什么他对机器人和具身智能格外兴奋。从感知到动作,从失败到修正,这种与真实世界反复博弈的过程,才是世界模型成长的土壤。访谈中他提到,相关技术一旦成熟,其在工业、物流、制造等领域的应用空间“mindboggling”,不是渐进式,而是结构性变化。

一个罕见的时间判断:2027年前,一切会变得很明显

LeCun向来谨慎,但这次他给出了一个异常明确的时间窗口。

他认为,围绕JEP(联合嵌入预测)和世界模型的路线,其优势将在2027年前“变得完全显而易见”。不是论文圈的共识,而是工程、产品和现实效果层面的压倒性差异。

更值得注意的是,他也坦承自己改变过看法,并主动推荐了一篇与LE世界模型相关的论文——这透露出一个信号:路线之争还没结束,但下注方向已经越来越清晰。对于从业者来说,这不是站队问题,而是是否提前理解范式切换的问题。

总结

这场对话最重要的价值,不在于唱衰LLM,而在于提醒我们:不要把阶段性成功误认为终局。LeCun给出的信号非常明确——未来的核心竞争力,不是更会“说话”的模型,而是能在真实或可模拟世界中形成稳定理解和行动能力的系统。

如果你是研究者,这意味着要更严肃地对待世界模型、具身智能和因果结构;如果你在做产品,这可能意味着下一波机会不在聊天框里;如果你只是关注趋势,那么记住这个判断:当大家还在卷参数时,真正的分水岭,可能已经在另一条赛道上悄悄成形。


关键词: Yann LeCun, 世界模型, 大语言模型, 具身智能, AI未来趋势

事实核查备注: 需要核查:1)LeCun关于OpenAI、Anthropic与Sun Microsystems的原话语境;2)JEP模型将在2027年前变得明显的具体表述;3)关于数据枯竭与explicit world models的原始说法;4)LE world model论文的准确名称与作者。