Chris Manning 联手创业,却说“大模型走偏了”:Moonlake 想重做世界模型
正在加载视频...
视频章节
当全行业还在迷信更大的模型、更贵的算力时,NLP 教父 Chris Manning 却在这期播客里反复强调一件事:真正卡住 AI 的不是规模,而是“有没有结构化的世界模型”。Moonlake 的出现,正是对 Scaling Laws 的一次正面挑战。
Chris Manning 联手创业,却说“大模型走偏了”:Moonlake 想重做世界模型
当全行业还在迷信更大的模型、更贵的算力时,NLP 教父 Chris Manning 却在这期播客里反复强调一件事:真正卡住 AI 的不是规模,而是“有没有结构化的世界模型”。Moonlake 的出现,正是对 Scaling Laws 的一次正面挑战。
一个反共识的判断:AI 不是缺算力,而是缺“世界”
节目一开场,Chris Manning 就抛出了一个让很多从业者不舒服的事实:我们已经很难再为 AI 找到“像样的 benchmark 了”。
早年做问答、分类任务时,一道题对就是对、错就是错。但今天,无论是“给我推荐一个适合欧洲旅行的背包”,还是“判断一个虚拟世界里接下来会发生什么”,都不存在标准答案。这不是评测工具落后,而是任务本身已经进入“世界级复杂度”。
Manning 的潜台词很明确:当任务变成开放世界问题,单纯堆参数、堆数据的路线开始失效。世界模型(World Models)之所以难,不是工程问题,而是认知问题——我们还没搞清楚,模型到底要“理解”什么样的世界。
Moonlake 的野心:不是生成像素,而是建模因果
Fan‑Yun Sun 回顾 Moonlake 的起点时,提到她博士期间与 NVIDIA Research 合作生成“可交互世界”的经历。那段经历让她意识到一个关键断层:
今天大量所谓 world model,本质仍停留在“预测下一个像素”,而不是“理解这个世界为什么会这样演化”。
Moonlake 的选择是更激进、也更困难的路线:放弃纯像素级拟合,转向结构化、可推理的世界表示。用他们的话说,目标是让模型像人一样思考——不是看见画面就反射性补全,而是内部有一个语义化、可操作的世界模型。
这也是他们反复强调的一点:‘Nobody’s doing it the way it should be done.’ 不是没人做 world model,而是大多数人做得太“表层”。
世界模型 vs 大语言模型:差的不是能力,是思维层级
在节目中,一个反复被提及的对比是:普通大语言模型的“推理”,与真正世界模型的“空间与因果推理”。
LLM 很擅长在语言表面做模式匹配,看起来会“想问题”,但一旦涉及空间关系、物理约束或多步因果,就开始露馅。而 Moonlake 想做的,是让模型内部存在一种语义世界:物体、关系、规则、演化过程都不是隐含在参数里,而是显式可操作的。
Manning 在这里点出一个细节:如果模型只能在像素或 token 层面工作,它永远无法真正理解‘世界’,只能记住世界长什么样。这句话几乎是在给当前主流多模态路线泼冷水。
对“苦涩教训”的正面反驳:结构不是人类执念
聊到后半段,讨论不可避免地转向 Yann LeCun 以及“Bitter Lesson”。那套观点强调:人类设计的结构最终都会被大规模学习取代。
Moonlake 的立场很微妙,也很有火药味。他们并不是否认规模的重要性,而是认为:当你面对的是开放世界推理,仅靠 scale 是不够的。结构不是为了让人类安心,而是为了让模型能做更高层次的泛化。
Manning 明确表示,把世界拆解成可组合、可推理的结构,并不等同于回到专家系统时代。恰恰相反,这是为了让学习真正发生在“语义层”,而不是参数噪声里。
从游戏到现实:为什么他们不急着谈商业化
当主持人问到实际应用时,Moonlake 的回答异常克制。他们承认,目前最现实的落地场景仍在游戏和模拟环境,因为那里的世界规则是封闭且可控的。
但更重要的一句话是:‘It always comes back to what are you building.’ 在他们看来,如果底层世界模型不成立,再漂亮的产品都是空中楼阁。
这也解释了为什么 Moonlake 直到现在仍把精力放在研究问题本身,而不是急着包装成“AI Agent 平台”。他们更关心的是:模型是否真的理解了一个世界,而不是是否能在 demo 里跑通几个任务。
总结
这期对话真正值得反复回味的,并不是某个具体技术方案,而是一种正在回潮的思路:在算力狂飙的时代,重新认真对待“结构”和“世界”。
如果你是 AI 从业者,这意味着两件事:第一,不要被短期 benchmark 和 demo 牵着走,世界级任务本就无法被简单评测;第二,世界模型很可能是下一个真正拉开差距的方向,但它需要长期主义和对认知问题的耐心。
一个值得带走的问题是:当 scale 的红利见顶,谁能最早构建出可推理、可组合的世界模型,谁也许就握住了下一代 AI 的钥匙。
关键词: 世界模型, AI推理, 大语言模型, Chris Manning, Moonlake
事实核查备注: 需要核查:1)Moonlake 的创始人构成与角色分工;2)Fan‑Yun Sun 与 NVIDIA Research 合作的具体背景;3)节目中关于 Yann LeCun 与 Bitter Lesson 的引用语境;4)Moonlake 是否已有对外 beta 产品或仍处研究阶段。