Yann LeCun：AI不需要“身体”，但必须真正理解世界

AI PM 编辑部 · 2019年09月03日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

在与Lex Fridman的对话中，Yann LeCun直面公众最熟悉的“类人机器人”迷思，解释为什么AI的未来不在于像人，而在于是否具备对现实世界的真正理解。他区分了“具身”和“世界锚定”，并用常识推理与情绪机制，勾勒出一条与主流想象截然不同的AI路径。

Yann LeCun：AI不需要“身体”，但必须真正理解世界

在与Lex Fridman的对话中，Yann LeCun直面公众最熟悉的“类人机器人”迷思，解释为什么AI的未来不在于像人，而在于是否具备对现实世界的真正理解。他区分了“具身”和“世界锚定”，并用常识推理与情绪机制，勾勒出一条与主流想象截然不同的AI路径。

当机器人被过度“拟人化”，问题不只是审美

为什么Yann LeCun会公开批评机器人Sophia？这并不是一次针对艺术表达的攻击，而是一次对AI公众叙事的严肃警告。在对话中他明确表示：“如果Sophia只是一个艺术作品，我完全没有问题。”真正让他不安的，是这个项目被包装成“接近通用智能”的假象。

LeCun指出，人类天生会对“长得像人、会说话”的东西产生智能错觉，而Sophia的展示正是系统性地利用了这种心理倾向。他直言，大众“普遍觉得Sophia能做的事情，远远超过她实际能做的”，而项目方并没有认真澄清这种误解。

更有意思的是，Lex Fridman反问：这是否和某些AI公司、研究者利用公众误解进行营销是同一回事？LeCun的回答并不回避现实。他承认确实存在“被炒得过热的初创公司”，并且这种夸大宣传“极其有害”。不同之处在于，学术论文和严肃研究通常会被严格审稿，不允许无依据的能力宣称。

这一段对话的价值在于，它揭示了一个常被忽略的问题：AI发展的风险，并不只来自技术本身，也来自我们如何讲述技术故事。

AI真的需要身体吗？LeCun的答案出人意料

“AI是否需要身体”，是智能研究中的经典问题，而LeCun给出的答案相当克制：他认为“具身（embodiment）不是必要的，但世界锚定（grounding）是必要的”。

所谓具身，指的是像人或动物一样拥有实体身体；而世界锚定，则是指智能系统必须以某种方式连接现实世界的运行规律。LeCun强调，仅靠语言本身，带宽太低，无法完整传递世界如何运作。

他举了一个经典的常识推理例子——Winograd Schema：“奖杯放不进箱子，因为它太大”和“奖杯放不进箱子，因为它太小”。人类能轻松理解“it”分别指奖杯和箱子，是因为我们知道大小关系、空间结构，以及‘大物体无法进入小容器’这样的物理常识。

LeCun的结论非常明确：“我不相信你可以只通过被告知（语言）来学会世界的一切。”这并不是否定语言模型的价值，而是指出：没有感知世界的经验，所谓‘理解’始终是不完整的。

从文字到视频：常识可能来自多模态，而非机器人

在谈到“世界锚定”如何实现时，LeCun给出了一个比“造机器人”更现实的路径：多模态学习。也就是说，AI不只是读文本，还要看视频、观察环境，甚至在虚拟世界中进行交互。

他明确表示，很多关于世界的知识“永远不会出现在文本中，也无法仅靠推理补全”。例如物体如何变形、摩擦力如何影响运动、空间关系如何随视角变化，这些都更适合通过视觉或触觉获得。

值得注意的是，LeCun并没有坚持“必须让AI在真实世界中行动”。他认为，虚拟环境、视频数据，甚至模拟交互，可能已经足够提供高带宽的世界信息。换句话说，AI最终的形态“并不一定需要是一个有身体的机器人”。

这段观点，在今天多模态模型迅速发展的背景下显得极具前瞻性，也解释了为什么他长期强调视觉、自监督学习和世界模型的重要性。

没有情绪，就没有真正的智能？

对话的最后，话题转向一个更少被工程师认真对待的问题：情绪。LeCun的态度依旧直接：“我们不可能在没有情绪的情况下，拥有大量智能。”

他用神经科学中的概念解释情绪的功能：大脑中的某些机制（如基底神经节）会评估当前的满足程度，而另一套机制会预测未来是否可能变糟。这种对不确定风险的预测，正是恐惧的来源。

关键不在于情绪的主观体验，而在于它们作为“驱动系统”的作用。恐惧、期待、挫败感，本质上都是帮助智能体在复杂环境中做决策的信号。

LeCun并没有给出如何在AI中实现情绪的工程方案，但他清楚地指出了方向：如果一个系统完全没有内在驱动力，它很难表现出真正的灵活性和长期目标导向。

总结

这段访谈最有价值的地方，不在于对某个具体模型的预测，而在于LeCun对“什么才算理解”的坚持。他反对用拟人化外壳制造智能幻觉，也反对把语言能力等同于世界认知。对今天的AI从业者和观察者来说，这是一种重要提醒：真正的突破，可能来自更朴素却更艰难的方向——让机器以高带宽方式接触世界，并发展出内在的驱动与常识结构。

关键词： Yann LeCun，具身智能，世界锚定，多模态学习，常识推理

事实核查备注：视频来源：Lex Fridman YouTube频道（2019-09-03）；讨论对象：机器人Sophia；关键概念：embodiment（具身）、grounding（世界锚定）、Winograd Schema（常识推理测试）；引用观点均来自Yann LeCun在视频中的原意表达。

返回文章列表