Gary Marcus：为什么纯深度学习走不到通用人工智能

AI PM 编辑部 · 2019年10月03日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 Lex Fridman 的播客中，Gary Marcus 系统阐述了他对通用人工智能的核心判断：单靠深度学习远远不够。通过常识推理、语言理解、儿童学习和象棋等具体案例，他提出了一条更现实的路径——将深度学习与符号推理相结合，构建真正可靠的智能系统。

Gary Marcus：为什么纯深度学习走不到通用人工智能

在这期 Lex Fridman 的播客中，Gary Marcus 系统阐述了他对通用人工智能的核心判断：单靠深度学习远远不够。通过常识推理、语言理解、儿童学习和象棋等具体案例，他提出了一条更现实的路径——将深度学习与符号推理相结合，构建真正可靠的智能系统。

为什么“奇点”不是某一天突然到来

讨论通用人工智能（AGI）时，人们常常沉迷于“技术奇点是否会在某一天突然降临”。Gary Marcus 一开始就泼了冷水。他直言，自己并不认为奇点会是一个清晰的时间点，而更像是一个长期、渐进的过程。这一点很重要，因为它决定了我们该如何评估当前 AI 的进展。

Marcus 提出一个关键判断：智能不是单一维度的指标，而是“多维变量”。机器也许在某些维度上已经超过人类，比如计算速度或特定任务的模式识别，但在语言理解、抽象推理和常识判断等方面，仍然存在明显短板。他强调：“我们还有大量工作要做，才能让机器真正理解自然语言。”

这种多维视角，直接反对了把 AlphaGo 或图像识别的成功等同为“接近人类智能”的叙事。在 Marcus 看来，这些成就是真实而重要的，但它们并不自动通向通用智能。误判这一点，会让整个行业对风险、能力和时间表产生系统性误解。

常识缺失：AI最被低估、也最棘手的难题

如果说当今 AI 最大的短板是什么，Marcus 的答案非常明确：常识。他反复强调，机器并不真正理解世界运作的基本规则。比如，人类可以轻易判断哪个容器会漏水、哪个物体会掉落，而 Marcus 直言：“我从没见过有人构建出一个系统，能够稳健地看视频并准确预测哪些容器会漏。”

问题并不只是数据不够，而是经验结构不同。人类通过身体与世界互动，获得大量隐性知识；而机器人在现实世界中的实践机会是有限的，很多体验“要么受限，要么根本不可获得”。这使得常识学习变得异常困难。

播客中还有一个耐人寻味的讨论：常识知识和心理知识（理解他人意图、信念）哪个更难？Marcus 的态度并不武断，他认为两者都充满谜团，甚至很难判断哪一个更容易。这种不确定性本身，正是他对当前 AI 研究保持谨慎的重要原因。

深度学习的边界，与符号推理的回归

Marcus 并非反对深度学习，相反，他承认 AI 已经“真正取得了很多成就”。但他始终坚持一个核心观点：仅靠深度学习不足以支撑通用人工智能。他在节目中多次提到，AI 实际上是一个“工具杂烩”，不同技术各有独特的优势和局限。

他与 Yann LeCun 的分歧正集中于此。LeCun 认为人类智能本身并不那么“通用”，并强调通过感知和表征学习逐步逼近智能；而 Marcus 则认为这是“在错误的层级上进行推理”。在他看来，AI 必须重新拥抱符号操作（symbol manipulation）——也就是对规则、变量和关系进行显式推理的能力。

Marcus 的主张并非倒退，而是融合。他明确表示，AI 需要在深度学习之外，结合符号推理的优势。这条“混合路径”或许不如端到端学习那样优雅，但更接近人类解决复杂问题的真实方式。

从孩子身上学到的智能真相

在整场对话中，最生动的故事来自 Marcus 的个人经历——养育孩子。他半开玩笑地说，自己“在妻子的巨大帮助下，构建了两个每个功耗只有 20 瓦的智能体”。这句话不仅幽默，也直指问题核心。

孩子并不是从海量数据中训练出来的。他们带着一些先天结构，同时又能迅速吸收新知识。Marcus 从中得到的启发是：如果 AI 一开始就拥有“更丰富的内置知识库”，学习速度可能会快得多。

这也影响了他对智能测试的看法。他并不否认现有基准的价值，但认为它们往往测到的是局部能力，而非整体理解。正因为如此，他对那些看起来“像人一样说话”的系统保持警惕。他直言，像 Sophia 这样的机器人，“有很好的脚本，但并不理解自己在说什么”。

总结

Gary Marcus 在这期播客中传递的并不是悲观，而是一种冷静的现实主义。他承认深度学习的巨大成功，同时清楚指出其结构性局限。对读者而言，最大的启发或许在于：通向通用人工智能的道路，不会是单一技术的胜利，而是多种范式的艰难融合。理解这一点，才能在喧嚣的 AI 叙事中保持清醒。

关键词： Gary Marcus，通用人工智能，深度学习，符号推理，常识推理

事实核查备注： Gary Marcus：NYU 荣休教授，Robust AI 联合创始人；播客主持人：Lex Fridman；涉及人物：Yann LeCun；关键概念：通用人工智能（AGI）、深度学习、符号操作（symbol manipulation）、常识推理；原话引用包括“intelligence is a multidimensional variable”“I’ve never seen anybody build a system…”“AI is actually a grab bag of different techniques”“Sophia has very good material written for her but she doesn't understand the things that she's saying”“two intelligences that are 20 watts each”。

返回文章列表