正在加载视频...
视频章节
在这期 Lex Fridman 的播客中,Gary Marcus 系统阐述了他对通用人工智能的核心判断:单靠深度学习远远不够。通过常识推理、语言理解、儿童学习和象棋等具体案例,他提出了一条更现实的路径——将深度学习与符号推理相结合,构建真正可靠的智能系统。
Gary Marcus:为什么纯深度学习走不到通用人工智能
在这期 Lex Fridman 的播客中,Gary Marcus 系统阐述了他对通用人工智能的核心判断:单靠深度学习远远不够。通过常识推理、语言理解、儿童学习和象棋等具体案例,他提出了一条更现实的路径——将深度学习与符号推理相结合,构建真正可靠的智能系统。
为什么“奇点”不是某一天突然到来
讨论通用人工智能(AGI)时,人们常常沉迷于“技术奇点是否会在某一天突然降临”。Gary Marcus 一开始就泼了冷水。他直言,自己并不认为奇点会是一个清晰的时间点,而更像是一个长期、渐进的过程。这一点很重要,因为它决定了我们该如何评估当前 AI 的进展。
Marcus 提出一个关键判断:智能不是单一维度的指标,而是“多维变量”。机器也许在某些维度上已经超过人类,比如计算速度或特定任务的模式识别,但在语言理解、抽象推理和常识判断等方面,仍然存在明显短板。他强调:“我们还有大量工作要做,才能让机器真正理解自然语言。”
这种多维视角,直接反对了把 AlphaGo 或图像识别的成功等同为“接近人类智能”的叙事。在 Marcus 看来,这些成就是真实而重要的,但它们并不自动通向通用智能。误判这一点,会让整个行业对风险、能力和时间表产生系统性误解。
常识缺失:AI最被低估、也最棘手的难题
如果说当今 AI 最大的短板是什么,Marcus 的答案非常明确:常识。他反复强调,机器并不真正理解世界运作的基本规则。比如,人类可以轻易判断哪个容器会漏水、哪个物体会掉落,而 Marcus 直言:“我从没见过有人构建出一个系统,能够稳健地看视频并准确预测哪些容器会漏。”
问题并不只是数据不够,而是经验结构不同。人类通过身体与世界互动,获得大量隐性知识;而机器人在现实世界中的实践机会是有限的,很多体验“要么受限,要么根本不可获得”。这使得常识学习变得异常困难。
播客中还有一个耐人寻味的讨论:常识知识和心理知识(理解他人意图、信念)哪个更难?Marcus 的态度并不武断,他认为两者都充满谜团,甚至很难判断哪一个更容易。这种不确定性本身,正是他对当前 AI 研究保持谨慎的重要原因。
深度学习的边界,与符号推理的回归
Marcus 并非反对深度学习,相反,他承认 AI 已经“真正取得了很多成就”。但他始终坚持一个核心观点:仅靠深度学习不足以支撑通用人工智能。他在节目中多次提到,AI 实际上是一个“工具杂烩”,不同技术各有独特的优势和局限。
他与 Yann LeCun 的分歧正集中于此。LeCun 认为人类智能本身并不那么“通用”,并强调通过感知和表征学习逐步逼近智能;而 Marcus 则认为这是“在错误的层级上进行推理”。在他看来,AI 必须重新拥抱符号操作(symbol manipulation)——也就是对规则、变量和关系进行显式推理的能力。
Marcus 的主张并非倒退,而是融合。他明确表示,AI 需要在深度学习之外,结合符号推理的优势。这条“混合路径”或许不如端到端学习那样优雅,但更接近人类解决复杂问题的真实方式。
从孩子身上学到的智能真相
在整场对话中,最生动的故事来自 Marcus 的个人经历——养育孩子。他半开玩笑地说,自己“在妻子的巨大帮助下,构建了两个每个功耗只有 20 瓦的智能体”。这句话不仅幽默,也直指问题核心。
孩子并不是从海量数据中训练出来的。他们带着一些先天结构,同时又能迅速吸收新知识。Marcus 从中得到的启发是:如果 AI 一开始就拥有“更丰富的内置知识库”,学习速度可能会快得多。
这也影响了他对智能测试的看法。他并不否认现有基准的价值,但认为它们往往测到的是局部能力,而非整体理解。正因为如此,他对那些看起来“像人一样说话”的系统保持警惕。他直言,像 Sophia 这样的机器人,“有很好的脚本,但并不理解自己在说什么”。
总结
Gary Marcus 在这期播客中传递的并不是悲观,而是一种冷静的现实主义。他承认深度学习的巨大成功,同时清楚指出其结构性局限。对读者而言,最大的启发或许在于:通向通用人工智能的道路,不会是单一技术的胜利,而是多种范式的艰难融合。理解这一点,才能在喧嚣的 AI 叙事中保持清醒。
关键词: Gary Marcus, 通用人工智能, 深度学习, 符号推理, 常识推理
事实核查备注: Gary Marcus:NYU 荣休教授,Robust AI 联合创始人;播客主持人:Lex Fridman;涉及人物:Yann LeCun;关键概念:通用人工智能(AGI)、深度学习、符号操作(symbol manipulation)、常识推理;原话引用包括“intelligence is a multidimensional variable”“I’ve never seen anybody build a system…”“AI is actually a grab bag of different techniques”“Sophia has very good material written for her but she doesn't understand the things that she's saying”“two intelligences that are 20 watts each”。