从模仿到理解：Vapnik谈智能的本质与学习的边界

AI PM 编辑部 · 2020年02月14日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期与Lex Fridman的对话中，统计学习理论奠基人Vladimir Vapnik并没有讨论热门模型或算力竞赛，而是回到一个更根本的问题：什么才是“理解”？他通过对模仿、数字识别、谓词与不变量的讨论，提出了一条与当下主流深度学习路径明显不同的智能观。

在这期与Lex Fridman的对话中，统计学习理论奠基人Vladimir Vapnik并没有讨论热门模型或算力竞赛，而是回到一个更根本的问题：什么才是“理解”？他通过对模仿、数字识别、谓词与不变量的讨论，提出了一条与当下主流深度学习路径明显不同的智能观。

这一段对话从Alan Turing的经典问题切入：如果机器能成功模仿人类行为，是否就意味着它具备智能？Vapnik的回答非常直接——“模仿和理解是完全不同的事情”。在他看来，当下很多机器学习系统，本质上仍停留在模仿层面。

他指出，模仿的核心是复现训练数据中的统计模式，而理解则意味着掌握独立于数据的属性。换句话说，如果系统只能在“见过的世界”里表现良好，它就无法应对真正的新情况。这也是他质疑图灵测试的原因：通过语言或行为骗过人类，并不等价于掌握世界的结构。

Vapnik强调，理解需要从“最简单的地方”开始构建。他说：“你应该用最简单的方法开始，否则你根本做不到。”这不是工程上的偷懒，而是一种认知策略——只有从可解释、可控制的任务入手，才能逐步逼近智能的核心。

在很多研究者眼中，MNIST手写数字识别已经是“被解决的问题”，甚至显得过于简单。但Vapnik却反复回到这个例子，因为在他看来，这类任务恰恰暴露了学习系统的本质限制。

他提出一个开放问题：如果我们从一开始就用复杂世界训练模型，是否反而掩盖了核心问题？数字识别之所以重要，是因为它迫使我们回答一个根本问题——模型究竟学到了什么？是像素的相关性，还是“这是一个数字6而不是9”的概念不变量？

在对话中，他承认这些直觉“很难用语言表达”，但正是这种难以形式化的部分，才是智能研究真正值得关注的地方。对Vapnik来说，简单任务不是终点，而是用来剖析学习机制的显微镜。

对话逐渐进入技术核心：谓词（predicate）与不变量（invariant）。Vapnik认为，真正有价值的知识，是那些不依赖训练数据也成立的性质。例如，对称性、保持结构不变的约束，这些都是人类在理解世界时天然引入的。

他用模型训练作类比：如果只依赖数据拟合，函数空间极其庞大；而一旦引入谓词和不变量，可选函数的集合就会“越来越小”。这不是坏事，反而是学习得以可能的前提。

面对“这样是否限制了模型能力”的反驳，他给出了一个关键观点：所有这些不变量，本来就是由人类指定的。问题不在于限制，而在于我们是否选对了限制。如果谓词是正确的，它们并不会削弱模型，而是让模型更接近真实世界的结构。

当讨论转向“收敛”与“弱收敛”时，对话看似进入数学细节，实则触及学习理论的哲学基础。Vapnik解释说，训练误差下降并不意味着真正的学习，关键在于模型是否在分布意义上收敛。

他区分了经验一致性和更强形式的收敛，并指出很多系统只是在训练集上“看起来一样”。这也是他对过度依赖经验验证保持谨慎的原因：如果没有理论保证，我们无法判断模型是否只是巧合地工作。

在这里，他再次强调理解的重要性——不仅要知道模型有效，还要知道“为什么有效”。这种态度贯穿了他对整个机器学习领域的看法。

在对话后段，Lex Fridman提出一个尖锐问题：如果学习这么依赖数据，逻辑系统是否已经过时？Vapnik的回答是否定的。他认为，逻辑、抽象和符号化的思想，正是人类理解世界的方式。

他并不主张回到纯逻辑AI，而是认为当前的数据驱动方法忽略了一个事实：世界是由抽象概念构成的。学习如果不能触及这些抽象，就只能停留在表面。

最终，他把话题又拉回到简单任务上——不是因为它们容易，而是因为它们足够清晰，能让我们看见智能的骨架。

这次对话的价值，不在于给出新的模型或算法，而在于逼迫我们重新审视一个被忽略的问题：我们到底希望机器学会什么？Vapnik提醒我们，数据和算力并不能自动带来理解。只有当人类主动引入谓词、不变量和抽象结构，学习系统才可能真正逼近智能。这不仅是对机器学习的反思，也是对人类认知方式的一次回望。

关键词： Vladimir Vapnik，统计学习理论，不变量，谓词，数字识别

事实核查备注：人物：Vladimir Vapnik，Lex Fridman；视频标题与发布时间；技术概念：MNIST数字识别、谓词（predicate）、不变量（invariant）、收敛、弱收敛；观点：模仿与理解的区分、简单任务的重要性