乔姆斯基眼中的深度学习：有用，但与理解语言无关

AI PM 编辑部 · 2019年12月01日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

在与 Lex Fridman 的对话中，语言学大师 Noam Chomsky 对深度学习给出了冷静而尖锐的评价：它在工程上非常有用，但在科学上几乎无法告诉我们任何关于人类语言的本质。这篇文章提炼了他对“工程 vs 科学”、数据驱动方法局限性以及语言研究方法论的核心洞见。

乔姆斯基眼中的深度学习：有用，但与理解语言无关

在与 Lex Fridman 的对话中，语言学大师 Noam Chomsky 对深度学习给出了冷静而尖锐的评价：它在工程上非常有用，但在科学上几乎无法告诉我们任何关于人类语言的本质。这篇文章提炼了他对“工程 vs 科学”、数据驱动方法局限性以及语言研究方法论的核心洞见。

工程的成功，不等于科学的胜利

为什么深度学习的巨大成功，反而让乔姆斯基保持警惕？在对话一开始，他就把讨论拉回一个根本问题：我们到底是在做工程，还是在做科学。乔姆斯基认为，深度学习“在工程上是值得拥有的，就像一台推土机”，它确实能解决实际问题，比如 Google 翻译，他自己也在使用。但问题在于，这种成功并不自动意味着我们理解了背后的世界。

在他看来，深度学习的核心做法，是“拿到海量样本，然后从中寻找模式”。这种模式匹配在很多应用场景中非常有效，但它的目标只是“能不能用”，而不是“为什么会这样”。乔姆斯基直言不讳地说：“Does it tell you anything about human language？ Zero. Nothing.”——它对理解人类语言毫无帮助。

这里的分歧并非技术细节，而是研究目标的不同。工程关心性能指标，科学关心解释力和理论结构。深度学习可以在不理解语言的情况下生成看似正确的结果，这恰恰是乔姆斯基感到不安的地方：如果一个系统在完全错误的假设下也能工作，那它的成功反而证明，我们离真正的科学理解还很远。

“随机实验”的隐喻：为什么大数据不等于科学方法

乔姆斯基对 Google 解析器（parser）的批评，揭示了他对数据驱动方法的根本质疑。一个典型的解析器，会拿到像《华尔街日报》这样的庞大语料库，然后尝试给其中的每一句话做出最接近“正确”的句法分析。每一个句子，在技术上都被当作一次“实验”。

但乔姆斯基提出了一个反问：有没有哪门科学，是通过“毫无目的地做大量随机实验”来获得理论突破的？他用了一个颇具嘲讽意味的类比：如果一个化学博士生说，自己的研究计划是“随便把很多东西混在一起，也许会发现点什么”，那一定会被直接赶出系里。

在他看来，科学的核心不是覆盖面，而是“关键实验”——那些专门用来检验某个理论假设的实验。而大规模语料分析恰恰相反，它并不关心理论问题，只关心统计上的拟合效果。这也是他所说的，深度学习“从一开始就与科学非常遥远，并且一直如此”。这并不是否认其工程价值，而是指出它的方法论，几乎无法自然通向对语言机制的解释。

当模型在“错误的语言”上表现更好

如果说前面的批评还停留在方法论层面，那么乔姆斯基提出的“结构依赖性”例子，则直接击中了深度学习的科学软肋。为什么这一点如此重要？因为人类语言并不是按词语的线性顺序来理解的，而是依赖层级结构，这是生成语言学的一个核心主张。

乔姆斯基指出，如果假设存在一种“错误的语言”，它完全依赖线性邻近关系来解释句子，那么深度学习模型反而会“更容易”学会这种语言，甚至表现得比在真实人类语言上更好。从工程角度看，这是成功；但从科学角度看，这是彻底的失败。

他直言：“这表明我们根本没有发现系统的本质，因为它在违反语言结构的情况下，也能做得一样好，甚至更好。”换句话说，如果一个模型无法区分“符合人类语言本质的系统”和“完全伪造的系统”，那它的高准确率并不能证明任何关于语言认知的理论。这一反直觉的例子，是整个讨论中最具冲击力的洞见之一。

不是反对深度学习，而是反对神话化

乔姆斯基反复强调，他的批评并不是要否定深度学习本身。“It's not an argument against doing it.” 他承认神经网络是有效的函数逼近器，在合适的任务上非常有用。但他警惕的是，把这种工具性成功，误读为对人类心智理论的“证实”。

他特别提到，有些深度学习研究者声称，这一波成功“证明了斯金纳式行为主义是正确的”。乔姆斯基认为这种说法完全站不住脚。尽管大数据规模带来了新的现象，但这并不意味着老的理论争论已经被解决。

在对话的后半段，他也给出了一个更温和的可能性：在某些受限条件下，从数据中发现此前未注意到的模式，确实可能对科学研究有所帮助。这就像语料语言学，或者古人类学——当你无法做关键实验时，只能依赖现有记录，尽力推断。但关键前提是，我们要清楚这是一种“次优选择”，而不是通向理论理解的捷径。

总结

乔姆斯基对深度学习的态度，既不是保守的拒绝，也不是盲目的拥抱，而是一种罕见的清醒区分：工程的成功，不应被自动升级为科学的解释。他提醒我们，性能指标、规模优势和商业价值，无法替代对机制和理论的理解。对于今天身处 AI 浪潮中的技术从业者和研究者来说，这种区分尤为重要——否则，我们可能会在“有用”的幻觉中，离“理解”越来越远。

关键词：深度学习，神经网络， Noam Chomsky，人类语言， Google

事实核查备注：人物：Noam Chomsky；访谈主持：Lex Fridman；公司：Google；技术名词：Deep Learning、Neural Networks、Google Parser、Corpus Linguistics、Structure Dependence；原话引用均来自视频内容片段。

返回文章列表