乔姆斯基眼中的深度学习:有用,但与理解语言无关

AI PM 编辑部 · 2019年12月01日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

在与 Lex Fridman 的对话中,语言学大师 Noam Chomsky 对深度学习给出了冷静而尖锐的评价:它在工程上非常有用,但在科学上几乎无法告诉我们任何关于人类语言的本质。这篇文章提炼了他对“工程 vs 科学”、数据驱动方法局限性以及语言研究方法论的核心洞见。

乔姆斯基眼中的深度学习:有用,但与理解语言无关

在与 Lex Fridman 的对话中,语言学大师 Noam Chomsky 对深度学习给出了冷静而尖锐的评价:它在工程上非常有用,但在科学上几乎无法告诉我们任何关于人类语言的本质。这篇文章提炼了他对“工程 vs 科学”、数据驱动方法局限性以及语言研究方法论的核心洞见。

工程的成功,不等于科学的胜利

为什么深度学习的巨大成功,反而让乔姆斯基保持警惕?在对话一开始,他就把讨论拉回一个根本问题:我们到底是在做工程,还是在做科学。乔姆斯基认为,深度学习“在工程上是值得拥有的,就像一台推土机”,它确实能解决实际问题,比如 Google 翻译,他自己也在使用。但问题在于,这种成功并不自动意味着我们理解了背后的世界。

在他看来,深度学习的核心做法,是“拿到海量样本,然后从中寻找模式”。这种模式匹配在很多应用场景中非常有效,但它的目标只是“能不能用”,而不是“为什么会这样”。乔姆斯基直言不讳地说:“Does it tell you anything about human language? Zero. Nothing.”——它对理解人类语言毫无帮助。

这里的分歧并非技术细节,而是研究目标的不同。工程关心性能指标,科学关心解释力和理论结构。深度学习可以在不理解语言的情况下生成看似正确的结果,这恰恰是乔姆斯基感到不安的地方:如果一个系统在完全错误的假设下也能工作,那它的成功反而证明,我们离真正的科学理解还很远。

“随机实验”的隐喻:为什么大数据不等于科学方法

乔姆斯基对 Google 解析器(parser)的批评,揭示了他对数据驱动方法的根本质疑。一个典型的解析器,会拿到像《华尔街日报》这样的庞大语料库,然后尝试给其中的每一句话做出最接近“正确”的句法分析。每一个句子,在技术上都被当作一次“实验”。

但乔姆斯基提出了一个反问:有没有哪门科学,是通过“毫无目的地做大量随机实验”来获得理论突破的?他用了一个颇具嘲讽意味的类比:如果一个化学博士生说,自己的研究计划是“随便把很多东西混在一起,也许会发现点什么”,那一定会被直接赶出系里。

在他看来,科学的核心不是覆盖面,而是“关键实验”——那些专门用来检验某个理论假设的实验。而大规模语料分析恰恰相反,它并不关心理论问题,只关心统计上的拟合效果。这也是他所说的,深度学习“从一开始就与科学非常遥远,并且一直如此”。这并不是否认其工程价值,而是指出它的方法论,几乎无法自然通向对语言机制的解释。

当模型在“错误的语言”上表现更好

如果说前面的批评还停留在方法论层面,那么乔姆斯基提出的“结构依赖性”例子,则直接击中了深度学习的科学软肋。为什么这一点如此重要?因为人类语言并不是按词语的线性顺序来理解的,而是依赖层级结构,这是生成语言学的一个核心主张。

乔姆斯基指出,如果假设存在一种“错误的语言”,它完全依赖线性邻近关系来解释句子,那么深度学习模型反而会“更容易”学会这种语言,甚至表现得比在真实人类语言上更好。从工程角度看,这是成功;但从科学角度看,这是彻底的失败。

他直言:“这表明我们根本没有发现系统的本质,因为它在违反语言结构的情况下,也能做得一样好,甚至更好。”换句话说,如果一个模型无法区分“符合人类语言本质的系统”和“完全伪造的系统”,那它的高准确率并不能证明任何关于语言认知的理论。这一反直觉的例子,是整个讨论中最具冲击力的洞见之一。

不是反对深度学习,而是反对神话化

乔姆斯基反复强调,他的批评并不是要否定深度学习本身。“It's not an argument against doing it.” 他承认神经网络是有效的函数逼近器,在合适的任务上非常有用。但他警惕的是,把这种工具性成功,误读为对人类心智理论的“证实”。

他特别提到,有些深度学习研究者声称,这一波成功“证明了斯金纳式行为主义是正确的”。乔姆斯基认为这种说法完全站不住脚。尽管大数据规模带来了新的现象,但这并不意味着老的理论争论已经被解决。

在对话的后半段,他也给出了一个更温和的可能性:在某些受限条件下,从数据中发现此前未注意到的模式,确实可能对科学研究有所帮助。这就像语料语言学,或者古人类学——当你无法做关键实验时,只能依赖现有记录,尽力推断。但关键前提是,我们要清楚这是一种“次优选择”,而不是通向理论理解的捷径。

总结

乔姆斯基对深度学习的态度,既不是保守的拒绝,也不是盲目的拥抱,而是一种罕见的清醒区分:工程的成功,不应被自动升级为科学的解释。他提醒我们,性能指标、规模优势和商业价值,无法替代对机制和理论的理解。对于今天身处 AI 浪潮中的技术从业者和研究者来说,这种区分尤为重要——否则,我们可能会在“有用”的幻觉中,离“理解”越来越远。


关键词: 深度学习, 神经网络, Noam Chomsky, 人类语言, Google

事实核查备注: 人物:Noam Chomsky;访谈主持:Lex Fridman;公司:Google;技术名词:Deep Learning、Neural Networks、Google Parser、Corpus Linguistics、Structure Dependence;原话引用均来自视频内容片段。