MIT自动驾驶课首讲：为什么深度学习是这场竞赛的核心引擎

AI PM 编辑部 · 2018年01月15日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

这是Lex Fridman在MIT自动驾驶课程6.S094的第一讲。通过竞赛设计、真实驾驶系统和深度学习方法论，他解释了为何“数据驱动”的深度学习正在重塑自动驾驶，以及它解决了哪些传统方法难以突破的问题。

MIT自动驾驶课首讲：为什么深度学习是这场竞赛的核心引擎

这是Lex Fridman在MIT自动驾驶课程6.S094的第一讲。通过竞赛设计、真实驾驶系统和深度学习方法论，他解释了为何“数据驱动”的深度学习正在重塑自动驾驶，以及它解决了哪些传统方法难以突破的问题。

从一场“冒着风雪”的开场白说起：这门课为什么不一样

一开始，Lex Fridman并没有直接谈算法，而是用一句轻松却真实的开场白拉近了距离：“Thank you everyone for braving the cold， and the snow...”这不是客套话，而是一个信号——这门课关注的是现实世界中的自动驾驶，而不是实验室里的理想模型。

课程官网selfdrivingcars.mit.edu被反复提及，背后是一整套以实践为核心的教学设计。与传统机器学习课程不同，这门课从第一天起就假设你要面对真实道路、真实车辆、真实噪声。行人、其他司机、骑行者，都是系统必须处理的不确定因素。

这一点很重要，因为它奠定了整门课的基调：自动驾驶不是“感知+控制”的抽象问题，而是一个在空间和时间中持续决策的系统工程。深度学习之所以重要，正是因为它在这种复杂环境下展现出独特优势。

用竞赛逼近现实：Deep Traffic、SegFuse 与 Deep Crash

Lex很快抛出了课程的第一个亮点：一系列围绕自动驾驶设计的竞赛。他几乎带着兴奋地说：“Okay. First： The Deep Traffic competition... This is super cool！”

Deep Traffic竞赛关注的是交通环境中的决策问题，核心在于如何在复杂车流中做出合理动作。接下来是SegFuse——动态驾驶场景分割竞赛。这里的关键词是“space and time”，也就是不仅要理解单帧图像，还要理解随时间变化的场景。这正是图像分割在自动驾驶中的真实挑战。

最后是Deep Crash，目标是直接从感知结果中预测转向指令。这一步把问题推向端到端学习的极限：模型不再只“看懂世界”，而是要直接“控制车辆”。通过这些竞赛，学生被迫面对深度学习在真实系统中的优点和短板，而不是停留在论文指标上。

为什么是深度学习，而不是传统方法？

在回答“为什么要做自动驾驶”之后，Lex把问题进一步收紧：“So why deep learning in this space？”他的答案并不玄妙：深度学习会随着数据规模的增长而持续变好。

这是一个方法论层面的判断。传统感知与控制系统往往依赖人工设计特征和规则，扩展成本高，泛化能力有限。而深度学习，尤其是在监督学习框架下，可以通过大量标注数据不断优化模型性能。

他用真实驾驶系统举例：“This is us driving， with two perception control systems... train them.”同样的车辆、同样的道路，不同的学习系统，通过训练数据的积累展现出截然不同的效果。这种对比不是理论推导，而是工程实践中反复验证的结果。

这也解释了为何课程明确聚焦监督学习。输入数据、输出标签、损失函数，这套看似朴素的范式，在自动驾驶中依然是最可靠的起点。

机会与代价：深度学习的局限同样真实

在热情之外，Lex并没有回避问题。当谈到模型在“very small amount of training data”上的表现时，他明确指出了深度学习的弱点：数据不足时，性能会迅速崩塌。

这不是抽象警告，而是对学生的现实提醒。像Pix2pixHD这样的模型，被提及为未来任务的一部分，但它们的成功前提是大量高质量数据和算力支持。课程之所以与NVIDIA等公司合作，正是因为自动驾驶深度学习已经无法脱离产业级资源。

因此，这门课并不是在“兜售”深度学习的万能性，而是在展示一条清晰路径：理解它为什么强，也要清楚它什么时候会失败。正如Lex在结尾反复强调的：“So again I return to： Why deep learning？”这是一个需要不断用实践回答的问题。

总结

这堂MIT自动驾驶课程的首讲，并没有停留在技术名词的堆砌，而是通过竞赛、系统对比和现实约束，解释了深度学习在自动驾驶中的真实价值。它既展示了数据驱动方法的力量，也坦诚面对其代价。对读者而言，最大的启发或许在于：深度学习不是答案本身，而是一种在复杂世界中不断试错、不断进化的工具。

关键词：深度学习，自动驾驶，监督学习，图像分割， MIT

事实核查备注：课程名称：MIT 6.S094；主讲人：Lex Fridman；发布时间：2018-01-15；课程网站：selfdrivingcars.mit.edu；竞赛名称：Deep Traffic、SegFuse、Deep Crash；提及模型：Pix2pixHD；合作公司：NVIDIA；核心方法：深度学习、监督学习

返回文章列表