George Hotz拆解自动驾驶三大难题：最难的甚至还没开始

AI PM 编辑部 · 2019年09月05日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

在这段与Lex Fridman的对话中，George Hotz用“静态、动态、反事实”三个问题框架，重新定义了自动驾驶的真正难点。他直言：行业大量精力集中在前两个问题，但真正决定成败的，是几乎没人解决的第三个。

George Hotz拆解自动驾驶三大难题：最难的甚至还没开始

在这段与Lex Fridman的对话中，George Hotz用“静态、动态、反事实”三个问题框架，重新定义了自动驾驶的真正难点。他直言：行业大量精力集中在前两个问题，但真正决定成败的，是几乎没人解决的第三个。

为什么所有自动驾驶公司看起来都“差不多”？

这一段对话的起点，其实带着一点讽刺。George Hotz指出，今天主流自动驾驶公司——无论是Cruise、Waymo、Aurora——在底层思路上“几乎是同一套东西”。他甚至提到，它们在历史上可以追溯到同一代DARPA Urban Challenge的技术路线，“they're all the same stack… the same codebase”。

这句话的重要性在于，它点出了行业的一个隐性共识：真正的竞争优势，已经不再来自常规工程优化，而必须来自“跳跃式”的思路转变。Hotz把这种机会描述为“leapfrog”——要么找到别人没走的方向，要么在某个关键环节实现质变。

在他看来，理论上存在两种可能的突破：一是极其强大的HD地图系统，能覆盖全球、各种天气；二是足够真实、足够大规模的仿真系统，直接推翻当前关于训练数据和泛化能力的假设。这不是泛泛而谈，而是在为后面“三个问题”的拆解埋下伏笔：如果你不知道自己到底在解决哪一类问题，就很容易在错误的地方卷工程细节。

第一个问题：静态驾驶，其实并不“简单”

Hotz把自动驾驶的第一个层级，称为“静态驾驶问题”（Static Driving）。它的前提假设非常极端：假设你是路上唯一的一辆车。没有行人，没有其他车辆，也没有不可预测的变化。

在这个假设下，问题看起来几乎可以完全交给地图和定位来解决。他用农业场景做了类比：农田里的自动化拖拉机之所以可行，是因为路径、速度、环境都可以被“静态调度”，就像操作系统里的静态进程调度一样。

但Hotz马上话锋一转，强调这并不意味着现实中的静态问题真的容易。他直言：“Tesla drifting out of lane is failing on the fundamental static driving problem。”也就是说，连最基本的保持在车道内，本质上都还没有被完全解决。

关键难点不在算法多聪明，而在环境的一致性：同一条路，在不同天气、不同车道线磨损状态下，都是不同的问题。Hotz明确表示，完美的定位器是可以构建的，但前提是你要正视传感器的物理极限，而不是假装它们不存在。

定位、激光雷达与工程现实：10厘米和1厘米的区别

在谈到如何解决静态问题时，Hotz毫不回避一个行业争议点：激光雷达（LiDAR）。他用一种近乎调侃的方式说：“why don't you use lidar， build a perfect localizer。”

他的论点非常工程化：不用激光雷达，你也许能做到10厘米级定位；用激光雷达，可以做到1厘米级。但真正危险的不是误差大小，而是“every once in a while you're just way off”。也就是说，系统偶发性的严重失准，才是自动驾驶最致命的问题。

Hotz强调，优秀系统的目标不是永远不出错，而是“you're never in a case where you're way off and you don't know it”。这句话极具代表性：自动驾驶首先是一个安全系统，其次才是智能系统。

因此，在他的框架里，静态问题是“obvious how to solve”的，但绝不是轻松解决的。它需要激光雷达、摄像头融合、高精地图，以及清晰的失效兜底逻辑。这也是他反复强调的前提：只有第一个问题站稳脚跟，后面的讨论才有意义。

真正的难题：动态与反事实，人类才是环境

第二个问题是“动态驾驶问题”（Dynamic Driving）。典型例子是一辆停在红灯前的车：它不可能被写进地图，因为你永远不知道它下一秒还在不在。系统必须实时感知、预测，并据此做出决策。

但Hotz认为，行业真正忽视的，是第三个问题——反事实（Counterfactual）。这不是简单预测其他车辆会怎么动，而是理解“如果我这么做，对方会如何反应”。当你并线、减速、加速时，你本身就在改变世界。

他说得非常直接：“the other agents are humans。”而人类的行为模型，无法通过静态规则或监督学习穷尽。Hotz认为，目前唯一可能触及反事实的方法，是强化学习（Reinforcement Learning）。

他的设想很激进：当世界上有足够多自动驾驶车辆时，在真实世界中进行强化学习，让系统从交互中学习因果关系，而不是只拟合历史数据。正如他所说：“the only real way to get at the counterfactual is to do reinforcement learning。”这也是他坦言“haven't solved the third yet”的原因——难度不在工程，而在认知本身。

总结

George Hotz的三分法，把自动驾驶从“堆模型、堆数据”的语境中抽离出来，变成一个层次分明的问题空间：先解决静态，再处理动态，最后直面反事实。他的核心提醒是：前两个问题再难，终究是工程问题；第三个问题，才是真正关于智能的挑战。对任何关注自动驾驶的人来说，这都是一个值得反复咀嚼的判断框架。

关键词：自动驾驶， George Hotz，激光雷达，反事实，强化学习

事实核查备注：视频来源：Lex Fridman Podcast Clips；发布时间：2019-09-05。核心人物：George Hotz。三大问题划分：Static Driving、Dynamic Driving、Counterfactual。关键技术名词：HD Maps、LiDAR、Localization、Reinforcement Learning。涉及公司：Tesla（作为案例提及）。

返回文章列表