正在加载视频...
视频章节
在这段与Lex Fridman的对话中,George Hotz用“静态、动态、反事实”三个问题框架,重新定义了自动驾驶的真正难点。他直言:行业大量精力集中在前两个问题,但真正决定成败的,是几乎没人解决的第三个。
George Hotz拆解自动驾驶三大难题:最难的甚至还没开始
在这段与Lex Fridman的对话中,George Hotz用“静态、动态、反事实”三个问题框架,重新定义了自动驾驶的真正难点。他直言:行业大量精力集中在前两个问题,但真正决定成败的,是几乎没人解决的第三个。
为什么所有自动驾驶公司看起来都“差不多”?
这一段对话的起点,其实带着一点讽刺。George Hotz指出,今天主流自动驾驶公司——无论是Cruise、Waymo、Aurora——在底层思路上“几乎是同一套东西”。他甚至提到,它们在历史上可以追溯到同一代DARPA Urban Challenge的技术路线,“they're all the same stack… the same codebase”。
这句话的重要性在于,它点出了行业的一个隐性共识:真正的竞争优势,已经不再来自常规工程优化,而必须来自“跳跃式”的思路转变。Hotz把这种机会描述为“leapfrog”——要么找到别人没走的方向,要么在某个关键环节实现质变。
在他看来,理论上存在两种可能的突破:一是极其强大的HD地图系统,能覆盖全球、各种天气;二是足够真实、足够大规模的仿真系统,直接推翻当前关于训练数据和泛化能力的假设。这不是泛泛而谈,而是在为后面“三个问题”的拆解埋下伏笔:如果你不知道自己到底在解决哪一类问题,就很容易在错误的地方卷工程细节。
第一个问题:静态驾驶,其实并不“简单”
Hotz把自动驾驶的第一个层级,称为“静态驾驶问题”(Static Driving)。它的前提假设非常极端:假设你是路上唯一的一辆车。没有行人,没有其他车辆,也没有不可预测的变化。
在这个假设下,问题看起来几乎可以完全交给地图和定位来解决。他用农业场景做了类比:农田里的自动化拖拉机之所以可行,是因为路径、速度、环境都可以被“静态调度”,就像操作系统里的静态进程调度一样。
但Hotz马上话锋一转,强调这并不意味着现实中的静态问题真的容易。他直言:“Tesla drifting out of lane is failing on the fundamental static driving problem。”也就是说,连最基本的保持在车道内,本质上都还没有被完全解决。
关键难点不在算法多聪明,而在环境的一致性:同一条路,在不同天气、不同车道线磨损状态下,都是不同的问题。Hotz明确表示,完美的定位器是可以构建的,但前提是你要正视传感器的物理极限,而不是假装它们不存在。
定位、激光雷达与工程现实:10厘米和1厘米的区别
在谈到如何解决静态问题时,Hotz毫不回避一个行业争议点:激光雷达(LiDAR)。他用一种近乎调侃的方式说:“why don't you use lidar, build a perfect localizer。”
他的论点非常工程化:不用激光雷达,你也许能做到10厘米级定位;用激光雷达,可以做到1厘米级。但真正危险的不是误差大小,而是“every once in a while you're just way off”。也就是说,系统偶发性的严重失准,才是自动驾驶最致命的问题。
Hotz强调,优秀系统的目标不是永远不出错,而是“you're never in a case where you're way off and you don't know it”。这句话极具代表性:自动驾驶首先是一个安全系统,其次才是智能系统。
因此,在他的框架里,静态问题是“obvious how to solve”的,但绝不是轻松解决的。它需要激光雷达、摄像头融合、高精地图,以及清晰的失效兜底逻辑。这也是他反复强调的前提:只有第一个问题站稳脚跟,后面的讨论才有意义。
真正的难题:动态与反事实,人类才是环境
第二个问题是“动态驾驶问题”(Dynamic Driving)。典型例子是一辆停在红灯前的车:它不可能被写进地图,因为你永远不知道它下一秒还在不在。系统必须实时感知、预测,并据此做出决策。
但Hotz认为,行业真正忽视的,是第三个问题——反事实(Counterfactual)。这不是简单预测其他车辆会怎么动,而是理解“如果我这么做,对方会如何反应”。当你并线、减速、加速时,你本身就在改变世界。
他说得非常直接:“the other agents are humans。”而人类的行为模型,无法通过静态规则或监督学习穷尽。Hotz认为,目前唯一可能触及反事实的方法,是强化学习(Reinforcement Learning)。
他的设想很激进:当世界上有足够多自动驾驶车辆时,在真实世界中进行强化学习,让系统从交互中学习因果关系,而不是只拟合历史数据。正如他所说:“the only real way to get at the counterfactual is to do reinforcement learning。”这也是他坦言“haven't solved the third yet”的原因——难度不在工程,而在认知本身。
总结
George Hotz的三分法,把自动驾驶从“堆模型、堆数据”的语境中抽离出来,变成一个层次分明的问题空间:先解决静态,再处理动态,最后直面反事实。他的核心提醒是:前两个问题再难,终究是工程问题;第三个问题,才是真正关于智能的挑战。对任何关注自动驾驶的人来说,这都是一个值得反复咀嚼的判断框架。
关键词: 自动驾驶, George Hotz, 激光雷达, 反事实, 强化学习
事实核查备注: 视频来源:Lex Fridman Podcast Clips;发布时间:2019-09-05。核心人物:George Hotz。三大问题划分:Static Driving、Dynamic Driving、Counterfactual。关键技术名词:HD Maps、LiDAR、Localization、Reinforcement Learning。涉及公司:Tesla(作为案例提及)。