自动驾驶的真正突破口:规模、世界模型与尚未解决的瓶颈

AI PM 编辑部 · 2025年02月26日 · 5 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期对话中,一位长期深耕自动驾驶与大模型的专家回顾了行业过去十多年的关键突破,并坦率地拆解了仍然卡住落地的核心瓶颈。比起单点算法创新,他更强调规模、数据与“世界模型”正在如何重塑自动驾驶的技术路径。

自动驾驶的真正突破口:规模、世界模型与尚未解决的瓶颈

在这期对话中,一位长期深耕自动驾驶与大模型的专家回顾了行业过去十多年的关键突破,并坦率地拆解了仍然卡住落地的核心瓶颈。比起单点算法创新,他更强调规模、数据与“世界模型”正在如何重塑自动驾驶的技术路径。

为什么今天的自动驾驶,未来可能看起来“很原始”

这一段对话从一个颇具画面感的判断开始:演讲者认为,“there is a potential future in which we look back at today…”,未来回看今天的自动驾驶系统,可能会觉得它们还处在相当早期的阶段。这并不是唱衰,而是基于技术演进节奏的冷静判断。

他指出,过去几年行业的显著进展,更多来自算力、数据和模型规模的指数级增长,而不是某一个“灵光一现”的算法突破。这一点在自动驾驶领域尤为明显——感知、预测、规划这些模块,本质上都在受益于更大模型和更强训练信号。

之所以重要,是因为这改变了我们评估进展的方式。如果用“是否已经完全无人驾驶”来衡量,很容易低估当前阶段的价值;但如果从“是否在为下一个数量级的能力做准备”来看,今天的系统反而是在铺路。正如他后面反复强调的那样,真正的分水岭,往往出现在规模条件突然满足的时刻。

从“更聪明的老师”到更大的模型:规模如何真正发挥作用

在谈到模型训练方法时,他用了一个很形象的比喻:给模型“a better teacher and a lot more information to work from”。这里的“更好的老师”,指的是更强的监督信号、更一致的数据标注策略,以及越来越多来自模型自身的自监督或互教机制。

当被问到这种思路具体是如何落地时,他的回答非常直接:核心就是“leverage that scale”,也就是充分利用规模优势。在他的经验里,一旦数据量、模型容量和训练算力同时上到一个新台阶,很多原本需要精巧工程技巧才能勉强解决的问题,会自然变得更平滑。

但他也提醒,“bigger is always better”并不是一句可以不加思考套用的口号。规模真正起作用的前提,是数据分布足够覆盖真实世界的复杂性,否则只会放大偏差。这也是为什么后面他多次提到数据策划(data curation)的重要性——规模不是简单堆料,而是系统性工程能力的体现。

自动驾驶最难的部分,其实已经变成了“扩展问题”

一个很有意思的转折出现在讨论“最难的问题还剩下什么”时。演讲者认为,很多传统意义上的难点——比如基础感知或局部决策——已经不再是主要障碍。相反,“all the challenges here now are about scaling”。

这里的“扩展”不只是模型变大,而是整个系统如何在更多城市、更多天气、更多长尾场景下保持稳定表现。这涉及到训练流程、评估方法、回归测试,甚至组织层面的协作方式。他坦言,这类问题往往比单一算法更“无聊”,但决定了产品能否真正部署。

他还结合自己在 Google 的经历提到,成熟团队最重要的资产之一,是知道哪些问题不该反复被重新发明。当他选择离开时,“knowing that the team was in good hands”是一种安心感——系统已经具备了自我扩展的能力,而不是依赖少数个人英雄。

世界模型:看似抽象,却可能决定自动驾驶的上限

在多次被追问未来研究方向时,“世界模型”(World Model)成为反复出现的关键词。简单来说,世界模型指的是系统内部对外部物理世界运作方式的可预测表示,而不仅是对当前画面的反应。

他认为,如果自动驾驶系统“have a very plausible world model”,很多现在需要通过规则或大量样本硬撑的场景,会变得更自然。这一点在极端情况(worst case scenario)下尤其关键,因为模型需要具备反事实推理和长期预测能力。

不过,他也很清醒地指出,世界模型并不是银弹。一方面,它对算力和训练数据提出了更高要求,“demands in computing”会显著上升;另一方面,如何验证一个世界模型“真的理解了世界”,在方法论上仍然是开放问题。正因如此,他判断,未来几年我们会看到大量围绕这一方向的探索,但真正成熟落地,还需要时间与社区的共同推进。

总结

这场对话的价值,不在于给出一个确定的时间表,而在于提供了一种看待自动驾驶进展的框架:突破往往来自规模条件成熟后的系统性跃迁,而瓶颈则越来越集中在扩展、验证与世界建模上。对读者而言,最重要的启发或许是——当一个领域开始反复谈论“规模”和“基础设施”,往往意味着下一个质变正在酝酿。


关键词: 自动驾驶, 规模化训练, 世界模型, 大模型, Google

事实核查备注: 视频来源:RedpointAI(2025-02-26);涉及公司:Google;核心概念:scale(规模化)、data curation(数据策划)、world model(世界模型);引用原话均来自公开视频片段,未涉及具体数字或未明确提及的产品名称。