今天马斯克在最新一条推文里,用一个极端场景说明自动驾驶必须面对的问题:一条狭窄的双车道上,行人突然摔倒进入车道。系统没有“完美解法”。直行会造成致命伤害,另一种选择是尽可能减速,同时与对向车辆发生擦碰,用更小的代价避免更严重的后果。这类问题在理论上被称为“电车难题”,长期停留在哲学讨论中,没有统一答案。
自动驾驶无法回避这种问题。系统需要在极短时间内做出决策,并且这个决策要能够被反复验证和优化。现实世界提供的数据并不完整。极端场景出现频率极低,即使有大规模车队在路上运行,能够覆盖到的样本依然有限。问题集中在最后一部分场景上。马斯克多次提到,自动驾驶99%的问题相对容易,真正困难的是剩下的长尾部分。
模拟成为必要手段。系统通过生成物理一致的环境,把现实中几乎不会发生的情况转化为可重复训练的样本。一个场景可以被扩展出不同速度、不同距离、不同反应时间的组合,形成大量变体。模型在这些数据中不断收敛,寻找伤害最小的决策路径。
算力决定了这套方法的上限。生成一段接近真实的高清视觉数据,需要接近一张H100级别的计算资源。完整自动驾驶系统依赖多摄像头输入,计算需求按倍数增长。大规模模拟需要持续的算力投入,这也是自动驾驶竞争中最难复制的一部分。
训练使用的数据依然依赖基础的车辆采集数据,车辆数据最接近真实环境,分布最广。但依然需要模拟来补齐真实数据无法覆盖的边界情况来解决自动驾驶的长尾问题。
FSD的核心不再是“会不会开车”,而是系统在极端情况下,能否依然保持可控的决策能力。