一图看懂自动驾驶 6个阶段:规则,VLA到...
回顾自动驾驶的发展历程,其实就是车辆控制权从人类工程师,向模型转移的过程;其核心能力演化路径可以分为6个阶段:模块化,深度学习,端到端,VLA,世界模型和自动架构;
🤖 模块化规则阶段:
这是自动驾驶早期,最容易工程化的一套思路:将驾驶过程分为多个明确的模块,每个模块各司其职,通过规则和算法解决特定问题,然后再将它们串联起来;
⭐️ 主流模块分类为:「感知 - 定位 - 预测 - 规划 - 控制」:
- 感知能力主要依赖激光雷达 + 传统算法
- 依靠「高精地图」提供更细致的道路信息;
- 规划分为路线规划,行为规划和更细节的运动轨迹规划,主要通过规则+状态机,以及轨迹搜索算法实现;
🤖 深度学习
深度学习开始兴起后,自动驾驶领域开始尝试用「神经网络」替换手写规则,提升了每个模块的泛化能力,解决了规则系统容易失效的问题;
⭐️ 深度学习还能学习到时序信息,可以利用历史帧,理解和预测物体的运动轨迹;
🤖 端到端
模块化系统最大的问题在于一个模块的错误信息会不断向后传导,模块越多,错误积攒的概率也就越大;
⭐️ 而端到端系统就是将所有模块都压缩到一个大模型中,利用海量数据进行训练,让它具备通过输入信息(视觉信息,地图信息等)直接输出驾驶方法的能力;
🤖 VLA 架构
端到端系统最大的问题有两个:解释性差,依赖数据质量;
⭐️ VLA 进一步把语言和任务理解引入系统,它的核心是「Vision + Language + Action」,有点类似于在端到端的基础上加上了思维链;基于输入信息,让模型先思考理解「任务是什么?我要怎么做?」,再决定「我该怎么开?」;
🤖 世界模型
VLA 主要负责理解任务,生成候选行动轨迹;世界模型则是想推演:“如果我这样做,接下来会发生什么?”,可以作为 VLA 的「行动前验证」
⭐️ 技术架构可以理解成:把当前外部世界编码成一个状态,再通过模型预测未来的世界状态,
- 世界模型通过辅助仿真,以及对生成长尾场景,减少对真实数据的依赖;
🤖 自动架构
前面五个阶段解决的是具体能力问题,而自动架构是想让 AI 自动探索「更会驾驶的系统结构」,并且能够自适应,自进化;
⭐️ 其核心是把「架构设计」变成一个可优化,可排列的空间。训练不同系统组合,看哪种结构整体表现更好;目前仍处于早期的试验阶段;