一、全球主流玩家全景图:纯视觉+端到端路线的全球格局
当前全球L3+自动驾驶技术竞争已形成以特斯拉为先锋、中国科技企业为主力、Wayve与Momenta为新兴力量的三极格局,纯视觉+端到端路线正从“技术实验”迈向“全球量产主导”。
企业 | 国家 | 技术路线 | 核心能力 | 量产进展 |
|---|
Tesla | 美国 | 纯视觉 + 端到端 FSD V14 | 基于8摄像头+Dojo超算,实现“图像→控制”直接映射,支持无图城市NOA、复杂路口博弈 | 全球超500万辆车搭载,FSD V14在北美、欧洲、中国多地实现零接管运行 |
Wayve | 英国 | 端到端视觉语言模型(VLM) | 首创“驾驶行为模仿+语义理解”双通道架构,可理解“前方车辆打双闪=可能抛锚”等语义指令 | 2025年完成伦敦全城无接管测试,获欧盟L3认证,与宝马合作量产 |
Momenta | 中国 | 一段式端到端大模型 | “飞轮数据闭环”驱动,无需人工标注,城市NOA市占率超60%(佐思汽研),适配通用、丰田等全球品牌 | 2025年实现10万辆级快速搭载,覆盖中东、东南亚市场 |
华为(ADS 3.0) | 中国 | 纯视觉主导 + 多传感器冗余 | 采用“视觉为决策主干、雷达为安全兜底”架构,GOD网络识别非标障碍物能力领先 | 享界S9实现北京机场高速零接管L3+,2025年出货超50万套 |
小鹏(XNGP 3.0) | 中国 | 纯视觉端到端 | 基于BEVFormer+Occupancy Networks,支持城市无图NOA,语义理解能力提升300% | 2025年底获L3准入,G9/G6实现全国开城 |
百度Apollo | 中国 | 纯视觉+车路协同 | 萝卜快跑在武汉实现7×24小时全无人运营,测试里程超9000万公里,视觉系统主导决策 | 2025年服务超600万单,全球Robotaxi运营规模第一 |
Comma.ai | 美国 | 开源端到端视觉系统 | 以低成本硬件($1000)实现类FSD能力,社区驱动模型迭代 | 全球超10万用户参与数据闭环,成为开源端到端标杆 |
全球趋势共识:2025年全球端到端自动驾驶市场规模达38.57亿美元,预计2032年将达439.15亿美元,年复合增长率(CAGR)达34.6%。纯视觉路线因硬件成本低、数据效率高、OTA迭代快,正成为全球主流选择,激光雷达从“主传感器”降级为“安全冗余”。
二、视觉认知能力:从“感知”到“理解”的范式跃迁
人类驾驶的本质,不是“看到”物体,而是“理解”意图。
人类能识别“行人抬手示意过马路”→预判其将横穿;
能理解“前方车辆双闪”→推断其可能抛锚;
能在无标线路口,依据“社会规范”判断通行优先级。
当前端到端模型(如FSD V12)仍停留在**“高度熟练但不可反思的执行者”**阶段:
新一代架构正突破这一瓶颈,迈向“视觉认知”:
Percept-WAM(引望智能 & 复旦大学):首次将世界感知(World-Awareness) 与行为决策统一于单一大模型,引入“World-BEV Token”,使模型不仅能“看到”障碍物,更能构建动态空间语义图谱,理解“这是一群学生正在过马路,需减速等待”。
视觉语言模型(VLM):如Wayve与小鹏XNGP 3.0,已引入自然语言理解模块,可响应“在便利店前靠边”等语义指令,实现从“感知图像”到“理解意图” 的跨越。
BEVFormer + Occupancy Networks:不再依赖“目标检测框”,而是以体素(Voxel)建模整个三维空间占用状态,可识别“散落的轮胎”“倒地的自行车”等非标准物体,实现类人空间常识推理。
关键结论:成熟的大模型必须具备“视觉认知”能力,即:感知 + 理解 + 推理 + 任务重解释。当前技术正从“模仿人类动作”转向“模拟人类认知”,这是纯视觉路线能否真正替代人类驾驶的唯一路径。
三、未来趋势:2026–2030年全球自动驾驶演进路径
技术收敛:2027年前,纯视觉端到端架构将主导90%以上L3+新车,激光雷达成本降至$100以下,仅用于极端场景冗余。
认知架构普及:2028年,VLM与世界模型(World Model) 将成为L4级系统标配,实现“语义级决策”。
商业化爆发:
2026年:全球L3级新车渗透率突破12%,中国、美国、欧盟为三大主战场;
2027年:城区L4 Robotaxi进入盈亏平衡点,百度、Waymo、Momenta率先实现;
2030年:自动驾驶软件订阅收入占整车利润超25%,传统“卖车”模式终结。
法规演进:欧盟将从“强制冗余”转向“能力认证”,中国“不限定技术路线”政策将持续利好纯视觉创新。
写在最后:
你,正在见证一场“驾驶权”的转移
我们曾以为,自动驾驶是“机器替人开车”。现在看,它是“机器学会像人一样思考”。谁能让车“看懂”世界,谁就能定义下一个十年的出行。
在未来的某个早高峰,当你看着一辆自动驾驶汽车在车流中自动变道、避让、礼让行人——你看到的不是科技,是人类驾驶智慧的数字化重生。
真正的自动驾驶,不是没有司机,而是车,终于学会了“看懂你”。