当行业还在打磨VLA量产落地,华为、小鹏已将目光投向更远处。就在小鹏汽车第二代VLA刚完成全场景推送、理想VLA司机大模型全系OTA升级之际,头部玩家们不约而同地释放出同一个信号——VLA不是终点,只是从辅助驾驶迈向全自动驾驶的过渡技术。真正的下半场,早已瞄准VLA之后的下一代技术范式。VLA,其核心技术逻辑是将视觉感知、语言理解与动作决策融合在一个Transformer架构中,实现从像素到方向盘的端到端输出。这一技术范式在2024至2025年间取得了里程碑式突破。2023年7月,谷歌DeepMind抛出全球首个VLA模型RT-2,自动驾驶行业嗅到了颠覆性变革的气息。到2025年,以小鹏、理想为代表的新势力和吉利、长城等传统车企扎堆入局,VLA迅速成为行业主流架构。核心突破在于"视觉感知+语言推理+动作输出"三位一体——车辆不仅能看见路况,还能理解路况背后的逻辑。小鹏第二代VLA已实现高速、国道、城市道路、乡间小路全路况覆盖,横风、暴雨、沙尘暴、大雪等极端天气下均能稳定运行。在5000公里智驾横穿中国的实测中,单人驾驶借助该系统实现1000公里仅偶尔接管,远超传统自驾极限。有行业一线技术团队专家表示,VLA带着四大"硬伤":时序逻辑缺失,对鬼探头、近距离穿插等高速动态场景预判不足;算力成本高企,推理时延虽已压缩至80毫秒以内,但智能化与速度仍不可兼得;缺乏物理世界常识,遇到"路面积水易打滑需减速"这类场景,数据无法完全覆盖便会决策失误;跨模态对齐偏差,逆光、浓雾等视觉受限场景下,语义理解与实际路况容易脱节。VLA解决了"智能化"问题,却没解决"安全性、实时性、通用性"问题。技术红利见顶,行业亟需新的突破口。如今在2026年技术发展节点上,头部厂商已跳出VLA的模态融合思维,转向物理世界智能建模。多模态物理世界模型。这是特斯拉、华为重点攻坚的方向。不同于VLA依托数据拟合场景,世界模型会自主学习现实世界的物理规则、交通规律、运动逻辑,构建完整的虚拟路况世界。理想汽车已依托世界模型搭建训练闭环,累计训练里程超25亿公里,模型迭代速度达到一周2个版本。时序具身智能架构。针对VLA时序推理薄弱的缺陷,下一代技术将彻底强化连续场景建模能力,搭建时序记忆与动态推演体系。从单帧静态推理进化为连续时序推演,让系统具备"提前预判、主动避险"的类人能力。原生无人车——重新定义"车"的本质。2026年5月,无方向盘、无油门刹车的L4级原生无人驾驶车型已拿到国内官方路测牌照。吉利在北京车展发布中国首台原生开发Robotaxi原型车Eva Cab,广汽与滴滴合作开发的首款L4级自动驾驶车型年内下线交付。座舱不再是驾驶位——驾驶员这个角色,正在从"操作者"变成"乘客"。华为ADS 5.0已规模量产,全新问界M9率先实现"工厂自动驾驶测试",车辆可在无人干预下完成自动过检测线、淋雨测试等12项出厂自检。华为终端BG董事长余承东放话"静候牌照",L3智能驾驶商业化落地提速。
小鹏第二代VLA按计划完成P7、G7、X9等车型推送,Ultra版本面向L4能力打造。何小鹏更是公开修正时间表:2028年实现L4级软件能力概率极高,L5雏形有望2030年出现。小鹏已跳过L3,直接瞄准L4量产。
理想将端到端+VLM双系统升级为VLA架构,使司机大模型具备空间理解、思维、记忆与沟通能力。全系AD Max硬件老车主均可免费OTA升级,不抛弃存量用户。
当我们把这些拼在一起,2026年自动驾驶的真实面貌已经清晰:这不是"更高级的辅助驾驶",而是一次整个出行系统的重装。L3被行业定义为量产元年,L4全无人商业化加速年。北京、上海、深圳等50城已开放L3/L4路测和商业化试点。无图城市NOA全面落地,告别高精地图依赖,华为ADS 5.0、小鹏XNGP 4.0、理想AD Max已实现全国核心城市全域无图自动驾驶。