当一辆车不仅能看懂红绿灯、识别行人,还能在脑中提前“预演”未来几秒的道路场景,并据此做出更稳妥的决策时,这意味着什么?近日,在NVIDIA GTC 2026大会上,理想汽车给出了他们的答案。
理想汽车基座模型负责人詹锟正式发布了下一代自动驾驶基础模型——MindVLA-o1。这个名称中的“o1”,或许正寓意着从“0”到“1”的跨越。与当前主流的自动驾驶方案不同,MindVLA-o1不再仅仅是感知和执行的工具,它试图成为一个能够“思考”的通用智能体。
从执行指令到“多模态思考”:驾驶范式的根本转变
根据发布信息,MindVLA-o1的核心突破在于五大技术创新,其中最引人遐想的莫过于“多模态思考”能力。
简单来说,传统的自动驾驶系统处理的是一个“当下”的问题:摄像头看到了什么,然后根据既定规则或模型,决定此刻该如何操作。而MindVLA-o1引入了一个“预测式隐世界模型”。它就像一个高速运转的“数字大脑”,能够在隐空间中模拟和推演未来几秒可能发生的场景变化。
例如,前方有辆自行车微微靠向机动车道。普通系统可能只是识别出“有自行车”,并保持安全距离。而具备“多模态思考”的系统,则可能在瞬间“想象”出多种未来画面:自行车是继续靠拢,还是保持原位?旁边车道的卡车是否会对我构成新的风险?基于这种提前的“心理模拟”,系统生成的驾驶轨迹可能会更加主动、平滑,或者说,更接近一位经验丰富的老司机那种“预判”式驾驶。
这背后是三层递进的训练:先用海量视频数据教会模型理解“未来”在数据上如何表征;然后将这种世界推演能力集成到大模型中;最后,将预测未来、理解现在和生成驾驶行为三者进行联合训练与对齐。理想汽车将这个过程定义为构建“生成式多模态思考”能力。
不止于车:一个面向物理世界的通用智能体雏形
发布中一个更具野心的观点是:MindVLA-o1的目标不仅是自动驾驶。
詹锟在演讲中明确表示:“当我们把视觉、语言和行动统一到一个模型中时,它已不再只是自动驾驶模型,而是在逐渐演化为面向物理世界的通用智能体。”基于同一套VLA(视觉-语言-行动)模型,其控制对象可以从车辆扩展到机器人。因此,自动驾驶被视作“物理AI”的起点,而这类基础模型将驱动新的“具身智能”范式。
理想汽车将其整个AI框架比喻为一个“数字大脑”:MindVLA-o1是统一的理解与推理核心;MindData是负责数据处理的感官;MindSim是可生成复杂场景的“运动皮层”;RL Infra(强化学习设施)则是提供反馈与优化动力的“多巴胺系统”。这套系统构成了一个能感知、理解、行动并持续学习的完整闭环。
从这个角度看,理想的布局已经超出了汽车本身。正如其所言,“车是最大号的机器人”,其本质是在为硅基生命构建躯干与大脑。这一定位,将车企的竞争维度从制造、续航、智能座舱,拉升至了构建底层人工智能能力的层面。
技术落地:从规模化验证到高效部署
任何前沿技术,最终都要接受真实道路的检验。理想汽车透露,其上一代VLA司机大模型在2025年8月随理想i8车型交付,9月向AD Max用户全量推送。截至2025年底,该模型月使用率已达80%,累计接收并执行用户指令超过1220万次。仅在2026年春节期间,搭载该系统的车辆辅助驾驶总里程就达到了2.5亿公里。
这些规模化应用产生的海量真实场景数据,为MindVLA-o1的迭代进化提供了燃料。为了加速进化,理想构建了高效的闭环强化学习框架。通过“前馈式”场景重建技术和自研的3D高斯泼溅渲染引擎,能够在仿真世界中瞬时生成大规模、高保真的驾驶场景进行训练,渲染速度提升近2倍,整体训练成本降低了约75%。
在部署端,为了解决大模型上车面临的算力与延迟挑战,理想提出了软硬件协同设计方法。通过在模型性能与硬件约束(如算力、内存带宽)之间建立统一的分析框架,团队评估了海量架构配置,快速找到了精度与延迟的最优平衡点,将架构探索时间从数月缩短至数天,旨在让强大的模型能力能够高效运行在车端芯片上。
争议与思考:是技术飞跃,还是概念先行?
每一次技术跃进都伴随着讨论。MindVLA-o1所描绘的“思考”与“想象”能力,在实际道路上究竟能带来多大体验提升?其“隐世界模型”的推演是否真的可靠,是否会带来难以解释的“黑箱”决策?当系统从执行规则变为“生成式思考”,其安全边界又该如何被精确定义和保障?
另一方面,从自动驾驶到“物理世界通用智能体”的宏大叙事,是水到渠成的技术延伸,还是为资本市场讲述的新故事?其技术框架向机器人等领域的可扩展性,仍需更多跨领域的实证。
无论如何,理想汽车的此次发布,清晰地指出了智能驾驶演进的一个潜在方向:从感知-决策-执行的链条,走向融合了时空预测与多模态推理的“认知”体系。这不仅是技术的升级,更是对“智能”本质的又一次深入探索。
免责声明: 本文内容基于理想汽车于NVIDIA GTC 2026大会公开发布的信息进行梳理与解读,旨在传递行业技术动态,不构成任何形式的投资或购买建议。自动驾驶技术仍在持续发展过程中,其功能与性能应以官方最终量产发布和实际体验为准。用户在使用相关辅助驾驶功能时,务必遵守交通法规,保持注意力,随时准备接管车辆。