5月13日,小米技术正式发布自动驾驶模型XiaomiOneVL,同时对外全面开源。
今年3月,小米推出XLA认知大模型架构,让品牌辅助驾驶技术告别单纯的感知模仿模式,正式具备场景理解与自主推理能力。
此次上新的XiaomiOneVL,是基于XLA架构升级而来的一步式潜空间语言视觉推理框架。这款模型整合VLA、世界模型、潜空间推理三类主流技术,把多种技术思路融为一体,让大模型推理兼顾速度与准确率。
实际使用中,它的精准表现胜过传统显式思维链,运行速度也和直接输出结果的预测方式持平,最短推理延迟仅有0.24秒,用时不足传统VLA自回归推理的一成,完全能够满足量产车辆车载端实时运行的使用要求。
小米选择将该模型全面开源,希望汇聚全球行业开发者的力量,共同推动自动驾驶技术落地实用,打造更稳定、更易拓展的行业发展新格局。