昨天,科技圈炸了。
不是手机,不是汽车,而是一个叫 Xiaomi OneVL 的自动驾驶模型——小米一口气全开源了。
说实话,第一眼看到这个消息的时候,我还有点不信。毕竟自动驾驶这块,各家都捂得严严实实,生怕别人知道自己的核心技术。小米倒好,模型权重、训练代码、推理代码,一股脑全扔出来了。
雷军亲自发微博,措辞毫不谦虚:
"欢迎全球开发者、研究人员一起参与探索。"
今天咱们就来看看,这个 Xiaomi OneVL 到底是个什么东西,凭什么让雷军这么有底气。
01 从"看见"到"看懂",自动驾驶卡在哪了?
在说 OneVL 之前,得先搞清楚一个背景问题:自动驾驶现在卡在哪了?
现阶段大多数辅助驾驶系统,本质上还是在模仿——看见前车减速就减速,看见红绿灯就停车。但真正难的是推理:前方那辆公交车是不是要变道?那个骑自行车的行人下一秒会不会突然拐弯?
这种"预判"能力,靠传统的感知算法很难搞定。所以行业里出现了两条路:
- VLA(视觉-语言-动作模型):让模型像人一样理解场景,然后输出驾驶动作。能力强,但推理慢。
- 世界模型:专注预测未来的场景变化。但两条路线各干各的,没法协同。
小米 OneVL 做的第一件事,就是把这两条路合并了。
02 0.24秒的背后:不是炫技,是 real world 测试出来的
说几个硬数字:
- 相比传统 VLA 自回归推理速度:只有原来的 5.4%
- NAVSIM 基准 PDM-score:88.84,首次在潜空间推理中超越显式思维链(88.29)
- ROADWork、Impromptu、Alpamayo-R1 三项主流基准全部 SOTA
可能有人要说数字没概念。翻译一下就是:它做到了精度超越显式思维链(就是那种一步步"想"出来的推理),速度却跟"直接出答案"一样快。
这在自动驾驶场景里是什么概念呢?
车辆以 60km/h 行驶,0.24秒大概走 4米。4米的决策窗口,对于大部分日常驾驶场景来说,够了。
小米能把这个数字压到这么低,靠的是他们所谓的"潜空间推理"。简单理解就是:模型不是在脑子里一个字一个字地想"前面有车、应该刹车、刹车力度多少……",而是把这些推理压缩成高层语义,直接出结论。
就像老司机反应快,不是因为他脑子里步骤多,而是经验足,看到情况身体直接就动了。
03 三项关键技术,把"看不见的"都补上了
小米官方文档里提到了 OneVL 的三项关键技术,我挑两个普通人也能理解的说:
第一,双重监督信号。
大多数模型训练只监督"最终答案对不对"。OneVL 同时监督两件事:模型的文字推理过程和对未来画面的预测。相当于既要你会说"为什么要这样开",也要你能想象"接下来会发生什么"。
这个设计挺聪明的。文字推理保证了决策可解释——出了事你能复盘;视觉预测保证了模型真的理解物理世界的因果,而不是在背答案。
第二,压缩的是"未来视觉"而非"语言"。
这是我认为最关键的一句话。
传统方案压缩的是语言层面的推理链——就像把"思考过程"压缩。但小米发现,自动驾驶真正依赖的并不是"前方有车"这样的语义描述,而是车辆运动、道路几何、障碍物演变这些时空因果关系。
你把语言压缩得再好,也丢失了最关键的因果结构。所以 OneVL 选择压缩"对未来视觉画面的预测"。保留了真正影响驾驶结果的东西。
04 开源这件事,比技术本身更值得说说
小米这次开源的不只是模型,还有完整的训练代码和推理代码。
对于搞研究的人来说,这绝对是个好消息。之前想复现自动驾驶大模型的工作,基本不可能——论文发了,代码没有,细节藏着。而小米这次把底裤都亮出来了。
对于行业来说,VLA + 世界模型 + 潜空间推理三条路线首次被整合到一个框架里,这意味着什么?意味着后来者不用再从零摸索了,直接站在小米的肩膀上继续走。
雷军那句话确实不是客套话:"欢迎全球开发者、研究人员一起参与。"
这很不像小米过去的风格,但又很对。毕竟智能驾驶这条赛道,现在谁也跑不完整个马拉松。
05 几点思考
车端部署有了可行路径。0.24秒的延迟加上全面开源,意味着中小厂商、甚至创业公司都有机会基于此做定制化开发。自动驾驶的门槛在降低。
"可解释性"和"实时性"不再是非此即彼。之前业界总觉得你要么有个慢但靠谱的推理系统,要么有个快但像个黑盒的直接预测。OneVL 至少在技术框架上证明了这两件事可以兼得。
开源竞争正在重塑自动驾驶格局。特斯拉、小鹏、华为都在跑,但小米选择把核心技术开源。这步棋走得很有意思——与其让大家用脚投票,不如先把生态做起来。
当然,现在说这些还有点早。开源只是第一步,真正的考验是:社区用起来怎么样?在更多场景下能不能打?车端芯片能不能跑得动?
这些都要时间来回答。
但有一点可以确定:小米这次出手,说明自动驾驶的下半场,不是拼谁家 demo 更酷,而是拼谁能把技术真正落地。
最后,附上 GitHub 地址,感兴趣的可以去瞅瞅:
https://github.com/Xiaomi-OneVL[1]
你看好小米这次的开源吗?欢迎评论区聊聊。
(本文素材综合自小米技术官方发布及公开技术资料)
引用链接
[1]https://github.com/Xiaomi-OneVL