自动驾驶圈,最近被小米"炸"了一下
最近汽车圈最热的话题不是哪款车降价,也不是哪家又搞了个发布会——而是小米悄悄丢出了一颗技术炸弹。
小米正式发布并开源了Xiaomi OneVL自动驾驶大模型。
开源这两个字,在自动驾驶圈可不是小事。你想想,这一行到底有多"藏"——特斯拉的FSD源代码?
不存在的。华为的大模型框架?
更别想了。小鹏的端到端方案?保密协议摞保密协议。
结果小米直接说:全套权重、训练代码、推理代码,全部免费开放,全球车企、科研机构、科技公司随便用。
这操作,多少有点"我不仅打赢了,还把武器配方公开了"的味道。
先搞清楚:OneVL到底解决了什么问题?
很多朋友可能觉得"VLA""世界模型""潜空间推理"这些词听起来像天书。别慌,咱们说人话。
自动驾驶要"聪明",本质上要解决三件事:
- • 看懂眼前的路(场景理解,输出驾驶动作)——这是VLA干的活
- • 预测接下来会发生什么(未来场景推演)——这是世界模型干的活
- • 在脑子里先"演练"一遍再做决策(潜空间推理)——这是推理模块干的活
问题来了——业内之前从没有人把这三件事统一到一个框架里做过。
大家要么各自为战,要么打补丁式地拼凑。就像三个部门各写各的报告,最后汇总的时候逻辑对不上,效率低、还容易出bug。
OneVL是业内第一个把三条技术路线统一到同一框架的模型。 通过"潜空间推理"作为核心连接器,让三者真正融合,而不是表面上的堆叠。
这个"首次",含金量很高。
测试成绩说话:4项评测,全部SOTA
光说架构先进没用,得看成绩。
OneVL参加了自动驾驶领域三项最具代表性的基准测试:
ROADWork——专门测道路施工区的应对能力。施工区是自动驾驶的噩梦,锥桶乱放、临时标线、工人走位飘忽,很多车在这里直接"懵掉"。OneVL:SOTA(超过所有已公开模型)。
Impromptu——极端非标路况测试,专门刁难你:没有路标、路面破损、非常规交叉口……OneVL:SOTA。
Alpamayo-R1——这个最硬核,考的是因果推理加上闭环安全评测,简单说就是"你做的决策,在真实闭环环境里会不会出事"。OneVL:依然SOTA。
另外在NAVSIM这个综合排行榜上,OneVL同样位列顶尖梯队。
更关键的是:精度超过了"显式思维链"方案,速度又对齐了"只给答案"的极速方案。 又快又准,鱼和熊掌都拿到了。
跟同行比一比,差距在哪里?
不妨直接摊开来聊:
小鹏的纯VLA端到端——技术路线相对单一,场景理解能力强,但世界模型和推理融合不够深。
华为的大模型+规则混合——鲁棒性不错,但"规则"这个东西本质上是人工经验的堆砌,在极端长尾场景下容易翻车,而且可解释性差、迭代慢。
特斯拉的纯端到端纯视觉——FSD的能力大家有目共睹,但它依赖海量美国路况数据,本土化适配一直是软肋,而且技术黑盒,出了事你都不知道模型为啥这么决策。
OneVL的优势恰恰就在这几个点上:技术统一度更高、全链路架构更完整、决策过程可解释(语言+视觉双维度)、多模态适配能力强、本土化场景数据更贴合中国路况。
可解释性这个点值得单独说一下——它不只是技术指标,更是监管和商业落地的必要条件。 你的车做了一个急刹车,能告诉监管机构"因为前方识别到一个横穿道路的行人",和只能说"模型觉得该刹",这两个差别是天壤之别。
开源,是大格局也是真策略
有人会问:小米凭什么免费开源?这不是把自己的核心竞争力拱手相让?
其实这个逻辑反过来想更清楚——
当你的技术足够领先,开源本身就是一种降维打击。 全行业都来用你的框架,就意味着全行业都在帮你完善生态、反哺数据、验证模型。你还占据了标准制定者的位置。
当年安卓开源,谷歌没有"亏"——它拿到的是整个移动互联网时代的入场券。
小米的算盘也在这里:用OneVL建立自动驾驶领域的"技术信任感",让全行业认同这套框架,然后在软硬件生态、数据飞轮、品牌溢价上收割长期红利。
这不是做慈善,这是在下一盘很大的棋。
写在最后
说实话,两年前谁会想到,在自动驾驶这件事上,小米会走到华为、特斯拉前面去开源?
技术的边界,正在被一个又一个"不可能"打破。
对消费者来说,这是好事——竞争越激烈,安全越有保障,落地越快,咱们坐上真正聪明的车,就越近。
给大家两个问题,欢迎评论区聊:
👇 你觉得小米OneVL开源,是真心推动行业进步,还是另有商业算盘?
👇 如果自动驾驶技术成熟了,你愿意完全放手让车自己开吗?