OneVL 是小米研究院推出的自动驾驶 VLA 框架,核心创新在于双模态辅助解码器——训练时,视觉辅助解码器从隐令牌预测未来路面画面(相当于内建世界模型),语言辅助解码器重建可读的思维链文本;推理时两个解码器全部丢弃,仅凭 6 个压缩隐令牌一次并行预填充就完成决策,做到比显式思维链快 1.5~2.3 倍、精度却全面反超,是唯一在四项基准上均击败显式推理的隐式方法。#AI科技