点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
点击进入—>【顶会/顶刊】投稿交流群
添加微信号:CVer2233,小助手拉你进群!
扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用!发论文/搞科研/涨薪,强烈推荐!

转载自:视觉语言导航
✨导读:高精地图造价高昂、更新繁琐,一直是自动驾驶规模化落地的拦路虎。澳门大学联合千里科技提出DriveVLN全新任务,依托视觉+自然语言实现无地图自动驾驶导航,在CARLA搭建200个实景仿真场景,首创规划+大模型选择双分支架构,经过监督+强化混合训练,车库泊车实测表现碾压GPT-5、Qwen等主流多模态大模型。

当下自动驾驶商业化落地进入瓶颈期,核心桎梏集中在高精地图依赖与传统VLN无法适配行车场景两大难题:
基于以上现实痛点,研究团队开创性提出DriveVLN:车辆不加载任何预存地图,仅通过车载摄像头视觉画面+用户简短目的地描述,自主识别路标、地面标线、建筑物等环境线索完成全流程导航。

团队自研Topo2Sim自动化数据生成管线,从数学任务定义、场景构建、数据增强、指标设计全流程搭建标准化评测基准,兼顾自动驾驶安全属性与VLN导航属性。
把车辆无地图语言导航转化为标准POMDP数学问题:
基准独创自动驾驶安全指标+VLN导航精度指标双维度评价规则,既考核车辆会不会剐蹭、路线是否平顺,又衡量能否精准抵达目标点位。

整套模型由轨迹规划模块、多模态导航选择器两大组件构成,搭配「监督微调+强化学习调优」分阶段训练,分工明确、落地友好。
输入车载RGB图像+激光雷达点云数据,采用锚定高斯分布采样+去噪逻辑,一次性生成多条符合交规、物理可行的候选轨迹,筛选Top-K条作为备选路径池;每条轨迹预设未来4秒行驶路线,包含8个路径关键点。
重点:该模块生成轨迹不参考目的地信息,只保证路线能正常开,选路决策全权交给下游大模型。
将每条候选轨迹用不同颜色标注并叠加在前视摄像头原图上,把「带彩色候选路径的图片+目的地文字指令」输入微调后的VLM; 模型固定输出格式:是否抵达目的地;最优路径对应颜色,同时缓存历史图像与过往决策,依靠时序记忆辅助十字路口、岔路口的路线选择。
设计局部安全奖励+全局路径奖励复合回报函数,采用GRPO分组策略优化大模型选择逻辑:
:选中轨迹和真实最优轨迹的重合匹配度,数值越高路线越平顺;
=碰撞标识,发生碰撞则、安全奖励直接归零,倒逼模型规避剐蹭。
=路口分支选择正确率、=行驶道路与最优路线重合占比、=成功抵达目的地额外奖励。
总收益融合:,搭配KL散度约束防止模型训练发散,最终依靠GRPO优势函数更新大模型参数。
实验分为仿真基准测评、真实车场落地测评、消融对照实验三大部分,硬件环境:8张NVIDIA A800显卡完成全量训练。
采用自研综合驾驶分数(值域0~1,分数越高性能越强):

👉亮点:DriveVLN综合得分断层领先,碰撞率与轨迹误差全模型最优;受无地图任务本身难度限制,全方案到达成功率不足50%,仍是后续优化方向。

在真实园区实测目的地识别与路径选择,车位到达识别准确率高达98.61% ,反观Qwen2.5-VL-72B车位识别准确率仅1.34%;整体目的地检出准确率91.40%,大幅超越GPT-5(81.89%)、Seed-1.6(56.15%),完美解决商用自动泊车无图落地难题。

本文系学术转载,如有侵权,请联系CVer小助手删文
在CVer公众号后台回复:何恺明,即可下载566页课件PPT!大家赶紧学起来! CVPR 2026 所有论文和代码下载 在CVer公众号后台回复:CVPR2026,即可下载CVPR 2026 所有论文和代码!
CV垂直方向和论文投稿交流群成立
扫描下方二维码,或者添加微信号:CVer2233,即可添加CVer小助手微信,便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者论文投稿+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer2233,进交流群
CVer计算机视觉(知识星球)人数破万!如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料,一定要扫描下方二维码,加入CVer知识星球!最强助力你的科研和工作!
▲扫码加入星球学习
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看