当前位置：首页>自动驾驶>CVPR 2026!自动驾驶相关论文清单(List 3)

CVPR 2026!自动驾驶相关论文清单(List 3)

2026-03-17 13:20:19

点击上方蓝字加入我们

✨ CVPR 自动驾驶相关论文持续更新中...

CVPR 自动驾驶相关论文清单（List 3），聚焦近期公开的优质成果。后续将持续跟进，不断更新论文列表，欢迎大家收藏、转发，一起追踪前沿技术动态～

📚 CVPR 自动驾驶论文清单（List 3）

（以下论文均为 CVPR 收录，部分暂未公开的论文将在更新时补充）

论文标题：恢复预测：可变长度轨迹预测的渐进回顾学习

核心亮点：提出渐进式回溯框架（PRF），通过级联的回溯单元逐步将不完整观测特征与完整观测特征对齐：每个回溯单元包含回溯蒸馏模块（RDM）和回溯预测模块（RPM），其中 RDM 负责蒸馏特征，RPM 则利用蒸馏后的特征恢复轨迹的历史时间步信息。此外，本文还提出滚动起始训练策略（RSTS），提升 PRF 训练过程中的数据利用效率。PRF 具备即插即用特性，可适配现有各类轨迹预测方法，在 Argoverse 2 和 Argoverse 1 数据集上的大量实验验证了其有效性。

原文链接：https://arxiv.org/abs/2603.10597

项目链接：https://github.com/zhouhao94/PRF

论文标题：HG-Lane：恶劣天气和光照条件下高保真生成车道场景，无需重新注释

核心亮点：提出HG-Lane，一款面向恶劣天气与光照条件的车道场景高保真生成框架，该框架无需重新标注即可生成对应场景的车道数据。基于此框架，作者进一步构建了包含恶劣天气和复杂光照场景的车道检测基准数据集，涵盖 30000 张图像。大量实验表明，HG-Lane 能持续且显著提升现有车道检测网络的性能：以当前最优的 CLRNet 模型为例，在该基准数据集上的整体 mF1 分数提升 20.87%；整体、正常天气、降雪、降雨、大雾、夜间、黄昏类别的 F1@50 分数分别提升 19.75%、8.63%、38.8%、14.96%、26.84%、21.5% 和 12.04%。本文已开源该框架的代码与构建的基准数据集。

原文链接：https://arxiv.org/abs/2603.10128
项目链接：https://github.com/zdc233/HG-Lane

论文标题：FoSS：通过傅里叶状态空间积分建模轨迹预测中的长程依赖关系和多模态不确定性

核心亮点：提出FoSS双分支框架，将频域推理与线性时间序列建模相统一：频域分支通过离散傅里叶变换将轨迹分解为编码全局意图的振幅分量和捕捉局部变化的相位分量，再经渐进式螺旋重排序模块保留频谱顺序；两个选择性状态空间子模块（Coarse2Fine-SSM、SpecEvolve-SSM）以 O (N) 复杂度优化频谱特征。同时，时域分支的动态选择性 SSM 以线性时间重构自注意力行为，保留长程时序上下文。跨注意力层融合时域与频域特征表示，可学习查询生成多个候选轨迹，加权融合头则表征运动不确定性。在 Argoverse 1 和 Argoverse 2 基准数据集上的实验表明，FoSS 在取得当前最优预测精度的同时，计算量降低 22.5%、参数量减少超 40%；全面的消融实验验证了各组件的必要性。

原文链接：https://arxiv.org/abs/2603.01284
项目链接：暂未公开

4. 论文标题：Dr.Occ：环景摄像头的深度和区域导引3D占用，实现自动驾驶

核心亮点：提出Dr. Occ深度与区域引导的占据预测框架：引入深度引导的 2D‑3D 视图变换器 D²‑VFormer，有效利用 MoGe‑2 的高质量稠密深度信息构建可靠几何先验，实现体素特征的精准几何对齐；同时受混合专家（MoE）启发，提出区域引导的专家变换器 R/R²‑EFormer，自适应分配区域专用专家以关注不同空间区域，有效缓解空间语义差异问题。这两个模块互补协同：深度引导保证几何对齐，区域专家增强语义学习。在 Occ3D‑nuScenes 基准上的实验表明，纯视觉条件下 Dr. Occ 相比强基线 BEVDet4D 提升 7.43% mIoU 与 3.09% IoU。
原文链接：https://arxiv.org/abs/2603.01007

项目链接：暂未公开

5. 感知近处，推理远方：自动驾驶的连贯远远轨迹预测

核心亮点：暂未公开

原文链接：暂未公开
项目链接：暂未公开

6. OpenVO：具备时间动态感知的开放世界视觉里程计

核心亮点：提出OpenVO，一种面向开放世界单目视觉里程计（VO）的时序感知新框架，可在输入条件受限的情况下，从观测频率不固定、未标定相机的行车记录仪视频中直接估计真实尺度的自车运动，从而从稀有的驾驶事件数据中稳健构建轨迹数据集。现有 VO 方法通常在固定观测频率（如 10Hz、12Hz）上训练，完全忽略时序动态信息，且大多需要相机内参已知的标定相机，在未知观测频率或未标定相机场景下性能大幅下降，严重限制了在行车记录仪轨迹提取等下游任务中的泛化能力。为解决这些问题，OpenVO 在两帧位姿回归框架中显式建模时序动态信息，并利用基础模型得到的3D 几何先验增强泛化性能。在 KITTI、nuScenes、Argoverse 2 三大自动驾驶基准上的实验表明，OpenVO 相比现有最优方法提升超过20%；在可变观测频率设置下，模型鲁棒性显著增强，各项指标误差降低46%–92%，充分证明其在真实世界三维重建与多样化下游任务中的通用性。
原文链接：https://openvo.github.io/assets/CVPR2026_OpenVO_preprint.pdf
项目链接：https://openvo.github.io/

7. 论文标题：在登记处驾车

核心亮点：本文提出DrivoR，一种简洁高效的基于 Transformer 的端到端自动驾驶架构。该方法以预训练视觉 Transformer（ViT）为基础，引入相机感知注册令牌，将多相机特征压缩为紧凑的场景表征，在不损失精度的前提下大幅降低下游计算量；这些令牌驱动两个轻量级 Transformer 解码器，分别生成候选轨迹并为其打分，其中打分解码器学习模拟 “先知” 模型，预测可解释的子分数（涵盖安全、舒适性、效率等维度），实现推理阶段的行为条件化驾驶。尽管设计极简，但 DrivoR 在 NAVSIM-v1、NAVSIM-v2 以及照片级真实感闭环 HUGSIM 基准测试中，性能均超越或持平当前主流强基线。实验结果证明，纯 Transformer 架构结合针对性的令牌压缩策略，足以实现精准、高效且自适应的端到端自动驾驶。本文将通过项目页面开源代码与模型权重。
原文链接：https://arxiv.org/abs/2601.05083
项目链接：https://github.com/valeoai/DrivoR

8. 论文标题：端到端自动驾驶的生成式场景部署

核心亮点：提出GeRo（Generative Scenario Rollouts），一款适用于 VLA 模型的即插即用框架，通过自回归 Rollout 策略，同时实现规划与基于语言的未来交通场景生成。首先，在规划、运动和语言任务监督下训练 VLA 模型，将自车与周边智能体的动态编码到隐式令牌中，支持与文本对齐的生成；随后，GeRo 执行基于语言条件的自回归生成，输入多视角图像、场景描述与自车动作问题，生成未来隐式令牌与文本响应，以支持长时域 Rollout。本文还设计了Rollout 一致性损失，利用真值或伪标签稳定预测，缓解累积漂移并保持文本 - 动作对齐。该设计使 GeRo 能够实现时序一致、语言对齐的场景推演，支持长时域推理与多智能体规划。在 Bench2Drive 上，GeRo 将驾驶分数与成功率分别提升 15.7 和 26.2；结合强化学习与生成式 Rollout 后，GeRo 在开环与闭环任务上均达到 SOTA，并具备很强的零 - shot 鲁棒性。这些结果证明，基于生成式、语言条件的推理是构建更安全、更可解释的端到端自动驾驶的重要方向。

原文链接：https://arxiv.org/abs/2601.11475

项目链接：暂未公开

9. 论文标题：RHO：基于整体式开放地理空间模型的稳健跨视图地理定位指标体系

核心亮点：构建了首个大规模地理定位基准数据集，包含 7 座城市、270 万张图像，覆盖恶劣天气、光照变化、传感器噪声等 8 种环境条件；提出Split-Undistort-Merge（SUM）模块，通过新颖的全景 BEV 投影方法有效解决全景畸变问题；设计Pin-Pan 双分支架构与 POF 算法，融合全景视图与针孔视图，联合编码空间位置与朝向信息。该方法具备极强的泛化能力，在 4 类极端天气与 3 种传感器扰动下性能稳定，可直接应用于真实自动驾驶场景。
原文链接：暂未公开
项目链接：https://github.com/AtmanDai/RHO

10. 基于深度学习的在线地图绘制的故障模式

核心亮点：基于深度学习的在线建图方法失效模式展开系统性分析与改进。此前研究已发现，自动驾驶常用数据集中训练集、验证集、测试集存在大量区域重叠，模型易记忆训练数据中的位置特定特征，导致标准划分下的评估结果失真。本文不仅对这类性能偏差进行了量化分析，还发现了第二种关键失效模式：模型会对已知地图元素的几何与拓扑结构过拟合。实验表明，该问题与位置记忆问题同等重要，在模型评估与数据集划分时必须同时考虑。在此基础上，本文提出了更真实可靠的评测基准，并设计了基于几何的相似度指标，通过训练集剪枝降低数据冗余；在仅保留 60%–80% 训练数据的情况下，部分划分下验证集性能仍获得显著提升。