✨ CVPR 自动驾驶相关论文持续更新中...
CVPR 自动驾驶相关论文清单(List 3),聚焦近期公开的优质成果。后续将持续跟进,不断更新论文列表,欢迎大家收藏、转发,一起追踪前沿技术动态~
📚 CVPR 自动驾驶论文清单(List 3)
(以下论文均为 CVPR 收录,部分暂未公开的论文将在更新时补充)
核心亮点:提出渐进式回溯框架(PRF),通过级联的回溯单元逐步将不完整观测特征与完整观测特征对齐:每个回溯单元包含回溯蒸馏模块(RDM)和回溯预测模块(RPM),其中 RDM 负责蒸馏特征,RPM 则利用蒸馏后的特征恢复轨迹的历史时间步信息。此外,本文还提出滚动起始训练策略(RSTS),提升 PRF 训练过程中的数据利用效率。PRF 具备即插即用特性,可适配现有各类轨迹预测方法,在 Argoverse 2 和 Argoverse 1 数据集上的大量实验验证了其有效性。
原文链接:https://arxiv.org/abs/2603.10597
项目链接:https://github.com/zhouhao94/PRF
核心亮点:提出HG-Lane,一款面向恶劣天气与光照条件的车道场景高保真生成框架,该框架无需重新标注即可生成对应场景的车道数据。基于此框架,作者进一步构建了包含恶劣天气和复杂光照场景的车道检测基准数据集,涵盖 30000 张图像。大量实验表明,HG-Lane 能持续且显著提升现有车道检测网络的性能:以当前最优的 CLRNet 模型为例,在该基准数据集上的整体 mF1 分数提升 20.87%;整体、正常天气、降雪、降雨、大雾、夜间、黄昏类别的 F1@50 分数分别提升 19.75%、8.63%、38.8%、14.96%、26.84%、21.5% 和 12.04%。本文已开源该框架的代码与构建的基准数据集。
原文链接:https://arxiv.org/abs/2603.10128
项目链接:https://github.com/zdc233/HG-Lane
核心亮点:提出FoSS双分支框架,将频域推理与线性时间序列建模相统一:频域分支通过离散傅里叶变换将轨迹分解为编码全局意图的振幅分量和捕捉局部变化的相位分量,再经渐进式螺旋重排序模块保留频谱顺序;两个选择性状态空间子模块(Coarse2Fine-SSM、SpecEvolve-SSM)以 O (N) 复杂度优化频谱特征。同时,时域分支的动态选择性 SSM 以线性时间重构自注意力行为,保留长程时序上下文。跨注意力层融合时域与频域特征表示,可学习查询生成多个候选轨迹,加权融合头则表征运动不确定性。在 Argoverse 1 和 Argoverse 2 基准数据集上的实验表明,FoSS 在取得当前最优预测精度的同时,计算量降低 22.5%、参数量减少超 40%;全面的消融实验验证了各组件的必要性。
原文链接:https://arxiv.org/abs/2603.01284
项目链接:暂未公开
4. 论文标题:Dr.Occ:环景摄像头的深度和区域导引3D占用,实现自动驾驶
核心亮点:提出Dr. Occ深度与区域引导的占据预测框架:引入深度引导的 2D‑3D 视图变换器 D²‑VFormer,有效利用 MoGe‑2 的高质量稠密深度信息构建可靠几何先验,实现体素特征的精准几何对齐;同时受混合专家(MoE)启发,提出区域引导的专家变换器 R/R²‑EFormer,自适应分配区域专用专家以关注不同空间区域,有效缓解空间语义差异问题。这两个模块互补协同:深度引导保证几何对齐,区域专家增强语义学习。在 Occ3D‑nuScenes 基准上的实验表明,纯视觉条件下 Dr. Occ 相比强基线 BEVDet4D 提升 7.43% mIoU 与 3.09% IoU。
原文链接:https://arxiv.org/abs/2603.01007
项目链接:暂未公开
5. 感知近处,推理远方:自动驾驶的连贯远远轨迹预测
核心亮点:暂未公开
原文链接:暂未公开
本清单将持续更新,补充更多 CVPR 自动驾驶相关论文;
若有遗漏的优质论文、论文链接更新、代码开源等信息,欢迎在评论区留言补充;
关注公众号,第一时间获取后续论文清单更新通知,追踪 CVPR 自动驾驶前沿动态。
转发给身边做自动驾驶、计算机视觉的朋友,一起学习进步~
另外,欢迎各位小伙伴补充遗漏的CVPR自动驾驶相关论文,一起完善这份清单,共同学习前沿技术~

END
CVPR 2026!自动驾驶相关论文清单(List 2)| 持续更新中
CVPR 2026放榜!自动驾驶相关论文清单(List 1)| 持续更新中
730 万条驾驶交互数据!同济打造自动驾驶 VLA 模型专属增强数据集,破解复杂路况推理难题
[T-ASE] 时空有向图赋能自动驾驶:实现混行交通下智能协商决策
东南 SG-CADVLM:上下文感知解码赋能,让自动驾驶危情模拟更真实
[ ICRA 2026 ] 车辆感知加持,3D 行人姿态预测新成果
ScenePilot:3847 小时跨 63 国驾驶数据,打造自动驾驶 VLMs 评估新标杆
清华 & 现代汽车 音频-情绪-视觉协同:EchoVLA 的多模态 CoT 推理与自动驾驶优化
浙大 & 港大 AutoDriDM: 给自动驾驶 “AI 大脑” 做决策考试,VLMs 的能力边界被说透了!
【TR-C】南理工 & 华科:博弈 + 稀疏性双 buff!自动驾驶极端场景生成算法,精准戳破算法漏洞
复旦 & 理想 & 同济等 SGDrive: 用场景 - 智能体 - 目标三层认知,让 AI 像老司机一样思考
慕尼黑工业提出:聊天控车的LLM 驱动框架,让自动驾驶语音指令精准落地!
CAR 实验室 & 特华拉 DAVOS:毫秒级响应 + 隐私防护双 buff,让自动驾驶又快又安全
清华 & 港中文 & 滴滴 ColaVLA:用 latent 推理 + 并行解码实现高效安全驾驶
西交 & 南理工 HOCD:融合司机意图与状态的协作驾驶方案,冲突率大降 2.4+
华科 & 小米 DriveLaw:让自动驾驶兼具场景想象力与行驶稳定性
港理工 UrbanV2X 多传感器车路协同数据集:3 大场景、含 7 类车载 + 3 类路侧设备,破解城市峡谷自动驾驶定位难题

分享

收藏

点赞

在看