#智能驾驶未来趋势 #自动驾驶技术解析 #学术论文解读 #科研成果分享 #科技爱好者必读
双语阅读:http://StudyAi.com/xueshu/paper/detail/5025329262
AI科学家:http://StudyAi.com
[AAAI-2025] 源码:https://github.com/Cedarch/M3Net
自动驾驶的感知系统通常需要处理多个不同的子任务。然而,当前算法通常分别处理单个子任务,这在旨在获得全面感知结果时会导致效率低下。一些多任务学习方法试图用一个模型统一多个任务,但并未解决多任务学习中的冲突。在本文中,我们介绍了M3Net,这是一个新颖的多模态和多任务网络,它同时处理检测、分割和3D占用预测,在自动驾驶方面实现了比单一任务模型更优越的性能。M3Net通过查询标记交互以多模态数据作为输入,并通过多个任务。为了增强多模态特征在多任务学习中的整合,我们首先提出了模态自适应特征集成(MAFI)模块,它使单模态特征能够分别预测其高性能任务的通道注意力权重。基于集成特征,我们随后开发了特定于任务的查询初始化策略,以满足检测/分割和3D占用预测的需求。利用正确初始化的查询,共享解码器逐层转换查询和BEV特征,从而促进多任务学习。此外,我们在解码器中提出了任务导向的通道缩放(TCS)模块,以缓解优化不同任务之间的冲突。此外,我们提出的多任务查询和TCS模块支持基于Transformer的解码器和基于Mamba的解码器,证明了其在不同架构中的灵活性。M3Net在nuScenes基准测试上实现了最先进的多任务学习性能。