当前位置：首页>自动驾驶>AWDYOLO:提升恶劣天气下自动驾驶感知的可靠性

AWDYOLO:提升恶劣天气下自动驾驶感知的可靠性

2026-03-21 01:39:34

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12769660/pdf/41598_2025_Article_29575.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

自动驾驶车辆的感知系统对其安全性至关重要。然而，雨、沙尘暴、雾霾等恶劣天气会显著降低感知系统的可靠性，遮挡关键细节并导致目标检测失效。

PART/1

概述

针对上述问题，本文提出一种基于YOLOv8n的恶劣天气双骨干YOLO（AWD-YOLO）模型。核心创新点包括分层特征融合策略与快速局部区域自注意力（FLRSA）模块。分层特征融合策略采用双骨干网络，分别从原始图像与预处理图像中提取互补特征；通过浅层拼接、双特征尺度增强（DFSE）模块与双坐标通道注意力（DCA）模块对特征进行融合，以保留细节并增强语义信息。FLRSA模块专为高效捕捉关键局部特征而设计。此外，模型引入专用的小目标检测头与Wise-IoUv3损失函数，以提升定位精度。大量实验表明：AWD-YOLO在DAWN数据集上取得67.7%的mAP@0.5与40.8%的mAP@0.5:0.9，较YOLOv8n分别提升15.4%与8.1%；在RTTS与ACDC数据集上同样表现出强鲁棒性，mAP@0.5分别优于YOLOv8n6.9%与12.5%。上述结果证明，AWD-YOLO在提升恶劣天气下自动驾驶感知系统可靠性方面具有显著潜力。

PART/2

背景

近年来，基于深度学习的计算机视觉技术为自动驾驶感知系统的研发做出了重要贡献。然而，雾、雪、雨等恶劣天气会造成图像细节丢失、纹理特征改变、远处目标消失，进而降低传感器性能，增加系统的风险与复杂度。

因此，在复杂多变的天气条件下高效检测行人、车辆等交通目标，对自动驾驶及高级驾驶辅助系统（ADAS）的感知与决策过程至关重要。尽管研究者已大量致力于提升恶劣天气下交通目标检测的精度与速度，但该领域仍存在诸多显著挑战。

恶劣天气下的小目标检测相比晴朗天气下的常规目标检测具有固有难点。受尺度限制，小目标在深度神经网络的反复卷积与池化过程中会出现严重的特征衰减，甚至判别信息完全丢失。尤其在雾天、雨天环境中，天气相关信息与目标相互作用导致图像质量下降，使得小目标检测区域内的细节纹理信息不足。目标像素面积的减小会进一步加剧小目标细节提取的困难，从而显著降低检测算法的效果。

传统目标检测方法难以快速、准确地检测低质量目标，而图像增强、复原与去雾技术能够提升目标视觉质量，增强检测算法的有效性。面向天气的图像增强可恢复模糊目标的细节信息，提取被误检目标的潜在特征，从而提升模型在恶劣天气场景下的鲁棒性。

现代目标检测算法分为单阶段检测器（如YOLO系列、SSD、RetinaNet）和两阶段检测器（如RCNN系列），后者精度更高，但通常会牺牲训练效率与推理速度。具有强大特征学习能力的深度学习方法能够有效融合多尺度特征，捕获丰富的语义信息与上下文依赖。然而，基础深度学习模型在精确检测类似背景的小目标时仍面临困难。

恶劣天气及相关因素（如雾）对目标检测精度与速度的显著影响，加之周围环境的复杂性，使得实现鲁棒、可靠的自动驾驶感知极具挑战。因此，研究能够在多种恶劣天气下保持精确与鲁棒性能的多尺度目标检测算法变得愈发重要。

本研究主要贡献如下：

(1)为解决恶劣天气导致的特征退化与噪声干扰问题，本研究提出一种新型恶劣天气双骨干YOLO（AWD-YOLO）。其双骨干架构同时并行处理两路输入：原始图像与预处理图像。保留原始图像以维护预处理过程中可能丢失的关键纹理与边缘细节，而预处理图像则用于提取更具鲁棒性的高层语义特征。此外，在P2层（如图1所示）增设专用检测头，以解决被噪声淹没的小目标问题。这缓解了深层网络固有的信息丢失问题，并提升了对小目标的感知能力。

(2)本研究提出一种分层特征融合策略，以有效融合双骨干特征。该策略将融合过程划分为浅层融合与深层融合。浅层融合采用特征拼接方式，以保留来自两个骨干网络的高分辨率空间信息。在深层网络中，引入双特征尺度增强（DFSE）模块与双坐标通道注意力（DCA）模块以获取丰富的语义信息。DFSE通过跨尺度交互增强特征判别性，而DCA则在空间与通道维度施加协同注意力，使模型能够动态聚焦于信息量最大的特征图。通过利用双骨干架构的互补特征，该策略显著提升了检测鲁棒性。

(3)为进一步捕获目标的局部上下文关系，本研究提出一种基于部分卷积的快速局部区域自注意力（FLRSA）模块。FLRSA创新性地将自注意力机制与局部区域感知相结合。通过在图像块间交互，并利用重叠区域增强特征关联性，使模型能够动态聚焦于关键局部区域。值得注意的是，部分卷积（PConv）的引入使模型仅更新有效像素区域，优化了有效信息的利用，尤其在恶劣天气条件下效果显著。

PART/3

新算法框架解析

AWD-YOLO

针对恶劣天气下目标检测的挑战，本研究提出一种基于YOLOv8n的新型AWD-YOLO网络。其架构由双骨干（Dual-Backbone）、颈部（Neck）和检测头（Head）三部分组成，如图1所示。

双骨干采用双分支结构：以预处理增强图像作为主分支输入，原始图像作为辅助分支输入。该结构旨在利用增强图像减轻恶劣天气带来的噪声干扰，并通过原始图像补偿图像处理流程中丢失的细节信息。通过信息提取的相互强化，两个分支使模型即便在恶劣天气下也能实现精准的目标检测与分类。

此外，考虑到浅层与深层网络特征的差异，本研究提出一种分层融合策略以整合不同网络层级的特征，进一步增强模型的特征提取能力，从而实现鲁棒的多尺度目标检测。颈部保留了YOLOv8的原始结构。在检测头部分为浅层特征增设小目标检测头，为模型提供更丰富的细节信息，尤其适用于道路上的远距离小目标。

分层特征融合策略

在双分支YOLO架构中，本研究开发了一种新型分层融合策略，专门用于实现鲁棒的多尺度目标检测。该策略基于浅层与深层特征的互补特性，采用差异化融合机制，以充分利用预处理输入的增强特征与原始输入的细节特征。

特征的语义与空间特性随网络深度而变化，这反映了不同层级特征图分辨率与语义内容的变化。然而，单一融合策略无法同时适配目标随尺度变化的特性。为解决这些局限，本研究引入一种依赖尺度的分层融合策略。该策略结合双分支结构、改进的特征利用方法与注意力机制，充分挖掘预处理输入与原始输入中的目标特征信息，实现双特征的有效融合与增强。

-在P2与P3层通过拼接实现轻量化融合，以保留小目标的高分辨率空间细节。

-在P4层采用设计的双特征尺度增强（DFSE）模块，增强目标特征并平衡语义与空间信息，充分利用其中等语义含量与部分全局上下文信息。

-在P5层（语义信息丰富但空间分辨率较低）应用设计的双坐标通道注意力（DCA）模块进行特征融合，以强化语义与全局上下文。

双特征尺度增强（DFSE）

DFSE的整体结构如图2所示，其设计灵感源于FEM。DFSE采用多分支卷积结构提取多维判别性语义信息，提升特征丰富度。

每个分支首先通过1×1卷积调整通道数：

-分支1引入残差结构，建立恒等映射以保留初始特征中的关键低频信息。

-分支2采用5×5标准卷积，实现局部-全局特征的密集采样。

-分支3混合多尺度卷积核（3×1、1×3、3×3），通过水平-垂直可分离卷积提升边缘敏感度，并通过空洞卷积实现稀疏采样以保留上下文信息。

将分支2与分支3的输出拼接后，通过1×1卷积进行融合，再与分支1的输出拼接，实现多尺度感受野协同，平衡语义与空间信息。

双坐标通道注意力模块（DCA）

DCA的设计灵感源于坐标注意力（CoordinateAttention），其整体结构（如图3所示）包含水平与垂直两个分支。

该模块融合多维空间信息，采用高效通道注意力（ECA）进行通道特征优化，并自适应调整注意力权重，以凸显不同主骨干网络的优势。具体流程如下：

输入特征图F1和F2分别沿水平与垂直方向进行全局平均池化，生成感知方向的特征图，以捕捉空间依赖关系。将两个方向的池化结果对应拼接，形成聚合特征FH与FV，随后通过ECA模块进行跨骨干通道交互，生成方向感知注意力特征图FVW。

快速局部区域自注意力（FLRSA）

传统SPPF通过级联多个5×5最大池化层构建空间金字塔，以获取具有静态感受野的多尺度特征。然而，池化层对局部极值的关注牺牲了全局语义关联性。对于承载强语义信息的深层特征而言，连续池化会丢失空间细节，且无法建模全局依赖关系。为解决这些局限，本文基于LRSA开发了快速局部区域自注意力（FLRSA）模块，其结构如图4所示。

该模块采用基于重叠块的特征图分解技术，在平衡注意力机制计算可行性的同时，保留了块间空间连贯性。通过计算块内成对注意力，这种局部操作能有效捕获长程依赖关系，从而模拟全局感受野。FLRSA将重叠块与多头自注意力相结合以增强特征交互，使网络能在不同位置和尺度上分配不同权重，进而实现更优的全局与局部特征捕获，并加深对目标与环境间关系的理解。

Wise-IoU

YOLOv8n默认使用CIoU作为边界框回归（BBR）损失，兼顾了预测框与真实框之间的形状和位置差异。然而，仅考虑长宽比差异会导致惩罚项精度不足。因此，研究者相继提出SIoU、EIoU、Focal‑EIoU及MPDIoU等损失函数，以获得更有效的梯度信号与精准的目标定位。

这类研究大多基于检测目标为高质量样本的前提，专注于提升边界框回归的拟合能力。但恶劣天气场景下的数据不可避免地包含低质量样本，此时距离、长宽比、角度等几何因素会对低质量样本产生过度惩罚。基于低质量样本强化边界框回归会显著降低模型的定位能力。

为解决这一问题，本文引入Wise‑IoUv3。该损失函数根据异常值程度动态评估锚框质量，生成非静态的自适应梯度增益分配策略。该策略既能降低低质量样本带来的欺骗性梯度，也能减弱高质量锚框的竞争优势，使模型更关注中等质量锚框。

PART/4

新算法框架解析

数据预处理

恶劣天气条件（雾、雨、雪、沙尘）通过直接物理机制显著降低相机采集清晰世界图像的性能。雾天条件下，有限的大气能见度会降低图像清晰度并造成特定遮挡。雨/雪天会导致图像畸变、模糊或遮挡。沙尘天则因高密度空气悬浮颗粒，造成颗粒遮挡和色度畸变。

预处理过程根据不同天气类型分别实现，如图6所示。针对雾天和雪天，采用暗通道先验算法进行去雾；针对雪天，引入基于平均图像亮度的自适应伽马校正策略，以增强低对比度区域的细节。对于雨天，通过结构相似性指数（SSIM）确定图像质量，SSIM＞0.8的类雨图像采用去雾方法处理。

对比度受限自适应直方图均衡化（CLAHE）在YUV色彩空间中实现，结合中值滤波与锐化处理，用以增强局部对比度和边缘特征。通过融合全局直方图均衡化与伽马校正等方法，整体对比度以及沙尘和雨天图像中暗部细节的可见性得到了提升。

基于DAWN的预处理消融实验

为验证图像预处理的必要性，本研究在DAWN数据集上开展了对比研究。

如图7所示，仅使用预处理图像进行训练相比使用未处理图像，能将大多数模型的mAP@0.5提升0.4至3.3个百分点。这证实了本研究的预处理方法能有效提升图像质量，并增强检测性能。然而，某些预处理技术可能导致原始图像特征丢失，这表明单纯依赖原始图像或预处理图像均非最优。

鉴于原始图像与预处理图像的互补特性，本研究设计了双骨干架构，以在恶劣天气下最大化检测精度。该架构并行处理两种输入，从而发挥各自的优势。

测试结果可视化

为进一步分析模型检测性能，本研究将AWD-YOLO四个检测头的特征图与同网络深度的基线YOLOv8n进行对比。

如图11所示，该对比完整呈现了从原始输入到中间层特征，再到最终检测结果的可视化链条。特征图颜色代表激活强度，黄色表示最强激活，更强激活意味着对模型决策更重要的特征。与基线相比，AWD-YOLO的特征图展现出更清晰的层级化特征表示与激活区域。这表明双骨干网络的分层融合策略在恶劣天气下有效缓解了噪声干扰，同时保留了丰富细节，增强了小目标检测能力。从特征图可见，检测头0和检测头1主要负责检测小目标：新检测头0的特征激活区域集中且边界清晰，维持了高分辨率与丰富细节特征，体现了其在小目标定位上的精度；检测头2和检测头3则更关注中大型目标。相比之下，基线模型的激活分布较为分散，表明其难以抑制噪声、对重要特征关注不足，易导致误检或漏检。

热力图用于可视化模型在复杂天气检测过程中对不同目标区域的注意力，进一步揭示模型的工作原理。

图12展示了不同模型检测头前集成C2f层的热力图，以评估恶劣天气下道路目标检测任务的性能差异。YOLOv8n的热力图显示，其在车辆检测时更关注大目标，对小目标重视不足，这表明尽管YOLOv8n能在检测时同步整合全局与局部信息，但其在雨、雾、沙尘等恶劣天气下对小目标及被遮挡目标的检测率仍稍显不足。相比之下，AWD-YOLO在各类恶劣天气下对小目标区域的关注度均有所提升，这种注意力增强使AWD-YOLO能更准确地识别与定位不同尺度的目标，尤其是小型车辆与行人，从而提升模型整体检测性能。

图13对比了AWD-YOLO与基线YOLOv8n的检测结果，用红色框标注了AWD-YOLO显著优于YOLOv8n的区域。结果表明，AWD-YOLO检测率更高，尤其在远距离小目标检测方面表现突出。相反，基线模型在多个场景中存在大量漏检：第二列雨天场景下，左车道所有车辆均未被检测到；第一列雾天场景下，还出现了将卡车误检为汽车等误检情况。尽管面临这些挑战性天气条件，AWD-YOLO仍保持了较高的检测精度与稳定性。

失败案例分析

图14展示了AWD-YOLO与真实标签、基线YOLOv8n的失败案例对比。AWD-YOLO存在重复检测与漏检目标的情况，表明模型在极端遮挡或极小尺度目标场景中仍面临挑战，这也是未来改进的关键方向。但与基线模型相比，AWD-YOLO的一大显著优势是能有效抑制误检（如首行所示）。我们认为YOLOv8n的误检源于其单骨干结构对低质量图像的脆弱性，易导致对背景噪声的误判；而AWD-YOLO的双骨干架构通过融合增强特征与真实背景纹理，有效缓解了这一问题。