图7. (a) 场景1:道路一侧有多辆货车停放. (b) 场景2:公交站有一辆公交车停放. (c) 场景3:由于静止(左)和移动(右)条件下货车的阻挡,导致道路交叉口能见度受限. (d) 场景4:一个具有无限循环道路结构的具有挑战性的道路,道路中有很多盲区,在这些盲区中,多名行人会在被遮挡的位置反复横穿马路,同时还有几辆车突然出现在这些盲区中
场景1:特征是路边停放了两辆卡车,因车辆后方存在盲区而产生潜在危险。当自动驾驶汽车(AV)接近时,原本被遮挡的障碍物正准备从第二辆卡车后方出现,引发重大安全隐患。场景2:描绘了一个公交车站,有一辆静止的公交车,这是一种典型且潜在危险的情况。当AV接近时,被遮挡的障碍物即将从公交车后方的盲区横穿马路,进一步放大了场景的固有风险。场景3:考虑了一个无信号灯控制的交叉口,一辆预设的障碍车辆从盲区出现,被一辆卡车遮挡,对AV构成潜在威胁。为了展示所提方法在处理静态和动态遮挡方面的通用性,我们在卡车处于静止和运动两种状态下进行了仿真。在这些场景中,AV的任务是从盲区前方的固定起始位置出发,穿越遮挡区域,并到达指定终点。
根据文献[54],我们旨在尽可能最大化场景的危急性(criticality)。如图8所示,我们针对包括行人、骑行者和汽车在内的多种障碍物类型进行了实验。纵向距离(PHO与盲区角点之间的距离)在一般情况下统一设置为2米,或者在有结构化道路和人行横道几何信息可用时基于中心线计算。我们使用碰撞时间(TTC)作为场景构建的标准。我们监测AV的速度,并在预计AV在0.5秒内到达潜在碰撞区时触发被遮挡障碍物从盲区的切入动作。具体而言,计算平均速度,以确保障碍物也在0.5秒内到达碰撞区,即TTC为0.5。通过调整被遮挡障碍物的初始位置与潜在碰撞区之间的距离,我们确保行人、骑行者和汽车的分别约为 2m/s、5m/s 和 10m/s,这些对于各类障碍物而言都是相对较高的速度,对AV构成了安全威胁。此外,为了增加实验的不确定性和真实感,我们从分布中采样被遮挡障碍物的时变纵向速度,并从中采样添加到动态障碍物初始横向位置的噪声。这引入了潜在碰撞区内交互位置的随机性。
图8. 危急情况设置示例
此外,为了评估所提方法在更复杂交通情况下的整体性能,我们采用了场景4——一条无限循环道路,其中包含由其他车辆或建筑物造成的众多感知盲区。在其中几个盲区,行人反复横穿马路,而车辆则从遮挡区域突然出现。这种循环设置确保了场景的随机性和多样性,移动障碍物可能作为感知障碍物(PO)或幽灵障碍物(PHO)出现,两者都对AV构成了重大的安全挑战。
为了评估所提遮挡感知轨迹规划方法的有效性,我们使用 Simulink、CarSim 和 PreScan 进行了联合仿真。为了平衡实时计算性能和轨迹规划的有效性,我们分别选择60米和6秒作为路径和速度规划的最大纵向规划距离和最大规划时间。表I提供了仿真中使用的其他一些关键参数概览。
表Ⅰ轨迹规划中采用的关键参数
A. 横向偏离与风险因子的影响
我们首先进行实验以评估在三个不同场景中不同程度横向偏移的影响。值得注意的是,实验设置排除了被遮挡障碍物,以消除由障碍物不可预测性引起的随机干扰。实验结果如图9所示。
图9. 在不同风险因素和横移偏差程度下比较轨迹和车速:(a)轨迹,(b)车速
首先,较高的风险因子会导致更保守的轨迹规划结果。这一观察表明,提高风险因子会导致在穿越盲区时与潜在被遮挡障碍物保持更大的距离,且从减速到加速的速度决策转变发生得更晚。此外,研究结果强调,在穿越盲区时引入明智的横向偏离(相较于无横向偏移的情况),有助于促进从减速让行到优先通过的速度决策转变,从而显著提高交通效率。
在场景1中,引入了一个被遮挡的行人,并保持风险因子。为了彻底评估横向偏离对避撞的影响,我们在两种条件下(有和无横向偏离)进行了一系列实验(200次试验)。这些实验的主要目的是检查在AV首次感知到原本被遮挡的行人时,AV与行人之间的距离。统计结果如图10所示。分析揭示了一个显著的模式:横向偏离显著增加了AV首次检测到被遮挡行人的距离。从实践角度来看,这种增加的距离转化为扩大的反应空间和为AV及障碍物采取必要预防措施的额外时间。这一延长的反应窗口通过允许采取更主动的安全措施和更平滑的避让动作,有效地降低了碰撞概率。这些发现强调了将横向偏离策略纳入遮挡感知规划框架的重要性,因为它显著增强了AV安全导航涉及不可预测障碍物环境的能力。
图10. 在有无侧偏条件下,场景1的统计实验结果
B. 利用量化风险约束解决死锁
为了验证量化风险约束在克服死锁(deadlock)情况方面的有效性,我们进行了以下对比实验。这些测试旨在全面评估当AV接近潜在冻结状态(freezing state)时不同方法的轨迹规划性能。为此,我们选择了两种成熟的方法进行测试:GO-POMDP[22]和基于集合的方法(set-based method)[14],这两种方法在此背景下具有代表性。此外,我们在两种配置下测试了所提出的方法——一种使用硬约束,另一种使用量化风险约束。实验在场景1和场景2中进行。为了隔离盲区处理对算法性能的影响,我们暂时移除了所有移动障碍物,仅保留造成盲区的静态障碍物。这种设置允许重点评估每种方法在存在遮挡时防止死锁并确保平滑轨迹规划的能力。
如图11所示,GO-POMDP方法由于其基于采样的特性,在接近盲区时表现出明显的停车行为。虽然这确保了避免死锁,但交通效率较低。此外,规划结果的离散性导致最终控制输出出现明显的波动,损害了驾驶舒适性。另一方面,基于集合的方法表现出高度保守的策略,特别是在我们构建的具有挑战性的盲区场景中。当障碍物较大且完全阻挡感知时,基于集合的方法倾向于做出最保守的假设,这限制了可行区域,最终导致死锁,AV完全停止。
图11. 在场景1和2的模拟中,分别在两个不同时刻得到的ST投影图象说明了引入量化风险约束可以建立一个向上的可行隧道,从而有效地解决死锁情况。(a)情形1,(b)情形2
对于所提出的方法,我们在两个场景的关键时刻(图11中的A和B时刻)捕获ST投影快照来说明结果。由于考虑了PHO的不确定性,PHO在ST投影中扩大了其占据空间,挤压了可行的凸空间。这种效应在场景1中尤为明显,连续的盲区导致了连续PHO的假设。在刚性(硬)约束下,这些保守假设迫使ST投影中的速度曲线穿过下方区域,最终导致死锁和车辆停止运动。相比之下,在量化风险约束下,速度曲线在某些极端情况下会在ST投影中主动开辟凸空间,在风险极小的情况下保持前进,如场景1中的时刻A所示。即使在更具挑战性的条件下,如场景2中的时刻A(由于上方缺乏凸空间,速度曲线被迫规划通过下方区域),量化风险约束也允许速度曲线保持其斜率,继续前进并探索盲区信息以避免死锁。总体而言,与其他方法相比,所提方法生成的速度曲线实现了最高的交通效率。
C. 通用性与安全性
1)典型场景评估
为了验证所提方法的通用性和安全性,我们在四个构建的场景中进行了多次实验。这些实验包含了所有必要的场景元素,特别是盲区内预设的被遮挡障碍物。如前所述,这些障碍物以相对较高的速度移动并带有波动以确保随机性,如果不采取预防措施,它们将导致与AV发生碰撞。用于比较的基准方法是EM规划器[13](不考虑动态障碍物或PHOs的不确定性)。此外,我们将所提方法与 GO-POMDP 和基于集合的方法进行了比较。为了确保比较更全面,我们增强了原始的基于集合的方法[14],集成了文献[20]中提出的基于加速度的占用建模,使其能够考虑被遮挡障碍物的运动不确定性。具体而言,我们采用了行人、骑行者和汽车的初始速度为2m/s,5m/s和10m/s,并将最大加速度设置为。为了表示横向位置不确定性,我们在障碍物的初始横向位置增加了一个范围采样的随机偏移。
我们在场景1、2和3中进行了多次测试。重点关注AV速度受遮挡影响直至完全感知盲区内状况的时间间隔。我们在通过时间和碰撞率方面进行了对比分析。在场景1和2中,为了评估所提方法对不同类型障碍物的适应性,我们测试了各种动态障碍物类别,具体为被遮挡的行人和被遮挡的骑行者。此外,为了展示该方法在涉及连续被遮挡障碍物场景中的适用性,我们在三个场景中设置了两个障碍物依次进入潜在碰撞区的情况。如图13所示,在场景1和2中,这两个障碍物类型不同(行人和骑行者),进入顺序随机。第一个障碍物的TTC为0.5,而第二个障碍物晚1秒进入区域。同时,为了展示所提方法在静态和动态场景中的通用性,我们在场景3中进行了仿真,其中卡车是动态移动的。在此设置中,卡车在路口左转,阻挡了AV对被遮挡车辆的感知,如图7(c)所示。每种实验设置都进行了200次试验以确保鲁棒性。
实验结果如图12和表II所示。对于基准方法,由于缺乏对盲区内潜在危险的考虑以及缺乏对被遮挡障碍物的避撞措施,导致碰撞案例数量显著较高。此外,不同试验中的通过时间变化很大,显示出性能的不一致和缺乏鲁棒性。
图12. 三个场景下盲区穿越的平均时间消耗柱状图
图13. 包含多个遮挡物的测试场景
表Ⅱ不同场景与方法下的碰撞率(%)
相比之下,GO-POMDP方法结合了观测和采样过程,总体通过时间较长。虽然与基准相比碰撞率显著降低(考虑了盲区内潜在障碍物的安全性),但由于过度依赖采样过程,碰撞率仍然相对较高。许多碰撞发生在方法盲目相信采样结果(即盲区内无障碍物)而撞上突然出现的障碍物时。这一结果强调了维持遮挡区域内存在PHOs假设以增强安全性的必要性。另一方面,基于集合的方法有效地将碰撞率降低到了极低水平。然而,这种安全性的提升是以牺牲交通效率为代价的。具体而言,基于集合的方法经常导致死锁情况,尽管实际路径是安全可通行的,但由于过度保守的风险估计,自车无法前进。这一问题在涉及遮挡的场景中尤为突出。我们的实验表明,基于集合的方法在场景1、场景2和静态场景3中的总体死锁率分别为93.0%、87.0%和83.5%(在动态场景3中,随着卡车移动盲区消失,避免了死锁)。此外,它导致了所有测试场景中最长的平均耗时。如此高的死锁率和延长的导航时间对于旨在实现现实世界安全高效导航的自动驾驶汽车来说是不可接受的。
对比之下,所提方法在所有评估场景中实现了 0% 的死锁率,展现了高效率和安全性,且通行时间具有竞争力。值得注意的是,所提方法在几个场景中的通过时间与基准方法相似,甚至更好。此外,所提方法始终保持极低的碰撞概率,有效地平衡了安全与性能。该方法还表现出对包括行人、骑行者和车辆在内的多种障碍物类型以及从静态到动态环境变化的卓越适应性和鲁棒性。即使在涉及连续被遮挡的多个障碍物的高度复杂情况下,所提方法仍能可靠运行,展现出相较于其他方法在效率和安全性方面的显著优势。此外,所提方法的计算效率值得注意,所有测试试验中每次规划迭代的平均计算时间仅比基准增加了6.8%。这些结果强调了该方法处理带有遮挡的复杂交通场景的能力,确保即使在挑战性条件下也能实现平滑安全的导航。
2)综合场景测试
为了评估所提算法在连续场景中的综合性能和可扩展性,我们使用构建的场景4进行了广泛测试。实验设计为无限里程测试,AV在循环道路上连续行驶,直到发生碰撞或陷入死锁,仿真结束。所有动态障碍物(包括PO和被遮挡障碍物)在预定路径上往返移动,给场景引入了巨大的不确定性。此设置专门设计用于评估算法在高度复杂场景中管理直接风险和潜在风险的整体性能。
除了无限里程测试外,还进行了固定时间仿真测试,以进一步分析算法的可扩展性和鲁棒性。在此实验中,AV运行固定的三分钟仿真时长,记录每次试验的最大行驶距离和平均碰撞次数。这提供了关于算法维持长期安全高效导航能力的额外见解。为了确保结果的可靠性,每种方法在两种实验设置下均进行了200次测试。在每次试验中,AV从预定起点静止出发,加速至8 m/s的目标速度。实验结果如表III所示,清楚地表明所提方法在无限里程和固定时间测试的各项性能指标上均显著优于其他方法。基准方法在固定时间测试中实现了最高的行驶距离,但由于无法安全处理复杂的遮挡场景,碰撞率很高。GO-POMDP方法在距离和安全性之间取得了平衡,但在两个指标上均不如所提方法。基于集合的方法虽然实现了最低的碰撞率,但由于频繁陷入死锁,未能展现出可扩展性和效率。所提方法在无限里程测试中实现了最高的平均行驶距离,并保持了最长的平均模拟时间(156.4秒),表明其在避免碰撞和死锁方面的卓越能力。在固定时间测试中,所提方法展现了安全与效率之间的出色平衡。
表Ⅲ 无限里程测试与固定时长测试下的性能评估
所提方法展示了其有效处理复杂遮挡环境和挑战性场景的能力。它实现了最佳的整体性能,显著减少了碰撞,实现了高效导航,并对潜在风险进行了鲁棒处理,使其成为现实世界场景中自动驾驶高度可靠且可扩展的方法。