当前位置：首页>自动驾驶>L4自动驾驶的MRM策略-最后安全底牌(上)

L4自动驾驶的MRM策略-最后安全底牌(上)

2026-06-15 13:27:34

本篇目录：

一、故障后安全脱离交通流二、L4 没有“人类兜底”的底牌三、一组“风险出口”四、高级形态：能力账本五、灰度六、MRM 决策核心：最小风险七、系统的影子八、微妙点：早准备

下篇：

九、MRM轨迹规划：“保守”但不“笨”

十、MRM控制策略：减速度不是越大越安全

十一、L4 MRM 与 MCU/SoC 的关系十二、远程协助的角色十三、MRM 验证十四、评价指标十五、工程创新方向：从规则系统走向风险操作系统十六、常见失败模式十七、推荐的 L4 MRM 框架十八、推荐的 MRM 决策流程十九、与功能安全、SOTIF 和安全案例的关系

二十、结语

自动驾驶系统里，MRM（Minimum Risk Manoeuvre，最小风险机动）常被定义为：系统出问题时自动靠边停车，但成熟的MRM应该是剩余能力组织和一整套生存策略。

一、故障后安全脱离交通流

MRM 表现为通用故障处理模块：传感器异常、定位跳变、控制故障、规划无解等问题的通用策略。服务器异常可以“挂起进程”，车辆故障时仍处于交通流中。车有质量、速度、乘客、周围交通参与者，还有法律责任，即使进入故障状态也要继续驾驶，这是 MRM 的特殊性。

MRM、MRC、Fallback 的关系

概念	工程含义	常见误解×	准确理解√
MRM	一段最小风险机动过程	刹停或靠边停车等单一动作	从当前状态走向低风险状态的一组策略、轨迹和控制动作
MRC	最小风险状态	一定是靠边停车状态	在当前故障、环境和车辆能力约束下可达的低风险稳定状态
Degraded Operation	降级运行	只是限速	在能力受损但仍可控时维持安全边界的过渡驾驶模式
Safe Stop	安全停车	车辆静止就安全	停在哪里、怎么停、意图是否可被后车识别

二、L4 没有“人类兜底”的底牌

L4在 ODD 内时乘员不需要参与驾驶，系统必须独自完成驾驶任务和fallback任务。意味着

L4 的 MRM 不能被设计成“提醒人、等人救”；
从过标角度，远程运营中心也不可靠，网络延迟、通信中断、责任边界和操作负荷会增加安全验证环节，让验证代价爆炸增长。

L4 MRM 的底层假设：

即使没有人回应、没有网络、部分传感器失效、地图不可靠，车辆仍要能进入一个可接受的低风险状态。

三、一组“风险出口”

高速主路、城市窄路、路口中央、隧道、匝道、施工区、无硬路肩道路、上下客区域，对“最小风险”的定义不同。

典型 MRM 类型对比

MRM类型	适用场景	优点	风险	工程要点
原车道直线减速停车	横纵向能力均下降、无安全换道条件	简单、可验证、控制需求低	可能阻塞车道，引发追尾	后向风险评估、双闪/制动灯策略、减速度约束
车道内安全停车	感知/规划降级但控制可用	不引入横向冲突	停车位置可能不利于救援	选择可见性更好的停止点，避免盲弯/坡顶
靠边停车 / 路肩停车	定位、感知和横向控制仍可信	对交通流干扰较小	换道/靠边过程可能引入侧向风险	可达区域检测、路肩可通行性判断、静态障碍识别
进入安全港湾	园区、Robotaxi 运营区、封闭道路	后续运营和救援友好	对地图和任务规划依赖高	预定义 MRC 点、可达性实时验证
低速驶离冲突区后停车	路口、铁路道口、施工瓶颈	避免停在最危险位置	延长故障后行驶时间	必须证明继续前行比立即停车风险更低
最小风险换道后停车	当前车道存在高追尾风险或障碍	降低后向暴露	换道本身高复杂度	仅在横向能力、感知覆盖和行为预测充足时允许
受限继续运行至服务点	冗余能力充足，风险可控	乘客体验和运营效率好	容易被滥用为“带病运行”	严格限速、限域、限时、在线健康监控

四、高级形态：能力账本

常见的MRM 触发方式是规则树：

if camera_fail or lidar_fail or localization_fail:    trigger_mrm()

这种写法在原型阶段很有吸引力，因为清晰、可调、容易解释。但规模化后会变成无法维护的蜘蛛网：每个故障都触发，每个触发都例外，每个例外都增加新规则，最后说不清系统为什么在某个路口突然停车。

更稳健的方法是建立“能力账本”，不只关心哪个模块坏了，组织整理出当前还剩下什么驾驶能力。

能力账本示意

能力维度	关键问题	可观测指标	对MRM选择的影响
感知能力	还能看清哪些方向、哪些目标类别？	传感器健康、遮挡率、检测置信度、时间同步误差	决定能否换道、靠边、穿越冲突区
定位能力	车在哪里还可靠吗？	定位协方差、地图匹配残差、GNSS/IMU一致性	决定能否依赖 HD Map 安全港湾
预测能力	周围目标未来行为是否可估计？	轨迹分歧度、交互不确定性、异常行为评分	决定是否允许复杂机动
规划能力	是否仍能生成合法、安全、可控轨迹？	规划失败率、约束冲突、候选轨迹数量	决定降级还是直接停车
控制能力	车辆能否按轨迹执行？	横纵向跟踪误差、执行器状态、制动余量	决定减速度、横向动作上限
通信能力	是否能请求远程协助？	链路质量、延迟、丢包、覆盖区域	只能影响运营策略，不应影响基础安全闭环
电源/计算能力	还能维持多久闭环？	供电状态、算力降频、热状态、看门狗	决定 MRM 时间预算

五、灰度

MRM 的状态机如果只设计成 Normal → MRM → Stop，工程上通常不够。发生问题时系统不是从健康突变至死亡，而是经历能力衰退、风险累积、可选动作逐渐变少的过程。

L4 自动驾驶的 MRM 状态机要表达的不是“系统当前在哪个模式”，而是系统对自身驾驶资格的判断过程，需要明确：

当前能力是否足以承担完整动态驾驶任务？
如果能力下降，是否还能短时间维持受限驾驶？
是否需要提前为 MRM 预留空间和时间？
是否已经进入不可逆撤离过程？
到达 MRC 后，是否允许恢复？由谁允许？依据是什么？

这使 MRM 状态机更像 ICU 监护，而不是软件异常处理。医生不会等病人心跳停止才处理，也不会因为一个指标轻微波动就推进抢救室。状态机的价值就在于把“轻微异常、风险升高、能力退化、必须撤离、兜底止损”分成不同等级，给每个等级匹配不同的行为权限。

5.1 不只切换模式，还管理行为权限

正常驾驶行为集合：跟车、换道、避让、绕行、无保护转弯、路口博弈、靠边上下客等。进入降级或 MRM 相关状态后，系统应逐步收缩行为集合。

状态	允许行为	应禁止或限制的行为	工程意义
Normal Driving	完整 ODD 内驾驶行为	无额外限制	系统具备完整 DDT 能力
Protective Driving	跟车、保持车道、温和减速、扩大车距	激进换道、抢行、贴近大车、复杂博弈	风险升高但尚未失去驾驶资格
Degraded Driving	低速行驶、保持车道、简单让行、驶向候选 MRC	无保护转弯、多车道连续变道、复杂绕行	能力受损但可短时受控运行
MRM Preparation	锁定候选停车区域、降低速度、打开提示、请求远程	继续执行原任务、进入更复杂交通区域	撤离前的准备阶段
MRM Execution	执行选定 MRM：停车、靠边、驶离冲突区	任意重新规划任务目标	已进入安全撤离走廊
Emergency Stop	以可控方式快速降低动能	横向复杂动作、依赖语义规划	当其他路径失效时止损
Minimal Risk Condition	保持停车、驻车、灯光提示、远程/救援流程	未经准入直接恢复行驶	车辆进入低风险稳定状态

关键是“行为权限收缩”。状态越靠近 MRM，允许系统做的事情越少，动作越可验证，控制越保守。MRM 状态机不是为了让车显得聪明，而是为了让车在变笨时仍然可靠。

5.2 工程例子

图里有几个关键工程细节：

Protective Driving 最容易被低估的状态。决定了 MRM 是否有空间执行。很多事故不是因为系统不会停车，而是因为系统在正常驾驶阶段开进了没有退路的位置：前方复杂、右侧不可用、后方高速逼近、车速又偏高。Protective Driving 的目的就是提前铺垫“撤离走廊”。

MRM Preparation 另一个关键状态。不应在异常瞬间就执行最终动作。合理做法是先完成候选 MRC 选择、可达性验证、后向风险评估、灯光提示、乘客提示、远程通知和控制资源预留，降低不可逆动作的失败概率。

Emergency Stop 不应当作常规 MRM。只在候选 MRC 不存在、执行路径被阻断、上层规划失效或碰撞风险快速恶化时启用。前面的风险识别和降级策略打磨的好，会避免频繁进入 Emergency Stop。

5.3 切换不只看故障码

早期系统用故障码直接驱动状态机，例如摄像头离线、定位异常、规划失败均进入 MRM。这种适合实验车阶段，不适合 L4 量产。因为同一故障在不同场景的安全含义不同。

前向摄像头短时不可用：

如果在封闭园区低速直行，激光雷达和毫米波雷达仍然稳定，可能只需要进入 Protective Driving；
如果正接近无保护路口且侧向遮挡严重，可能需要进入 MRM Preparation；

定位协方差升高：

如果在结构化高速道路上可以保持车道，风险相对可控；
如果车辆正在靠近复杂匝道分流点，风险会陡然放大。

因此，状态切换应由“故障严重度 + 场景风险 + 剩余能力 + 时间预算”等共同决定。可以理解成“驾驶资格评分”，问自己此刻还剩多少驾驶资格。模块故障只是扣分项，场景复杂度会放大扣分，冗余能力会抵消部分扣分，时间预算决定是否有机会撤离。

5.4 滞回，防止在边界状态抖动

工程上常见的一类问题是状态抖动。刚进入降级状态，指标稍恢复，系统又切回正常；几秒后指标再次波动，系统又重新降级。因此MRM 状态机必须设计滞回机制，进入和退出某状态不能使用同一阈值，也不能只看瞬时值。

机制	作用	示例
双阈值	避免指标在边界附近反复横跳	定位误差 > A 进入降级，只有 < B 才允许恢复，且 B < A
持续时间窗口	排除瞬时噪声	传感器异常持续 500 ms 才改变状态
恢复观察期	防止刚恢复就重新放权	故障消失后保持 3~10 s 保护驾驶
状态最短驻留时间	避免状态机高频切换	进入 MRM Preparation 后至少完成一次完整评估
趋势判断	识别持续恶化	指标虽未越限，但连续恶化时提前准备
场景敏感阈值	根据环境动态调整	高速、隧道、路口中触发阈值更保守

滞回机制就像水库闸门，水位超过上限开闸，但不能水位低一点就马上关闸。

5.5 “可逆”和“不可逆”

Protective Driving 和 Degraded Driving 通常可逆，只要能力恢复、风险降低，系统可回到正常驾驶。但 MRM Execution 一旦开始，往往应该被视为半不可逆甚至不可逆。

原因在于，MRM Execution 对外部交通已经释放了强烈意图：车辆减速、靠边、打双闪、可能改变车道。此时如果取消 MRM，就会被后车、旁车、乘客和远程运营误解。若MRM 进入执行阶段，除非原动作本身变得危险，否则应优先完成MRM整套动作。

状态	是否允许自动回退	回退条件
Protective Driving	允许	风险指标恢复并满足滞回时间
Degraded Driving	有条件允许	能力恢复、场景简单、未释放强MRM外部意图
MRM Preparation	有条件允许	未锁定不可逆动作，候选风险已消除
MRM Execution	原则上不建议自动回退	仅当继续执行 MRM 风险更高时重新规划
Emergency Stop	不允许回退	停稳后进入 MRC 或救援流程
Minimal Risk Condition	只能经过恢复准入	不能因为故障码消失就起步

原则：准备阶段可以犹豫，执行阶段要坚定。犹豫发生在决策前，不能发生在动作已影响交通后。

5.6 恢复准入比触发更难

“什么时候可以退出 MRM”经常被忽视。实际上，恢复准入更危险。触发 MRM 是把车辆从复杂交通中撤出，恢复则是把车辆重新放回交通，重新承担风险。

完备的恢复准入机制至少应检查：

恢复检查项	关键问题
故障是否真正消失	是根因消除，还是监控暂时未报错？
冗余是否恢复	是否仍存在单点风险？
定位是否重新收敛	地图匹配、车道级定位是否稳定？
感知是否重新稳定	目标检测、跟踪、遮挡判断是否恢复？
车辆周围是否允许起步	后方、侧方、前方是否安全？
当前停车位置是否合法可起步	是否处于路肩、非机动车道、交叉口边缘？
乘客和远程是否已知情	是否需要人工确认？
日志是否完整	是否满足安全事件记录要求？

恢复策略可以分为三类：

恢复类型	使用场景	权限
自动恢复到 Protective Driving	轻微瞬时异常，未进入 MRM Execution	系统可自主完成
自动恢复到 Degraded Driving	能力部分恢复，但不满足完整 DDT	限速、限动作、限区域
远程确认后恢复	已到达 MRC 或发生严重故障	需要运营或安全策略授权

不允许“故障码清零即恢复驾驶”，L4 需要保守的恢复过程。

5.7 状态机要与日志、安全案例绑定

MRM 状态机会是测试、事故复盘、法规沟通和安全案例的支撑。状态机需要记录每次状态切换的原因：从 Degraded Driving 进 MRM Preparation，或者为什么没有选择靠边而选择原车道停车。目标是支撑安全论证。

每次切换应记录的结构化信息：

日志字段	示例
当前状态与目标状态	Degraded Driving → MRM Preparation
触发因子	定位协方差升高、右侧可通行性不足、ODD边界接近
剩余能力快照	前向感知可用、侧后方感知置信度下降、制动可用
候选 MRM	原车道停车、靠边停车、驶离冲突区后停车
被拒绝候选及原因	靠边停车被拒绝：右侧存在临停车辆
最终选择原因	原车道减速至低风险位置，后向 TTC 满足阈值
控制约束	最大减速度、最大 jerk、灯光策略
外部通知	远程事件 ID、乘客提示、双闪状态
恢复条件	需要远程确认或故障恢复观察期

从而实现系统可学习。没有结构化日志，MRM 事件就只能靠人工看视频猜；有了结构化日志，才能统计误触发、漏触发、候选 MRC 失败原因和状态机抖动问题。

5.8 状态机安全边界：上层聪明，下层可靠

L4 MRM 状态机通常不只存在于 SoC 。SoC 可以维护复杂状态机，结合场景语义做精细化判断；MCU 或安全控制器则应维护一个简化但独立的安全状态机，用于处理 SoC 卡死、心跳丢失、通信异常、电源异常等情况。

设计关键是可靠性。SoC 状态机能够区分路口、隧道、施工区、路肩可用性；而MCU 状态机必须足够简单，能够在上层失效时完成基础制动、灯光、驻车和执行器安全控制。

5.9 典型设计陷阱

陷阱	表现	后果	修正方向
状态过少	Normal 直接跳 MRM	误触发和晚触发并存	增加保护、降级、准备状态
状态过多	十几个模式互相跳转	难以验证，边界混乱	用行为权限而非模块故障定义状态
无滞回	状态反复切换	车辆行为不稳定	双阈值、驻留时间、恢复观察期
故障码驱动	单一故障直接决定状态	缺乏场景敏感性	引入能力账本和风险上下文
执行可回退	MRM执行中随意取消	外部交通难以预测	执行阶段半不可逆
恢复过快	故障消失立即正常驾驶	二次风险高	恢复准入和远程确认
上下层耦合	SoC失效后MCU也无策略	单点失效	独立安全状态机
日志贫乏	只能看到最终状态	无法复盘和改进	记录状态切换因子和候选动作

5.10 逐渐变保守

MRM 状态机的目标不是让系统在异常时立即停车，而是让系统随能力下降逐渐变保守。轻微异常时，扩大/增加安全约束；能力下降时，缩减可选行为集合；撤离开始后，完整执行；停稳之后，谨慎恢复。

灰度机制是 L4 MRM 与简单故障停车之间的分水岭。

六、MRM决策核心：最小风险

MRM 选择可以被抽象成一个受约束优化问题，但目标函数不是“越快停车越好”。

城市路口就是典型反例，车辆进入交叉口不能立即停车；选择低速通过冲突区后靠边，虽然行驶了更长距离，却显著降低横向碰撞暴露。隧道也类似。

MRM决策代价函数的工程构成

成本项	含义	典型权重变化
碰撞风险	与车辆、行人、骑行者、静态障碍发生碰撞的概率与严重度	永远最高优先级
二次事故风险	停车后被追尾、引发绕行冲突、遮挡视线	高速、隧道、盲弯中权重上升
违法/越界风险	压线、占用公交道、进入禁行区域	可被安全目标覆盖，但不能随意忽略
可控性风险	轨迹是否可由剩余执行器稳定跟踪	执行器降级时权重急剧上升
可解释性	事后能否说明为什么这样停	量产安全闭环中非常重要
可救援性	乘客、运营、道路救援能否处理	Robotaxi / 无人物流中权重上升
交通扰动	是否造成大范围拥堵或阻塞关键节点	不应压过生命安全，但影响运营质量
乘坐舒适性	减速度、jerk、横摆角速度	在紧急状态下让位于安全，但不能完全无约束

MRM 不应是“效用最大化”问题，而应是“安全约束下的风险最小化”问题。换句话说，系统可以在多个不好选项里找相对不坏的一个，但不能为了收益选择违反硬安全边界的动作。

七、系统的影子

架构上看，MRM 不只是 planning 里的一个 fallback branch，更像是影子系统：平时不抢方向盘，但持续监控、必要时介入。

有几个工程分界非常重要：

ODD 是道路类型、天气、光照、交通密度、施工状态、法规约束、传感器可用性共同定义的运行许可。
候选 MRC 不能离线写死，预定义安全港湾很有用，但现实会有违停车辆、施工围挡、积水、锥桶、临时管制。MRC 必须在线验证可达性和占用状态。

八、微妙点：早准备

一个微妙点：准备可以早。

早准备意味着系统在风险刚升高时就降低速度、扩大车距、选择更保守车道、预留靠边空间、提高冗余计算优先级。这些动作对外看起来仍是正常驾驶，其实是在为 MRM 铺路。

层级	系统动作	触发条件	设计意图
Risk Awareness	提高风险感知频率，记录上下文	指标轻微异常或接近 ODD 边界	让系统“警觉”
Protective Driving	限速、增距、减少激进机动	风险升高但能力完整	给后续决策买时间
Degraded Driving	禁止部分动作，如换道、无保护左转	某些能力下降但仍可控	缩小行为集合
MRM Preparation	锁定候选 MRC，通知远程，准备灯光/提示	能力下降趋势不可逆或时间预算不足	为撤离做准备
MRM Execution	执行停车、靠边、驶离冲突区等动作	无法继续安全承担 DDT	实际撤离交通任务
Emergency Stop	最大限度降低能量	无可达 MRC 或风险快速恶化	兜底止损

L4自动驾驶的MRM策略-最后安全底牌(上)

本篇目录：

自动驾驶系统里，MRM（Minimum Risk Manoeuvre，最小风险机动）常被定义为：系统出问题时自动靠边停车，但成熟的MRM应该是剩余能力组织和一整套生存策略。