摘要: 针对当前混合交通环境下网联自动驾驶汽车专用车道(Connected and Automated Vehicle Lane, CAVL)部署适应性差、宏微观决策割裂与实时响应能力不足等问题,本文提出一种融合渗流理论与多智能体深度强化学习的动态宏微观协同控制(Dynamic Macro-Micro Collaborative Deployment, DMMCD)方法。宏观层面,基于路网实时交通流状态动态更新渗流阈值,聚合高渗透率路段形成CAVL骨干网络,确保混行路网拓扑结构的连通性;微观层面,构建基于多智能体深度Q网络(Multi-AgentDeepQ-Network, MADQN)的分布式训练框架,通过多目标奖励机制优化车道级CAVL部署策略。渗流层通过动作空间宏观骨架强约束,使宏观策略直接引导微观决策;微观层依托端到端模型,实现对实时交通流的动态响应;车道级交通状态再反馈至宏观层,驱动骨干网络迭代更新,实现宏微观决策的耦合联动。最后,基于7×7的双向4车道拓扑路网进行仿真验证。结果表明:在CAV渗透率为0.1~0.9范围内,本文方法平均出行时间较分层人工蜂群算法与无专用车道方案分别降低6.77%和28.15%,平均行驶速度提升9.18%和23.94%,系统CO2排放量降低11.35%以上;当CAV渗透率超过0.5时,本文方法优势进一步扩大,出行时间降幅可达31.12%以上。此外,本文智能体单次策略生成时间仅0.12ms,能够满足实时CAVL管控需求。相关成果能够为城市路网环境下的CAVL动态部署提供理论指导。
关键词: 智能交通; 专用车道部署; 多智能体强化学习; 网联自动驾驶; 车路协同
原载: 交通运输系统工程与信息, 2026, 26(2): 125-136
全文: 请扫描下方二维码获取全文PDF