当前位置：首页>自动驾驶>让自动驾驶更懂人类司机:人工智能如何实现个性化轨迹预测?

让自动驾驶更懂人类司机:人工智能如何实现个性化轨迹预测?

2026-04-17 23:55:05

点击蓝字关注我们

摘要

自动驾驶车辆必须准确预测周围车辆的轨迹，以确保在复杂交通环境中的安全性与运行效率。然而，现有方法往往忽略了驾驶风格差异的影响，限制了其对多样化驾驶行为的建模能力。为此，本文提出了一种考虑驾驶风格的时空 Transformer（DS-STT），用于实现高精度且个性化的车辆轨迹预测。该模型基于车辆轨迹构建时空交通图（STTG），并采用基于 Transformer 的编码器，结合空间自注意力（SSA）与时间卷积（TC），以捕捉车辆之间的交互关系和时间依赖特征。此外，模型引入风格注意力模块（SAM），将驾驶风格、运动状态及交互特征进行融合，从而实现针对不同驾驶行为的自适应预测。在 HighD 和 ApolloScape 数据集上的实验结果表明，DS-STT 相较于基线模型表现出持续的性能优势：在 HighD 数据集上均方根误差RMSE）最高降低 81.58%，在 ApolloScape 数据集上最终位移误差降低 22.51%。这些结果验证了 DS-STT 在准确性、鲁棒性以及长时序预测能力方面的优越性，凸显了引入驾驶风格信息在提升自动驾驶系统安全性与可靠性方面的重要意义。

研究背景

自动驾驶作为智能交通系统中的关键技术，近年来受到学术界与工业界的广泛关注，其在提升道路安全与缓解交通拥堵方面展现出巨大潜力。作为自动驾驶系统中连接感知与决策的重要中间环节，车辆轨迹预测对于实现安全、高效的行驶决策至关重要。然而，由于真实交通环境中车辆运动受到历史状态、车间交互以及驾驶风格等多种因素的共同影响，轨迹预测问题具有高度不确定性与复杂性。现有方法在不断演进中，已从早期基于运动学与动力学的物理模型，发展到以 LSTM、GNN 以及 Transformer 为代表的深度学习方法，这些方法能够从数据中自动学习时空特征，并在一定程度上提升预测性能。其中，GNN 通过图结构建模车辆间交互关系，Transformer 依赖注意力机制捕捉长程依赖，均在轨迹预测任务中取得了显著进展。同时，一些研究也引入张量分解方法以挖掘大规模交通数据中的潜在时空结构，或结合物理约束的深度学习框架以提升预测的物理一致性与稳定性。然而，现有主流方法多基于同质行为假设，主要关注时空相关性建模，忽略了驾驶行为的个体差异性，限制了模型对复杂混合交通场景中多样化驾驶行为的刻画能力。

驾驶风格作为描述车辆在一定时间窗口内行为模式的关键因素，能够反映其与环境及其他车辆交互的方式。不同驾驶风格（如激进型与保守型）在速度、变道频率及交互策略等方面表现出显著差异，但现有大多数公开数据集缺乏明确的驾驶风格标签。为此，已有研究通过问卷调查、规则方法、模糊逻辑以及基于聚类与概率模型（如 K-means、PCA、GMM 等）的机器学习方法进行驾驶风格识别，但这些方法通常依赖特定场景，泛化能力有限，且难以刻画驾驶风格的动态变化。近年来，基于图结构与轨迹特征的学习方法为驾驶风格建模提供了新的思路，但仍存在表达灵活性不足的问题。因此，如何在轨迹预测中有效融合驾驶风格信息，并提升模型对行为异质性的建模能力，成为当前研究的重要挑战。

基于上述背景，本文提出了一种考虑驾驶风格的时空 Transformer 模型（DS-STT），用于实现个性化的车辆轨迹预测。该方法首先基于车辆轨迹构建时空交通图（STTG），以刻画车辆之间的空间关系与时间依赖；在模型结构上，引入空间自注意力（SSA）子层与时间卷积（TC）子层，用于联合建模车辆间交互关系与时序动态特征；同时，设计驾驶风格特征提取器，从图结构中挖掘驾驶行为模式；进一步地，引入风格注意力模块（Style Attention Module, SAM），用于融合驾驶风格、运动状态与交互特征，并自适应调节注意力权重，从而引导解码器生成具有个性化特征的未来轨迹。该框架在保持高效计算的同时，实现了对行为异质性与时空依赖的统一建模，从而在复杂交通场景中显著提升轨迹预测的准确性、鲁棒性与可解释性。

研究结果

1. 本文所提出的方法

本文提出的 DS-STT 方法整体结构如图1所示，围绕驾驶风格建模与时空特征融合展开，以实现复杂交通场景下的个性化轨迹预测。模型以多车辆历史轨迹为输入，通过统一的符号体系进行建模与表示，并明确了编码器、解码器以及驾驶风格特征提取模块之间的数据流关系。其中，编码器用于提取车辆间的时空相关性，解码器用于生成未来轨迹，而驾驶风格特征提取器则从交通图结构中学习驾驶行为表征，并为后续预测提供风格先验信息。

图1

在方法设计上，首先对车辆轨迹预测问题进行形式化建模，将其视为多变量时间序列预测任务，输入为历史时刻的车辆状态信息（包括位置、速度等），输出为目标车辆的未来轨迹序列。在驾驶风格建模方面，本文构建了时空交通图（STTG）来刻画多车辆之间的空间交互与时间依赖关系（见图2相关结构），其中空间边描述同一时刻车辆之间的交互关系，时间边描述同一车辆在相邻时间步之间的动态演化。基于该图结构，引入加权邻接机制以反映车辆之间交互强度，并结合图论中的度中心性与接近中心性来刻画车辆的局部交互程度与空间位置特征：度中心性用于衡量车辆与邻域车辆的连接数量，从而反映其交互活跃程度与潜在激进性；接近中心性则通过平均距离的倒数衡量车辆在交通流中的相对位置，能够反映其靠近或远离交通拥堵中心的趋势。通过对这些时序中心性特征进行建模，并结合多时间步的图结构信息，模型学习驾驶行为与图特征之间的映射关系，进而输出对应的驾驶风格类别（如激进型与保守型），并以 one-hot 向量形式进行编码，为后续模块提供风格条件输入。

图2

在轨迹编码阶段，首先通过全连接层对原始运动状态进行高维嵌入，并结合位置编码以保留轨迹的序列顺序信息。在此基础上，编码器由空间自注意力（SSA）子层与时间卷积（TC）子层构成：SSA 子层通过多头自注意力机制建模不同车辆之间的空间交互关系，实现对邻车影响的全局建模；TC 子层则进一步通过时间自注意力与时间卷积相结合的方式，捕捉车辆轨迹在时间维度上的动态依赖关系，并扩展感受野以增强对长时序信息的建模能力。通过层级化的时空特征提取，编码器能够获得兼具空间交互与时间演化信息的表示。

在轨迹解码阶段，本文设计了风格注意力模块（SAM），用于融合驾驶风格、车辆交互特征以及历史运动状态信息。该模块通过前馈神经网络生成注意力权重，并在解码过程中保持相对稳定，以表征驾驶员在观测窗口内的行为倾向，从而在时间维度上保持一致的行为影响。融合后的特征作为解码器输入，解码器由多头自注意力、带掩码的时间注意力以及前馈网络组成，其中掩码机制保证预测仅依赖于已知历史信息，从而实现自回归式生成。最终，通过线性映射与归一化操作输出未来轨迹序列。

此外，模型训练通过最小化预测轨迹与真实轨迹之间的误差来进行优化。相较于基于图神经网络的方法（依赖逐步消息传递），DS-STT 利用注意力机制实现全局交互建模与并行计算，在保证表达能力的同时提升了计算效率，使其在中等规模交通场景（如 HighD 与 ApolloScape 数据集）中具备良好的实时性与可扩展性。整体而言，该方法通过将驾驶风格建模与时空建模相结合，在统一框架下实现了对交通参与者异质行为的显式刻画，从而提升轨迹预测的精度与个性化能力。

2. 性能评估结果

本研究围绕所提出的DS-STT模型，在HighD与ApolloScape两个大规模真实数据集上开展了系统且全面的实验验证，涵盖数据集设置、评价指标、对比实验、消融分析以及定性可视化分析。实验在统一的输入条件与数据划分（训练/验证/测试为7:1:2）下进行，所有模型均不依赖高精地图、路径意图或语义标注，以确保公平性与可复现性。在数据构建方面，HighD数据集包含约11万车辆的高速公路轨迹数据（选取双向六车道场景，并将25 Hz降采样至5 Hz），而ApolloScape数据集包含约10万条城市交通轨迹，融合了摄像头与LiDAR等多源信息。针对数据集中缺乏显式驾驶风格标签的问题，本文采用基于时变交通图与中心性特征的标注方法，并结合人工注释，将驾驶行为划分为激进与保守两类，同时仅利用历史轨迹信息进行推断，以避免标签泄漏并保证标注的可靠性。

在建模层面，本文构建了基于距离倒数加权的无向时空交互图（引入距离阈值μ），并通过空间自注意力与时间卷积机制联合建模车辆间交互关系与时序依赖，同时引入驾驶风格相关的中心性特征（如度中心性与接近中心性）来刻画车辆行为的动态变化，从而在上下文感知框架下实现对驾驶风格的有效表征。该设计在不依赖显式结构信息的情况下，仍能稳定捕捉复杂交通环境中的关键交互关系。

在定量实验方面，DS-STT在HighD与ApolloScape两个数据集上均显著优于包括CV、S-LSTM、CS-LSTM、PiP、MMnTP、STDAN、GRIP++以及SOUT在内的多种基线方法。在HighD数据集上，DS-STT在不同预测时域中均表现出最低的预测误差，相较传统恒速模型CV最高可降低81.58%的RMSE，同时相较STDAN等深度学习方法亦有约13.67%的性能提升。随着预测时间延长，各模型误差整体呈上升趋势，但DS-STT增长最为平缓，体现出更强的长时预测稳定性与误差抑制能力。相关趋势在图3中得到直观展示：DS-STT的RMSE从1秒时的0.10 m缓慢增长至5秒时的1.30 m，而传统CV模型则从0.73 m急剧上升至6.68 m，表明其在长时预测中存在显著的误差累积问题。进一步从逐时域误差变化来看，DS-STT在不同预测步长下始终保持更低且更平滑的误差增长曲线。

图3

在ApolloScape数据集上，DS-STT在ADE与FDE指标上均取得最优性能，相较SOUT分别提升16.89%与22.51%，并在FDE上降低约0.5 m，显示出更优的终点预测能力与潜在安全性。同时，相较于同样基于图结构建模的GRIP++，DS-STT也实现了约16.29%的性能提升。这一结果表明，在更复杂的城市交通场景中，通过融合车辆交互信息、运动状态与驾驶风格特征，DS-STT能够更准确地建模多主体行为并实现稳健预测。相关定量对比结果可见于图4。

图4

消融实验进一步验证了各模块的有效性。具体而言，分别移除空间自注意力模块（SSA）、时间卷积模块（TC）以及风格注意力模块（SAM）后，模型性能均出现明显下降。其中，去除SSA会削弱对车辆间空间交互关系的建模能力；去除TC会降低对时间依赖的建模能力；而去除SAM则使模型无法根据不同驾驶风格自适应调整注意力分配，从而忽略个体行为差异。三者协同作用共同构成了DS-STT性能提升的关键来源。不同配置下的对比结果如Table 5与Table 6所示。此外，距离阈值μ的敏感性分析表明，该参数对模型性能具有重要影响：当μ设置为30 ft时，模型因遗漏关键邻近车辆而表现较差；当μ扩大至120 ft时，引入过多无关车辆，增加计算负担并干扰建模效果；最终选择90 ft作为在性能与效率之间的折中方案。相关实验趋势如图5和图6所示.

图5

图6

在定性分析方面，通过轨迹可视化结果（图7）可以观察到，DS-STT预测结果与真实轨迹具有高度一致性，并能够有效区分不同驾驶风格。在图中，激进驾驶车辆（红色）表现出高速行驶、频繁变道及超车等行为特征，而保守驾驶车辆（白色）则呈现出稳定车道保持、较低速度以及更短轨迹长度等特点。相比STDAN等强基线方法，DS-STT生成的轨迹更贴近真实分布，说明模型不仅能够准确进行轨迹预测，还能够学习并刻画不同驾驶风格下的行为模式。

图7

综上，DS-STT通过融合空间—时间建模与驾驶风格建模，在多数据集与多场景条件下均展现出优异的预测精度、良好的长时稳定性以及较强的泛化能力，有效缓解了轨迹预测中的误差累积问题，并验证了显式引入驾驶风格信息对于提升自动驾驶轨迹预测性能与行为理解能力的重要价值。

研究结论

本研究提出了一种显式融合驾驶风格信息的时空建模框架 DS-STT，用于提升车辆轨迹预测的准确性与个性化能力。该方法通过引入空间–时间 Transformer 结构，并结合空间自注意力（SSA）、时间卷积（TC）以及风格注意力模块（SAM），有效建模车辆之间的空间交互关系、时间依赖特征以及驾驶行为的异质性，从而在统一框架下实现对多源信息的协同表征。从理论上看，DS-STT 将驾驶风格作为潜在动态因素引入 Transformer 建模过程，拓展了传统基于注意力机制的轨迹预测范式，为个性化运动建模与交互关系学习提供了新的思路。在实际应用层面，该方法为自动驾驶与智能交通系统中的行为感知轨迹预测提供了重要支撑，可进一步服务于路径规划、碰撞规避以及协同驾驶等关键任务。

通过实验验证，DS-STT在HighD和ApolloScape 两个真实数据集上均表现出稳定且优越的性能。定量结果表明，相较于基线方法，该模型在 HighD 数据集上的均方根误差（RMSE）最高降低了 81.58%，在 ApolloScape 数据集上的最终位移误差（FDE）最高降低了 22.51%，体现出其在短期与长期预测中的显著优势。同时，结合图3–图6的可视化结果可以观察到，DS-STT 在复杂交通场景中能够更准确地贴合真实轨迹变化趋势，在多车交互、变道及加速减速等动态行为下仍保持良好的预测一致性，尤其在长时间跨度预测中有效缓解了误差累积问题，验证了其在复杂场景下的鲁棒性与泛化能力。

尽管 DS-STT 在预测精度与建模能力方面取得了显著提升，但仍存在一定局限性。一方面，基于 Transformer 的结构带来了较高的计算开销，在资源受限的嵌入式或边缘计算环境中可能面临实时性挑战；另一方面，当前驾驶风格表征主要依赖图中心性等统计特征，虽能够反映整体交互模式与交通上下文，但对细粒度、短时行为变化的刻画能力仍有提升空间。未来研究可从模型轻量化与推理效率优化入手，通过模型剪枝、知识蒸馏及轻量化注意力机制降低计算复杂度，同时结合分层建模与端–云协同架构以平衡效率与性能。此外，引入高精地图、车联网（V2X）信息以及多模态感知数据，将有助于进一步增强模型的环境感知能力与适应性，并推动 DS-STT 向多智能体协同预测与不确定性建模方向扩展，从而为更加安全、智能的自动驾驶系统提供支撑。

原文链接：

Cui Y, Wan Z, Pan M, He P, Wu D, Wang R. Incorporating Driving Style in Spatial–Temporal Transformer for vehicle trajectory prediction. Engineering Applications of Artificial Intelligence. 2026;171:114133.

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

让自动驾驶更懂人类司机:人工智能如何实现个性化轨迹预测?

最新文章

热门文章

随机文章

让自动驾驶更懂人类司机:人工智能如何实现个性化轨迹预测?

高颜值SUV只售10万多,车长4.7米方盒子,越野能力强,比汉兰达漂亮

ADS 自动驾驶系统标志灯相关要求

最新文章

热门文章

随机文章