现在很多神经重建仿真系统,最高频展示的就是一段高保真视频。

道路纹理很真实,建筑阴影很自然,树木、路面、车道线、护栏和远处背景看起来都像真实采集。换一个相机视角,场景还能继续渲染。再插入几辆车、几个行人,看上去就像一个可以运行的自动驾驶仿真环境,但对自动驾驶验证来说,这远远不够。
真实道路采集数据的优势非常明确:来自真实交通环境,包含真实道路纹理、光照、遮挡、传感器噪声、交通参与者行为和复杂背景。对自动驾驶感知模型来说,真实数据长期是最可靠的基准来源。但真实数据有三个硬伤:
第一,不可控。某辆车何时变道、行人何时横穿、前车是否急刹、雨雪何时出现,测试人员无法精确控制。
第二,不可复现。即使回到同一路口,也很难再次获得完全相同的交通流、天气、光照、遮挡关系和行为触发条件。
第三,不可泛化。采集时的传感器配置是固定的。换了摄像头安装高度、鱼眼角度、激光雷达位置、毫米波雷达型号或整车外形,原始数据很难复用。
所以真实数据适合做基准和源素材,但单靠真实数据无法支撑大规模、可复现的自动驾驶验证。
传统仿真系统的优势是可控,可配置车辆、行人、天气、时间、光照、交通流、传感器和测试脚本,也可以反复运行同一测试用例。
但传统仿真的短板明显:复杂道路环境通常需要人工建模,制作周期长;真实道路纹理、阴影、材质、遮挡、雨雪反射、传感器噪声与真实数据之间存在明显域差。
因此,更合理的方向不是“真实数据替代仿真”,也不是“传统仿真替代真实数据”,而是:
用真实路采数据重建静态世界,用仿真系统控制动态世界
仿真场景重建是把一次性路采数据转化为可复用、可编辑、可测试、可闭环运行的仿真资产。
输入通常包括相机图像、激光雷达点云、毫米波雷达数据、GNSS/INS 提供的自车定位与姿态信息、传感器内外参、时间同步信息、车辆 CAN/运动学状态、HD Map 或道路语义信息,以及数据版本与场景标签。
输出通常包括静态道路环境(提供给传感器模型)、道路网格(提供给传感器和车辆模型)、语义地图(提供给决策规划算法)、可插入动态交通参与者、可配置传感器,可进行有限天气/光照编辑,可用于开环、闭环、SiL、HiL、DiL测试。

仿真场景重建系统能力可以从四个方面判定。
2.1 输入数据是否足够干净
标定、同步、曝光、白平衡、坐标系、自车位姿和多传感器一致性,决定了后续所有重建结果的上限。若前端数据质量不稳定,后端神经重建会把错误放大。
真实路采数据里,相机、激光雷达、毫米波雷达、GNSS/INS、IMU、CAN、HD Map 等数据必须在时间、空间和坐标链条上对齐。若标定错误、时间同步漂移、曝光频繁变化、白平衡不稳定、坐标系定义混乱,后端模型不会自动把这些问题修好。相反,神经重建很可能会把这些错误固化到场景中:
图像和点云错位,会导致几何监督错误;
曝光和白平衡漂移,会导致纹理闪烁;
GNSS/INS 轨迹跳变,会导致道路弯曲、场景拼接断裂。
2.2 动态物体是否被正确移除
真实路采数据中包含车辆、行人、骑行者和阴影。如果没有被正确识别、跟踪、分割和剔除,它们会被固化到静态世界里,形成残影、鬼影、漂浮物和错误遮挡。后续再插入虚拟车辆时,虚拟对象还会和这些残留对象发生视觉冲突。

2.3 重建结果是否有几何监督
很多神经重建结果可以生成漂亮图像,但自动驾驶验证还需要道路网格、车道线、路沿、可行驶区域、坡度、障碍物边界、碰撞几何边界和传感器射线几何。
1. 车道线看起来清楚,不代表它和地图一致:只有车道线在统一坐标系下与 HD Map、BEV 语义结果、人工验收结果和车辆定位轨迹保持空间一致,才说明具备测试价值。
2. 路面看起来平整,不代表它的三维表面是正确的;只有路面网格具备尺度正确、连续性合理、坡度可信、法向稳定、无明显空洞和错层,才代表它具备可用于车辆空间关系判断的道路几何。3. 建筑边缘看起来真实,不代表 LiDAR 射线求交是正确的;只有建筑、护栏、路沿、障碍物等几何表面在三维空间中具有可信位置、边界、遮挡关系和反射/命中属性,并能与真实点云或标定传感器回波对齐,才说明它具备传感器几何可信度。
所以,画面逼真不等于几何正确。真正代表几何正确的,是能否在统一坐标系下通过地图一致性、点云一致性、可行驶区域一致性、碰撞检测、射线求交。

2.4 传感、规控、交通流是否进入闭环
只能生成图像的系统,最多服务于感知回放和数据增强。能接入传感器模型、动态交通流、规划控制、车辆动力学、SiL/HiL/DiL 链路的系统,才具备完整验证价值。
神经重建仿真可以把真实路采转化为资产,但资产是否有价值还要看运行设计域(Operational Design Domain,ODD)。ODD 决定了场景重建的目标边界:系统要在哪些道路、天气、光照、交通对象、速度范围和传感器配置下运行,场景重建就必须围绕这些边界组织采集、净化、重建、编辑和验收。
ODD 定义 → 采集计划 → 场景切片 → 数据契约 → 静态/动态分离 → 重建资产输出 → 测试用例生成 → 覆盖度统计 → 回归测试
城市路口 ODD 需要覆盖红绿灯、停止线、行人横穿、非机动车混行、遮挡起步和复杂车道拓扑;高速 ODD 更关注长距离车道线、护栏、匝道、并线、远距目标和高速同步误差;停车场 ODD 则更关注低速近距障碍物、车位线、柱体、坡道、盲区和鱼眼/环视一致性。
所以采集任务要写清楚:
否则采回来的数据无法证明它对目标自动驾驶功能有验证价值。
场景切片不是按时间随便切 10 秒、20 秒,而应按 ODD 事件和验证目标切。 例如:
3.3 ODD 决定静态世界和动态世界如何划分
在神经重建里,最危险的问题之一是把不该固化的东西固化进静态背景。ODD 会直接影响同一类物体“什么时候是静态资产,什么时候不是”。
例如:
ODD 决定了静态背景的定义,不是所有“采集时存在的东西”都应该进入静态重建结果。
不同 ODD 对重建资产的精度要求不同。
例如:
3.5 ODD 决定新视角外推边界
神经重建资产不可无限外推。ODD 中的传感器安装高度、FOV、车身尺寸、车速范围和道路空间结构,会决定新视角能否可信。
例如:
重建资产入库后,不应该只统计“有多少公里”“有多少场景”,而应该统计 ODD 覆盖:
四、系统总体架构:从数据层到验证层
数据层+数据契约层 → 标注净化层 → 静态重建层 → 动态编辑层 → 传感器仿真层 → 测试验证层。
数据层不仅包含数据存储层,还是神经重建仿真系统的可信入口。神经重建系统后续产生的视觉外观、几何结构、道路语义、传感器观测和闭环测试结果,本质上都依赖这一层输入数据的完整性、一致性和可追溯性。数据层如果只保存原始传感器数据,而不记录标定、同步、坐标系、采集条件和质量状态,后续即使重建画面看起来真实,也无法判断其误差来源、适用边界和验证可信度。
对自动驾驶仿真而言,真实路采数据不是“越多越好”,而是必须满足明确的数据契约。每一段可进入重建流程的数据,都应回答几个基本问题:
传感器是否完成有效标定
时间戳是否来自统一时钟
Camera、LiDAR、Radar、GNSS/INS 和 CAN 是否在同一坐标链条下对齐
曝光和白平衡是否稳定
自车位姿是否连续
HD Map 或道路语义是否与采集轨迹处于同一空间基准
任何一个问题没有被记录和验证,都会在后续动态物体净化、点云聚合、神经重建、新视角生成和多传感器仿真中被放大。
因此,数据层应至少包含四类信息:原始传感器数据、几何与语义先验、工程元数据、管理与索引数据。其中,原始传感器数据决定系统能看到什么,几何与语义先验决定系统如何理解道路空间,工程元数据决定这些数据是否可以被正确对齐和解释,管理与索引数据决定资产是否可以被追溯、复现和用于回归测试。
数据层还必须承担质量准入功能,对于标定不稳定、时间同步异常、曝光/白平衡频繁变化、GNSS/INS 轨迹跳变、传感器丢帧严重或地图对齐误差过大的数据,应在数据层被拦截、降级或标记风险,而不是交给后续神经网络“自动修复”。神经重建模型不会消除前端数据错误,只会把这些错误转化为残影、漂浮物、纹理闪烁、道路扭曲、传感器错位和闭环异常。
工程上,数据层应输出的不只是数据文件,而是带质量状态的数据资产包。每个资产包至少应包含原始数据、标定文件、同步状态、坐标系定义、自车轨迹、地图版本、传感器配置、ODD 标签、场景标签和质量评分。只有这样,后续标注净化层、静态重建层、动态编辑层、传感器仿真层和测试验证层才能明确知道当前数据适合做什么、不适合做什么,以及最终测试结果可以追溯到哪一版输入。
数据层不仅为后续算法提供素材,而且为整个仿真验证链路提供可信边界。没有数据契约和质量闸门,后续所谓高保真重建、多传感器仿真和闭环验证都只是不可审计的结果展示。
除了生成感知训练标签,标注与净化层还要从真实路采数据中分离永久静态背景、临时静态前景和动态交通参与者。对于神经重建仿真而言,车辆、行人、骑行者及其阴影、反射和点云残留若未被正确剔除,会被错误固化为静态场景的一部分,进而造成残影、鬼影、遮挡错误和新视角渲染破碎。因此,本层需要完成目标检测、实例分割、跨传感器融合、时序跟踪、动态掩码生成、阴影检测、点云滤波和质量一致性修正等任务。
4.3 静态世界重建层
静态世界重建层应同时输出视觉资产、几何资产、语义资产、物理交互资产和空间索引资产。而神经渲染模型只解决外观与部分几何表达,不能替代道路网格、地图拓扑、碰撞体和传感器射线几何。常见技术包括NeRF、3DGS、多视图几何、点云聚合、道路网格重建、深度监督、法线监督和分块训练。
NeRF通过连续神经场表达场景,输入空间位置和视角方向,输出密度与颜色,并通过体渲染生成新视角图像。NeRF原论文将场景表示为连续5D函数,即空间位置和视角方向到体密度、视角相关辐射的映射。
3DGS则使用三维高斯表达场景,并通过可见性相关的快速渲染实现更高实时性;其核心优势是避免在空空间中做大量无效计算,并通过各向异性高斯和快速splatting支持实时渲染。
4.4 动态场景编辑层
静态世界重建解决“道路和背景在哪里”,动态场景编辑解决“交通行为怎么发生”。动态层通常包括:
4.5 传感器仿真层
对于多传感器自动驾驶系统而言,仿真平台还需要支持相机、鱼眼相机、环视相机、激光雷达、毫米波雷达、深度图、语义分割、自车运动状态以及传感器延迟、噪声、畸变等数据输出。
传感器仿真的核心不是“生成某种数据格式”,而是生成符合物理趋势、时序逻辑和跨传感器一致性的观测结果。可用于验证的传感器仿真需要同时满足成像模型合理、空间关系正确、时间延迟可控、噪声特征可信、多传感器目标一致等要求。
传感器仿真层关键内容与验证重点
传感器仿真层的工程价值,在于把神经重建得到的静态世界转化为多传感器可观测的测试环境。静态背景负责提供真实道路外观和局部几何,传感器模型负责模拟相机、LiDAR、Radar 等设备对该环境的观测结果。只有当不同传感器对同一目标、同一路沿、同一条车道线给出一致的空间和时间描述时,仿真输出才具备验证价值。
因此,传感器仿真层不能停留在“支持相机、LiDAR、Radar 输出”的功能,而应进一步验证其是否满足以下要求:
传感器仿真的目标是让被测自动驾驶系统接收到的数据在物理逻辑、时序关系和跨模态一致性上足够可信。
测试验证层是判断神经重建仿真系统是否具备工程价值的最后关口。对于自动驾驶验证而言,测试验证层必须建立覆盖几何、视觉、新视角、动态净化、传感器一致性、下游任务、闭环运行和工程吞吐的指标体系。
需要强调的是,神经重建仿真的目标不是笼统地“消除域差”,而是在限定 ODD、限定传感器配置、限定场景类型和限定验证任务下,缩小并量化真实数据与仿真数据之间的差异。脱离 ODD 和传感器配置谈高保真,属于无效表述。
测试验证层应避免两个极端:一个极端是只看视觉效果,把神经重建当作渲染展示;另一个极端是只看单项算法指标,忽略系统闭环。自动驾驶仿真的验证对象不是单个模型,而是由静态世界、动态世界、传感器模型、地图约束、场景脚本和被测系统共同构成的完整链路。
因此,测试验证应至少分为四个层级:
下游任务验证只能作为域差评估的一部分,不能单独作为场景真实性的充分证明。检测、分割、跟踪和定位模型本身也存在偏差,因此必须与几何一致性、传感器一致性、人工质检和闭环运行指标共同使用。
最终,测试验证层要回答的是:
只有这些问题都能被量化回答,神经重建仿真系统才是可进入自动驾驶研发测试流程的工程验证资产。

静态世界追求真实感,动态世界追求可控性,传感器层追求物理一致性,测试执行层追求工程闭环。
场景重建其实把感知算法中的一大部分前处理能力,重新包装成了“静态世界净化与资产生产工具”。
尤其在神经重建仿真里,感知能力不是可选项,而是前置硬门槛。标注与净化层需要做目标检测、实例分割、跨传感器融合、时序跟踪、动态掩码、阴影检测、点云滤波和质量一致性修正,目标是把永久静态背景、临时静态前景和动态交通参与者分离出来。
核心区别在这里:
所以不是“又做了一遍感知”,而更像是:
用感知算法做数据清洗,用几何算法做空间约束,用神经渲染做外观重建,用仿真引擎做动态控制。
真正的工程真相更难听一点:
以为场景重建的核心是 NeRF/3DGS,结果发现,决定仿真能不能落地的,往往不是神经渲染模型,而是前面的感知式净化、标定同步、坐标统一、动态物体剔除、点云聚合和地图对齐。
如果这些没做好,后面 3DGS 再漂亮也只是“把错误高保真地渲染出来”。
可以把场景重建链路拆成三层:
其中第一层确实高度像感知系统,而且是重建质量的前置条件。 但它不是为了“开车”,而是为了回答一个问题:
哪些东西应该固化进静态世界,哪些东西必须被删除,哪些东西应该变成可编辑的动态对象。
这也是神经重建仿真比宣传片复杂得多的地方。宣传说的是“从数据生成高保真场景”。实际工程说的是:
先用一套很重的感知/融合/几何管线,把真实世界拆干净;否则重建出来的不是场景,是污染过的历史录像。