首先,是规模。一辆 L4 级自动驾驶测试车,每天产生的原始数据量可达 2-4 TB。其中,摄像头图像、激光雷达点云、毫米波雷达信号、高精地图矢量、车辆 CAN 总线数据……每一种模态都需要经过标注处理,才能被算法"消化"。
其次,是精度。自动驾驶的决策链路遵循"感知-预测-规划-控制"的严格逻辑。感知层的一个标注错误,可能在规划层被指数级放大,最终表现为一次急刹、一次误判,甚至一次事故。
再次,是迭代速度。自动驾驶算法以周为单位迭代,每一次迭代都需要新的标注数据集来验证和训练。标注产能,直接决定了算法迭代的"天花板"。