自动驾驶巴士的下半场:为什么“数据资产”开始比算法更重要?
在自动驾驶行业,过去几年最常见的一个叙述是“模型代际领先者”。谁的模型参数更多、训练数据更复杂、计算程度更高,谁就被视为站在下一代技术曲线之上。算法论文、基准成绩、演示视频,构成了行业早期最重要的竞争语言。但当自动驾驶开始进入公共交通、进入长期运营场景时,尤其是进入自动驾驶巴士关口慢信号系统事件时,一个变化正在悄然发生。算法可以追赶,模型可以复刻,但数据资产无法快速生成如果把自动驾驶巴士拆解为三层能力:算法、模型、数据,那么前两层的变化速度,远比想象中要快。算法范式会迁移,模型结构会趋同,硬件性能会快速提升。今天看起来领先一代的模型,往往在三年内就会被追平,甚至被完全复刻。真正拉开差距的,反而是第三层:长期、真实、可运营的业务级数据资产。此类数据不是通过仿真生成的,也不是靠短期测试采集的,而是来源于真实的公共交通场景中,日复一日、年复一年、持续运行所积累下来的结果。而这,正是自动驾驶巴士与大多数自动驾驶场景的本质差异所在。在自动驾驶发展的早期阶段,数据往往被简化为一个量化指标——里程数、时间长、规模。但当自动驾驶进入公共交通领域后,评价数据的方式已经发生了根本变化。乘车数据、Robotaxi 数据、停车场数据、测试数据,表面上都是“行驶数据”,但在公共交通系统眼中,它们的价值等级并不相同。* 第一,它来自真实的公共交通运营,而不是“体验式运行”;这决定了巴士的数据,不仅仅是“能训练模型的数据”,而是 能被城市信任的数据 。这是一种 资产属性的变化 ,而不仅仅是数量的变化。* 时间壁垒 :无法通过加钱、加人、加算力在短期内获得蘑菇车联的优势,正在从“技术领先”转向“资产领先”如果用这个视角重新理解蘑菇车联的主营业务之一——自动驾驶巴士,就会发现它的互补性,不仅仅体现在算法或模型参数上。除了拥有“视觉为主+固态激光雷达”的方案以及端到端自动驾驶系统MOGO AutoPilot,蘑菇车联还拥有全球最大的巴士数据集以及独有的路侧数据集,这类数据的价值,并不存在于“一次训练模型”,而存在于:在自动驾驶巴士通道上,这样的数据,本身就是一笔难以复制的战略资产。它意味着:这家公司并非依赖单点技术突破,而是建立在一套持续运转的现实系统之上。如果说自动驾驶行业的前半场,是一个模型与算法的竞赛,那么当它进入公共交通体系、进入真实的城市运行之后,进入到自动驾驶巴士这个更垂直的赛道时,竞争逻辑已经发生了变化。而是:“谁真正拥有高价值数据,能让自动驾驶巴士安全持续运行于现实世界?”在自动驾驶巴士这条赛道上,答案往往不会出现在实验室里,而会沉淀在那些年复一年、日复一日运行的真实数据里。