去年7月北京那场暴雨,不少人应该还有印象。立交桥下积水不算特别深,正常开过去问题不大,但好几辆开着L2+辅助驾驶的车,到了积水区域直接弹出接管提示,系统退了。不止北京,上海、成都、广州,只要遇上极端天气,类似的抱怨隔三差五就冒出来。
这事儿往深了想,问题不在车本身硬件差,而在模型没见过这种场景。

自动驾驶的模型训练,靠的是大量真实路况数据反复喂。雷军去年在微博上说过,小米智驾预计到今年年底实际行驶里程突破1000万公里。这个数字听起来不小了,但换个角度看:广东村里突然蹿出来的小孩、成都老城区胡同里乱窜的电动车、暴雨天桥洞下半米深的积水——这些低概率场景在1000万公里里能碰上几次?有行业统计说,单个模型训练里程超过300万公里,在极端场景的识别精度上依然存在明显不足。不是车企不努力,是概率分布摆在那儿,光靠自己车队跑,周期拉得太长。
所以车企们一直在想办法拓宽数据来源。众包方案是一条路,把所有量产车日常行驶中遇到的关键场景——急刹、事故、特殊路况——通过车载通信模块传回云端,让别的车也能”学到”。思路没问题,但网络一抖,一次急刹产生的300帧数据里,关键的那50帧说没就没了。带宽和稳定性,到现在还是个实打实的瓶颈。
这时候有个事情就显得有点荒诞了。
全国到去年底,已经有超过20个城市建成或者正在建城市级智算中心。合肥、武汉、杭州,单体算力普遍超过1000PFLOPS。什么概念呢,这些算力拿来训练自动驾驶模型,绰绰有余。但有业内人士测算过,这些智算中心的平均负载率大概在三到四成之间。大量算力核耗着电、散着热,跑一些无关紧要的演示任务。
一边是车企为了训练模型到处找算力、找数据,另一边是城市花了大价钱建的智算中心吃不饱。

武汉的做法值得琢磨。作为全国首批”双智”试点城市,他那边已经改造了260公里智能网联道路,平台上接入了超过500辆自动驾驶车辆,路侧部署了1000多个RSU和3000多个传感器。到今年年底,经开区计划实现全域覆盖。这套”车城网”体系里,路侧感知数据和云端调度平台已经初步打通了。
华为和青岛港的合作走得更前面一步。港口是个封闭环境,路侧感知和本地算力直接接进调度系统,无人集卡的”云控调度”已经跑起来了。虽然港口和开放道路不是一回事,但这至少证明了一件事:让车辆模型直接从城市基础设施里学东西,技术上走得通。
从逻辑上说,如果把车载超算和城市智算网络接在一起,好处是双向的。车企能借城市路侧传感器采集的公共场景数据来补极端样本的缺口,城市智算中心的闲置算力也有了用武之地。2024年8月长三角三省一市签了协议,启动车路协同数据走廊建设,目标是让沪苏浙皖30多个高速公路服务区实现数据互通。国家发改委也发了文件,支持建设城市算力网,往这个方向在推。
不过话说回来,能不能真正打通,让人担心的地方也不少。

第一个是数据归谁的问题。车辆运行数据在”城市-车-路”之间流转,车主的隐私、车企的商业机密、城市平台的监管责任,目前没有一部法规把这些边界划清楚。第二个是车规级和非车规级硬件的安全标准不统一,ISO 26262的ASIL-D认证不是随便过的,城市智算中心的服务器和车载芯片之间怎么做功能安全隔离,还需要时间去啃。第三个更现实:大规模高清视频回传——8路以上800万像素摄像头的数据——对现网带宽的压力,5G能不能扛得住,说不定还得再等一代通信技术。
从目前的进展来看,封闭场景(港口、矿区)已经有成熟案例,半开放场景(如重庆永川和百度Apollo合作的RoboTaxi示范区)也在跑,但面向全量产车的开放道路场景,约莫还得两三年才能看到实质性的规模化落地。这中间政策、标准、商业模式哪个环节卡住了,整条链路都转不起来。
方向是清楚的,路还得一段一段修。