在近期举办的中国电动汽车百人会论坛上,自动驾驶领域的讨论呈现出一种耐人寻味的分裂感。一方面,头部自动驾驶公司的高管们不约而同地抛出了要转向“物理AI”的观点,声称只有拥有海量驾驶数据的自动驾驶企业才能真正做好物理AI;另一方面,L3级自动驾驶的落地呼声再次高涨,被视为通往L4/L5的必经之路。
然而,拨开这些行业大佬宏大叙事的迷雾,站在行业观察者的角度,我们不得不发问:这些观点真是技术演进的必然趋势,还是企业为了生存下去的营销策略?对于大多数身处局中的从业者和吃瓜群众而言,理解这些观点背后的逻辑,比盲目相信更为重要。
物理AI:自动驾驶的技术革命还是营销话术?
“自动驾驶公司必须转身做物理AI,其他行业没有足够的数据。”这一论断在论坛上掷地有声。
从技术层面看,所谓的“物理AI”,即能够理解、推理并与物理世界互动的人工智能,确实是下一代人工智能的核心。自动驾驶作为物理世界中最复杂的交互场景之一,天然拥有海量的多模态数据。据统计,特斯拉仅通过其车队就积累了超过几百亿英里的真实路况数据,而Waymo的实际Robotaxi运营里程突破了2亿英里,仿真里程据说已突破200亿英里。
然而,因此就将“物理AI”视为自动驾驶公司的专属领地,实则是一种危险的傲慢。事实上,自动驾驶本身只是物理AI的一种应用形式,从传统的计算机视觉、规控算法到如今的端到端神经网络,自动驾驶从未脱离过对物理世界的建模。
所谓的“大模型公司降维打击”论,更像是一种制造焦虑的营销手段。如果数据中心可以搬上车,大模型公司或许可以降维打击,但实际车端可用芯片算力等资源是及其受限的,这本身就是自动驾驶行业的一个产业门槛,当年小模型走过的路,大模型来了以后一样要走一遍。现在数据中心普遍适用英伟达的GPU,但车端最先进的也就是英伟达的Drive Thor芯片,最大算力也就是1000tops,相比较数据中心的算力,九牛一毛而已。
更值得警惕的是,部分企业将“物理AI”作为一个新瓶装旧酒的营销概念。当自动驾驶研发遇到瓶颈,换一个“物理AI”的标签,既能向投资人讲述新的增长故事,又能在资本市场上争取更多的资源倾斜。这种做法掩盖了一个事实:物理AI的门槛不仅在于数据,更在于对物理规律的深刻理解和工程化落地能力。
L3的悖论:必经之路还是营销陷阱?
与“物理AI”的喧嚣并行的,是对L3级自动驾驶的推崇。“L3是实现L4/L5的必经阶段”这一观点,在业内争论了近十年,却依然充满逻辑漏洞。
作为一名从业人员,我对L3分级存在价值持深度怀疑态度。SAE分级标准中,L3的定义是“有条件自动驾驶”,核心痛点在于“人机共驾”时的责任边界模糊。当系统请求接管时,人类驾驶员往往因为注意力分散无法及时响应,这导致了巨大的安全隐患。
并且由于L3的系统设计对于车端系统安全的极致追求,会极大牺牲驾驶效率,影响乘坐体验。
奔驰的Drive Pilot系统是全球首个获批的L3级系统,但其运行条件极为苛刻:仅限于高速公路、车流密集时、时速不超过60km/h。这种“带着镣铐跳舞”的体验,注定了L3在商业上的尴尬——成本高昂(激光雷达、高算力芯片),但用户体验却因频繁的接管请求而大打折扣。
另外就是更深层“先有鸡还是先有蛋”的数据困境。要实现L3,需要真实的海量的长尾场景数据;但L3的车辆因为体验不佳,难以大规模普及,也就无法产生足够的数据。这导致许多曾经高调宣布进军L3的车企,如今都在“悄咪咪地后退”,转而深耕L2++的体验优化或者重点布局L4业务。
相比之下,我认为终极自动驾驶的形态是L42C(L4级面向消费者),而L5级自动驾驶的在商业上几乎没有意义。L5强调在任何场景下的全自动驾驶,但这忽略了车辆本身的用途属性。如果一辆车本身就不会去任何的ODD,为什么要装一套纳豆能去的自动驾驶系统。而更有甚者,说自动驾驶带去无人区探险,更像是物质过剩后的荒诞调侃,而非真实的市场需求。
L42C的核心定义是:消费者自己车,在用户输入目的地后,全程无需介入,车辆安全舒适地将乘客送达,应用场景越大体验越好。
要实现这一目标,结合当前产业资源,我认为主要存在两条路径:
1.路径一:L2++ > L3(高速) > L3(城市) > L42C。逻辑是通过逐步释放功能,积累数据和算法能力。但如前所述,L3阶段的“人机共驾”是最大的拦路虎,用户行为的不可控性(如开车睡觉、玩手机)让车企背负了巨大的法律和安全风险。
2.路径二:L2++ > L42B(Robotaxi) > L42C。这条路的代表是Waymo、百度Apollo以及特斯拉等部分新势力。逻辑是先在封闭或半封闭区域(ODD约束内)实现完全无人驾驶(L42B),通过运营数据反哺技术,待技术,成本和法规成熟后,再扩展到私人用车市场(L42C)。
从现实可行性来看,第二条路径显然更具优势。Robotaxi作为一种服务,其运行环境相对可控(固定区域、统一管理、远程协助),能够更快地实现数据闭环和商业变现。Waymo在旧金山的日均订单量已突破10万单,百度Apollo在武汉的全无人驾驶订单量也在持续攀升,这些数据证明了L42B模式的生命力。而并且特斯拉也在积极推动前装量产车的逻辑去跑L4robotaxi,如果能快速上量,也将会是robotaxi领域的一大颠覆。
这里笔者认为第一条路径中的L3urban,会因为高昂的成本和糟糕的体验,逐渐被边缘化为一个“过渡性的伪命题”,要把L3Urban做好的难度会比L42B还要高。
结语:回归工程本质
百人论坛上的观点碰撞,折射出的是自动驾驶行业在经历发展瓶颈后的焦虑与迷茫。
对于行业而言,与其纠结于概念的包装和分级的争论,不如回归工程本质。无论是做Robotaxi还是做私家车,核心都在于能否在限定的成本内,提供超越人类驾驶的安全性和舒适性。
终极的自动驾驶,不需要L5的全能幻想,也不需要L3的模糊地带,它需要的是L42C那种“从A点到B点,把时间还给乘客”的坚定承诺。而通往这一终点的捷径,或许并不在于铺天盖地的L3宣传,而在于Robotaxi车轮下的每一公里真实路测,以及对物理世界更深刻的AI建模。
当潮水退去,我们终将发现,那些踏实做数据、做工程、做运营的企业,才是穿越周期的真正赢家。而那些只会制造新概念、在L3泥潭里打转的玩家,终将被时间证明只是过客。