自动驾驶进化到今天,卷来卷去终于要迎来关键阶段——L3,也就是终于可以把辅助两个字去掉,变成自动驾驶(虽然是有条件的)了。在这个时候,各家提及的关键词,不再是多少TOPS的算力和芯片,也不再是激光雷达,而除了这些硬件在前几年早就卷到硬件过剩了,也在于越来越多用户发现软件才是目前的短板和关键。而对于华为、小鹏等高手,以及蔚来、吉利等品牌统一提到的世界模型,它到底是个什么呢?今天就用最不装X的话术,让你习得这本装X指南。
首先,过去人们对驾驶辅助能力的判断,大概分三层境界。入门级选手,就会像开头提到的那样,重点看芯片和感知硬件,甚至一度诞生了“有激光雷达必然比纯视觉好”的观点。随着认知加深,也就是当人们发现高算力的系统不一定好用,不带激光雷达的也有高手之后,又发现了“端到端”这个关键词。这个时候再进阶的话,那就是对于具体的端到端,又有VLA和世界模型两个最主要的新分支。
所以在讲世界模型之前,需要先讲清楚,为什么高算力和强感知硬件不能跟好的体验直接画等号。
做一个类比的话,强感知硬件,就相当于人的耳鼻眼等感知器官,理论上确实是器官越多、灵敏度越高,任何风吹草动就越逃不过你的感知。
可问题是,高算力却并不等于高智商,而只是解决了高智商的一部分:计算速度,真正聪明的决策,还得靠软件和算法。
如果没有强大的算法和软件,高感知+高算力依然是一个“空壳”:横穿马路的行人、纵向车道的大货车、甚至是后面速度过快的尾随车系统都看到了,但反应却会像婴儿一样“一脸懵逼”(因为看到不等于认识、认识也不等于知道如何处置,这当中差着小20年的生活常识和交通规则培训);想让它像成年人那样去减速、变道,甚至像老司机那样提前预判,还得有一套本身就适合开车,且经验丰富的算法和软件,而这才是自动驾驶系统真正的大脑。
关于寻找哪套软件更适合开车,有老司机“眼观六、耳听八、临危不乱、预判准确”的特质(而不是遇到紧急情况自乱阵脚),又如何训练驾驶经验,由于不是本篇重点,只简单聊聊两个难点。
一个是感知策略,而汽车感知的难点就在于,传感器越多看似是好事,但如何整合、统一信息却是大难题。就像在黑夜中,摄像头只能看到大灯照亮的区域,激光雷达却能感知到更远黑暗处的障碍物,这个时候一个看到了,一个没看到,到底信谁的?是激进一点先开过去再说,等摄像头激光雷达同时看到再一脚急刹?还是保守点提前减速?别说电脑,人脑都很纠结(就好比你刚拿到驾照,也一心一意开车,但又是电驴又是行人横穿马路还堵车的复杂路况,让当初的你不知所措)。
而自动驾驶的重点突破就得益于感知策略的进化,一开始只是分别单独标记,后面慢慢进展到3D鸟瞰成像,动态的、静止的、远处的、近处的各种障碍物都能准确识别出来了。决策算法也一样,一开始是程序员输入指令,车机“死记硬背”,然后引入了基于大语音模型的端到端,可以自己检索、因果关联了(如大模型发现,左转和拐大弯,匝道和减速常常成对出现,那么不需要程序员去输入死板的指令,它自己也能学会开车)。
那么VLA和世界模型又是啥呢?先讲VLA,它和普通语音大模型的区别是,语音大模型的行为模式更像是动物,以短链思维为主,执行决策的过程更像是条件反射(如宠物听到盘子响,就会来乖乖等开饭);VLA则增加了一个解释的过程,系统会把看到的路况,车辆的状况和行动规划都记录下来(语音大模型则不行,也就是可解释性差)再最终执行决策。所以相比盘子响→开饭这种简单反射,VLA可以处理更加复杂的情况(如除了盘子响,也得听到主人开罐头、撕包装的声音才决定最终行动,而不会被骗被误导),因此它也成了很多厂商选择的新方向。
可为什么更多厂商选的是世界模型呢?首先,VLA虽然解释性更强,甚至可以后续人为干预、修正决策的过程,但语言终归是一种模糊的表达,尤其对于空间和运动:左拐拐大弯,多大才叫大?匝道提前减速,具体提前多少?减到多少才是合适?所以用到其他方面,VLA很合适,但对于开车,它依然不是天选的老司机。
而世界模型,简单说就是“牛顿爱因斯坦附体”了。模拟一下它推理决策的过程,语音模型包括VLA都更像文科生,如看到无数的案例,发现了杯子+掉到地上=碎了这三个关键词之后,它也学会了;世界模型则更像理科生,它推理学习的过程不是抓这三个关键词,而是看完案例之后,还会思考掉地上是因为万有引力,碎了的结果是因为杯子脆、地板硬。也就是它不再是有样学样的思维,而是能透过本质举一反三了。体现在驾驶上,除了行动规划之外,世界模型还能推演预测障碍物的行动轨迹、寻找最有路径。
不过,必须要说的是,世界模型听起来更高大上,更接近真相本源,选择的厂家也更多,但在AI行业它跟VLA谁更好至今是一个争议巨大的话题(原因也在于世界引擎还是初级阶段,存在推理之外也爱幻想等问题)。像除了能举一反三,更聪明的思维方式也让世界模型有了会自己“幻想”的坏习惯,所以很多厂商只会在云端部署、用作训练为主。至于到底谁更好,还是那句话,用实践检验真理,让最终的体验和事实说话。

长按二维码关注汽研社
入驻平台「不止」
今日头条|搜狐|车家号|新浪|易车|网易|UC|企鹅|一点|百家
汽研社旗下媒体「还有」
球叔教你买车|SUV与越野车顾问|豪华车视界
汽车行业发展与研究|精准购车|新车点评|汽车发烧友
商务合作-微信-chemishengjing