自动驾驶,十年前还是相对小众的玩意儿,那时候这个名词对于大部分人来说还很新鲜。现如今,武汉有了“萝卜快跑”,滴滴也可以打到自动驾驶出租车,小马智行开始提供自动驾驶出行服务。不同级别自动驾驶(当前目前官方语境下还只能叫做辅助驾驶,主要是L2或者L2++)从实验室里的研究对象、大企业前瞻研发项目,开始走进人类生活,越来越多不同价格区间的乘用车甚至商用车开始拥有辅助驾驶能力。这里有一个背景,自动驾驶是分级的,中国汽车工程学会(及其制定的国家标准GB/T 40429-2021《汽车驾驶自动化分级》)将自动驾驶分成了五个等级,该标准的分级和国际自动机工程师学会(SAE)的分级基本一致。0级:除了AEB在紧急情况下帮你刹车避险,你就理解为啥自动功能都没有。纯人工操作。1级:只有车道保持功能,或者车道偏离预警告诉你开车开得稳点儿,别偏出车道了。方向盘还是牢牢握在人类手中的。2级:车辆开始可以控方向盘了,比如有时候变个道啊什么的,但是人类驾驶员可不能放松,因为虽然他在自己开,但是出了事,还是算人类驾驶员的。3级:分水岭来了。你叫的自动驾驶出租车算是这类,也就是说【在特定的条件下,开车这件事你可以完全交给汽车了】,但是你不能下车或者跑到其他地方去,车辆提示你接管的时候你要在规定的时间内接管。4级:在特定划定的区域内,车辆可以完全自动驾驶,甚至只能自动驾驶,人类已经完全无需干预。5级:终极形态,汽车人完全体。任何时间、任何地点,不管什么天气情况,车辆都可以自己开,只要它机械结构没有因为遭到破坏而无法运转。感兴趣可以去bilibili上看看特斯拉的自动驾驶系统在北美的表现。简单说就是,辅助驾驶阶段(L3以下)机器代替人类开车,人类的角色是“监工”;L3及L3以上,机器全权代劳,雇了一个机器人司机专门为自己服务。大聪明可能就要说了,“这有什么呀,我有钱,我可以雇一个司机,况且,开车多有意思,我喜欢开车”。个人爱好,不做评价,但是对于汽车产业来说,可能就是另一个故事了。自动驾驶其实是具身机器人的一种,是物理世界的AI,只不过是以汽车的形态出现的,其内核或者说灵魂依然是物理AI(有别于纯粹的大语言模型这种数字AI)。L5级自动驾驶的实现意味着物理AI的大规模产业落地,AI不再是只能在数字世界中生存的缸中之脑,必然同步出现的是人形机器人、四足机器狗等具身机器人开始拥有真正意义上自主生存能力。宇宙探索,一些基本的任务的完成、火星基地建设,不用人类宇航员,机器宇航员就能全部完成。一百多年前,福特T型车还没有问世之时,汽车还只是少数人的玩具,甚至是奢侈品,远远没有像今天这样走入千家万户,满大街都是。如果你去看19世纪末20世纪初,1900年左右的汽车,其样貌更多的看起来像马车,而非今天大众心目中汽车的形象。下图是参与1894年“巴黎—鲁昂赛”的标致3型车。是不是像马车没有马?而下面这张图,是福特1908-1921年量产的“T型车”,从此汽车开始走入大众市场,普通人也可以买的起,开的了汽车了。对比自动驾驶的发展,从十年前的鲜为人知,到今天L2级自动驾驶已经逐步成为多数中高端电动乘用车的基本功能之一,不管是标配还是选配。我自己的车也具备LCC车道保持功能,拥堵的时候还是很能帮我忙的。今天空中密布的航线上穿梭的航班✈️,在100年前可是极其危险的新鲜玩意,飞两架可能就要掉下来一架。直到1920年代,无线电导航、全金属机身和更可靠的活塞发动机出现,飞行才从“勇敢者的游戏”变成“概率可控的交通工具”。从100年到10年,信息时代,科技的迭代步伐更快了。2019年之前的自动驾驶,基本上是模块化的自动驾驶,模块和模块之间耦合度很低,各个模块有自己的KPI,共同为自动驾驶最终的KPI服务,这种架构“结构脆弱,容错率低”,好处就是各自都有自己明确的优化目标,模块之间接口清晰,提前定义好了需求之后,出了问题不容易甩锅。但是,长尾场景考手搓的C++规则代码根本不可能全部覆盖,每做完一个项目,就会新生出一堆自己回头看都未必能看懂的奇形怪状的代码,维护难度日渐增加。自动驾驶本质上是在处理物理世界的概率与不确定性。
从系统论的角度看,现在的自动驾驶越来越像一个复杂的生命体。历史上的科技浪潮大多是“工具的延伸”(如锤子变电钻),而 2026 年的 AI 浪潮是“决策的替代”。我们现在所做的,实际上是在为物理世界编写一套底层编码。这种编码不再是显式的 if-then,而是一个复杂的权重系统。当这个系统强大到可以理解路口一个皮球滚过可能预示着一个小孩跑出(因果推理)时,它就跨越了历史上所有“工具”的范畴。
自动驾驶正从规则(if-else)和判别(y = f(x)数学公式)相结合的范式,走向判别(贝叶斯网络)、生成(拟合全概率P(x, y))、预测未来几秒的世界、理解真实物理世界现象的因果关联和本质规律。作为一个有十年自动驾驶工程经验的行业专家,我也来大胆的预测一下行业的未来发展,未来 5-10 年,自动驾驶将经历从“感知驱动”向“认知驱动”的发展。
基于世界模型(World Models)的自动驾驶全面落地:目前的端到端(End-to-End)架构正在解决“如何开”的问题,而接下来的核心是解决“如何理解世界”的问题。自动驾驶系统将具备对物理世界和互动过程,基于规律的预测能力——它能像人类一样,在脑中模拟出“如果我加速,前方行人可能的反应,以及我加速的后果”,实现从概率映射到因果推断的跨越。
电子电气架构(EEA)的终局:随着中央计算平台(Central Compute)和区域控制器(Zonal Control)的完全成熟,车辆将真正成为“带轮子的超级计算机”。硬件将高度标准化,核心竞争力将彻底转向数据闭环的效率和基础模型的泛化能力。
具身智能(Embodied AI)的合流:自动驾驶将与通用机器人技术合流,汽车形态越来越多样,汽车甚至会长出机械手。城市道路只是一个特定的“受限空间”,当 AI 能够处理复杂的交通流时,同样的底层架构可以轻易迁移到室内配送、工厂协作等所有移动、飞行机器人领域。
稍微想想,就会发现,如果有一天,L5级自动驾驶像呼吸一样自然,人类交通的底层逻辑将被重构一遍。
出行空间的“解构”
停车场消失。我们现在的城市中心有20%-30%的土地都被停车场占据了,停车在很多一线城市是个老大难问题,很多人买了车也不愿意开,因为停车是在是不方便。
但是当汽车可以完全自己开呢?车就不再需要“停”在某个固定的地方,可以永远在流动,或者自己找停在某个相对远地方的充电站,需要了,提前手机上点一下让你的车子过来接你就好了。
出行空间的重组
“距离”的概念失效,通勤不再是痛苦。车内空间将进化为生活空间(移动办公室、卧室、咖啡厅、理疗馆)。当你在睡眠中跨越 50 公里到达公司时,居住地与工作地的距离不再是购房的首要因素,城市将呈现“去中心化”的散状分布,不用非得挤在市中心。
效率的“极致优化”
丝滑的交通流: 所有的车辆联网,红绿灯有可能退出历史。交通流可能看起来很乱,但是其实内部逻辑极其精确。
物流成本大幅降低、效率大幅提升:无人货运将实现 24小时全天候 不间断运转,社会的物流成本大幅下降,效率大幅提升。
社会与法律
个人车险将退出历史舞台,取而代之的是产品责任险。
从生存技能到精英标签
19世纪之前,出行骑马长途旅行,那基本上是标配,不会骑马可不行,但是今天呢?骑马成了贵族运动,成了一种娱乐项目。
自动驾驶普及,开车将不再是必备技能,更多的会像什么“潜水证”、“飞行执照”一样,成为一种爱好,一种非必要的技能。
驾驶场馆化
好比今天的骑马你得去马场,以后可能开车你也得去车场,路上想自己开车,对不起,法律法规不允许人类随便驾驶汽车,可能方向盘都给你隐藏了,需要特定许可才能启用。
什么?想要享受驾驶乐趣?来我们都驾驶体验场。赛车运动依然会存在,甚至会更加纯粹,更加极致。
自动驾驶的征途,本质上是人类将物理世界的决策权有标准、有逻辑地移交给 AI 的过程。
从 19 世纪“无马马车”的笨拙尝试,到T型车彻底激活人类的驾驶热情,再到 2026 年端到端世界模型的进化,这已经不仅仅是一场交通工具的革命,而是具身智能大规模降临的前哨战。
这场浪潮是不可逆转的。正如一百年前 T 型车终结了马车的时代,未来的人类终将习惯在移动的“第三空间”里,像呼吸一样自然地享受 AI 带来的新的现实。而驾驶,这门曾经承载着文明发展速度的技艺,终将走进博物馆,成为我们怀念“掌控感”时的时代注脚。