自动驾驶的下一战:不是谁的车跑得更远,而是谁的模型"想象"得更准。
小马智行发布世界模型2.0:自动驾驶进入"想象力"竞赛
2026年4月,小马智行发布PonyWorld世界模型2.0。同期,其关联公司注册资本增至2亿元,增幅100%。
这两条消息放在一起看,信号很明确:自动驾驶公司正在把赌注从"感知能力"押向"世界理解能力"。
世界模型不是感知模型。感知模型回答"现在发生了什么",世界模型回答"接下来会发生什么"。
自动驾驶的技术路线之争:模块化、端到端、世界模型
自动驾驶技术路线经历了三次迭代。
第一代是模块化方案:感知、预测、规划、控制各自独立,像一条流水线。优点是可解释性强,出了问题容易定位。缺点是模块之间的信息损耗严重,系统整体表现受限于最弱的一环。
第二代是端到端方案:输入传感器数据,直接输出驾驶决策。特斯拉FSD V12是典型代表。优点是减少了信息损耗,系统更流畅。缺点是黑盒特性,出了事故难以归因,长尾场景处理能力弱。
第三代就是世界模型:在端到端之上加一层"对世界的理解"。模型不仅看到当前的路况,还能"想象"未来几秒内可能发生什么——那辆车的司机在看手机,他大概率会偏离车道;那个路口的行人正在犹豫,他可能会突然冲出来。
PonyWorld 2.0的核心能力,就是在海量真实驾驶数据的基础上,让模型学会"预测未来"。
为什么是世界模型?因为长尾场景杀不死
自动驾驶最大的敌人不是高速公路上的直线巡航,而是那些十年一遇的极端场景。
暴雨天突然冲出的外卖骑手。施工路段临时改道的锥桶。前车掉落的不规则货物。夜间对向车道的远光灯致盲。
这些场景在传统感知模型里是"没见过",在端到端模型里是"置信度低",在世界模型里是"可以推演"。
世界模型的本质是:用对物理规律的理解,弥补数据的不足。 它不需要"见过"每一种极端场景,它只需要理解场景背后的因果关系。
行业格局:谁在做世界模型?
不只是小马智行。
2025年以来, Waymo、华为、百度、理想等头部玩家都在推进世界模型相关的技术布局。行业共识正在形成:纯端到端方案的能力天花板已经显现,加入世界模型的理解层是突破长尾场景的必由之路。
但技术路线的分歧依然存在。一派认为世界模型应该作为端到端的"辅助模块",在置信度低时介入;另一派认为世界模型应该成为核心决策引擎,端到端只是执行层。
小马智行的选择是后者。PonyWorld 2.0不是"锦上添花"的插件,而是架构级的升级。
注册资本翻倍:不只是技术信号,也是商业信号
小马智行关联公司注册资本增至2亿元,增幅100%。在自动驾驶行业普遍收缩的背景下,这个动作值得解读。
第一,世界模型的研发成本远高于传统方案。需要更强的算力、更高质量的数据、更长的训练周期。增资是技术投入的直接体现。
第二,自动驾驶商业化正在加速。Robotaxi在多个城市扩大运营范围,L3级自动驾驶准入政策逐步放开。增资也是在为规模化商业化储备弹药。
第三,行业洗牌期,现金储备就是生存能力。2025年以来,多家自动驾驶创业公司资金链断裂。逆势增资,是在向市场传递"我还在、我能打"的信号。
自动驾驶的GPT时刻:当模型学会"想象"
回顾大语言模型的发展,GPT-3的突破不是参数量变大,而是模型学会了"理解语言的结构"。自动驾驶的世界模型,正在经历类似的拐点。
当模型不再只是"看到",而是能够"理解"和"预测",自动驾驶的能力边界会被大幅推高。
这不是说L5明天就到。但技术路线的收敛,意味着行业正在从"百花齐放"走向"殊途同归"。
小马智行这步棋,押的是自动驾驶的下一个范式转移。赌注2亿,赢面多大,取决于世界模型能不能真正跨过从"能想象"到"敢上路"的最后一道门槛。
自动驾驶的胜负手,正在从"谁的车跑得更远"变成"谁的模型想象得更准"。