刚刷到朋友圈有人吐槽,花了几万块选的智驾包,每次OTA都号称“重大更新”,可用起来还是会在匝道口犹豫、遇到加塞就急刹。
说实话,这真不怪你挑剔。老木我这两年试过不下20台带高阶智驾的车,一直想搞明白一件事:我们到底在等什么?直到最近翻完特斯拉、华为、蔚来、Momenta这几家在2025年底到2026年初密集公开的技术资料,我才慢慢摸到那个答案——大家嘴上说的“端到端”其实只是个开胃菜,真正的主菜叫世界模型。
这玩意儿不是什么玄学。你把它想象成:之前的智驾是靠背题库考试,现在得让车真懂物理规律,脑子里能放电影。
车企们都在搞,但路子完全不一样
在2025年10月,特斯拉AI负责人Ashok在ICCV大会上透了底。他们FSD的输入端极其夸张,7个摄像头、36帧每秒、500万像素,再加上导航和车辆动态数据,换算下来一次要处理约20亿个输入token,最后就精简成两个动作——转向和加速。Ashok原话说得很直白:端到端AI才是自动驾驶的未来。
几乎同一时期,华为、蔚来、Momenta、轻舟智航全亮出了各自的世界模型方案。大家虽然都叫“世界模型”,但怎么用、装在哪,差异大到能吵一架。
也欢迎关注老木,后续我会给大家出一篇各个车厂智驾方案的实测文章供你参考!
分歧点来了:你是要个“AI驾校”,还是“随车大脑”?
先说华为。他们的WEWA架构把这事拆得非常清楚。云端有个“世界引擎”,相当于AI驾校,能把真实数据里那些无聊的路段,生生合成出加塞、鬼探头、前车急刹的极端组合,难例密度比真实世界高1000倍。车端则跑着“世界行为模型”,这是业内首个智驾原生基模型,不靠语言模型中间商赚差价,直接感知直接开。数据很硬:ADS 4系统上,端到端时延降低50%,重刹率降了30%。
华为这套逻辑很“理工直男”,但也最让咱们普通消费者安心——它追求的是物理世界最直接的因果判断,没有在决策链里塞进一个“翻译官”。
再看蔚来。2025年5月,他们那个叫NWM的世界模型就已经推送给超40万台车了。这玩意儿特别强调“毫秒级预演”,100毫秒内能推演216种可能轨迹,挑一条最优的,下个100毫秒再根据新信息重新推演。这更像是给车装了个时刻都在高速运转的“心算大脑”。
特斯拉则更激进一点,他们搞了个神经世界模拟器,能让AI一天内学会人类500年的驾驶经验,专门用来跟车端模型做闭环强化训练。
后续我会出智驾“第一梯队”们实际上路的真实测评文章,欢迎大家给老木点个关注别错过!
那带大语言模型的方案,到底是不是弯路?
这是当前吵得最凶的话题。小鹏在2025年4月拿出了一个720亿参数的世界基座模型,走的就是融合语言推理能力的路子,想用大模型的常识来辅助空间推理。
但华为的立场非常坚定,坚决不让语言模型介入驾驶决策。地平线HSD也只让语言模型干点认路牌的辅助活儿。商汤绝影CEO王晓刚点破了一个尴尬的天花板:如果只是模仿人类开车,那人的水平就是智能上限。我们日常看手机追尾、疲劳驾驶的例子还少吗?
所以,现在路线之争本质是:我们到底是要一个开得像我一样(但可能犯错)的AI,还是利用世界模型在虚拟环境里穷尽几十亿次试错,长出一个驾驶水平远超人类老司机的AI?
现阶段咱看车,也别光听销售吹“我们有端到端”、“我们有AI大模型”。
你就问他三句话:
第一,你们的世界模型是跑在云端当驾校,还是落在我车上实时参与决策?
第二,你们的极限避险能力,是靠人类标注数据喂出来的,还是在仿真器里亿万次“撞出来”的?
第三,下一版OTA,能不能让重刹率有两位数的下降?
最后一个题外话,现在大家都在卷“世界模型”,但老木我反而担心算力成本。
以后是不是不单买车花钱,用高阶智驾还得按月为“云端AI驾校”的训练费买单?
这恐怕是我们车主未来要面对的真问题。
觉得老木分析的在理,欢迎点个关注,后续给大家带来更多最新第一手分析文章!
你怎么看,能接受一次性买断变持续付费吗?