当前位置：首页>自动驾驶>不上这条路线就跑不出来了:物理AI成自动驾驶厂商生死线

不上这条路线就跑不出来了:物理AI成自动驾驶厂商生死线

2026-05-08 18:24:23

2026年的智能汽车行业，ldquo;物理AIrdquo;三个字几乎无处不在。从百度到华为，从卓驭到小鹏，所有智能驾驶算法厂商都在往这个方向转型。这股浪潮来得凶猛，却也透着几分悲壮。在卓驭科技副总裁于贝贝看来，这不是一场可以错过的技术迭代，而是一场关乎生死的淘汰赛。

ldquo;如果不上这条技术路线，很可能今后就跑不出来了。rdquo;于贝贝近日在一次行业论坛上直言不讳。这句话，说出了所有智能驾驶算法厂商共同的心声。

从专家模型到基础模型的历史轮回

要理解物理AI的意义，需要回顾人工智能发展的基本脉络。

过去的智能驾驶行业，主流范式是ldquo;专家模型rdquo;。顾名思义，就是针对每一个具体场景，训练一个专门的模型。高速场景一个模型，城市NOA一个模型，自动泊车又一个模型，泊车还要分记忆泊车和自主泊车。这种方式在行业发展早期是有效的，能够快速解决特定场景的问题，让智驾功能尽快落地。

但专家模型的天花板很快显现：场景之间无法泛化，新增一个场景就要新增一个模型，模型数量越来越多，维护成本越来越高，最终陷入ldquo;小模型不断堆叠rdquo;的困境。

于贝贝打了个比方：ldquo;以前做视觉语言模型时，也有人做专家模型，有人做通用基座模型。最终跑出来的，是做基座模型的那批人。以前那些专注于某一个domain（领域）的专家模型，其实都没有真正跑出来。rdquo;

大语言模型的历史，正在智能驾驶领域重演。GPT-2时代，业界也曾有过专家模型和通用模型之争，最终通用基础模型凭借零样本泛化能力胜出。当基础模型能力从GPT-2升级到GPT-4，所有垂直领域的专家应用都受到巨大冲击。如今，智能驾驶领域正在经历同样的范式切换。

VLA 2.0：视觉-语言-动作大一统

2025年，智能驾驶行业基本完成了从规则驱动到数据驱动的切换，模型基础能力达到了ldquo;开箱70分rdquo;的水平。但行业很快发现，仅靠数据驱动还不足以解决长尾问题，感知能力的天花板限制了决策规划的上限。

2026年，行业正处于一个关键的范式转折点：是继续沿着专家模型的路线小步迭代，还是果断切换到大模型路线？

卓驭科技的选择是后者。在今年北京国际车展上，卓驭发布了面向移动物理AI的原生多模态基础模型。这一模型的核心理念，是将视觉、语言、音频、动作、规则和推理统一在同一个模态空间中，让模型在预训练阶段就能理解物理世界的因果关系和动态变化。

于贝贝解释道：ldquo;我们认为，把所有信息都转译到一个语言空间里去做理解，然后再通过语言转译的结果去理解物理世界，是一种反常识的做法。真正合理的路径是，让模型能够天生、原生地理解物理世界，而不是借助语言的翻译。语言只是人类表达的工具，不应该是AI理解世界的唯一桥梁。rdquo;

这一思路与特斯拉的端到端方案有所不同，也与小鹏的VLA路线有所区别。业内将这类新一代方案统称为VLA 2.0——虽然都叫VLA（视觉-语言-动作），但对ldquo;大一统rdquo;的理解已经有了本质差异。

行业洗牌的号角已经吹响

在新的竞争维度上，智能驾驶算法厂商的对手不再仅仅是曾经的同行。那些从数字AI领域跨界而来的科技巨头、做具身智能的新势力，虎视眈眈地盯着这块市场。

英伟达凭借Orin芯片和DRIVE平台，已经成为智能驾驶领域最大的ldquo;卖水人rdquo;。华为凭借MDC芯片和鸿蒙生态，在智能驾驶市场快速扩张。百度Apollo、小马智行、Momenta等老牌自动驾驶企业，也在加速从L4向L2+的转型。

于贝贝坦承：ldquo;行业洗牌可能即将开始。所有做自动驾驶的公司，应该都会在不久的将来，转变为移动物理AI公司。能在这场竞赛中存活下来的玩家，其商业空间也将随之打开。而无法适应新范式的厂商，将面临被替代的风险。rdquo;

这种判断并非危言耸听。回顾过去五年智能驾驶行业的发展，多少曾经炙手可热的明星公司，已经销声匿迹。技术路线押错了注，资金链断裂，团队流失，任何一个环节出问题，都可能导致一家公司的崩塌。而这一次范式切换的力度，比以往任何一次都更大。

商业模式的深层重构

物理AI不仅改变了技术范式，也在深刻重塑商业模式。

传统Tier 1（一级供应商）的商业模式是ldquo;卖硬件、收开发费rdquo;——一次性交易，简单直接。Mobileye时代的黑盒交付模式，将算法和芯片打包卖给车企，靠的是规模效应和先发优势。但这种模式在物理AI时代面临挑战。

在物理AI时代，算法厂商需要持续参与软件的迭代和运营，因为基础模型需要不断从真实数据中学习。这意味着需要一个持续性的收入来源，而不是一次性买断。订阅模式、分润模式应运而生。

更激进的探索是ldquo;动作令牌rdquo;（Action Token）模式。未来的消费级具身智能产品——比如扫地机器人、割草机、自动驾驶电动车——可以将传感器数据上传到云端，由云端的物理AI大模型进行推理后，下发一条轨迹指令或者动作序列。用户按使用次数或里程支付ldquo;动作令牌rdquo;费用。

ldquo;扫地机器人每次清扫收费一分钱，割草机每平方米收费一分钱。这种细颗粒度的商业模式，在以前是不可想象的。rdquo;于贝贝描述道。这种模式的本质，是将算法能力从ldquo;一次性交付rdquo;变成了ldquo;持续性服务rdquo;。

护城河：模型能力与分发网络

面对新一轮的行业洗牌，卓驭的护城河是什么？于贝贝认为有两点。

第一，模型能力。ldquo;现在大家的迭代范式，乃至最终采用什么样的模型架构，都还没有定论。也许3D DiT或者V-JEPA等全新架构会跑出来，但这些都是未知数。真正重要的是，谁能在这场模型架构的竞赛中保持领先。rdquo;

第二，分发能力。ldquo;建立一个分发平台和分发网络，创建生态，联合不同的合作伙伴共同分发，这一定是极高的门槛。rdquo;具身智能不像数字AI可以通过手机实现病毒式传播，它必须部署到具体的硬件上。这个分发过程本身就是壁垒——你需要与车企、机器人厂商、OEM深度合作，才能让模型真正落地。

从卓驭的发展路径看，这家公司的策略是一边打磨模型能力，一边扩大朋友圈。今年北京车展期间，卓驭与多家主机厂和Tier 1供应商签署了合作协议，加速推进物理AI技术的量产落地。

结语

物理AI的浪潮已经到来，这不再是一道ldquo;要不要转型rdquo;的选择题，而是一道关乎生死的必答题。在这场新的淘汰赛中，只有那些真正具备基础模型能力和生态分发能力的玩家，才能笑到最后。

对于整个智能驾驶行业而言，2026年或许就是那个分水岭。潮水退去，方知谁在裸泳。接下来的两到三年，将是决定胜负的关键时刻。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

不上这条路线就跑不出来了:物理AI成自动驾驶厂商生死线

从专家模型到基础模型的历史轮回

VLA 2.0：视觉-语言-动作大一统

行业洗牌的号角已经吹响

商业模式的深层重构

护城河：模型能力与分发网络

结语

最新文章

热门文章

随机文章

不上这条路线就跑不出来了:物理AI成自动驾驶厂商生死线

从专家模型到基础模型的历史轮回

VLA 2.0：视觉-语言-动作大一统

行业洗牌的号角已经吹响

商业模式的深层重构

护城河：模型能力与分发网络

结语

农机自动驾驶:透视精准农业的下一个十年

特斯拉的 1.47 万亿美元赌注:自动驾驶、人形机器人

最新文章

热门文章

随机文章