2026年的智能汽车行业,ldquo;物理AIrdquo;三个字几乎无处不在。从百度到华为,从卓驭到小鹏,所有智能驾驶算法厂商都在往这个方向转型。这股浪潮来得凶猛,却也透着几分悲壮。在卓驭科技副总裁于贝贝看来,这不是一场可以错过的技术迭代,而是一场关乎生死的淘汰赛。
ldquo;如果不上这条技术路线,很可能今后就跑不出来了。rdquo;于贝贝近日在一次行业论坛上直言不讳。这句话,说出了所有智能驾驶算法厂商共同的心声。
从专家模型到基础模型的历史轮回
要理解物理AI的意义,需要回顾人工智能发展的基本脉络。
过去的智能驾驶行业,主流范式是ldquo;专家模型rdquo;。顾名思义,就是针对每一个具体场景,训练一个专门的模型。高速场景一个模型,城市NOA一个模型,自动泊车又一个模型,泊车还要分记忆泊车和自主泊车。这种方式在行业发展早期是有效的,能够快速解决特定场景的问题,让智驾功能尽快落地。
但专家模型的天花板很快显现:场景之间无法泛化,新增一个场景就要新增一个模型,模型数量越来越多,维护成本越来越高,最终陷入ldquo;小模型不断堆叠rdquo;的困境。
于贝贝打了个比方:ldquo;以前做视觉语言模型时,也有人做专家模型,有人做通用基座模型。最终跑出来的,是做基座模型的那批人。以前那些专注于某一个domain(领域)的专家模型,其实都没有真正跑出来。rdquo;
大语言模型的历史,正在智能驾驶领域重演。GPT-2时代,业界也曾有过专家模型和通用模型之争,最终通用基础模型凭借零样本泛化能力胜出。当基础模型能力从GPT-2升级到GPT-4,所有垂直领域的专家应用都受到巨大冲击。如今,智能驾驶领域正在经历同样的范式切换。
VLA 2.0:视觉-语言-动作大一统
2025年,智能驾驶行业基本完成了从规则驱动到数据驱动的切换,模型基础能力达到了ldquo;开箱70分rdquo;的水平。但行业很快发现,仅靠数据驱动还不足以解决长尾问题,感知能力的天花板限制了决策规划的上限。
2026年,行业正处于一个关键的范式转折点:是继续沿着专家模型的路线小步迭代,还是果断切换到大模型路线?
卓驭科技的选择是后者。在今年北京国际车展上,卓驭发布了面向移动物理AI的原生多模态基础模型。这一模型的核心理念,是将视觉、语言、音频、动作、规则和推理统一在同一个模态空间中,让模型在预训练阶段就能理解物理世界的因果关系和动态变化。
于贝贝解释道:ldquo;我们认为,把所有信息都转译到一个语言空间里去做理解,然后再通过语言转译的结果去理解物理世界,是一种反常识的做法。真正合理的路径是,让模型能够天生、原生地理解物理世界,而不是借助语言的翻译。语言只是人类表达的工具,不应该是AI理解世界的唯一桥梁。rdquo;
这一思路与特斯拉的端到端方案有所不同,也与小鹏的VLA路线有所区别。业内将这类新一代方案统称为VLA 2.0——虽然都叫VLA(视觉-语言-动作),但对ldquo;大一统rdquo;的理解已经有了本质差异。
行业洗牌的号角已经吹响
在新的竞争维度上,智能驾驶算法厂商的对手不再仅仅是曾经的同行。那些从数字AI领域跨界而来的科技巨头、做具身智能的新势力,虎视眈眈地盯着这块市场。
英伟达凭借Orin芯片和DRIVE平台,已经成为智能驾驶领域最大的ldquo;卖水人rdquo;。华为凭借MDC芯片和鸿蒙生态,在智能驾驶市场快速扩张。百度Apollo、小马智行、Momenta等老牌自动驾驶企业,也在加速从L4向L2+的转型。
于贝贝坦承:ldquo;行业洗牌可能即将开始。所有做自动驾驶的公司,应该都会在不久的将来,转变为移动物理AI公司。能在这场竞赛中存活下来的玩家,其商业空间也将随之打开。而无法适应新范式的厂商,将面临被替代的风险。rdquo;
这种判断并非危言耸听。回顾过去五年智能驾驶行业的发展,多少曾经炙手可热的明星公司,已经销声匿迹。技术路线押错了注,资金链断裂,团队流失,任何一个环节出问题,都可能导致一家公司的崩塌。而这一次范式切换的力度,比以往任何一次都更大。
商业模式的深层重构
物理AI不仅改变了技术范式,也在深刻重塑商业模式。
传统Tier 1(一级供应商)的商业模式是ldquo;卖硬件、收开发费rdquo;——一次性交易,简单直接。Mobileye时代的黑盒交付模式,将算法和芯片打包卖给车企,靠的是规模效应和先发优势。但这种模式在物理AI时代面临挑战。
在物理AI时代,算法厂商需要持续参与软件的迭代和运营,因为基础模型需要不断从真实数据中学习。这意味着需要一个持续性的收入来源,而不是一次性买断。订阅模式、分润模式应运而生。
更激进的探索是ldquo;动作令牌rdquo;(Action Token)模式。未来的消费级具身智能产品——比如扫地机器人、割草机、自动驾驶电动车——可以将传感器数据上传到云端,由云端的物理AI大模型进行推理后,下发一条轨迹指令或者动作序列。用户按使用次数或里程支付ldquo;动作令牌rdquo;费用。
ldquo;扫地机器人每次清扫收费一分钱,割草机每平方米收费一分钱。这种细颗粒度的商业模式,在以前是不可想象的。rdquo;于贝贝描述道。这种模式的本质,是将算法能力从ldquo;一次性交付rdquo;变成了ldquo;持续性服务rdquo;。
护城河:模型能力与分发网络
面对新一轮的行业洗牌,卓驭的护城河是什么?于贝贝认为有两点。
第一,模型能力。ldquo;现在大家的迭代范式,乃至最终采用什么样的模型架构,都还没有定论。也许3D DiT或者V-JEPA等全新架构会跑出来,但这些都是未知数。真正重要的是,谁能在这场模型架构的竞赛中保持领先。rdquo;
第二,分发能力。ldquo;建立一个分发平台和分发网络,创建生态,联合不同的合作伙伴共同分发,这一定是极高的门槛。rdquo;具身智能不像数字AI可以通过手机实现病毒式传播,它必须部署到具体的硬件上。这个分发过程本身就是壁垒——你需要与车企、机器人厂商、OEM深度合作,才能让模型真正落地。
从卓驭的发展路径看,这家公司的策略是一边打磨模型能力,一边扩大朋友圈。今年北京车展期间,卓驭与多家主机厂和Tier 1供应商签署了合作协议,加速推进物理AI技术的量产落地。
结语
物理AI的浪潮已经到来,这不再是一道ldquo;要不要转型rdquo;的选择题,而是一道关乎生死的必答题。在这场新的淘汰赛中,只有那些真正具备基础模型能力和生态分发能力的玩家,才能笑到最后。
对于整个智能驾驶行业而言,2026年或许就是那个分水岭。潮水退去,方知谁在裸泳。接下来的两到三年,将是决定胜负的关键时刻。