当前位置：首页>自动驾驶>自动驾驶不是具身智能的上半场

自动驾驶不是具身智能的上半场

2026-06-23 18:24:09

文｜三少爷

“自动驾驶是具身智能的上半场，具身智能是自动驾驶的下半场。”这个论断在业内广为流传，顺滑得让人几乎忘了追问，这个金句真的经得起推敲吗？

经常做深入逻辑思辨的小伙伴们可能会发现，上、下半场的说法制造了一种逻辑惯性，藏着一个偷换概念的思维陷阱：它把“先后发生”偷换成了“因果必然”。这种思维陷阱其实并不新鲜，在智能电动汽车这个赛道，电动化就曾经被广泛宣传为智能化的上半场，仔细思之，这个观点其实并不成立。

毕竟，油混、插混乃至燃油车，搭载高阶智驾的比比皆是。电动化推动了智能化的跃迁，但智能化并不以电动化为不可逾越的前提。具身智能也是同样的道理。自动驾驶人才的涌入让“下半场”的说法有了事实基础——但它不能反过来说明，具身智能必须以AD为上半场。

元能力的平移

“具身智能是自动驾驶的下半场”——这句话是成立的，它刻画的，是一场大规模的人才迁徙和元能力的平移。从AD赛道冲杀出来的人，正携带着被量产工程淬炼出的元能力，集体涌入具身智能的新疆域。这点正由一批批响亮的名字反复印证。

最典型的案例是理想系。理想汽车前CTO王凯、前智驾技术研发负责人贾鹏、前智驾量产负责人王佳佳，三位在理想并肩打过几年硬仗的老兵，共同创立了至简动力。贾鹏的履历本身就是一部AD人才迁徙史——他2016年成为英伟达中国智驾团队一号员工，2021年加入理想带领团队从零自研智驾，在2023年完成城市NOA量产、2025年初端到端双系统交付后，转身扎进了具身智能的深海。

地平线系的下海潮同样批量涌现——005号员工余轶南创办了维他动力，智能座舱产品线总经理牛建伟创立叮当动力，前视觉感知技术负责人黄冠创办极佳视界。据统计，地平线至少有14位核心技术和管理层离职创业，其中13人进入了具身智能赛道。

他们带走的，不是某个可复用的模型代码，而是在AD战场上锻造出的全套“肌肉记忆”：如何定义复杂问题，如何在不确定性中拆解任务，如何在严苛的资源约束下做关键取舍，又如何在一个长达数年的开发周期里，维持团队的纪律与信心。

AD领域的具体知识——某个算法实现、某个特定调优技巧——或许会随技术换代迅速贬值。但AD过程所锤炼出的元能力——对算法开发与部署的掌控力、跨域协同的工程力、将技术从Demo推向量产的执行力——却是实实在在的硬通货。

这就像AI时代的学习：我们记住具体知识的速度早已追不上机器，但我们习得的“如何学习”的能力本身，依然长期具备真正的价值。贾鹏起步于英伟达自动驾驶部门，从一个纯算法人员成长为“无论聊芯片、硬件、软件系统还是算法都能跟上”的架构师，这种跨越层级的系统视角，正是人才元能力最精确的注脚。因此，具身智能是自动驾驶的下半场的论断，说的是，AD人带给具身智能的，是人的元能力，是那些在AD战场上千锤百炼而成的、做成事情的底层惯性与方法论。

技术的鸿沟

“自动驾驶是具身智能的上半场”——这句话说的是另一件事：它把AD当成了具身智能的技术基础，暗示做过AD自然能做具身。但两者从一开始，核心能力的要求就截然不同。

AD要解决的核心问题只有一个：安全的导航移动。它的关键能力是环境感知、路径规划和碰撞规避——一切为了“从A点安全移动到B点”。具身智能则需要同时解决三大问题：导航移动（走到哪里）、运动控制（怎么完成奔跑、跳跃等动作）和灵巧操作（怎么抓、拧、摁）。导航移动只是具身智能的入场券，运动控制和灵巧操作才是具身智能面临的两大核心挑战。

正因为能力要求如此不同，AD和具身智能在传感、执行、模型等层面存在巨大的差异。

首先是传感。

AD的传感器配置收敛到了“摄像头+毫米波雷达+激光雷达”的组合——扫描百米外的路面，识别车辆和行人，精度到厘米级即够用。具身智能的传感器则是一张远为复杂的清单：除了同样的视觉传感器，还需要六维力传感器（感知手指和物体的接触力矩）、触觉阵列（感知材质和滑移）、IMU惯性单元（维持全身平衡）、关节编码器（实时反馈每个关节的角度和速度）。不光是种类多，精度要求也差了数量级——触觉传感器的力分辨率必须达到0.01牛顿，相当于一根头发丝掉到手指上的力度；灵巧操作需要在毫米级空间内施加毫牛顿级的力控，拧螺丝劲大了滑丝、劲小了拧不进去；数据采集更要求亚毫米级的物理精确性和微秒级的多模态时间同步。

其次是执行。

AD的动作输出是轨迹规划——方向盘打多少度、油门踩多深。本质上，它在控制一个高度抽象化的物理系统——四个轮子的速度矢量。具身智能的执行则分成两道完全不同的题。下半身是运动控制：四足机器人需要在非平坦地面上动态平衡，双足机器人需要协调几十个关节完成行走、奔跑乃至后空翻。上半身是灵巧操作：拧一颗螺丝需要手指在毫米级空间内施加精确到毫牛顿的力——劲大了螺纹滑丝，劲小了拧不进去。

第三是模型。

在这个维度上，AD和具身的差距可能比传感和执行更大。

AD的模型范式已经在快速收敛，具身智能大模型当前连范式都没收敛——VLA、世界动作模型（WAM）、联合嵌入预测架构（JEPA）、端到端强化学习，几条路线各说各话，没有哪个被证明明显优于其他。更根本的难题在于：具身智能的模型和本体是深度绑定的。AD的模型解决了“怎么开”的问题后，可以部署在几乎任何一辆四轮车上，但具身的本体千差万别——双足人形和轮式双臂的动力学方程完全不同，灵巧手和物理夹爪的控制策略不在一个维度上。在范式突破之前，在当前本体多样化的阶段，没有一个通用模型能覆盖所有构型。

破壳机器人创始人许华哲的判断一针见血：“具身智能不是机器人学、不是自动驾驶——是物理AGI新物种”。AD是一个为了“安全移动”这一单一目标而高度特化的子集，具身智能则是面向通用物理交互的全新系统。把子集当作全集的基础，是方向性的误判。因此，自动驾驶是具身智能的上半场这一句不成立：从AD到具身，需要跨越的不是一条小马就能趟过去的河，而是一片广袤的大陆。

根本就没有上半场

如果AD真的是具身智能不可或缺的上半场，那么，逻辑推论应该很清晰：从未涉足AD的公司，理应在具身赛道上举步维艰。但跑在最前列的几家明星公司，恰恰构成了有力的反证。

宇树科技是这条反证链条上最硬的代表。王兴兴2016年8月创立宇树，比国内AD产业爆发早了整整五年。从早期Go1四足机器人到20台G1登上2026年春晚同步完成弹射、大回环、连续翻滚，宇树的元能力来自十年死磕四足动力学——关节要多少力矩、重心什么时候转移，这些问题的答案不在任何一篇AD论文里。

智元机器人则是另一条路径。2023年2月，稚晖君从华为离职创立智元。三年后，智元2025年出货量达到5168台，超过宇树成为全球人形机器人出货量第一，用3年走完了宇树10年走的路。智元的元能力来源并非AD赛道降维，而是极客工程执念加上一整套华为大厂训练出的组织方法论——前华为副总裁邓泰华是真正的操盘者，管理团队中有一大批华为23到24级的老将。

宇树和智元这两条线，一条是十年死磕硬件，一条是三年操盘生态——没有一条经过AD。它们共同指向一个简单结论：元能力的来源是多元的。AD带来的系统工程能力是宝贵的一支，但极客的破局力、硬件死磕者的长期主义，同样能在具身智能的土壤中长出强大的根系。

写在最后

从AD涌向具身智能的人才潮是真实的，但这股潮水冲过来的，是AD人被量产工程淬炼出的元能力：定义问题、拆解任务、在严苛约束下做关键取舍的底层惯性。不是模型，不是算法，不是任何一个可以在两个行业间直接搬运的技术模块。如果技术真能无缝迁移，机器人赛道恐怕早已跑步进入成熟期了。

于是，真正的问题变成了另一个：那些从AD战场走来的战士，带着他们珍贵的元能力，在新赛道上，跑得过那些从十年死磕硬件、从极客工程、从更早的机器人产业中拿到了同样能力的人吗？要知道，元能力只是入场券，而能不能走到终点，永远取决于在新战场上的创新力与执行力。