“自动驾驶是具身智能的上半场,具身智能是自动驾驶的下半场。”这个论断在业内广为流传,顺滑得让人几乎忘了追问,这个金句真的经得起推敲吗?
经常做深入逻辑思辨的小伙伴们可能会发现,上、下半场的说法制造了一种逻辑惯性,藏着一个偷换概念的思维陷阱:它把“先后发生”偷换成了“因果必然”。这种思维陷阱其实并不新鲜,在智能电动汽车这个赛道,电动化就曾经被广泛宣传为智能化的上半场,仔细思之,这个观点其实并不成立。
毕竟,油混、插混乃至燃油车,搭载高阶智驾的比比皆是。电动化推动了智能化的跃迁,但智能化并不以电动化为不可逾越的前提。具身智能也是同样的道理。自动驾驶人才的涌入让“下半场”的说法有了事实基础——但它不能反过来说明,具身智能必须以AD为上半场。
“具身智能是自动驾驶的下半场”——这句话是成立的,它刻画的,是一场大规模的人才迁徙和元能力的平移。从AD赛道冲杀出来的人,正携带着被量产工程淬炼出的元能力,集体涌入具身智能的新疆域。这点正由一批批响亮的名字反复印证。
最典型的案例是理想系。理想汽车前CTO王凯、前智驾技术研发负责人贾鹏、前智驾量产负责人王佳佳,三位在理想并肩打过几年硬仗的老兵,共同创立了至简动力。贾鹏的履历本身就是一部AD人才迁徙史——他2016年成为英伟达中国智驾团队一号员工,2021年加入理想带领团队从零自研智驾,在2023年完成城市NOA量产、2025年初端到端双系统交付后,转身扎进了具身智能的深海。
地平线系的下海潮同样批量涌现——005号员工余轶南创办了维他动力,智能座舱产品线总经理牛建伟创立叮当动力,前视觉感知技术负责人黄冠创办极佳视界。据统计,地平线至少有14位核心技术和管理层离职创业,其中13人进入了具身智能赛道。
他们带走的,不是某个可复用的模型代码,而是在AD战场上锻造出的全套“肌肉记忆”:如何定义复杂问题,如何在不确定性中拆解任务,如何在严苛的资源约束下做关键取舍,又如何在一个长达数年的开发周期里,维持团队的纪律与信心。
AD领域的具体知识——某个算法实现、某个特定调优技巧——或许会随技术换代迅速贬值。但AD过程所锤炼出的元能力——对算法开发与部署的掌控力、跨域协同的工程力、将技术从Demo推向量产的执行力——却是实实在在的硬通货。
这就像AI时代的学习:我们记住具体知识的速度早已追不上机器,但我们习得的“如何学习”的能力本身,依然长期具备真正的价值。贾鹏起步于英伟达自动驾驶部门,从一个纯算法人员成长为“无论聊芯片、硬件、软件系统还是算法都能跟上”的架构师,这种跨越层级的系统视角,正是人才元能力最精确的注脚。因此,具身智能是自动驾驶的下半场的论断,说的是,AD人带给具身智能的,是人的元能力,是那些在AD战场上千锤百炼而成的、做成事情的底层惯性与方法论。
“自动驾驶是具身智能的上半场”——这句话说的是另一件事:它把AD当成了具身智能的技术基础,暗示做过AD自然能做具身。但两者从一开始,核心能力的要求就截然不同。
AD要解决的核心问题只有一个:安全的导航移动。它的关键能力是环境感知、路径规划和碰撞规避——一切为了“从A点安全移动到B点”。具身智能则需要同时解决三大问题:导航移动(走到哪里)、运动控制(怎么完成奔跑、跳跃等动作)和灵巧操作(怎么抓、拧、摁)。导航移动只是具身智能的入场券,运动控制和灵巧操作才是具身智能面临的两大核心挑战。
正因为能力要求如此不同,AD和具身智能在传感、执行、模型等层面存在巨大的差异。
首先是传感。
AD的传感器配置收敛到了“摄像头+毫米波雷达+激光雷达”的组合——扫描百米外的路面,识别车辆和行人,精度到厘米级即够用。具身智能的传感器则是一张远为复杂的清单:除了同样的视觉传感器,还需要六维力传感器(感知手指和物体的接触力矩)、触觉阵列(感知材质和滑移)、IMU惯性单元(维持全身平衡)、关节编码器(实时反馈每个关节的角度和速度)。不光是种类多,精度要求也差了数量级——触觉传感器的力分辨率必须达到0.01牛顿,相当于一根头发丝掉到手指上的力度;灵巧操作需要在毫米级空间内施加毫牛顿级的力控,拧螺丝劲大了滑丝、劲小了拧不进去;数据采集更要求亚毫米级的物理精确性和微秒级的多模态时间同步。
其次是执行。
AD的动作输出是轨迹规划——方向盘打多少度、油门踩多深。本质上,它在控制一个高度抽象化的物理系统——四个轮子的速度矢量。具身智能的执行则分成两道完全不同的题。下半身是运动控制:四足机器人需要在非平坦地面上动态平衡,双足机器人需要协调几十个关节完成行走、奔跑乃至后空翻。上半身是灵巧操作:拧一颗螺丝需要手指在毫米级空间内施加精确到毫牛顿的力——劲大了螺纹滑丝,劲小了拧不进去。
第三是模型。
在这个维度上,AD和具身的差距可能比传感和执行更大。
AD的模型范式已经在快速收敛,具身智能大模型当前连范式都没收敛——VLA、世界动作模型(WAM)、联合嵌入预测架构(JEPA)、端到端强化学习,几条路线各说各话,没有哪个被证明明显优于其他。更根本的难题在于:具身智能的模型和本体是深度绑定的。AD的模型解决了“怎么开”的问题后,可以部署在几乎任何一辆四轮车上,但具身的本体千差万别——双足人形和轮式双臂的动力学方程完全不同,灵巧手和物理夹爪的控制策略不在一个维度上。在范式突破之前,在当前本体多样化的阶段,没有一个通用模型能覆盖所有构型。
破壳机器人创始人许华哲的判断一针见血:“具身智能不是机器人学、不是自动驾驶——是物理AGI新物种”。AD是一个为了“安全移动”这一单一目标而高度特化的子集,具身智能则是面向通用物理交互的全新系统。把子集当作全集的基础,是方向性的误判。因此,自动驾驶是具身智能的上半场这一句不成立:从AD到具身,需要跨越的不是一条小马就能趟过去的河,而是一片广袤的大陆。
如果AD真的是具身智能不可或缺的上半场,那么,逻辑推论应该很清晰:从未涉足AD的公司,理应在具身赛道上举步维艰。但跑在最前列的几家明星公司,恰恰构成了有力的反证。
宇树科技是这条反证链条上最硬的代表。王兴兴2016年8月创立宇树,比国内AD产业爆发早了整整五年。从早期Go1四足机器人到20台G1登上2026年春晚同步完成弹射、大回环、连续翻滚,宇树的元能力来自十年死磕四足动力学——关节要多少力矩、重心什么时候转移,这些问题的答案不在任何一篇AD论文里。
智元机器人则是另一条路径。2023年2月,稚晖君从华为离职创立智元。三年后,智元2025年出货量达到5168台,超过宇树成为全球人形机器人出货量第一,用3年走完了宇树10年走的路。智元的元能力来源并非AD赛道降维,而是极客工程执念加上一整套华为大厂训练出的组织方法论——前华为副总裁邓泰华是真正的操盘者,管理团队中有一大批华为23到24级的老将。
宇树和智元这两条线,一条是十年死磕硬件,一条是三年操盘生态——没有一条经过AD。它们共同指向一个简单结论:元能力的来源是多元的。AD带来的系统工程能力是宝贵的一支,但极客的破局力、硬件死磕者的长期主义,同样能在具身智能的土壤中长出强大的根系。
从AD涌向具身智能的人才潮是真实的,但这股潮水冲过来的,是AD人被量产工程淬炼出的元能力:定义问题、拆解任务、在严苛约束下做关键取舍的底层惯性。不是模型,不是算法,不是任何一个可以在两个行业间直接搬运的技术模块。如果技术真能无缝迁移,机器人赛道恐怕早已跑步进入成熟期了。
于是,真正的问题变成了另一个:那些从AD战场走来的战士,带着他们珍贵的元能力,在新赛道上,跑得过那些从十年死磕硬件、从极客工程、从更早的机器人产业中拿到了同样能力的人吗?要知道,元能力只是入场券,而能不能走到终点,永远取决于在新战场上的创新力与执行力。