▌01 / 为什么这个话题现在值得聊
上周几个新闻放在一起看,很有意思。
Nvidia 和 LG 签约合作造人形机器人,提供 Isaac 平台。Boston Dynamics 给 Spot 接上了大语言模型,让它学会理解场景做推理。科大讯飞发布了星火 X2-VL,号称给具身智能提供"AI 大脑"。
这些新闻的共性是什么?做自动驾驶的公司和人才,正在大规模涌入具身智能赛道。
Nvidia 的 Isaac 平台脱胎于 Drive 平台,DeepMind 的机器人团队和自动驾驶团队早就合并了。国内更不用说——一堆自动驾驶公司的算法工程师跳槽去了机器人创业公司。
我自己是做自动驾驶中间件的,每天跟 CyberRT、FastDDS、SOME/IP 打交道。最近也在看机器人方向,想搞清楚一件事:做了这么多年自动驾驶,到底哪些能力能带走,哪些得从零开始?
━━━━━━━━━━━━━━━━━━
▌02 / 先说能复用的:感知-规划-控制架构
自动驾驶和具身机器人,底层架构出奇地像。
自动驾驶的标准技术栈是:传感器采集 → 感知(检测/跟踪/分割)→ 预测(轨迹预测)→ 规划(行为/路径)→ 控制(横纵向控制)。
人形机器人的技术栈是:传感器采集 → 感知(环境理解/物体识别)→ 决策(任务规划)→ 规划(运动规划)→ 控制(关节/力控)。
看出来了吗?管道结构几乎一样。都是传感器进、控制信号出,中间经过感知→决策→规划几层。做自动驾驶感知的人,转到机器人感知基本无缝衔接——检测、分割、跟踪、多模态融合,这些技能完全通用。
中间件层面更是如此。CyberRT、FastDDS、ROS 2 本质上解决的是同一个问题:异构传感器数据如何在实时约束下可靠地传输和调度。做 DDS 配置、QoS 策略、零拷贝传输的人,换一个机器人项目,干的活一模一样。
━━━━━━━━━━━━━━━━━━
▌03 / 再说不能复用的:三个关键差异
架构像,不等于能直接搬。我梳理了三个最大的差异:
差异一:结构化 vs 非结构化环境。自动驾驶的车道线、交通标志、行人轨迹——这些都有明确的规则和统计模式。但机器人在工厂、家庭、户外面对的是完全非结构化的场景。一个散落在地上的螺丝、一个没关好的抽屉、一只突然跑过的猫——这些 corner case 的分布比自动驾驶宽得多。
差异二:控制频率和精度要求完全不同。自动驾驶的控制频率通常在 10-50Hz,横纵向控制的精度要求是厘米级。但人形机器人的关节控制需要 1kHz 甚至更高的频率,力控精度要求是毫牛级。做自动驾驶控制的工程师,转到机器人控制会发现:原来的控制算法在关节空间里根本不够用。
差异三:Sim-to-Real 的难度不是一个量级。自动驾驶的仿真(CARLA、SUMO)已经相当成熟,sim-to-real gap 在可接受范围内。但机器人的仿真——尤其是灵巧手操作——和现实之间的差距大得多。一个在仿真里完美抓取的瓶子,到了现实里可能因为摩擦力、材质变形、光照变化而失败。这也是为什么 Figure 和 1X 都在强调"真实世界数据"的重要性。
━━━━━━━━━━━━━━━━━━
▌04 / 中间件视角:CyberRT 人到了 ROS 2 世界
作为一个做中间件的人,这块我想多说几句。
自动驾驶行业,CyberRT 和 FastDDS 是主流。CyberRT 是 Apollo 的中间件,主打高性能、低延迟、确定性调度。FastDDS 是 DDS 标准的实现,主打 QoS 灵活性和分布式通信。
机器人行业,ROS 2 是事实标准。底层也是 DDS,但上层封装了更丰富的生态——TF 坐标变换、Action 服务、Navigation 2 等等。
从 CyberRT 切到 ROS 2,核心概念(节点、话题、服务、参数)是通的,但有几个坑:
第一个坑:实时性。CyberRT 的调度器是确定性的,ROS 2 的 executor 在复杂场景下可能出现优先级反转。做高实时性应用时,需要仔细配置 DDS 的 QoS 和线程模型。
第二个坑:生态依赖。ROS 2 的包管理比 CyberRT 方便太多,但依赖链也长。一个简单的导航应用,可能拉起十几个包,调试起来比 CyberRT 的单体架构复杂。
第三个坑:工具链。CyberRT 有 cyber_monitor、cyber_visualizer,ROS 2 有 rviz2、rqt。功能上等价,但操作习惯完全不同。做惯了 cyber 工具的人,刚切到 rviz2 会很不适应。
━━━━━━━━━━━━━━━━━━
▌05 / 一个判断:融合正在加速
说一个趋势判断。
过去两年,自动驾驶和机器人是两条平行线。做自动驾驶的人看不起机器人——"玩具,离量产差得远"。做机器人的人看不起自动驾驶——"封闭道路,不够通用"。
但从 2025 年底开始,两条线开始交汇了。Nvidia 把 Drive 和 Isaac 统一到同一个计算平台。DeepMind 合并了自动驾驶和机器人团队。国内比亚迪、小鹏、蔚来全部下场做人形机器人。
背后的逻辑很简单:自动驾驶和机器人共享的底层技术——感知融合、实时通信、运动规划、Sim-to-Real——正在被同一个 AI 范式重新定义。端到端模型在自动驾驶上的成功,让机器人公司看到了 VLA 大模型的可能性。而机器人在灵巧操作上的突破,也让自动驾驶公司开始思考:如果车都能自己开了,为什么不能让它干点别的?
━━━━━━━━━━━━━━━━━━
最后说几句
写这篇文章的时候,我一直在想一个问题:如果明天我的岗位从自动驾驶集成变成了机器人集成,我能不能快速上手?
答案是:能,但没那么容易。能复用的是架构思维、中间件经验、传感器融合的直觉。需要重学的是运动学、力控、以及面对非结构化环境的调试耐心。
但我越来越觉得,这两个领域的界限会越来越模糊。五年后回头看,可能"自动驾驶工程师"和"机器人工程师"会合并成一个职业——"智能体系统工程师"。你做的不是车或机器人,你做的是一套让物理世界里的智能体可靠运行的系统。
到那时候,今天的迁移成本,就是明天的竞争优势。