先说结论:从自动驾驶转到具身智能,难度并没有想象中大。两者在硬件认知、算法范式、数据工程乃至传统方案兜底等层面高度相通,自动驾驶积累的端到端、IL、VLA、RL 等经验,以及感知、SLAM、规控等能力,大多可以直接复用。而且具身智能尚处早期,越早期门槛越低,对自驾背景的同学来说,现在正是切入的合适窗口。
原文内容如下:
在具身智能语境下,我觉得本质上可以认为自动驾驶是一个失效成本很高的轮式机器人(当然还要考虑车规)。
从硬件构型上看,自动驾驶我更愿意将其视为具身智能的子集——某种构型确定、出货量大的四轮式机器人。
具身智能的身体则千奇百怪,四轮足/双轮足/单臂/双臂/移动机械臂等等,而且现在普遍出货量不高,没有变成消费标品,因此机器人更适合作为一个平台类产品。
从算法上看,自动驾驶想在所有驾驶场景完成一个通用导航问题;而这次具身智能的主要浪潮,个人认为是解决通用移动操作问题(这个问题的难度是比自动驾驶更高维的难题,但是好处是失效成本低)。
自动驾驶的action维度很低,只用考虑xy方向,也不需要和物理世界接触交互(除非碰撞),只有主要是多车之间的博弈交互,所以自动驾驶的仿真也会更好做。
但是具身智能的action是3D空间的移动,需要和物理世界产生交互,而且要交互不同材质的物体,这就对于仿真的要求更高。
具身智能目前发力的热点是(VLA)IL+RL,自驾现阶段大家研发的方向也开始转向IL+RL,也有在宣传自驾VLA方案的厂家。
自驾端到端IL/VLA/RL 这些实操经验都很适合复用到具身。具身智能同样需要数据工程,自动化标注,而且现阶段具身智能落地也免不了需要一些传统方案来兜底,传统感知、SLAM、规控都能找到自己合适的位置。
不过具身智能做真机实验很麻烦,不像之前在自动驾驶中,感知的一些任务跑个 benchmark 就能出结果,涉及物理交互的操作都需要上真机验证(仿真验证只是一个辅助验证工具)。
身边也有好多自驾的同学转行到具身的,就像前两年转大模型的一样,越早期门槛越低、越容易加入。现阶段的自驾基本上技术路线已经基本收敛,想要博一博更广阔的发展空间,具身可能是当下比较合适的选择
文章来源:@AIming 知乎作者授权分享 https://www.zhihu.com/question/1937101538351870795/answer/1942013341846446516
欢迎关注『深蓝职通车』
SHEN LAN
推荐阅读


