核心判断
其一,人形机器人具备长期战略价值和产业牵引意义,但当前尚未形成类似智能驾驶的数据飞轮、产品闭环和规模化商业路径,短期内不宜将技术演示能力等同于产业成熟能力。
其二,原本被寄予较高期待的“将车辆自动驾驶数据、算法和工程体系嫁接到人形机器人”的路径,短期内并不乐观,甚至在多数场景下并不可行。人形机器人需要重新建立面向具身操作、接触交互和任务执行的数据体系与技术范式。
一、自动驾驶:从地图依赖到数据驱动
过去十余年,自动驾驶技术路线大体经历了高精地图方案、模块化规则方案、无图智驾方案和数据驱动方案的演进。
1. 高精地图:早期自动驾驶的确定性基础
早期自动驾驶高度依赖高精地图。该路线通常由地图服务商或自动驾驶企业提前采集厘米级道路信息,包括车道线、停止线、交通标志、信号灯位置、道路曲率、路口拓扑等要素。车辆在高精地图、精确定位和多传感器感知的基础上,实现车道级路径规划与决策控制。
该方案的优势在于边界清晰、系统可解释性较强、安全冗余较充分,较适合 Robotaxi、园区物流、港口运输、矿区作业等限定区域场景。
但此路线较高,道路施工、临时管制、车道调整等变化会削弱地图先验的有效性,跨城市、跨区域扩展效率不足。因此,高精地图更适合作为高等级自动驾驶的安全冗余和先验辅助,而难以单独支撑开放道路的大规模泛化应用。
2. 手写规则:工程可控但难以覆盖长尾
随后,自动驾驶进入以模块化系统和手写规则为主体的发展阶段。典型架构包括感知、定位、预测、决策、规划、控制等模块。系统通过人工设定大量交通规则和驾驶策略,例如跟车距离、变道条件、让行逻辑、绕障策略和速度约束等。
这一路线具备较强工程可控性,便于系统验证和安全边界管理。但开放交通环境具有高度复杂性和不确定性,单纯依靠人工规则难以覆盖全部长尾场景。特别是在城市道路中,临停车辆、非机动车混行、施工改道、异形障碍物、复杂路口博弈等情况频繁出现,规则系统容易陷入“不断补丁化”的发展状态。
3. 无图智驾:地图退后,车端感知前移
近年来,自动驾驶逐步转向无图智驾和端到端学习方向。所谓“无图”,并非完全脱离地图,而是不再强依赖厘米级高精地图。普通导航地图仍用于全局路径引导,车辆则依靠车端感知、道路理解、行为预测和规划模型实时判断局部驾驶策略。
其本质是将车辆从“依图行驶”逐渐推向“基于环境实时理解的自主决策”。在该路线下,地图由主导要素转变为辅助要素,规则由核心方法转变为安全底线,数据和模型逐渐成为系统能力提升的主要驱动力。
4. 路线分化:Robotaxi、特斯拉与中国方案
不同企业在这一过程中形成了差异化技术路线。
Robotaxi 企业通常强调多传感器冗余、高精地图辅助和高安全约束,目标是实现限定区域内的高等级无人驾驶。其优势在于安全边界和系统冗余较强,劣势在于运营区域扩展、成本控制和商业规模化仍存在挑战。
特斯拉选择较为激进的纯视觉和数据驱动路线,强调通过大规模量产车队采集真实驾驶数据,并利用神经网络学习驾驶行为。其核心优势在于车辆保有量大、数据来源广、迭代速度快,能够形成较强的数据闭环。但该路线也面临可解释性、安全验证和监管适配等问题。
华为、小鹏等国内企业则更多采取多传感器融合与无图城市辅助驾驶相结合的路线。其特点是在摄像头、激光雷达、毫米波雷达等传感器基础上,降低对高精地图的依赖,通过车端实时感知和行为模型完成复杂城市道路决策。这一路线兼顾工程冗余和泛化能力,较符合国内城市交通环境复杂、道路变化频繁的特点。
5. 数据飞轮:智能驾驶的关键变量
自动驾驶之所以能够持续迭代,关键不只是单点算法突破,而是逐步形成了数据飞轮。
车辆销售规模扩大后,真实道路数据持续积累;数据规模提升进一步促进模型迭代;模型能力增强改善用户体验;用户体验提升又反过来促进产品竞争力和市场扩张。车辆天然处于高频使用状态,人类驾驶行为天然构成示范数据,驾驶员接管行为又可形成重要纠错数据。
这一闭环,是当前智能驾驶持续演进的重要基础。
二、人形机器人:需求明确,路径未明
人形机器人之所以受到高度关注,根本原因在于其潜在应用空间较广。人类社会的生产生活环境大多按照人体结构设计,包括门把手、楼梯、工具、桌椅、生产设备、仓储空间和家庭设施等。人形机器人理论上具备更强的环境适应能力和任务迁移潜力,可面向工业制造、危险作业、应急救援、仓储物流、养老康养、公共服务等场景提供新型智能执行能力。
1. 需求存在:产业和社会均有牵引
从需求端看,相关方向具备一定现实基础。工业领域需要柔性化、可重构的智能装备;危险行业需要减少人员暴露于高危环境;养老康养领域面临长期照护压力;国防、安全、巡检、应急等行业也存在对复杂环境自主执行体的需求。
因此,人形机器人被视为人工智能、高端装备制造和新质生产力的重要结合点,具有较强的产业叙事和政策牵引意义。
2. 传统方案:结构化场景有效,开放环境受限
从技术实现看,传统机器人系统主要依赖几何建模、运动规划、轨迹跟踪和力控方法,在结构化场景中具有较高可靠性。例如工业机械臂在固定工位、固定物料、固定流程下,已经能够实现高效率、高精度和高稳定性作业。
但一旦进入开放环境,传统方案容易受到物体多样性、接触复杂性、任务不确定性和环境动态变化影响。尤其是在灵巧操作、柔性物体处理、多任务迁移和失败恢复等方面,传统方法面临明显瓶颈。
当前行业普遍希望通过大模型、模仿学习、强化学习、视觉—语言—动作模型等方法提升机器人的类人行为能力。但技术路线尚未稳定,工程闭环尚未成熟。
3. 数据短板:具身数据稀缺且昂贵
与自动驾驶相比,人形机器人面临更突出的数据短板。智能汽车天然处于高频使用状态,人类驾驶行为可以持续产生示范数据和接管数据;而人形机器人尚未形成大规模真实部署,缺乏稳定、持续、低成本的具身数据来源。
现阶段,人形机器人的数据主要来自遥操作、动作捕捉、仿真平台、实验室采集、训练场采集以及少量真实场景试运行。这类数据采集成本高、规模有限、场景覆盖不足,且不同机器人本体之间存在较强差异,数据复用和迁移难度较大。
更重要的是,人形机器人所需数据不仅包括视觉图像,还包括关节状态、末端力、触觉信号、接触状态、物体形变、动作结果和失败原因等。其数据结构更复杂,标注成本更高,数据闭环更难形成。
4. 嫁接困难:自动驾驶经验不可简单迁移
当前存在一种观点,认为车辆自动驾驶已经在感知、规划、控制和数据闭环方面积累了较成熟经验,可以较快嫁接到人形机器人领域。该判断需要审慎看待。
自动驾驶积累的数据主要来自道路交通环境,其任务目标相对明确,即在道路约束下实现安全、高效、舒适的车辆行驶。车辆执行维度较低,主要控制方向、速度和制动,环境虽然复杂,但任务边界相对清晰。
人形机器人面对的则是全身运动、灵巧操作、接触交互和开放任务执行。其核心数据不是“如何在道路上开车”,而是“如何在物理世界中完成任务”。这类数据涉及手眼协调、力觉触觉、物体操作、失败恢复和人机协作,与车辆自动驾驶数据存在本质差异。
因此,自动驾驶的工程经验具有参考价值,例如数据闭环、仿真测试、安全冗余、灰度迭代等方法论可以借鉴;但自动驾驶数据和算法体系难以短期直接迁移到人形机器人。将“车端智能”直接嫁接为“机器人智能”,在多数复杂操作场景中并不现实。
人形机器人需要重新建立面向具身操作的数据体系、模型体系、评测体系和安全体系。这一过程不能简单依赖自动驾驶存量能力替代。
5. 规模化路线:仍处于验证阶段
各地建设机器人训练场、具身智能数据平台和仿真平台,方向上具有积极意义。通过集中采集多模态操作数据、构建标准化任务场景、形成统一评测体系,有助于缓解具身智能训练数据不足的问题。同时,工信部推动人形机器人与具身智能标准化工作,也有利于规范产业发展、统一接口标准、完善安全要求和测试评价体系。
但应当看到,训练场数据、仿真数据与真实生产生活场景之间仍存在显著差距。机器人产业最终需要解决的不是单次演示成功,而是长期稳定运行、可复制部署、可维护运营和可持续盈利。
因此,当前人形机器人的规模化路线尚未完全跑通,仍处在技术验证、场景筛选和商业模式探索阶段。
三、关键差异:人形机器人为何更难
与车辆自动驾驶相比,人形机器人面临更高维度、更复杂和更难闭环的技术及产业挑战。
1. 自由度高:系统复杂性显著增加
车辆自动驾驶的控制对象相对有限,主要包括方向盘、油门、刹车等执行单元,运动约束主要发生在道路平面内。尽管交通环境复杂,但车辆本体的运动形式相对明确。
人形机器人则完全不同。其执行系统包括双腿、腰部、躯干、双臂、手腕、多指灵巧手等多个自由度,同时还要满足平衡、避障、全身协调、接触力控制和任务完成等约束。
一个看似简单的“拿取物体”任务,实际涉及站位选择、身体姿态调整、手臂避障、手眼协调、指尖接触、抓取稳定、搬运保持、递交姿态和失败恢复等多个环节。
因此,人形机器人并不是自动驾驶技术在机器人本体上的简单延伸,而是更复杂的具身智能系统。
2. 数据不足:难以形成自然飞轮
自动驾驶数据具有天然来源。车辆持续行驶,人类驾驶行为天然构成示范数据,驾驶员接管行为可以形成重要负样本和纠错数据。随着车辆保有量增长,数据积累具有规模效应。
人形机器人尚不具备这一条件。当前机器人并未像汽车一样进入大规模日常使用状态,缺少稳定的数据产生场景。即使建立训练场和仿真平台,也仍面临真实接触数据不足、任务多样性不足和场景泛化能力有限等问题。
换言之,汽车是“越卖越多、越开越多、数据越积越厚”;人形机器人则仍处于“未规模部署、数据不足、能力受限、进一步制约部署”的冷启动阶段。
3. 迁移困难:仿真与现实差距更大
自动驾驶仿真虽然同样存在现实差距,但道路环境、车辆动力学和交通参与者行为相对更容易建模。人形机器人涉及软接触、摩擦、滑移、布料、线缆、复杂工具使用、人机协作等物理交互问题,仿真误差更容易放大。
在灵巧操作任务中,微小的摩擦差异、接触位置误差或物体初始姿态变化,都可能导致完全不同的执行结果。因此,仅靠仿真训练难以解决真实世界中的复杂操作问题,必须依赖高质量真实具身数据和长期试验验证。
4. 闭环不清:商业化仍待验证
从产业化看,人形机器人当前仍主要处于展示、科研、教育、数据采集、试点应用和小规模交付阶段。部分企业在出货量和订单方面取得进展,但行业整体尚未形成稳定的大规模商业闭环。
从市场结构看,人形机器人当前较多应用仍集中于科研教育、展陈演示、二次开发和特定试点场景。相比之下,四足机器人在巡检、安防、科研、文娱等领域已经形成相对清晰的产品形态和应用路径,商业化成熟度整体高于人形机器人。
以宇树、智元、乐聚等国内企业为代表,人形机器人在产品发布、订单拓展、行业关注度方面进展较快,但企业盈利质量、场景复购能力、规模化交付能力和单位经济模型仍需继续观察。尤其是部分收入仍来自科研、教育、展示和二次开发市场,距离大规模替代生产性劳动仍有距离。
因此,对人形机器人产业化进展应保持审慎判断。出货增长、融资增长和演示能力提升,并不必然意味着大规模商业闭环已经形成。其真正产业拐点,应当以稳定应用场景、持续订单能力、明确单位经济模型和可复制交付能力为标志。
四、人形机器人产业升温的主要原因
近年来,人形机器人技术产业快速升温,既有技术因素,也有产业和政策因素。
1. 产业升级需要新载体
国内产业升级需要新的增长方向。在新能源汽车、光伏、锂电等产业快速发展之后,市场和地方产业体系需要新的高端制造载体。人形机器人集成人工智能、高端装备、伺服驱动、减速器、传感器、灵巧手、软件平台和数据服务等多类技术,具备较强产业链带动效应。
2. 政策引导提供新牵引
人工智能与实体经济融合正在成为产业政策重点方向。人形机器人作为具身智能的重要载体,能够承接人工智能从“信息智能”走向“行动智能”的战略需求。政策支持、标准建设、试点示范和地方产业布局,将为行业发展提供持续牵引。
3. 产业链成熟奠定基础
我国在机械加工、电子制造、供应链组织、整机集成和成本控制方面具备较强优势,有利于人形机器人硬件快速迭代和产业链完善。电机、减速器、传感器、控制器、结构件、整机装配等环节的成熟度提升,为行业进一步降本和规模化试验创造了条件。
4. 资本科研形成合力
车企、机器人企业、人工智能企业、高校和科研机构纷纷布局,使该领域快速进入技术竞争和产业卡位阶段。资本投入和科研力量集聚,有助于推动关键技术突破,但也可能带来重复建设、短期炒作和同质化竞争。
五、发展建议:以场景和数据为主线
人形机器人产业发展宜坚持问题导向、场景牵引和长期投入,防止概念先行、重复建设和低水平竞争。
1. 聚焦垂类场景
不宜过早将通用家庭机器人作为主要商业化目标。应优先选择需求明确、边界清晰、价值可量化的应用场景,例如危险作业、国防安全、工业制造、仓储物流、巡检运维、应急救援、养老康养等领域。
通过垂直场景积累数据、验证可靠性、完善产品形态,再逐步拓展通用能力。对人形机器人而言,垂类场景不是过渡性选择,而是形成能力闭环的必要起点。
2. 推进人工智能从“认知”走向“行动”
人形机器人应服务于人工智能从感知、理解、生成向执行、交互、操作延伸。重点应放在能够解决实际生产生活问题的任务环节,例如高危环境替代、重复劳动减负、柔性制造补充、老龄化社会服务等。
产业发展应避免停留于展示表演和概念宣传,必须以真实任务完成能力、系统稳定性和经济价值作为核心评价标准。
3. 完善分级分类治理
人形机器人涉及公共安全、数据安全、产品质量、人机协作、劳动关系和伦理责任等问题。监管不宜过早过严,也不宜完全放任。
较为合理的路径是分领域、分阶段、分风险等级推进:科研测试场景给予较大探索空间,工业封闭场景加强安全标准建设,公共服务和家庭场景则应更加重视责任边界和安全规范。
应防止出现“一放就乱、一管就死”的局面,形成既鼓励创新又守住底线的行业治理体系。
4. 建设高质量具身数据体系
未来人形机器人竞争的核心之一,是高质量具身数据。应围绕视觉、语言、动作、力觉、触觉、任务结果、失败原因和恢复策略等要素,建设标准化、多场景、可复用的数据集和评测体系。
同时,应建立数据采集、清洗、标注、训练、验证和共享机制,提升数据资产利用效率。只有形成持续、低成本、高质量的数据供给,机器人行为模型才可能实现稳定迭代。
5. 强化交叉基础研究
人形机器人不可能仅依赖大语言模型或传统控制方法取得突破。未来需要多模态感知、世界模型、运动控制、触觉反馈、灵巧操作、任务规划、安全约束和类脑智能等方向深度融合。
应鼓励人工智能、神经科学、控制科学、机械工程、材料学和认知科学等交叉研究,特别是加强类脑智能、具身认知、触觉感知、柔性操作和行为学习等基础方向布局。
6. 理性引导社会预期
社会公众应认识到,人形机器人发展具有长期性和不确定性。真实场景中的摔倒、抓取失败、动作迟缓、任务中断,在一定阶段内属于工程系统迭代过程的一部分。
舆论应避免两种倾向:一是过度神化,将演示视频等同于产业成熟;二是过度否定,以单次失败否定长期方向。对于处于早期阶段的复杂工程系统,应建立更加理性、包容、可持续的评价环境。
7. 前瞻应对就业影响
人形机器人一旦进入工业、服务业和养老场景,将不可避免影响部分劳动岗位结构。应提前研究岗位替代、技能转型、人机协作、劳动保护和收益分配等问题。
技术进步的目标不应被简单理解为“替代人”,而应更多体现为降低危险劳动、补充劳动力缺口、提升生产效率和改善服务供给。