中国人形机器人在国家电视春节联欢晚会上以功夫翻转动作吸引了全球关注,同时中国手机制造商荣耀在西班牙世界移动通信大会上发布其首款人形机器人及机器人手机。机器人技术被列为国家"中国制造2025"计划的优先发展领域,尽管最初专注于工厂自动化而非人形机器人。如今,多模态AI的快速发展正在加速所谓的具身AI——在现实世界中运行的自主机器——官员表示这一推进有助于缓解劳动力短缺并推动生产力提升。埃里克·施密特办公室的中国及AI政策负责人徐赛琳娜表示,在人形机器人发展的早期阶段,中国公司在速度和产量上都超越了美国竞争对手。
徐赛琳娜告诉TechCrunch(《科技博客》):"中国拥有更强大的硬件供应链——其中很多是通过电动汽车行业建立的,从传感器到电池——以及全球最强的制造基础,这使得公司能够比西方竞争对手更快地进行迭代。"
因此,不仅中国机器人更便宜,公司也能更快地发布新型号。徐赛琳娜指出,中国领先企业宇树科技去年的出货量大约是美国竞争对手Figure和特斯拉的36倍。
银河通用机器人首席战略官赵玉立告诉TechCrunch,最近最大的转变是从"演示驱动的兴奋"转向"运营驱动的采用"。银河通用的人形机器人G1出现在今年的春节联欢晚会上,这是中国一年一度的国家农历新年除夕电视节目,与宇树机器人、诺亿拓和魔法实验室的机器人一同亮相。
赵玉立说:"更多客户在问:机器人能在真实环境中稳定运行并真正为人们分担工作吗?这种实用需求在中国得到加强,因为政策和产业战略鼓励自动化升级,制造生态系统使迭代极其快速。"
虽然对人形机器人初创企业增加的资金投入"确实加速了"进展步伐,但"最持久的采用来自于你能在生产或服务运营中展示可靠和可重复的价值,而不仅仅是一次性的展示",赵玉立补充说。
美国公司也在超越华而不实的演示,专注于现实世界的部署。此外,他们正在追求自己的激进目标。例如,美国初创企业Foundation计划到2027年底建造5万台人形机器人。
但据12月TrendForce报告,中国已经在瞄准经济实惠的大众市场型号和高端应用的组合,快速将人形机器人扩展到工业、消费和康复领域。
在AI系统和集成软件方面,中国人形机器人公司的真实地位仍不明确。该行业主要押注视觉-语言-行动模型和"世界模型",但这两项技术仍处于早期阶段。据徐赛琳娜称,英伟达目前在端到端人形机器人软件栈方面领先,因此中国大多数人形机器人初创企业自然都采用英伟达的Orin芯片。然而,她表示,国内芯片制造商正在开发自主替代方案。
然而,人形机器人制造商仍在解决基本问题。挑战在于使机器人基础模型能够预测机器人在不可预测环境中将面临的"下一个物理状态",就像大语言模型预测下一个单词一样。但与大语言模型不同,人形机器人公司不能简单地从互联网上抓取训练数据。因此,大多数公司依赖仿真环境生成合成数据,尽管现实世界的数据收集仍然至关重要。
这位分析师说:"由于数据稀缺问题,人形机器人距离自主性还很遥远。硬件目前领先于软件——机器人身体今天能处理比几年前更多的灵活性(尽管存在可靠性问题,正如我们在人形机器人马拉松中看到的机器人故障),但大脑仍处于萌芽阶段。"
安全性也是人形机器人面临的重大障碍。一次高调的事故可能引发公众反弹,中国可能在权衡如何在不过于急躁的情况下快速推出这项技术。随着行业成熟,预计会有更多法规出台。
鉴于数据匮乏,赵玉立认为对人形机器人的需求将首先在相当封闭的工作场所增长。他说:"早期势头可能在工业制造、仓储物流和零售领域,这些领域任务重复、工作时间长、流程清晰——为人形机器人大规模创造价值创造了真正的需求和理想条件。"
除此之外,人形机器人的规模化发展更离不开网络技术的支撑。无论是多机器人协同作业时的实时数据交互,还是仿真环境与真实场景的数据同步、远程监控与调试,都需要高速、低延迟的网络作为保障,破解多自由度协同、远程控制等技术瓶颈,将成为具身AI落地的重要基础设施。
行业内存在一个深刻的技术观察:为什么都说人形机器人比自动驾驶汽车更难?实际上,虽然自动驾驶汽车和人形机器人都属于“具身智能”的范畴,但如果说自动驾驶是“在二维平面上的受限博弈”,那么人形机器人就是“在三维空间里的全自由度生存”,二者的技术难度不在一个量级。业内公认人形机器人更难,主要源于以下四个核心维度的跨越:
从“感知”到“交互”的质变
其中最关键的力反馈难题: 汽车不需要感知地面的“硬度”,但机器人必须感知物体的“软硬、轻重、摩擦力”。这种双向的物理交互比单纯的视觉识别要复杂几个数量级。
数据获取的“贫富差距”
AI的进化依赖于数据,而人形机器人的数据极度匮乏。
容错率与硬件极限
在能量密度方面,汽车可以背负巨大的电池和算力芯片。人形机器人受限于体积和重量,必须在极小的空间内集成高性能电机、减速器和高算力平台,还要维持数小时的续航。
在稳定性上,汽车熄火了是停在路上,而人形机器人失去动力会直接摔毁。由于它是倒立摆模型(头重脚轻),维持动态平衡本身就是一项极其消耗计算资源的挑战。
自动驾驶解决的是“从A点到B点”的位移逻辑,而人形机器人要解决的是“理解并改变物理世界”的通用逻辑。
这就是为什么马斯克说 “Optimus的长期价值将超过汽车业务” —— 因为它一旦成功,意味着人类掌握了通用的劳动力,将对社会生产生活产生革命性影响。
你认为,未来5年内,我们更有可能先看到满大街的无人驾驶车,还是先看到在工厂里打工的人形机器人?欢迎在留言区分享你的观点。
综合自| 澎湃新闻·澎湃号·湃客、SongBot具身智能实验室