具身智能的 2026 年 5 月:550 亿融资、3800 辆召回、一场正在发生的范式夺权
━━━━━━━━━━━━━━━━━━━━
一边是550亿融资,一边是3800辆Robotaxi集体溺水。这个行业正在被撕成两半。
1. 冰火两重天
2026 年 5 月的第三周,具身智能赛道同时发生了两件事。
第一件:融资数据出来了。2026 年前四个月,具身智能赛道融资超 200 笔,总规模超550 亿元。36氪的标题直接用了「2026 年上半年最火赛道」。魔法原子在硅谷发布了「自进化具身大脑」——中国公司的名字第一次出现在具身智能底层系统发布会的硅谷会场上。
第二件:Waymo 召回了3800 辆 Robotaxi。原因很朴素——它们不认识积水。传感器把积水路面识别为可通行区域,车辆直接往里开。
这两件事放在一起,就是 2026 年 5 月具身智能行业的全部真实面貌:一边是资本在疯狂下注未来,一边是工程现实在反复打脸。
我不觉得这是矛盾的。恰恰相反,当一个行业同时出现「史上最大融资」和「最大规模召回」的时候,说明它正在从一个阶段迈向另一个阶段。泡沫和真实突破经常长在同一棵树上。
2019年号称「全自动驾驶硬件」的芯片,6年后被证实不够用。为FSD付过钱的人被耍了。
2. HW3 之死:自动驾驶进入实事求是期
这一周还有一条被低估的新闻:特斯拉的 HW3 硬件被正式判了死刑。
马斯克认怂了——HW3 的计算能力不足以支撑真正的无监督 FSD。这款芯片 2019 年量产,当时被包装成「全自动驾驶硬件」。特斯拉卖车时告诉用户:买下 FSD 能力,以后硬件够用。
6 年后,答案出来了:不够用。
这意味着:所有购买了 HW3 车辆、为 FSD 能力付过费的用户,永远无法在这套硬件上获得真正的无人驾驶体验。他们的车不会通过 OTA 升级变成 Robotaxi。硬件天花板到了。
但这件事的冲击不在特斯拉本身。冲击在于:当全球最强的自动驾驶公司都无法在 6 年前的硬件上实现无人驾驶,整个行业的时间表都需要重估。
过去几年,我们听了太多「明年量产」「三年内 L4 落地」的承诺。HW3 的结局是一个残酷的校准:硬件迭代速度根本跟不上算法野心的膨胀速度。你 2019 年算力能做的事,到 2025 年算法已经跑不动了。这不是哪家公司的失败,是整个行业的底层矛盾。
Waymo 的 3800 辆召回和特斯拉的 HW3 死刑是同一件事的两面:自动驾驶正在从「吹牛期」进入「实事求是期」。现在没人敢再给时间表了。敢给的也很快会被打脸。
CVPR可能是最后一个具身智能以「副课题」身份出现的顶会。明年不是这样了。
3. CVPR 2026:具身智能的范式夺权
本周的 CVPR 2026 给出了一个信号——但不是在论文里,是在论文分布上。
具身智能相关的投稿和接收数量,大幅超过了传统计算机视觉的细分方向。雷锋网的标题用了一个精准的词:「范式夺权」。
不是「计算机视觉正在扩展到具身智能」,是「具身智能正在把计算机视觉变成自己的子集」。
这背后是一个逻辑变化。传统 CV 追求的是「理解图像」——识别物体、分割场景、估计深度。这些东西的价值上限在哪儿?你在手机相册里搜「猫」能找到所有猫的照片——很好,然后呢?
具身智能给出了「然后」的答案:理解了就要行动。看到了杯子要能拿起来。识别了积水要能绕开。判断了物体的材质要能调整抓取力度。
从「看」到「做」——这一步跨出去,CV 的战场从屏幕上移到了物理世界里。而这个市场比图像识别大几个数量级。
CVPR 2026 不是具身智能的起点,但它是学术界正式承认「具身智能是主战场」的那一届。
中国公司第一次在硅谷发布具身智能底层系统。不是应用层套壳,是真东西。
4. 中国玩家:从追赶到站上台前
魔法原子这周在硅谷发了「自进化具身大脑」。这个名字值得拆开看。
「自进化」的意思是:机器人在执行任务的过程中,可以实时更新自身的行为模型,不需要回厂重新训练。你让它搬箱子,它在搬的过程中会自己变好。越搬越准,越搬越稳。
这是一个质的区别。过去机器人的学习模式是「训练-部署-永不更新」。模型训练好了,烧进机器人里,出厂什么样就是什么样。自进化打破了这条线——它把「部署」和「学习」合成了一个连续的过程。
另一家值得盯的公司是智元机器人。创始人邓泰华的原话:「具身智能产业刚刚起步,未来空间巨大,有望成为未来最大的单品工业品,市场规模有望达到——」他没说完,但意思很清楚了。
更值得留意的是国家队在入场。北京人形机器人创新中心搞出了「一脑多机」模式——一个大脑同时控制机械臂、轮式机器人、人形机器人。盐城启动了具身智能机器人产业发展三年行动。亿欧出了《2026 中国具身智能企业出海全景报告》。
这不是几家创业公司在玩。这是一个国家在押注。
具身智能被写进了中国的「未来产业」名单,跟人工智能并列。BBC 的报道里有一句话:「被寄望成为推动科技自主与经济增长的新引擎。」
550 亿融资不是泡沫。是押注。
自动驾驶用了6年学会了一件事:别吹牛。这是整个行业最值钱的教训。
5. 三个底层信号
把这一周所有新闻叠在一起,能看到三件事:
信号一:具身智能的「Android 时刻」已经到了。
iPhone 时刻没来——还没有一个产品像 iPhone 那样重新定义整个品类。但 Android 时刻来了:多家公司在同时发布平台级产品,资本在涌入,国家队在入场,开源社区在复现。行业正在从「谁能做」变成「谁能做大」。这是一个生态形成的信号。
信号二:自动驾驶用 6 年学会了一件事——别吹牛。
HW3 之死和 Waymo 召回在本质上是同一课:物理世界比模型复杂太多。积水、逆光、施工区域、突然冲出来的小孩——这些东西在训练数据里占比可能不到 0.01%,但在真实路况上每天都在发生。自动驾驶终于从 demo 阶段进入了工程阶段——这意味着不再有激动人心的产品发布会,只有漫长的、无聊的、一步步的迭代。这是好事。
信号三:学术界和产业界第一次同步了。
CVPR 的范式夺权和魔法原子的产品发布发生在同一周。这不是巧合。学术界在认「具身智能是主战场」,产业界在用 550 亿投票。这种同步在过去十年的 AI 浪潮中很少见——通常是学术界先跑 3-5 年,产业再跟进。这次两边在同时加速。
━━━━━━━━━━━━━━━━━━━━
最后说几句
我跟具身智能跟了大半年,对 2026 年 5 月的感觉是:行业正在从青春期进入成年期。
青春期的标志是乐观、敢承诺、速度快。成年期的标志是承认问题、接受约束、实事求是。Waymo 敢召回 3800 辆车、马斯克敢承认 HW3 不够用——这是成年期的行为。在青春期,出问题都是偷偷修,没人公开召回。
让我比较在意的反而是 550 亿融资这个数字。
550 亿不是小钱。但钱多不代表方向对。2016 年自动驾驶第一波融资潮的时候,融的钱比现在还多——然后一批公司死在了 2019 年的「幻灭期」。今天回头看,活下来的公司有多少?两只手数得过来。
具身智能会不会重蹈覆辙?我的判断是:不会完全相同。因为这一波跟 2016 年有几个本质区别。
第一,底层模型变了。2016 年的自动驾驶用的是规则系统 + 简单的感知网络,泛化能力极差。2026 年的具身智能背靠大语言模型和视觉基础模型,泛化能力和 2016 年不是一个量级。
第二,硬件成本在快速下降。人形机器人的核心零部件——电机、减速器、传感器——正在经历「中国制造」的成本压缩。宇树、智元这些公司的 BOM 成本比三年前低了一半以上。
第三,也是最被低估的一点:场景正在明确。2016 年的自动驾驶只有一个场景——上路。但具身智能的场景是分散的:工厂、仓库、养老院、手术室、家庭、农田——每个场景的进入门槛不同,容错率不同。这使得行业不会出现「赢家通吃」的局面,也不会出现「全行业一起死」的局面。总有一些场景先跑出来。
但我的担忧也不小。
HW3 的教训告诉我们:硬件的天花板是真实的。你今天设计的机器人,5 年后算法可能跑不动了。这不是 bug,这是物理规律。机器人不像手机——你不能每年换一台。一台工业人形机器人的采购成本是几十万到上百万,客户期望的使用寿命是 5-10 年。如果 3 年后算力就不够了怎么办?这个问题没人回答。
另一个问题:550 亿里有相当一部分投在了「跟风」的项目上。我和做硬科技投资的朋友聊过,他说目前的具身智能项目里,至少有三分之一是「PPT 机器人」——团队拉了几个人,攒了一台 demo 机,拍了一条视频,就出来融资了。没有量产能力,没有供应链,没有落地场景。
这些项目会在下一次融资窗口关闭时集体倒下。不是如果,是当。
但我不悲观。恰恰相反。
因为 Waymo 的召回、特斯拉的认怂、CVPR 的范式转移——这三件事指向同一个方向:具身智能正在从「能跑起来就是胜利」进入「能稳定跑起来才有意义」的阶段。这是一个健康的转变。
泡沫会破,PPT 公司会死,但真正的工程能力——供应链、量产、落地、持续迭代——会留下来。
2026 年 5 月不是终点。它是实事求是期的第一天。