AI最先征服的是屏幕,最难进入的是现实世界。在屏幕里,AI犯错最多是答错一道题;到了现实世界,一旦出错,就会撞上车、撞上人。2026年CES上,黄仁勋宣告机器人领域的ChatGPT时刻已经到来,"物理AI"成为行业聚光灯的中心。但一个根本问题是:物理AI的门槛不在于谁喊概念更响,而在于谁先拿到进入长赛道的门票——规模化数据、可持续现金流、真实世界的量产验证。
为什么不是机器人先跑通?
2026年前几个月,中国具身智能融资已进入百亿级密集爆发阶段。但资本只能更快地为试错扫清障碍,却买不来完整的物理世界周期。
OpenAI早年同时布局机器人和语言模型,最终阶段性选择GPT,背后正是成本结构差异。数字AI的数据来自互联网,天然大规模、低成本、易获取;物理世界的逻辑完全不同——数据采集难,测试周期长,试错代价高。
从这个角度看,自动驾驶可能是最先规模化跑通"数据闭环"和"商业闭环"的物理AI场景。
世界模型:在虚拟世界里先练车
2026年2月,Waymo发布了基于Google DeepMind Genie 3构建的Waymo World Model,用于生成高真实度、可交互的自动驾驶仿真环境。
4月25日,北京车展期间,Momenta发布了R7强化学习世界模型,实现量产首发。这不是一个简单的OTA升级,而是底层架构的一次质变。
世界模型分为三层:
预训练层——依托量产车队产生的海量真实驾驶数据,将物理规律、常识与因果关系压缩进模型,让系统拥有"物理直觉"。
仿真层——让系统理解"如果我的行为发生变化,世界将如何演变"。不再是简单的规则模拟,而是基于真实数据的概率推演。
强化学习层——最关键的一层。系统从单纯的模仿学习走向"想象与探索",在虚拟世界里经历千万次推演,自主学会在复杂博弈中做出最优决策。
一个具体的例子:如果前车意外掉落一箱苹果,R7能预判苹果滚落的轨迹与扩散范围,提前平稳减速并规划绕行路线。只依赖已有数据和真实路测,很难穷尽这类低频风险。
量产是最大的护城河
搭载Momenta系统的量产车辆已超过80万台,覆盖超过20个品牌、60余款车型,包括梅赛德斯-奔驰、奥迪、宝马的新发布车型。
Momenta CEO曹旭东给出了一个判断:"任何一个人工智能应用,一旦接近人类的水平,就会在很短的时间内大幅超过人类的水平。"
他认为智驾领域正在呈现一种"摩尔定律"式的进步节奏——过去大约是两年十倍的提升速度,行业领军企业甚至可能做到一年十倍。
时间壁垒同样真实。自动驾驶软件具备接近零边际成本的规模效应,先发优势因此格外显著。以奔驰为例,2017年投资Momenta,由奔驰董事长亲自决策,但第一个量产项目上市是2025年下半年,整整八年。
但一旦成功拿下,就有望迎来"赢者通吃"的局面。
安全标准是物理AI的终极考验
奔驰与Momenta累计测试里程达80亿公里。奔驰团队曾反复挑战一个极端场景:高速上没有灯光,一个摩托车骑手摔倒,戴着黑色头盔,头朝后方。
奥迪AUDI品牌产品研发执行副总裁Martin Kraus在北京车展上说了一句很直白的话:"质量和安全标准是没得商量的。"
梅赛德斯-奔驰中国研发自动驾驶执行副总裁王忻提到一个更深层的思考:AI进入物理世界时,"这个虚拟人也需要有情感,它也要有'害怕'"。
物理AI如果只理解物理规律,还不够,它最后要理解的是坐在车里的人如何感到安全和从容。一位奥迪车主讲起京沪高速上的一次经历:前车连续追尾,系统帮他刹住并驶离超车道。他给母亲打电话:"你帮我把汤热一下,我要到家了。"
这比任何参数都更能解释安全标准的意义——它最后要回答的,是一个人能不能安全回家。
自动驾驶不是物理AI的终点。但它可能是这场长赛道上,最先被真实世界验证的一张门票。Momenta已向港交所秘密递交招股书,IPO估值预期超千亿元,计划年内挂牌。
从屏幕到现实,AI的征途才刚刚开始。
你觉得物理AI会先在哪个领域真正落地?自动驾驶、机器人、还是其他?评论区聊聊你的看法。