引言:一辆车的灵魂觉醒
2026年6月,深圳坪山区。一辆没有安全员的出租车,在晚高峰车流中自主完成了一次无保护的左转——对面来车、侧方电动车、斑马线上的行人,它在2.3秒内做出了37次微决策。乘客后座的屏幕上,实时渲染着车辆“眼中”的世界:每一个移动的物体都被赋予了运动轨迹预测,道路边缘的语义分割精确到厘米级。
这不是科幻电影,而是百度Apollo第六代无人车“颐驰06”的日常运营画面。
如果说2023-2025年是属于语言大模型的“寒武纪大爆发”,那么2026年,物理AI的元年正式开启。 而在所有物理AI的应用场景中,自动驾驶是技术复杂度最高、产业带动力最强、社会影响最深远的“绝对主线”。它不仅仅是把ChatGPT搬上车,而是要让AI具备在物理世界中感知、推理、决策和行动的完整能力——这条路一旦走通,机器人、低空经济、智慧城市都将水到渠成。
本文将深度拆解:为什么自动驾驶是物理AI的“主战场”?它的技术路径、产业格局和未来图景正在如何被重塑?
一、什么是物理AI?为什么自动驾驶是它的终极试金石?
1. 定义物理AI
英伟达CEO黄仁勋在2025年GTC大会上,给物理AI下了一个广被引用的定义:“能够理解物理世界、在物理世界中推理并执行行动的AI系统。” 它与传统AI的核心区别在于:
数字世界AI(如ChatGPT、Midjourney):输入输出都是符号或像素,容错率高,可无限重试。
物理世界AI(如自动驾驶、机器人):输出直接影响物理实体,不可逆,一次失误可能致命。
物理AI的三大核心能力:感知、推理、行动。这三者的闭环,在自动驾驶场景中被要求到了极致—感知要应对雨雪雾霾和遮挡;推理要预判行人意图和博弈策略;行动要在毫秒级内将决策转化为方向盘、油门、刹车的精准控制。
2. 为什么自动驾驶是“绝对主线”?
在物理AI的诸多应用赛道中,自动驾驶独据主线地位,有三大铁证:
第一,市场规模决定的“引力中心”。 据波士顿咨询2025年报告,全球自动驾驶市场规模预计在2030年达到1.2万亿美元,其中Robotaxi约占60%。对比之下,人形机器人市场2030年预计约380亿美元,低空经济约1500亿美元。自动驾驶的市场体量决定了,它将吸附最多的资本、人才和政策资源,成为物理AI商业化的第一战场。
第二,技术复杂度决定的“溢出效应”。 一辆L4级自动驾驶汽车,需要融合激光雷达、毫米波雷达、摄像头、高精地图、V2X等多种信号,在120公里/小时的速度下,反应时间要求低于100毫秒。这套“感知-决策-控制”的完整技术栈,可以像工业母机一样向其他物理AI场景溢出:端到端模型可迁移至机器人抓取,多模态融合可赋能无人机导航,世界模型可应用于工业数字孪生。得自动驾驶者,得物理AI的通用技术底座。
第三,社会价值决定的“政策倾斜”。 全球每年交通事故死亡人数约135万(据WHO数据),90%以上与人因失误有关。自动驾驶的终极目标之一就是消除人因事故。同时,它还能解决老龄化社会的运力短缺问题。这种公共价值,使其成为各国AI战略的必争之地——美国、中国、欧盟、日本均已出台国家级自动驾驶法规框架。

二、产业结构重构:从“造车卖车”到“运营服务”
自动驾驶的商业化,正在从根本上重构汽车产业的底层逻辑。
1. 旧三角:整车厂-Tier1-经销商
传统汽车产业百年格局:整车厂设计车型,博世/大陆等Tier1提供系统集成,经销商负责销售和售后。利润链条是一次性的:卖一辆车赚一笔钱。
2. 新三角:AI平台-算力供应商-出行服务商
当汽车变成一个“移动的AI终端”,整个产业链被重新定义:
AI平台层:掌握端到端模型、世界模型、云端训练基础设施的公司。代表是Waymo(谷歌系)、百度Apollo、特斯拉、华为、小鹏等。这是物理AI时代的“操作系统”拥有者。
算力供应商:自动驾驶的训练和推理都需要海量算力。英伟达凭借Orin和Thor芯片以及CUDA生态,占据了车载AI芯片80%以上的市场份额(据Counterpoint Research 2025年数据)。但地平线、黑芝麻、华为昇腾等国产替代正在加速——地平线征程6芯片已量产上车,算力达560TOPS(万亿次操作每秒)。
出行服务商:这一层正在模糊化。滴滴与广汽埃安、小鹏的合作,曹操出行与吉利的绑定,都在把出行平台与自动驾驶技术深度耦合。车不再是“卖出去”,而是“服务出去”——按里程、按时长付费。
3. 产业链数据
据CB Insights统计,截至2026年一季度,全球自动驾驶领域累计融资额已突破1800亿美元。其中,2025年单年融资约420亿美元,是2023年的两倍多。资金高度集中于头部:
Waymo完成56亿美元融资(2025年),估值超450亿美元,背后的Alphabet已累计投入超300亿美元。
百度Apollo分拆后的“萝卜快跑”完成B轮融资约15亿美元(2025年),投后估值超百亿美元。
特斯拉未单独融资,但马斯克多次表示,FSD是特斯拉万亿估值的唯一支撑,2025年FSD订阅收入突破30亿美元。
中国市场的特殊性在于“政府+产业资本”双轮驱动。 北京、上海、广州、深圳、武汉、成都等超过40个城市开放了自动驾驶测试道路,总里程超过3万公里(据交通运输部2025年12月数据)。国资背景的亦庄国投、上海国际集团等深度参与产业投资,把自动驾驶纳入新型基础设施范畴。

三、技术路径:端到端、世界模型和VLA的“三箭齐发”
2024-2026年,自动驾驶的技术范式经历了从“规则驱动”到“数据驱动”的范式革命。这场革命的核心,是一套全新的技术三件套。
1. 端到端模型
传统自动驾驶系统是“模块化”的:感知→定位→预测→决策→规划→控制,每个模块由不同的工程师团队维护,模块间通过定义好的接口传递信息。这种架构的致命缺陷是:信息在传递中不断衰减和扭曲,误差逐级放大。
端到端模型则用一个巨大的神经网络,直接完成“传感器信号→方向盘/油门/刹车指令”的映射,中间没有人类定义的显式规则。其理论渊源是行为克隆和模仿学习。
里程碑事件一:2024年3月,特斯拉在全美推送FSD v12,这是业界首个大规模落地的前装量产端到端自动驾驶系统。马斯克宣称:“它删除了30万行C++代码,只靠神经网络驾驶。” 多家机构评测(如AMCI Testing)显示,v12的干预里程较v11提升了5-10倍。
里程碑事件二:2025年,小鹏汽车发布“图灵”AI智驾系统,实现从端到端到云端训练的全链路闭环。据其1024科技日公布的数据,端到端模型将城市NOA的通行效率提升40%,变道决策成功率从89%跃升至97%。
里程碑事件三:华为在2026年初发布ADS 4.0,采用“GOD网络”+“PCR网络”的双网络架构,宣称已基本实现L3级有条件自动驾驶在高速公路上的商业化落地。
2. 世界模型
端到端解决了“怎么做”的问题,但没有解决“为什么”和“如果…会怎样”的问题。这正是世界模型要解决的。
世界模型的核心能力是:给定当前场景,预测未来数秒内的场景变化。 它像一个高保真的物理模拟器,但不是用游戏引擎,而是用深度学习从海量驾驶数据中学出来的。
Wayve 在2024年发布GAIA-1世界模型,能生成长达数分钟的未来驾驶场景视频,并理解“打左转灯意味着车辆即将变道”这种语义概念。2025年,Wayve获得英伟达、微软等10.5亿美元融资,创下欧洲AI公司纪录。
特斯拉在2025年发布了“世界模型3.0”,将其深度整合进FSD的训练流程。它不仅仅做场景预测,还能生成大量长尾场景(罕见情况)作为训练数据,极大地降低了实车测试的里程成本。马斯克称其“相当于每天跑一亿英里虚拟里程”。
中国公司也不落后。 毫末智行在2024年发布DriveGPT,后迭代为“雪湖·海若”世界模型;商汤绝影在2025年发布了DriveAGI世界模型,并在多家车企定点。
3. VLA
VLA模型是2025年以来最受关注的自动驾驶技术方向。它把大语言模型的常识推理能力,与视觉感知和驾驶动作结合起来。
什么意思?传统自动驾驶能认出“前面有个塑料袋”,VLA能推理出“塑料袋很轻,压过去问题不大”;传统系统看到“路边一群人穿球衣”,VLA能推理出“可能有球赛结束,人流即将涌出”。这种常识层面的推理能力,被认为是L4/L5级自动驾驶突破的最后一块拼图。
2025年6月,Waymo联合谷歌DeepMind发布了基于Gemini的VLA模型,使Robotaxi在面对从未见过的施工区域、临时交通管制时,决策合理度大幅提升。
2026年初,小鹏汽车在XNGP中融入VLA能力,其CEO何小鹏在财报电话会上称:“我们的车开始理解‘为什么’要绕行,而不只是‘看到’了锥桶。”
技术三件套的协同逻辑:端到端负责“条件反射式的快决策”,世界模型负责“在想象中预演后果”,VLA负责“用常识理解世界”——三者融合,共同指向一个具备类人驾驶智慧的物理AI系统。

四、目前技术成果:L4逼近商业化临界点
说了这么多技术概念,真实世界的自动驾驶到底做到了什么程度?我们用“铁数据”说话。
1. Robotaxi
Waymo是目前全球运营规模最大的L4级自动驾驶出行服务商。据其2025年12月公布的安全报告:
在美国凤凰城、旧金山、洛杉矶、奥斯汀四城运营,周付费订单量突破25万单。
累计自动驾驶里程超过5000万英里(约8000万公里)。
在凤凰城运营区,Waymo车辆每百万英里仅发生0.4起造成人员受伤的事故,而人类驾驶员同期为2.78起。事故率比人类低约85%。
中国方面,百度Apollo的“萝卜快跑”在2025年底覆盖全国15个城市,其中武汉、北京(亦庄)、重庆等核心区域实现了全无人运营。据百度2025年Q4财报披露,萝卜快跑全年提供出行服务约900万单,同比增长2.5倍。在武汉投放的第六代无人车,每车成本已降至20万元人民币以下(不含传感器折旧),与网约车司机人力成本的盈亏平衡点日益接近。
2. 乘用车智驾:从尝鲜到常用
根据高工智能汽车研究院的数据,2025年中国市场前装标配L2级及以上辅助驾驶的新车占比达到56%,其中具备城市NOA功能的车型交付量约280万辆,同比增长180%。
中国市场的“智驾内卷”已进入白热化:
华为系(问界、阿维塔、智界等):ADS 3.0/4.0持续迭代,宣称“全国都能开,有路就能开”,2025年底覆盖全国所有地级市。
小鹏:XNGP城市智驾月度活跃用户渗透率超过85%,用户智驾总里程突破10亿公里。
理想汽车:2026年初全量推送AD Max 4.0,城市NOA内测用户突破100万。
特斯拉:FSD(监督版)在中国等待审批落地,欧洲已获得部分许可,2026年有望成为FSD全球化的关键年份。
3. 无人物流与限定场景
在商用化速度上,无人配送和无人矿卡走在了Robotaxi前面。
新石器:截至2026年初,在全国超过100个城市部署无人配送车5000余辆,累计完成配送订单超3000万单。
踏歌智行、易控智驾等:在露天矿区实现100台以上无人矿卡的编组运营,已安全运行超过300万小时。
驭势科技:在香港国际机场、上汽通用工厂等场景,提供全无人物流解决方案,2025年营收突破10亿元。
这些限定场景的成功,为开放道路自动驾驶积累了宝贵的物理AI经验。

五、未来发展:三个方向与一个终极赌注
站在2026年中展望,自动驾驶作为物理AI的主线,将如何演绎?
1. 方向一:VLA大模型将接管一切?
一个越来越清晰的共识是:未来的自动驾驶软件,本质上就是一个超大规模的VLA模型。 端到端和世界模型都将被吸收进去。它的训练将需要百万块GPU级的算力集群,数据需要覆盖全球数十亿公里的驾驶场景。
这意味着,竞争门槛被急剧拉高——只有少数几家同时拥有算力、数据、资金和顶级AI人才的科技公司或超级车企才能留在牌桌上。行业集中度将迅速提升。据瑞银2026年1月研报预测,到2030年,全球自动驾驶操作系统市场将被3-4家主导。
2. 确定方向二:硬件摩尔定律落地
此前制约自动驾驶规模化的瓶颈之一是传感器和计算平台的成本。但硬件正在快速降价:
激光雷达:禾赛科技、速腾聚创的舱内固态激光雷达,单价已从2020年的数万美元降至200-300美元区间(2025年)。2026年有望跌破200美元。
车载计算平台:英伟达Thor芯片单颗算力2000TOPS,地平线征程6达560TOPS,黑芝麻A2000超过1000TOPS。而成本呈下降趋势。
线控底盘:伯特利、亚太股份等国产供应商的线控转向/制动产品进入量产阶段,成本较外资品牌下降40%以上。
硬件成本的平民化,将使20万元级甚至15万元级车型具备L4级自动驾驶硬件预埋成为可能。
3. 确定方向三:法规与保险
2025-2026年是全球自动驾驶法规的“大年”:
中国:工信部等四部委联合发布《关于开展智能网联汽车准入和上路通行试点工作的通知》落地,首批L3/L4准入车企于2025年底公布。
美国:国家公路交通安全管理局(NHTSA)在2025年修订了《联邦机动车安全标准》,取消了无方向盘、无踏板自动驾驶车辆的法规障碍。
联合国:世界车辆法规协调论坛通过了关于L3级自动驾驶的全球技术法规。
保险方面,中国保险行业协会2025年发布了《智能网联汽车保险创新指引》,明确事故责任划分原则。保险精算模型的成熟,将解除出行服务商和消费者的后顾之忧。
4. 终极赌注:通往L5还要多久?
L5级自动驾驶——完全无人驾驶,任何天气、任何道路。这个终极目标离我们还有多远?
业界存在巨大分歧:
乐观派(马斯克、何小鹏等):2027-2028年可望实现技术突破。
保守派(图灵奖得主Yann LeCun等):需要更根本性的AI突破,10年都不一定。
产业派(Mobileye CEO Amnon Shashua):将经历漫长的“影子模式”(AI学习人类驾驶)积累,2030年前后可能见到曙光。
一个务实的判断是:城市简单场景的L4(特定区域Robotaxi、高速公路自动驾驶)将在未来2-3年内规模商业化;但应对所有极端场景和罕见情况的L5,可能需要世界模型的又一次根本性飞跃。

六、汽车不再只是汽车?
当物理AI的绝对主线走向成熟,这场革命的终局会是什么?
第一,汽车成为移动的物理AI节点。 每一辆自动驾驶汽车,都将搭载超级传感器套件和边缘算力。它们不仅运送乘客,还将成为城市的数据采集终端——实时更新高精地图、监测空气质量、识别路面病害、预警潜在安全风险。未来的城市大脑,将由数百万个这样的“移动节点”提供神经末梢。
第二,出行成本趋近于零。 据ARK Invest在2026年初发布的《Big Ideas》报告预测,到2030年,Robotaxi的每英里成本将降至0.25美元,低于私家车的0.70美元和传统出租车的2.00美元。当出行比拥有更便宜、更便捷,“卖车”这门生意将被彻底改写。大众、丰田等巨头已开始布局出行服务平台,以防被时代抛弃。
第三,物理AI技术向千行百业溢出。 自动驾驶锻造的VLA模型、世界模型和端到端训练框架,将向人形机器人、无人机、无人船舶乃至工业自动化全面迁移。这也是为什么特斯拉同时做人形机器人Optimus,小鹏布局飞行汽车和机器人,百度Apollo将技术输出给港口、矿山—自动驾驶是物理AI的黄埔军校,从这里毕业的技术,将重塑整个物理世界。
结语:这条路通向整个物理世界
1956年,通用汽车在宣传片中描绘了一个自动驾驶的乌托邦。当时的人们认为这还需要50年。
70年后的2026年,我们在深圳、旧金山、武汉的街头已经叫到了没有司机的出租车。但它们仍然会在某些情况下犹豫、错误判断、请求远程接管。我们既没有被吹上天的“今年就L5”蒙蔽,也没有被悲观者的“永远不行”劝退。
物理AI的真正起点,不是ChatGPT在屏幕上写出第一句诗,而是第一辆自动驾驶汽车在夜幕中,安全地送完最后一位乘客,安静地驶向充电桩,开始自我归位、自我诊断、自我升级。
那一刻,人工智能才算真正走出了数据中心,走进了我们生活的人间烟火。
而自动驾驶,就是这条路上最重要的那辆车。
*主要数据与信息来源:
ARK Invest:《Big Ideas 2026》年度报告。
黄仁勋,英伟达GTC 2025主题演讲。
特斯拉:2025年Q4及全年财报电话会议,FSD安全数据。
百度:2025年Q4财报,Apollo“萝卜快跑”运营数据。
Waymo Safety Hub:2025年12月发布的安全影响数据。
何小鹏,小鹏汽车2025年Q4财报电话会议及1024科技日。
高工智能汽车研究院:2025年中国市场乘用车前装智驾数据。
中国交通运输部:全国自动驾驶测试道路及示范区域数据(2025年12月)。
CB Insights:全球自动驾驶融资趋势报告(2026年Q1)。
瑞银(UBS):《全球自动驾驶操作系统》行业研报(2026年1月)。
弗若斯特沙利文:中国激光雷达市场分析报告(2025年)。
中华人民共和国工业和信息化部等四部委:《关于开展智能网联汽车准入和上路通行试点工作的通知》(2024年)。
NHTSA:修订的联邦机动车安全标准(FMVSS)(2025年)。
世界卫生组织(WHO):全球道路安全状况报告。
Wayve公司:GAIA-1世界模型发布及融资信息(2024-2025年)。