01|两条路,一个目标
自动驾驶江湖,现在分裂成两个泾渭分明的阵营。
一边是特斯拉,坚持"纯视觉"——车身周围8颗摄像头,算法解决一切,不装激光雷达,不依赖高精地图。
另一边是国内主流车企,华为、小鹏、理想、比亚迪、小米,几乎全部选择"多传感器融合"路线——激光雷达+毫米波雷达+摄像头,冗余备份,全天候感知。
两条路的技术哲学截然不同,但终极目标完全一致:让车自己开,人可以脱手。
这两条路究竟有什么区别?为什么中国和美国走出了完全不同的技术方向?
本文从传感器的底层物理出发,深度拆解两条路线的技术原理与真实能力边界。
02|特斯拉的眼睛:纯视觉的物理极限
特斯拉的自动驾驶系统,核心是视觉感知。
车身8颗摄像头,每颗200万像素,每秒处理36帧画面,覆盖车身前后左右各个方向。摄像头将光线转换为电信号,通过深度神经网络提取特征——车道线、交通标志、车辆、行人、障碍物——最终输出完整的周围环境三维理解。
这套系统的逻辑前提是:人类司机用眼睛开车,摄像头本质上是在模拟人的视觉中枢。
但摄像头有一个无法回避的物理缺陷——它是被动传感器,依赖环境光照。黑夜、暴雨、大雾、逆光……这些场景下摄像头的感知能力会急剧下降。
特斯拉的应对策略是"数据驱动的长尾覆盖"。通过全球600万辆以上特斯拉车辆持续收集行驶数据,神经网络见过足够多的雨夜、雾天、逆光场景之后,学会了在低光照条件下推断深度和距离。
这是特斯拉最核心的技术壁垒:不是算法本身,而是数据的规模和质量。
截至2026年6月,特斯拉FSD累计行驶里程已超过100亿英里(约160亿公里),Waymo是1.7亿英里商业里程,特斯拉是Waymo的近60倍。这个数据规模让特斯拉的视觉模型能在极其罕见的场景下做出正确判断。
FSD V12之后的端到端架构,则彻底打破了传统自动驾驶的"感知→规划→控制"模块边界。神经网络直接输入摄像头图像,输出转向、加速、制动指令,取消了30万行手写规则代码,系统反应速度达到毫秒级。
2026年6月推送的FSD v14.3.4,进一步升级了MLIR AI编译器,响应速度再提升20%,同时引入强化学习(RL)训练框架,针对低能见度场景和复杂路口做了专项优化。
但核心事实不变:这是一套L2级辅助驾驶,驾驶员必须全程监控,随时准备接管。
03|激光雷达:主动发射光的感知器
激光雷达(LiDAR)的工作原理和摄像头完全不同。
它自己发射激光脉冲,测量光从发出到反射回来的时间(飞行时间法,ToF),精确计算每一个反射点的距离。通过快速扫描,激光雷达在短时间内构建出周围环境的三维点云图——每个点都自带精确的XYZ坐标。
这带来一个关键优势:主动感知,不依赖环境光。
深夜没有路灯,摄像头几乎抓瞎,但激光雷达毫不在意,它自己发光照亮周围。暴雨天水滴散射光线,摄像头视野模糊,激光雷达发射的是近红外光,波长更长,抗雨雾干扰能力显著更强。
更重要的是,激光雷达提供的距离数据是物理精确的——它不需要"推断"前方障碍物有多远,而是直接测量出来。摄像头要从二维图像中推断三维深度,天然存在误差。
这也是为什么国内主流车企在L3及以上自动驾驶上,几乎全部选择激光雷达作为核心传感器。
2026年,激光雷达的价格已从几年前的数万元跌至150~500美元区间。中国市场的年装机量突破300万台,渗透率超过45%,禾赛科技、速腾聚创、图达通三家中国企业合计占据全球前装市场份额超过70%。
华为的192线混合固态激光雷达,2026年新版问界M9甚至堆到了6颗,360度无死角覆盖。
04|两条路线的技术博弈:精度 vs 泛化
纯视觉和多传感器融合,在工程实践中的差异远比表面上看到的复杂。
精度层面,激光雷达阵营占优。
多传感器融合方案中,激光雷达提供精确的深度信息,4D毫米波雷达补充远距离和速度数据,摄像头识别语义类别,三者优势互补。华为最新一代融合感知系统能做到AEB 150km/h刹停静止前车,对低矮障碍物(宠物、锥桶)的识别精度比纯视觉方案高45%以上。
泛化能力层面,特斯拉的视觉方案有独特优势。
因为不依赖激光雷达,特斯拉的感知系统天然对不同光线、天气条件的泛化能力更强——它从数据中学习,而不是从传感器规格书中定义能力边界。当一个全新城市上线FSD,不需要额外的激光雷达标定和地图适配,只要视觉模型见过足够多的相似场景,就能应对。
中国车企的激光雷达方案则需要针对每个城市、每条道路做大量本地化验证和适配,这让特斯拉的"无图"开城速度反而更快。
从实测数据看,2026年最新智驾评测中,华为乾崑ADS 4.1综合得分4.46/5,排名第一,无保护左转和环岛通过率超过90%,全国400+城市无图NOA;小鹏XNGP纯视觉方案得分4.33,城区变道超车效率最高;理想AD Max 4.06分,家用场景最平顺。
但特斯拉FSD v14在榜单上缺席——因为国内没有FSD,没有办法直接对比。这是特斯拉在中国市场的最大变量。
05|特斯拉Robotaxi:FSD的最终形态
2026年,特斯拉的Robotaxi项目从概念正式进入小规模商业运营。
得克萨斯州奥斯汀市是第一个落地城市,2026年6月已扩展至整个都会区,实现全域全无人驾驶付费服务,车队规模虽小(不足100辆),但已是全球第二个实现无安全员商业运营的城市。
Robotaxi的核心硬件是特斯拉自研HW4.0,8颗高分辨率摄像头,算力144TOPS,成本仅数千美元——远低于Waymo单辆15万美元的硬件成本。专属车型Cybercab已量产下线,无方向盘、无踏板,目标售价2.5~3万美元。
特斯拉的Robotaxi战略本质是:用海量L2辅助驾驶数据训练出一个足够通用的视觉AI,再把这个AI平移到Robotaxi场景,用低成本硬件规模复制。
这个逻辑是否成立,取决于FSD的安全表现能否持续提升。目前特斯拉报告FSD激活状态下碰撞率为0.28次/百万英里,低于美国人类驾驶员平均的1.76次/百万英里。但这是"全场景"统计,包含高速公路等相对简单的场景,城区复杂路况的真实表现仍有争议。
NHTSA(美国国家公路交通安全管理局)对特斯拉FSD的调查仍在进行中,2026年3月已升级为工程分析阶段,覆盖约320万辆车。
06|国内激光雷达:硬件冗余的工程哲学
国内车企选择激光雷达路线,背后是中国独特的工程哲学:宁可冗余,不要单点失效。
问界M9的6颗激光雷达布局就是典型案例。
车顶一颗896线主雷达,兼顾远距(探测200米以上)和宽视场角;前向低位一颗固态激光雷达,专门解决"车头挡住"的盲区,识别低矮小目标;车顶还集成了一颗舱内激光雷达,与主雷达形成冗余备份;左右侧向各一颗,解决A柱盲区问题;车尾一颗,覆盖后方。
这不是简单的堆料,而是针对中国真实路况的精细化设计——电动车在盲区内突然窜出是高频事故场景。
这种硬件冗余的代价是成本和复杂度的大幅上升。6颗激光雷达的物料成本、线束布置、算力需求,远高于特斯拉的单一路由8摄像头方案。但在中国消费者的认知里,"传感器多=更安全"的逻辑成立,愿意为此付费。
芯片化是降本的关键路径。禾赛科技"芯片化收发模块"、速腾聚创"二维MEMS扫描芯片"均已量产,推动定点价格下探至150美元以下。2026年,15万元级别的车型已能标配单颗激光雷达——这个价格,放在三年前不可想象。
07|两条路线的终局:融合还是收敛?
纯视觉 vs 激光雷达,这个问题没有绝对的正确答案。
从技术上看,两条路线都有清晰的边界:纯视觉在光照良好、场景标准化的条件下性价比最高,且泛化能力最强;激光雷达在复杂天气、低速近距离、城市高频加塞场景中提供了必要的安全冗余。
有意思的是,两个阵营正在相互渗透。
小鹏已经开始向纯视觉方案倾斜,XNGP VLA2.0视觉能力大幅提升;华为则在不断强化激光雷达的数量和线束密度;特斯拉虽然坚持纯视觉,但HW4.0硬件预留了激光雷达接口,官方从未彻底关掉这条技术路线的可能性。
真正的终局,可能不是"谁赢了",而是两条路线在各自的应用场景里各自胜出:
Robotaxi、无人配送等L4场景,激光雷达冗余是安全底线;
消费级L2辅助驾驶,纯视觉是成本最优解;
高速路场景,两条路线差距最小,都可以做得很好;
城区复杂路况,激光雷达的安全优势目前更明显。
作为消费者,理解这两条技术路线的底层逻辑,比单纯比较"谁的智驾更强"更有意义。毕竟,安全没有唯一解,但一定有底线。