过去几年,汽车行业有一个越来越明显的变化:车企开始亲自下场造芯片。
特斯拉FSD已迭代至第五代;蔚来推出神玑NX9031;小鹏自研AI图灵芯片;理想造了马赫M100;比亚迪、吉利、Momenta也被频繁点名。
表面上看,这是一场“去英伟达化”的运动。
但如果只看到这一层,就太浅了。
真正的问题是:自动驾驶模型本身,已经开始变了。
从CNN,到Transformer,再到DiT与世界模型,模型范式在切换,而旧时代的芯片逻辑,未必还能接住下一代自动驾驶。
这才是车企重新造芯片的真正原因。

自动驾驶技术路线的演进
从模块化到端到端:一场范式革命
自动驾驶技术在过去十年经历了三次大的范式跃迁。
第一代:模块化架构。感知、决策、控制分模块独立开发,各模块之间通过人工定义的接口连接。优点是可解释性强、便于调试,缺点是信息在模块间传递有损耗,难以应对复杂的长尾场景。这是大多数L2级辅助驾驶系统的技术基础。
第二代:端到端架构。用一个神经网络模型替代所有模块,从传感器输入直接输出控制指令。优点是信息无损传递、决策更拟人,缺点是黑盒特性、可解释性差。特斯拉FSD V12是这一路线的标志性产品。
第三代:VLA大模型架构。在端到端基础上引入语言模型能力,让AI不仅“看到”障碍物,还能“理解”其行为意图。VLA模型由视觉编码器、大语言模型骨干网络以及动作解码器三个核心组件构成,将原本相互独立的感知、理解与执行在同一个语义空间内完成对齐。
当前主流的三条技术路线
目前,自动驾驶行业的技术路线大致可以分为三条:
第一条是分段端到端路线。这是大多数厂家的选择,典型代表是Uni-AD。其核心思路是将自动驾驶任务拆分为感知、预测、规划等子模块,每个模块用神经网络实现,但模块之间仍保留人工定义的接口。总参数一般不超过5亿,对芯片算力要求相对温和,是目前量产方案的主流。
第二条是VLA(视觉-语言-行动)路线。这是当前头部车企重点投入的方向。VLA模型通常是MoE(混合专家)架构,总参数在20亿到70亿之间。它将视觉感知、语言理解和动作决策统一到一个神经网络中,让系统具备了“理解”驾驶场景的能力——例如,识别出打转向灯的车“想”变道、打双闪的车“可能”故障。理想MindVLA、小鹏第二代VLA是这一路线的代表。
第三条是世界模型加扩散动作专家路线。这是正在探索中的下一代技术方向,目前还没有量产上车的案例。世界模型的核心逻辑是让系统在云端预演未来几秒会发生什么,再带着“预判”去开车,从根本上解决长尾场景问题。这一路线何时能够量产,存在较大不确定性。
值得注意的是,没有哪家厂家只押一条路。三条线都在做,都在看,没人敢掉队。
模型迭代加速,芯片压力陡增
模型迭代的速度正在加快。从CNN到Transformer的跨越用了约5年,但从Transformer到VLA的跨越只用了不到2年。有行业专家预测,从VLA到世界模型的过渡可能更快。
这意味着什么?
芯片研发周期通常是3到5年,而模型架构的迭代周期已经压缩到1到2年。当供应商的芯片还停留在“上一代模型”的优化思路上时,车企已经需要为“下一代模型”准备算力底座。
这种周期错配,是车企自研芯片最根本的驱动力。
不同路线对芯片的差异化需求
分段端到端路线
这条路线对芯片的需求相对明确和稳定。总参数量在5亿以内,核心需求是稳定的实时推理能力、低延迟和低功耗。当前市场上,无论是英伟达Orin还是地平线征程系列,都有成熟方案可供选择。
对于走这条路线的车企来说,外采芯片仍然是性价比最高的选择。
VLA路线
VLA路线对芯片提出了全新挑战。20亿到70亿的参数量意味着算力需求大幅提升。MoE架构要求芯片具备高效的专家并行调度能力,不同专家之间的通信带宽成为性能瓶颈。与此同时,大语言模型部分的推理延迟需要控制在50毫秒以内,这对内存带宽和计算单元的利用率提出了极高要求。
更重要的是,VLA的技术方案仍在快速演进。今天的设计可能明天就过时。外采芯片的风险在于:供应商的方案可能跟不上车企自己的模型迭代节奏。这也是为什么头部车企选择自研——他们比供应商更清楚自己五年后要跑什么模型。
世界模型路线
世界模型加扩散动作专家是三者中对芯片要求最为苛刻的路线。它需要前所未有的算力密度和内存带宽,对芯片架构的灵活性要求极高——因为技术路线本身尚未收敛。
目前市场上没有任何成熟方案可供选择。如果车企瞄准这一方向,自研几乎是唯一的选择。
自研芯片的账:不只是经济账
经济账:出货量够吗?
5纳米甚至3纳米芯片的研发投入,一次性工程费用加对外采购IP高达数亿人民币。出货量不够,账面上一定是亏的。
但车企的账本和芯片公司不一样。
这笔费用可以计入整体研发成本,分摊到数十万辆车中。更重要的是,自研芯片能拉高市值、强化科技品牌——“全栈自研”本身就是资本市场认可的硬指标,也是面向消费者的营销卖点。
账算到最后,商业逻辑是通的。
控制权账:谁定义技术路线?
芯片研发周期长。从完整定义设计目标到芯片上量产车型,中间需要2到4年。海外厂家更长,可能是3到5年。
这意味着芯片厂家在今天落笔,押注的其实是5到8年后的技术走向。预测错了,要么芯片生命周期大幅缩短,要么干脆没人用。
做汽车数字类芯片,赌性确实很大。
车企自研芯片,某种意义上是在说:我比供应商更清楚自己五年后要跑什么模型。这不仅是成本问题,更是对技术路线的控制权问题。
门槛在转移
技术门槛方面,随着IP生态成熟、EDA工具链完善,以及专门服务车厂定制芯片的中间商涌现,芯片设计的工程难度正在快速下降。
真正难的部分,已经转移到软件栈、编译器和长期模型适配上了。而这恰恰是芯片供应商最难替你定制的部分。
车企自研芯片现状梳理
特斯拉:FSD芯片的持续迭代
特斯拉是这一轮车企造芯的先行者。其FSD芯片已迭代至第五代,从最初的和三星合作,到现在的全栈自研。特斯拉不仅做芯片,还做Dojo超级计算机,形成了从训练到推理的完整闭环。马斯克最近宣布,AI5芯片已完成流片,性能较前代提升40倍。
蔚来:神玑NX9031已出货
蔚来神玑NX9031采用5nm制程,500亿以上晶体管,单颗综合性能相当于四颗英伟达Orin-X。目前累计出货已超15万套,芯片子公司已完成首轮22.57亿元融资,投后估值近百亿元。
小鹏:图灵芯片出货领先
小鹏图灵AI芯片采用40核处理器加双NPU异构架构,单颗即可支持300亿参数大模型本地运行。累计出货已超20万片,2026年目标接近100万片。小鹏已获大众汽车量产定点,实现了“内销”与“出口”的双重突破。
理想:押注数据流架构
理想的马赫M100选择了与主流GPU截然不同的技术路线——数据流架构。单颗马赫M100的有效算力约为英伟达Thor U的3倍,双芯组合总算力2560TOPS。理想强调,自研芯片是为了让AI能在物理世界真正运行起来。
比亚迪:4nm芯片规模化量产
比亚迪璇玑A3采用4nm制程,单颗芯片集成16核CPU、3核NPU,三颗协同可释放超2100TOPS总算力。王传福在发布会上透露,比亚迪芯片研发团队已超过7000人,累计研发投入跨过1000亿元。更关键的是,这颗芯片已开启规模化量产。
对一级市场投资人的启示
车企自研芯片,对供应链意味着什么?
自研芯片并不意味着“全栈自给”。大量配套环节仍需要外部供应商:IP授权、编译器工具、测试验证服务、先进封装等细分领域都存在增量机会。
但传统芯片供应商的潜在市场空间正在被压缩,尤其在中低端智驾芯片市场。车企自研芯片的“示范效应”可能引发更多玩家跟进。
什么样的芯片初创公司仍有价值?
不是所有车企都会自研芯片。自研芯片的门槛仍然很高:年销量低于50万辆的车企,自研芯片的经济性存疑;没有足够算法积累的车企,定义不出好芯片;数亿级别的NRE费用不是所有车企都能承担。
以下方向的芯片初创公司仍有独立价值:一是舱泊一体、HPC、传感器融合等细分场景专用芯片;二是服务中小车企的“芯片即服务”平台;三是编译器、工具链等生态层企业。
投资判断
短期来看,头部车企自研芯片加速,关注相关IP、工具链、测试服务供应商。
中期来看,行业分化将加剧,自研芯片与否可能成为车企核心竞争力的一道分水岭。
长期来看,芯片定义能力可能成为智能汽车品牌的“标配能力”——就像今天的“自研电机”一样,不再是差异化优势,而是入场券。
结语
车企自研芯片,不是一场“省钱”的运动,而是一场“抢时间”的竞赛。
芯片研发周期3到5年,模型迭代周期1到2年。当供应商的芯片还停留在“上一代模型”的优化思路上时,车企已经需要为“下一代模型”准备算力底座。
这不是英伟达不够强,也不是地平线不够快,而是通用芯片的定位决定了它不可能为每一家车企的差异化模型做极致优化。
真正的竞争,不在图纸上,不在发布会里,而在每一代芯片流片时,对5年后模型趋势的判断是否准确。
赌对了,领先一个时代。赌错了,数十亿研发费用打了水漂。
这就是车企“造芯”真正的赌局。