Genma_Jp(X账号 @nymbusjp,也称 Genma_Jp 或类似化名)。
他是一位拥有15年以上ADAS(高级驾驶辅助系统)/自动驾驶感知领域经验的工程师,曾在传统车企或相关领域工作,之前对特斯拉FSD持怀疑态度(甚至嘲讽过马斯克),后来通过亲身测试或深入了解FSD的实际表现和技术护城河(如端到端模型、数据飞轮、规模化部署等)彻底转变观点,并全仓(all-in)特斯拉股票(除房子外,把多年积蓄都投入TSLA)。
核心观点总结(基于他的帖子和中文社区解析的10大护城河)
Genma_Jp认为,FSD的成功不是单一技术,而是数据飞轮 + 端到端AI + 硬件闭环 + 规模化的系统性优势。传统车企或竞争对手(如Waymo依赖HD Map和LiDAR)在多个环节存在根本缺陷。
1. 统一车型与传感器套件(Frozen Sensor Suite):特斯拉2016年起固定8摄像头配置,避免传统车企因车型多样导致数据碎片化。其他厂商传感器位置/类型常变,数据无法有效复用。
2. 海量真实世界数据(Data Flywheel):数百万辆车实时上传边缘案例(interventions),形成正反馈循环。传统车企数据量“惨淡”,且缺乏自动上传机制。特斯拉能快速发现并训练长尾场景(long tail)。
3. AI自动标注与视频压缩(Neural Video Codec):特斯拉自研神经网络视频压缩技术,丢弃90%比特位却提升感知质量;自动标注(self-supervised,从未来帧预测)极大降低成本。传统方案依赖人工标注,效率低下。
4. 自有算力中心 + 硬件闭环(Hardware-in-the-Loop):Cortex集群(H100/AI4/AI5)支持大规模模拟与训练。最关键的“隐藏护城河”:训练时直接用生产级AI4芯片做bit-exact inference闭环,避免量化误差(quantization tail)。其他公司用云GPU训练,再部署到车端芯片时性能崩盘。
5. 端到端(End-to-End)神经网络:从光子(像素)直接到控制(torque),中间无手工规则/HD Map。模型自动泛化(如从未见过泰国停牌仍识别)。传统模块化堆栈(感知+规划+控制)在corner cases易失效。
6. 真实世界模拟引擎(Learned Simulator):高度逼真的RL(强化学习)模拟器,每天模拟数百万“死亡场景”迭代。结合真实数据,发现新边缘案例。仅特斯拉有足够算力(~10万H100等效)支持高epoch训练。
7. 影子模式与用户干预信号:车主“影子模式”提供即时RL教师信号,干预数据远优于被动采集。规模化用户训练让安全边际最大化。
8. 感知能力与泛化:FSD在复杂无图场景下的表现远超预期(如提前刹车识别“隐形”障碍)。
Genma_Jp亲测后震惊,称传统感知栈“无望”。
其他要素还包括:预训练海量标注公里、C-Float等新型数值格式优化训练效率、Robotaxi规模化部署的经济护城河等。这些层层 interlocking,移除任何一层整个系统崩塌。