工作地点:上海 · 虹桥, 湖南·长沙 职位职级:覆盖 实习 / 校招 / 社招资深专家
组内直招,简历投递: chenyuanpeng@xingshentech.com
行深智能是国内领先的自动驾驶末端物流产品及解决方案提供商,核心团队起源于国防科大,在无人车领域拥有丰富的技术积累。灵犀团队作为行深智能内部专注前沿算法攻坚的核心力量。团队成员主要来自国内知名互联网大厂与自驾第一梯队公司。我们致力于将 VLA(视觉-语言-动作)、世界模型与端到端技术应用于复杂末端配送场景,解决从非标路段到人车混行环境下的高阶智能决策难题。
一 岗位方向描述
本岗位旨在通过 VLA(Vision-Language-Action) 赋予自动驾驶系统理解常识与复杂意图的能力,利用 世界模型(World Model) 构建具备物理规律推演能力的虚拟底座,最终实现真正的端到端(End-to-End)智驾进化。
二 岗位职责
- VLA 大模型研发:开发多模态大模型,将视觉感知、自然语言指令与驾驶动作对齐,解决自动驾驶在复杂交互场景下的“理解力”瓶颈。
- 世界模型构建:利用生成式 AI(Diffusion/Autoregressive)学习交通场景的演化规律,实现高保真的时空序列预测及合成数据生成。
- 端到端架构设计:设计从原始传感器输入到路径规划/控制输出的端到端神经网络,优化感知、决策与控制的闭环性能。
三、 任职要求
【社招 - 资深专家】
- 核心背景:拥有自动驾驶、生成式 AI 或机器人领域经验。
- 技术深度:深度参与端到端方案的开发;或在视觉大模型(VLM)领域有量产/重磅项目经验; 或有丰富传感器融合项目量产经验,或定位建图项目量产经验。
- 工程能力:具备处理 PB 级智驾数据、构建自动化数据闭环(Data Loop)的能力, 或C++ 工程能力丰富。
【校招 】
- 科研能力:在 CVPR、NeurIPS、ICLR 等顶会以一作发表过关于 Generative AI 或端到端驾驶的研究。
- 算法基础:精通 Transformer 及其变体,熟悉 Hugging Face 生态,或熟悉C++
【实习生】
- 基本要求:硕士或博士在读,上海虹桥实地实习 3 个月以上。
四、加分项
- 1: 在 NuScenes 或 Waymo Open Dataset 榜单取得过 Top 排名。
- 2: 有 3DGS (3D Gaussian Splatting) 或 NeRF 在场景重建中的实战经验,对Wan系列 或Cosmos 系列等模型比较熟悉
- 3: 对物理引擎(如 NVIDIA Isaac Gym,AlphaSim)及强化学习(RL)有深入研究。