今天雨哥带着大家一起打开自动驾驶的"脑子", 看它是怎么想的?一篇NIST论文的深度解读
附:Paper原文地址, https://tsapps.nist.gov/publication/get_pdf.cfm?spm=a2ty_o01.29997173.0.0.bb525171TEiqZD&pub_id=822604
想象一下,你开车在路上,前面突然有个东西:
🧱 一块砖头🛢️ 一个交通锥👶 一个小孩子📦 一个纸箱
传统规划器的反应:❗️"有障碍物!紧急避让!"
结果:不管啥东西,一律绕,该变道变道,该刹车刹车。
但人脑不是这么干的。你会快速判断:
"砖头?碾过去没事""交通锥?压了可能伤底盘,绕一下吧""小孩?!必须刹停!"
解决方案:给车装一个"知识大脑"(Ontology)
别被术语吓到,Ontology(本体)简单说就是:一套机器能读懂的"常识知识库" + "推理规则"
{"物体":{"砖头":{"刚性":"高","可移动性":"低","密度":"高","尺寸":"小"},"交通锥":{"刚性":"中","可移动性":"中","密度":"中","尺寸":"中"},"报纸":{"刚性":"低","可移动性":"高","密度":"低","尺寸":"小"}},"车辆":{"悍马":{"刚性":"高","重量":"大","离地间隙":"高"},"摩托车":{"刚性":"中","重量":"小","离地间隙":"低"}},"推理规则":["如果【大车 + 小硬物】→ 碰撞损伤:无","如果【小车 + 固定硬物】→ 碰撞损伤:灾难级","如果【任何车 + 小孩】→ 碰撞损伤:不可接受(必须避让)"]}
怎么用在路径规划上?
传统流程:感知 → 检测到障碍物 → 规划器:绕!论文方案:感知 → 识别物体类型 → 查询本体知识库 → 推理碰撞后果 → 价值评估模块:算"绕"和"撞"的代价 → 规划器选最优解
关键升级:规划器不再只看"有没有障碍",而是问"撞了会怎样?"
这是一篇2004年的论文,对今天的自动驾驶技术发展的启发
✅ 语义理解 > 几何检测
现在的BEV+Occupancy Network,本质上也是在构建"可理解的3D世界",和论文思路一脉相承。
✅ 代价函数需要"常识"注入
端到端大模型之所以难落地,部分原因就是缺乏可解释的"价值判断"。本体推理提供了一种可审计、可调试的决策中间层。
✅ "障碍物"是关系,不是属性
论文提出:Obstacle is a role, not a type(障碍物是一种角色,不是物体固有属性)。
👉 同样一个人,在路边不是障碍,冲上马路就是——这个思想直接影响了后来的场景理解(Scene Understanding) 研究。
本文结论:自动驾驶的终极挑战,从来不是"看得清",而是"想得明白"。
这篇老论文像一面镜子:
- 它照见了20年前的智慧:用知识表示让机器"懂常识";
- 也映出今天的困境:大模型很猛,但"为什么这么决策"还是黑箱。
或许真正的自动驾驶技术,不在于堆多少算力,而在于能不能让车学会像人一样权衡:"这块砖,值得我打一把方向吗?"