当前位置：首页>自动驾驶>让自动驾驶“看懂”复杂路口:TopoNet用“关系图”破解拓扑推理难题

让自动驾驶“看懂”复杂路口:TopoNet用“关系图”破解拓扑推理难题

2026-06-01 15:10:05

探角观察员

想象一下，你驾驶着车来到一个复杂的十字路口：地面的车道线在中心区域突然消失，头顶上却密密麻麻挂着好几个红绿灯和指示牌。这时候，人类司机往往能迅速做出判断——通过观察哪条路通向哪里、哪个灯管哪条道，从而安全通过。

但对于自动驾驶汽车来说，这却是一个巨大的挑战。传统的自动驾驶系统通常只擅长“看清”物体，比如识别出哪里有车道线、哪里有红绿灯，但却很难理解这些物体之间的“关系”。这就像是一个人虽然认得所有的汉字，却读不懂整句话的意思。

目前的解决方案大多依赖高精地图，把路口的拓扑结构提前录入。但这种方法成本高昂，且一旦道路临时改道或施工，地图就会失效。另一种在线建图方法虽然能实时感知，但往往只还原了物体的形状，没说明它们之间的关联，导致下游的决策系统还得靠人工规则来“猜”。

TopoNet

给汽车装上“关系大脑”

为了解决这个问题，上海人工智能实验室OpenDriveLab联合华为等团队，提出了一种名为TopoNet（拓扑推理网络）的全新方案。这项成果已被中国科技核心期刊《SCIENCE CHINA Information Sciences》录用，并在GitHub上开源，迅速成为该领域的基准模型。

TopoNet的核心理念是：让汽车不再只做“识别题”，而是直接做“关系推理题”。它不需要依赖昂贵的离线地图，而是通过车载摄像头实时捕捉画面，直接在系统内部构建出一张“交通关系图”。

这张图里包含了两类关键信息：一是“车道连车道”（比如这条左转道最终会并入哪条主路），二是“交通元素管车道”（比如头顶的哪个红绿灯对应着当前的直行道）。通过这张图，汽车就能瞬间明白：“我现在在A道，前方红灯亮起，且A道连接着B出口”，从而做出精准的驾驶决策。

独特的“双视图”与“知识图”设计

TopoNet的技术实现非常巧妙。它首先通过一个共享的图像特征提取器，将摄像头捕捉到的前视图（PV）和鸟瞰图（BEV）进行分离处理：前视图负责识别红绿灯和路牌，鸟瞰图负责检测车道中心线。

真正的“大脑”在于其上方的场景图神经网络（SGNN）。这里有一个技术难点：交通标志在2D图像里，而车道在3D空间里，怎么让它们“对话”？SGNN通过一个轻量级的嵌入网络，将2D的语义信息映射到与车道一致的特征空间，让不同维度的信息能够互相交流。

更厉害的是它的场景知识图设计。TopoNet不会把所有信息一视同仁地混在一起，而是为不同类型的交通元素（如红灯、左转牌）和不同方向的车道连接（前驱、后继）分别设置了独立的“权重通道”。这就像是给不同类型的邻居开了专属VIP通道，红灯的消息走红灯的通道，左转牌的消息走左转牌的通道，避免了信息混淆，也让推理更加符合交通逻辑。