论文解析:基于Row-wise的激光雷达车道线检测Row-wise LiDAR Lane Detection Network with Lane Correlation Refinement

1、摘要

车道检测功能是检测本车道和相邻车道的准确位置和曲率,为路径规划功能提供必要的输入。

出发点:

  1. 随着大量的基于图像的车道线检测数据集出现,基于摄像头的车道线检测网络发展迅速,但这些算法依赖于图像,图像在消失线附近失真并且容易受光照影响。
  2. 基于lidar的车道线检测算力消耗较大,在交通拥堵情况下,对遮挡严重的车道线检测效果不好。
  3. 车道线在形状和距离方面有一定的规律,利用这一点,可以进行优化。

贡献点:

  1. 提出的基于行预测的的车道线检测方法,比基于分割的车道线检测方法计算效率更高。
  2. 本方法为两阶段车道线检测方案,第一阶段预测出车道proposals,第二阶段通过注意力机制预测最终结果。
  3. 本方法的算力消耗更少,在严重遮挡的情况下,提升效果明显。

2、车道线检测网络

网络框架预览
[图片]
图解
B 表示 特征提取
C 表示 逐行检测头(即第一阶段)
D 表示 优化检测头(即第二阶段)

2.1、特征提取

具体参考上篇博客基于Grid–Seg的车道线检测LLDN-GFC 的4.1、4.2部分

2.2、检测头

通过基于图像的车道线检测方法比较,基于row-wise的方法在保持较好的精度下推理速度更快,所以本文使用row-wise的检测头。

2.2.1、第一阶段:逐行检测头

检测头输出两个结果:
1. row-wise车道线存在性,即每类车道线在当前道路上是否存在
[图片]
具体(如上图的上半部分):
共享MLP输出N cls ×H BEV ×2 ,其中:
N cls表示车道线的类别数
H BEV表示输入BEV特征图的H
2表示存在/不存在(用1/0表示)
2. row-wise车道线位置概率
具体(如上图的下半部分):
共享MLP输出N cls ×H BEV ×W BEV,其中:
N cls表示车道线的类别数
H BEV 和 W BEV 表示输入BEV特征图的H和W
3. 最后,确定车道线类别和位置
具体(如上图最右边部分):
利用沿列的 Softmax 函数应用于上述1和2输出的特征图
利用沿行的 Argmax 函数确定某一类车道线在某一行上的存在性和位置
通过行和列以及类别即可完成车道线检测

2.2.2、第二阶段:优化检测头

  1. 收集feature tokens(只有当同一行/列的tokens数量大于一定值,即拥有的车道线数量大于一定值时,该行的tokens才会被收集),最后收集到的feature tokens维度为N lanes * H bev * (C head * W thick),其中:N lanes表示按照上述要求提取的车道数量,W thick表示车道线的宽度,例如,W thick = 3,则表示在tokens的左右列再各取一个tokens,所以在行的维度为3,即车道线的宽度。
  2. 将 1 收集到的feature tokens在通过 Transformer 处理,得到细化的特征向量。(之所以这样做是想通过Transformer学习到车道线在形状和彼此距离方面的规律)
  3. 通过 2 得到细化精炼的特征后,再利用两个不同的共享MLP来预测最终的row-wise存在性和row-wise概率,这个的具体操作和第一阶段的逐行检测头操作一样。

2.3、损失函数

损失函数包括row-wise 存在性的损失和位置概率损失,Row-wise lane detection 是预测每一行的概率,所以这两个损失函数都是 cross-entropy loss
1、存在性损失:L ext
[图片]
2、位置概率损失:L loc
[图片]
3、总的损失函数:L total
[图片]
第一阶段的 λ1(L1 ext + L1 loc)加上第二阶段的λ2(L2 ext + L2 loc)

3、总结

3.1、优点

  1. 解决了基于grid 分割的车道线检测在遮挡严重时效果差的问题
  2. 网络结构上:检测头通过row-wise的方式检测车道线,相对于grid-seg方式,节省大量算力消耗

3.2、缺点

  1. 效果在直线上较好,在急转弯车道上检测效果较差。

猜你喜欢

转载自blog.csdn.net/jin15203846657/article/details/129098612
今日推荐