【论文阅读】【三维目标检测】3DSSD: Point-based 3D Single Stage Object Detector

香港中文大学,香港科技大学出品,贾佳亚团队
2020CVPR

3DSSD

F-FPS

这是我认为本文最重要的一个贡献,该贡献解决了前景点采样点(representative points)少的问题。解决方式也很巧妙,在FPS的过程中,除了使用点与点之间的距离,还加入了feature与feature的距离。该方式的加入使得采样点中前景点的数量更多了。具体效果也在Table 2中做了比较。

值得注意的一点是,作者并没有完全使用F-FPS,而是使用了D-FPS与F-FPS的结合,两者均取一些点,然后将两者采样的点合起来。这样做是为了在训练过程中引入足够的负样本。

Framework

如果读过VoteNet这篇论文,可以发现CG Layer与VoteNet中的很像。VoteNet的详细解读可以参考我的另外两篇博客[1][2]

Loss中也是与VoteNet很像,新的部分是使用了center-ness score,center-ness score文中说是参考了2D Object Detection中FCOS。如果看FCOS,可以看到这个的center-ness score与FCOS中的确实很像,只不过是由2维度变成了3维。

Experiment

在KITTI和nuScenes数据集上都做了实验,效果还不错

Ablation Study分别验证了

  • F-FPS与D-FPS结合的有效性
  • CG Layer的有效性
  • Center-ness score的有效性
  • 计算时间上的优势

问题:

1、由于还是FPS,尽管加入了feature空间,还是相当于对(位置+feature)空间内全体的采样,也就是说在预测时,还有很多背景点。
2、Figure. 3没有详细解释,通道数对不上啊。例如左图,第一次下采样过后的点的feature的通道数不应该是(64+128+128)吗?

猜你喜欢

转载自blog.csdn.net/wqwqqwqw1231/article/details/105174129
今日推荐