【ICCV2019】TensorMask：A Foundation for Dense Object Segmentation

其他 2020-04-16 17:44:02 阅读次数: 0

【ICCV2019】TensorMask：A Foundation for Dense Object Segmentation

概要
结构
实验

在这里插入图片描述

概要

目前(2019年前）基于密集网格式的滑动窗口目标检测器很流行也很成功(SSD，RetinaNet等)，但是实例分割仍是由先检测再分割的Mask R-CNNR-CNN主导。本文提出了一个4D张量来代表预测的mask(其实就是将通道表示成一个固定大小区域的mask）。

出发点：dense instance segmentation
解决思路：developing effective representations for dense masks

结构

第三章看起来很复杂，据我的理解(若有错误还请指出)，主要的就是两点。第一点就是特征的对齐，如下图所示。
在这里插入图片描述
左图这些五颜六色的小方框就是(y,x)点对应的通道特征，如果我们把通道reshape成VxU来代表这个中心点(y,x)点产生的mask，会有特征不对齐的问题，因为明明是这个点的特征，却用这个特征去表示周围点的mask特征不合适。所以就有了右图的对齐操作，这样这个点产生的特征对应了该点的mask特征。

第二点就是Tensor Bipyramid，提出这个是因为不同大小的特征图需要不同的窗口去产生mask，比如小的特征图，我们通常会预测大的物体，这时所需要的窗口要够大，而对于大的特征图，会预测较小的物体，此时我们需要的窗口要小。这里需要说明一下up_align2nat 操作，如下图所示：
在这里插入图片描述
这里的s其实就是stride(论文里用unit表示)，假如现在的通道特征比目前的特征图更粗糙(对应到原图像上，意思就是预测出来的mask比本应预测的更粗糙)，先用up_bilinear把通道变多，然后再进行一个对齐操作。

在这里插入图片描述
还有一个swap_align2nat操作，就是比up_align2nat多了一个subsample操作，这样可以实现“小特征图预测的mask数量更少“。

第四章介绍了各种head。
在这里插入图片描述
如果用a)，说明每一层大物体和小物体都用相同的像素去预测。而b)可以保证mask和物体大小成正比。

实验

在这里插入图片描述

Hanawh

发布了86 篇原创文章 · 获赞 10 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_36530992/article/details/105550885

【ICCV2019】TensorMask：A Foundation for Dense Object Segmentation

TensorMask: A Foundation for Dense Object Segmentation

神经网络 | TensorMask: A Foundation for Dense Object Segmentation（何凯明团队新作）近5年目标检测综述

ICCV2017：Focal Loss for Dense Object Detection

Mutual Supervision for Dense Object Detection（ICCV2021）阅读笔记

[ICCV2019] Co-segmentation Inspired Attention Networks for Video-based Person Re-identification

Focal Loss for Dense Object Detection

【论文浅读】《A Pyramid CNN for Dense-Leaves Segmentation》

Spatiotemporal CNN for Video Object Segmentation

Segmentation as Selective Search for Object Recognition

ICCV2019论文点评：3D Object Detect疏密度点云三维目标检测

Focal Loss for Dense Object Detection论文阅读

Focal Loss for Dense Object Detection解读

Focal Loss for Dense Object Detection(RetinaNet)

Focal Loss for Dense Object Detection(文献阅读)

【Focal Loss】《Focal Loss for Dense Object Detection》

'Dense' object has no attribute 'compile' 错误

Focal Loss for Dense Object Detection 阅读总结

RetinaNet：Focal Loss for Dense Object Detection

VarifocalNet: An IoU-aware Dense Object Detector

论文精读:Focal Loss for Dense Object Detection

【ICCV2019】FCOS

[ICRA 2019]Multi-Task Template Matching for Object Detection, Segmentation and Pose Estimation Using Depth Images

2019论文阅读4:Fast and Accurate Online Video Object Segmentation via Tracking Parts

CVPR 2019——Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds

foundation

论文阅读：Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation

论文笔记：Capsules for Object Segmentation

Rich featurehierarchies for accurate object detection and semantic segmentation

Segmentation as Selective Search for Object Recognition论文翻译

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)