【深度学习】CVPR2019-PAPER IDEAS

1. driving stereo: a large-scale dataset for stereo matching in autonomous driving scenarios

这位朋友的工作主要是在制作深度数据集,制作数据集的过程写了这篇paper。主要是深度标签不好获得,直接用雷达获取的还不够准确,他又结合了其他信息来制作更准确的label~(第一次知道,制作label的方法也可以写文章。。之前一直以为根据图片和label训练的过程可以发paper。。。emmmm)

2. pose2seg

之前我也做过类似的,这边是先提pose特征+pose定位点,然后得到分割结果。

我之前做过pose定位点+image,得到分割结果。

3. cyclic guidance for weakly supervised jiont detection and segmentation

weakly supervised: 只有分类标签,训练detection和seg任务

用分类的各种heat map作为检测的伪标签,检测的预测图作为分割的伪标签,分割的结果再返回来优化检测,形成一个环~

4. visual attention consistency under image transforms for multi-label image classification

这个是我感觉今天上午看到最有意思的工作之一,虽然在分类任务上做的,但是,我感觉使用范围并不局限于分类。

主要思想:原图片和翻转的图片提取的feature理论上也是翻转的关系,但是实际情况确不是这样的,他们分别把原图和翻转的图片输入网络提取特征,然后翻转其中一个特征,两个特征做个consistency loss,over。

思想简单,一目了然,十分有道理啊~好奇为啥这个工作不是oral。。

5. bag of tricks for image classification with convolutional neural networks

a. learning rate warm up

b. mix up training

c. label smoothing

d. cosine learning rate decay

e. knowledge distillation

似乎是之前的各种方法的组合。。人太多了。。没能去问。。

6. libra r-cnn: towards balanced learning for object detection

三个创新点,1. 没懂。2. 没懂,大概是结合不同level的信息干啥来着。3. 我感觉第三个创新点比较有意思,detection会出分类和检测的结果,有的框分类结果对,但是检测框不准,有的是检测框比较准,分类结果不对。分类和检测是两个loss分别约束的,同时训练的时候这种不匹配的情况就会互相影响,比如,分类很好了,检测还差一点,那这个检测就很难训练到,他们改进loss曲线,让分类好的那些,依旧可以提升检测效果~然后就有提升了

7. adaptively connected neural networks

这个去的时候没有人了。。大概看了一下,self,cnn, mlp三种连接方式做了一个balance~想法蛮简单的~不过,有点儿像剪枝。。。

——————————————————————————————————————————————————————————————

1. Dual attention network for sene segmentation

两个分支,分别在hw和c维度计算attention,然后合并两个分支结果,该部分加在网络最后

2. decoders matter for semantic segmentation: data-dependent decoding enables flexible feature aggregation

赞~

扩展channel数量,然后channel四等分,放在前边,相当于2倍upsample,这种upsample是有参数的upsample,参数存在weight中,在计算过程中施加对weight的约束,使upsample的图像再downsample之后还原回原图尽可能减少损失。这个部分加在网络最后来提升效果。

3. compressing convolutional neural networks via factorized convolutional filters

赞~

一种确定剪枝策略的方法,和drop out的区别是,drop out是随机的,这个方法是通过某种约束来选择的。

约束是:每一个weight对应一个v(取0或者1)来决定这个weight保留还是去掉,但是离散值并不能求解最优值,他们想到一个方法,如果v是2维,它的取值一共有4个,可以看作是以这四个点为顶点的正方形与其外接圆的交点,这两个区域求最优值然后求交集就可以得到解的值。就可以知道相应的点需要保留还是去掉了。

4. context-reinforced semantic segmentation

通过强化学习找到分割结果中有效的部分作为伪标签加入到训练过程中提升网络性能。之前通过confidence map没有效果的原因是一开始训练的结果直接来选,并不一定confidence高的就是分类准确的,所以他们一开始加入强化学习帮助网络区分哪些是好的,哪些是不好的。

5. A simple pooling-based design for real-time salient object detection

在显著性检测任务中在网络的不同层各种加提取多尺度信息的结构。结合显著性献策和边缘提取的任务来提升显著性检测的效果。

6. Progressive image deraining networks: a better and simpler baseline

很新奇的点呀~

任务是图片去雨。这个任务目前的网络结构越来越复杂,但是作者找到了一种比较简单的结构并且很work。没有提出新的结构,只是去掉了很多冗余的结构。不过在rebuttal的时候reviewer也会说没有新的方法~但是还是通过了。

7. Deep flow-guided video inpainting

任务是补全video里边缺少的一块。通过video的flow来从其他帧选取像素补全当前像素缺失的部分。

8. Towards instance-level image-to-image translation

任务是图片白天转为黑夜。对不同的物体采取不同的转换网络来训练(主要是用于修改test时使用的网络的前边的参数),更有针对性。测试的时候是一个网络结构,保证图片中间不会有断层。

猜你喜欢

转载自blog.csdn.net/Sun7_She/article/details/93474139
今日推荐