2017-SENet CVPR

企业开发 2022-06-06 07:16:32 阅读次数: 0

文章目录

2017-SENet CVPR

2017-SENet CVPR

论文地址: https://arxiv.org/abs/1709.01507

1. 简介

1.1 简介

WMW以极大的优势获得了最后一届 ImageNet 2017 竞赛 Image Classification 任务的冠军，

SENet则主要关注通道上可做点，通过显示的对卷积层特征之间的通道相关性进行建模来提升模型的表征能力；并以此提出了特征重校准机制：通过使用全局信息去选择性的增强可信息化的特征并同时压缩那些无用的特征。

SE 模块可以嵌入到现在几乎所有的网络结构中。通过在原始网络结构的 building block 单元中嵌入 SE 模块，我们可以获得不同种类的 SENet。如 SE-BN-Inception、SE-ResNet、SE-ReNeXt、SE-Inception-ResNet-v2 等等。

2. 网络

2.1 SE模块

即插即用的模块

如上图所示是 SE 注意力机制模块的网络架构图，

为了获得在通道维度上的注意力，特征图输入后，先通过基于特征图的宽度和高度进行全局平均池化，使空间特征降维到 1×1，如公式 1 所示。
$Z_c=F_{sq}(u_c)=\frac{1}{H\times W}\sum_{i=1}^H\sum_{j=1}^W u_c(i,j)$
紧接着使用两个全连接层和非线性激活函数建立通道间的连接，如公式 2 所示。
$\hat{z}=T_2(ReLU(T_1(z)))$
然后经过 Sigmoid 激活函数获得归一化权重，最后通过乘法逐通道加权到原始特征图的每一个通道上，完成通道注意力对原始特征的重新标定。如公式如下所示。

$\hat{X}=X\cdot \sigma(\hat{z})$

经过全局平均池化，可以获得全局的感受野，在第一次全连接时通过减少特征图的维度，大大减少了参数和计算量，之后经过非线性激活函数后再通过一个全连接恢复到原来的通道数，完成了通道间相关性的建立。

3. 代码

import torch
import torch.nn as nn


class SEBlock(nn.Module):
    def __init__(self, mode, channels, ratio):
        super(SEBlock, self).__init__()
        self.avg_pooling = nn.AdaptiveAvgPool2d(1)
        self.max_pooling = nn.AdaptiveMaxPool2d(1)
        if mode == "max":
            self.global_pooling = self.max_pooling
        elif mode == "avg":
            self.global_pooling = self.avg_pooling
        self.fc_layers = nn.Sequential(
            nn.Linear(in_features = channels, out_features = channels // ratio, bias = False),
            nn.ReLU(),
            nn.Linear(in_features = channels // ratio, out_features = channels, bias = False),
        )
		self.sigmoid = nn.Sigmoid()
     
    
    def forward(self, x):
        b, c, _, _ = x.shape
        v = self.global_pooling(x).view(b, c)
        v = self.fc_layers(v).view(b, c, 1, 1)
        v = self.sigmoid(v)
        return x * v

if __name__ == "__main__":
    model = SEBlock("max", 54, 9)
    feature_maps = torch.randn((8, 54, 32, 32))
    model(feature_maps)

参考资料

https://blog.csdn.net/weixin_43913124/article/details/123113339

猜你喜欢

转载自blog.csdn.net/wujing1_1/article/details/125148776

2017-SENet CVPR

cvpr 2017

CVPR 2017论文

2017-DenseNet CVPR

2017cvpr 目标检测

Speed Accuracy TradeOffs (CVPR, 2017)

debug-DMLIR-CVPR2017

【CVPR 2017】On the effectiveness of visible watermark

2017 ShuffleNetV1 CVPR

CVPR

【CVPR2018】Squeeze-and-Excitation Networks (SEnet)

CVPR 2017 全部及部分论文解读集锦

CVPR2017论文分类汇总

论文阅读:《Deep Image Matting》CVPR 2017

CVPR 2017、2018 - 目标检测文章

从CVPR2017 看多样目标检测

CVPR 2017部分论文小结

Densely Connected Convolutional Networks (DenseNet 2017 CVPR)

[CVPR2017]Deformable Convolutional Networks

2017 经典的CVPR 关于ImageCaptioning论文

（四）EAST----2017CVPR论文解读

(七)FPN----2017CVPR论文解读

【语义分割】2017-PSPNet CVPR

【图像分类】2017-MobileNetV1 CVPR

CVPR 2017 paper list & ICCV 2017 paper list

CVPR2017部分论文简介

论文阅读：《Pyramid Scene Parsing Network》CVPR 2017

CVPR 2017 《Deep Feature Flow for Video Recognition》论文笔记

论文笔记——CVPR 2017 Dilated Residual Networks

转载这篇文章是CVPR2017的oral

今日推荐

deepseek热度已过？

MOOC习题:“GPS数据处理”题目个人解析(C语言)

DeepSeek接入微信公众号小白保姆教程

图+语义：RDF语义处理组件Neosemantics功能列表

大语言模型Prompt工程之使用GPT4生成图数据库Cypher

大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher

GPT-3.5 生成 Fabric Cypher

生成 Cypher 能力：GPT3.5 VS ChatGLM

LangChain 2 ONgDB：大模型+知识图谱实现领域知识问答

生成 Cypher 能力：MOSS VS ChatGLM

Neo4j/ONgDB 图数据库快速处理 Excel 文件

LangChain-Agents 入门指南

周排行

blog公告

Lucene：基本增删改查（Java方式）

1、类库

android环信集成单聊功能

删除数据库表数据SQL语句

rhel6.3安装Percona XtraDB Cluster 5.7时错误的解决方法

天梯赛-堆栈（线段树）

ES6原生Class

20120607

张正友标定算法原理详解

每日归档

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)

2025-04-02(0)