神经网络-非线性激活

文章

- 概述：
- RELU
- Sigmoid
- 总结

概述：

非线性激活主要是为了给我们的神经网络去引入一些非线性的特质，比较常用的非线性激活有两个分别是Sigmoid和RELU。

RELU

示例代码：

import torch
from torch import nn
from torch.nn import ReLU

input = torch.tensor([[1,-0.5],
                      [-1,3]])

input = torch.reshape(input,(-1,1,2,2))
print(input.shape)

# 搭建神经网络
class Booze(nn.Module):

    def __init__(self):
        super(Booze, self).__init__()
        # inplace参数的意义就是是否将原来的变量的值替换成处理后的结果值 若inplace=True则对原来的变量进行替换，原来变量的值就变了，变成处理后的结果值，若inplace=False则不对原来的变量进行替换，产生的结果需要一个新的变量去接收
        # 通常情况下，建议将inplace传入False，这样可以保证原始数据不丢失
        self.relu1 = ReLU()
	# 重写forword方法
    def forward(self,input):
        output = self.relu1(input)
        return output

obj = Booze()
output = obj(input)
print(output)

代码运行结果：
在这里插入图片描述

对于ReLU接口的使用，该接口只有一个参数需要传入，那就是inplace参数。

torch.nn.ReLU(inplace=False)

inplace参数的意义就是是否将原来的变量的值替换成处理后的结果值若inplace=True则对原来的变量进行替换，原来变量的值就变了，变成处理后的结果值，若inplace=False则不对原来的变量进行替换，产生的结果需要一个新的变量去接收。
通常情况下，建议将inplace传入False，这样可以保证原始数据不丢失。
在这里插入图片描述
上面这张图是ReLU激活函数的图像，对上面这张图的解释：小于零进行截断，大于零则输出原有值。

Sigmoid

示例代码：

import torch
import torchvision
from torch import nn
from torch.nn import ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter


dataset = torchvision.datasets.CIFAR10("./CIFAR10",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader = DataLoader(dataset,batch_size=64)

# 搭建神经网络
class Booze(nn.Module):

    def __init__(self):
        super(Booze, self).__init__()
        # inplace参数的意义就是是否将原来的变量的值替换成处理后的结果值 若inplace=True则对原来的变量进行替换，原来变量的值就变了，变成处理后的结果值，若inplace=False则不对原来的变量进行替换，产生的结果需要一个新的变量去接收
        # 通常情况下，建议将inplace传入False，这样可以保证原始数据不丢失
        self.relu1 = ReLU()
        self.sigmoid1 = Sigmoid()

    # 重写forward方法
    def forward(self,input):
        # output = self.relu1(input)
        output = self.sigmoid1(input)
        return output

obj = Booze()

# 使用tensorboard进行可视化
writer = SummaryWriter('logs')
step = 0

for data in dataloader:
    imgs,targets = data
    writer.add_images("input",imgs,step)
    # 使用神经网络对图片进行处理
    output = obj(imgs)
    writer.add_images("output",output,step)

    step+=1

writer.close()

Sigmoid和RELU的使用方法类似这里就不再赘述。
上述代码运行结果在tensorboard中可视化如下图所示：
在这里插入图片描述
非线性激活sigmoid函数处理前后的效果还是比较明显的哈。

总结

非线性变换主要目的就是在我们的网络当中去引入一些非线性特征。因为非线性也多的话，你才能训练出符合各种曲线或者说符合各种特征的一个模型，如果大家都是直愣愣的话，模型的泛化能力就不够好。