Educoed--实现神经网络模型的前向传播、反向传播和训练

第1关:实现神经网络模型的前向传播

import numpy

from layers import Convolution, Relu, FullyConnected, MaxPool, SoftmaxWithLoss


 

class TinyNet:

    def __init__(self, W_conv1, b_conv1, W_conv2, b_conv2, W_fc, b_fc):

        ########## Begin ##########

        self.conv1 = Convolution(W_conv1, b_conv1, stride=1, pad=1)  

        self.relu1 = Relu()  

        self.pool1 = MaxPool(2, 2, stride=2, pad=0)  

        self.conv2 = Convolution(W_conv2, b_conv2, stride=1, pad=1)  

        self.relu2 = Relu()  

        self.pool2 = MaxPool(2, 2, stride=2, pad=0)  

        self.fc = FullyConnected(W_fc, b_fc)  

        self.loss = SoftmaxWithLoss()

        ########## End ##########

    def forward(self, x, t):

        ########## Begin ##########

        x = self.conv1.forward(x)  

        x = self.relu1.forward(x)  

        x = self.pool1.forward(x)  

        x = self.conv2.forward(x)  

        x = self.relu2.forward(x)  

        x = self.pool2.forward(x)  

        x = self.fc.forward(x)  

        loss = self.loss.forward(x, t)  

        return x, loss 

        ########## End ##########

第2关: 实现神经网络模型的反向传播

import numpy

from layers import Convolution, Relu, FullyConnected, MaxPool, SoftmaxWithLoss


 

class TinyNet:

    def __init__(self, W_conv1, b_conv1, W_conv2, b_conv2, W_fc, b_fc):

        self.conv1 = Convolution(W_conv1, b_conv1, stride=1, pad=1)

        self.relu1 = Relu()

        self.pool1 = MaxPool(2, 2, stride=2, pad=0)

        self.conv2 = Convolution(W_conv2, b_conv2, stride=1, pad=1)

        self.relu2 = Relu()

        self.pool2 = MaxPool(2, 2, stride=2, pad=0)

        self.fc = FullyConnected(W_fc, b_fc)

        self.loss = SoftmaxWithLoss()


 

    def forward(self, x, t):

        x = self.conv1.forward(x)

        x = self.relu1.forward(x)

        x = self.pool1.forward(x)

        x = self.conv2.forward(x)

        x = self.relu2.forward(x)

        x = self.pool2.forward(x)

        x = self.fc.forward(x)

        loss = self.loss.forward(x, t)

        return x, loss

    def backward(self):

        ########## Begin ##########

        dx = self.loss.backward()  

        dx = self.fc.backward(dx)  

        dx = self.pool2.backward(dx)  

        dx = self.relu2.backward(dx)  

        dx = self.conv2.backward(dx)  

        dx = self.pool1.backward(dx)  

        dx = self.relu1.backward(dx)  

        dx = self.conv1.backward(dx)

        ########## End ##########

        return self.conv1.dW, self.conv1.db, self.conv2.dW, self.conv2.db, self.fc.dW, self.fc.db

第3关:实现神经网络的梯度下降训练

import numpy

from layers import Convolution, Relu, FullyConnected, MaxPool, SoftmaxWithLoss


 

class TinyNet:

    def __init__(self, W_conv1, b_conv1, W_conv2, b_conv2, W_fc, b_fc):

        self.conv1 = Convolution(W_conv1, b_conv1, stride=1, pad=1)

        self.relu1 = Relu()

        self.pool1 = MaxPool(2, 2, stride=2, pad=0)

        self.conv2 = Convolution(W_conv2, b_conv2, stride=1, pad=1)

        self.relu2 = Relu()

        self.pool2 = MaxPool(2, 2, stride=2, pad=0)

        self.fc = FullyConnected(W_fc, b_fc)

        self.loss = SoftmaxWithLoss()

    def forward(self, x, t):

        x = self.conv1.forward(x)

        x = self.relu1.forward(x)

        x = self.pool1.forward(x)

        x = self.conv2.forward(x)

        x = self.relu2.forward(x)

        x = self.pool2.forward(x)

        x = self.fc.forward(x)

        loss = self.loss.forward(x, t)

        return x, loss

    def backward(self):

        dx = self.loss.backward()

        dx = self.fc.backward(dx)

        dx = self.pool2.backward(dx)

        dx = self.relu2.backward(dx)

        dx = self.conv2.backward(dx)

        dx = self.pool1.backward(dx)

        dx = self.relu1.backward(dx)

        dx = self.conv1.backward(dx)

        return self.conv1.dW, self.conv1.db, self.conv2.dW, self.conv2.db, self.fc.dW, self.fc.db


 

def train_one_iter(W_conv1, b_conv1, W_conv2, b_conv2, W_fc, b_fc, x, t, learning_rate):

    network = TinyNet(W_conv1, b_conv1, W_conv2, b_conv2, W_fc, b_fc)

    out, loss = network.forward(x, t)

    dW_conv1, db_conv1, dW_conv2, db_conv2, dW_fc, db_fc = network.backward()

    ########## Begin ##########

    new_W_conv1 = W_conv1 - dW_conv1 * learning_rate  

    new_b_conv1 = b_conv1 - db_conv1 * learning_rate  

    new_W_conv2 = W_conv2 - dW_conv2 * learning_rate  

    new_b_conv2 = b_conv2 - db_conv2 * learning_rate  

    new_W_fc = W_fc - dW_fc * learning_rate  

    new_b_fc = b_fc - db_fc * learning_rate 

    ########## End ##########

    return new_W_conv1, new_b_conv1, new_W_conv2, new_b_conv2, new_W_fc, new_b_fc

猜你喜欢

转载自blog.csdn.net/qq_57409899/article/details/124992904