深度学习：手写反向传播网络拟合sinx，可设置网络层数

一、全局方法：

rand(a,b)：该方法返回在区间（a，b）的任意随机数，且保证每次调用的时候返回的都是与之前不同的随机数
generate_w(m,n)：该方法返回生成的m*n的weight矩阵，且通过在该方法中调用rand(a,b)来初始化每个weight的值
generate_b(m)：该方法返回生成的m长度的bias值，且通过在该方法中调用rand(a,b)来初始化每个bias的值
fit_function(x,deriv=False)：该方法返回拟合函数，如果该方法传入的deriv是True,则返回拟合函数的导数。我试验了两种拟合函数，一种是sigmoid。另一种是tanh函数，在实验数据来看，tanh拟合效果比较好，而sigmoid由于只能输出0-1的正数，只能拟合0-π的一部分，且拟合效果不是很好。

random.seed(0)
def rand(a, b):
    return (b-a) * random.random() + a

def generate_w(m, n):
    w = [0.0] *m
    for i in range(m):
        w[i] = [0.0]*n
        for j in range(n):
            w[i][j] =rand(-0.69,1)#rand(-1,1) #
    return w

def generate_b(m):
    b = [0.0]*m
    for i in range(m):
        b[i] =rand(-2.409,0.02)# rand(-1,1)#
    return b

def fit_function(x,deriv=False):
    if deriv==True:
        #return x*(1-x)
        return 1-np.tanh(x) * np.tanh(x) #tanh鍑芥暟鐨勫鏁?
    return np.tanh(x)
    #return 1/(1+np.exp(-x))

二、定义了BPNetwork类，其内部函数方法说明如下：

__init__(self)：定义类中所需要的数据，类中所需要维持的参数名称在此函数中事先定义。这些数据包括：

⑴ self.input_n = 0：表示输入层的神经元个数，拟合sinx需要self.input_n = 2，一个是输入的数据，另一个用来调节bias

⑵ self.input_cells = []：表示输入层的神经元输入的数据，有两个元素，一个是输入的数据；另一个用来调节bias，默认为1

⑶ self.output_n = 0：输出层的神经元个数

⑷ self.output_cells = []：输出层的神经元的输出值

⑸ self.input_w = []：输入层到第一层隐藏层的weight

⑹ self.output_w = []：最后一层隐藏层到输出层的weight

⑺ self.hidden_ns = []：隐藏层的设置，它的长度是指隐藏层个数，它的每个元素指该层隐藏层的神经元个数

⑻ self.hidden_ws = []：隐藏层的weights，其中的每个元素为上一层隐藏层到下一层隐藏层的weight，一共有n-1个weight

⑼ self.hidden_bs = []：其中的每个元素self.hidden_bs[i]都是第i层隐藏层的bias设置，其长度为隐藏层的个数

⑽ self.output_b = []：输出层的bias

⑾ self.hidden_results = []：其中的每个元素是每一层隐藏层的输出值

⑿ self.output_deltas = []：指输出层的∂Error/∂(output_w)

⒀ self.hidden_deltases = []：其中的每个元素self.hidden_deltases[i] 指从第i层出发的∂Error/∂(weight),该weight指从第i层到第i+1层的weight

2. setup(self, input_n, output_n, hidden_set): 初始化类中所需参数，输入的参数中，

input_n是定义输入的参数个数，但并不等于输入层神经元个数，self.input_n等于输入的参数input_n+1,原因是需要新增一个神经元用来调节bias，且这个神经元的输入值记为1，这样就可以通过用output_deltas来调节input_b了

output_n是输出层个数

hidden_set是一个list，里面的每个元素是隐藏层的神经元个数，如[10,10]表示有两层隐藏层，两层隐藏层都有11个神经元，+1的原因同input_cells中增加一个神经元的作用是一样的，是为了调节该隐藏层的bias

通过这些信息就可以初始化类中所需要的数据了。即在__init__方法中的那些数据.

需要注意的是在初始化weight的时候使用generate_w方法形成一个由随机数的矩阵，初始化bias的时候使用generate_b形成一个由随机数组成的一维数组

 def __init__(self):
        self.input_n = 0
        self.input_cells = []
        self.output_n = 0
        self.output_cells = []
        self.input_w = []
        self.output_w = []
        self.hidden_ns = []
        self.hidden_ws = []
        self.hidden_bs = []
        self.output_b = []
        self.hidden_results = []
        self.output_deltas = []
        self.hidden_deltases = []

    def setup(self, input_n, output_n, hidden_set):
        #初始化各种参数
        self.input_n = input_n +1
        self.output_n = output_n
        self.hidden_ns = [0.0]*len(hidden_set)
        for i in range(len(hidden_set)):
            self.hidden_ns[i] = hidden_set[i]+1

        self.input_cells = [1.0]*self.input_n
        self.output_cells = [1.0]*self.output_n
        #初始化weights和bias
        self.input_w = generate_w(self.input_n, self.hidden_ns[0])
        self.hidden_ws = [0.0]*(len(self.hidden_ns)-1)
        for i in range(len(self.hidden_ns)-1):
            self.hidden_ws[i] = generate_w(self.hidden_ns[i],self.hidden_ns[i+1])
        self.output_w = generate_w(self.hidden_ns[len(self.hidden_ns)-1], self.output_n)
        self.output_b = generate_b(self.output_n)
        self.hidden_bs = [0.0]*len(self.hidden_ns)
        for i in range(len(self.hidden_ns)):
            self.hidden_bs[i] = generate_b(self.hidden_ns[i])
        self.hidden_results = [0.0]*(len(self.hidden_ns))

3. forward_propagate(self, input)：向前传播。

⑴ 将输入的input作为前n-1个输入层神经元的输入值，第n个输入层神经元设为1，然后进行向前传播

⑵ 传播分为三个部分，输入层到隐藏层第一层，在隐藏层之中，然后从最后一层隐藏层到输出层。传播公式为：

Output[h]=fit_function((Σi=0输入层神经元个数weight[i][h]*input[i])+bias[h])

传播的思路就是：前一层的输入的值乘以前一层到后一层的weight，然后得到积的加和，再用这个加和加上下一层的对应的bias，得到后一层的输出。

def forward_propagate(self, input):
        for i in range(len(input)):
            self.input_cells[i] = input[i]
        #输入层
        self.hidden_results[0] = [0.0]* self.hidden_ns[0]
        for h in range(self.hidden_ns[0]):
            total = 0.0
            for i in range(self.input_n):
                total += self.input_w[i][h] * self.input_cells[i]
            self.hidden_results[0][h] = fit_function(total+self.hidden_bs[0][h])
        #隐藏层
        for k in range (len(self.hidden_ns)-1):
            self.hidden_results[k+1] = [0.0]*self.hidden_ns[k+1]
            for h in range(self.hidden_ns[k+1]):
                total = 0.0
                for i in range(self.hidden_ns[k]):
                    total += self.hidden_ws[k][i][h] * self.hidden_results[k][i]
                self.hidden_results[k+1][h] = fit_function(total + self.hidden_bs[k+1][h])
        #输出层
        for h in range(self.output_n):
            total = 0.0
            for i in range(self.hidden_ns[len(self.hidden_ns)-1]):
                total += self.output_w[i][h] * self.hidden_results[len(self.hidden_ns)-1][i]
            self.output_cells[h] = fit_function(total + self.output_b[h])

        return self.output_cells[:]

4. get_deltas(self, label):该函数是得到self.output_deltas和self.hidden_deltases的函数。

self.output_deltas = ∂Error/∂(output_w):指输出层的deltas公式为

output_deltas[o]=fit_function(output_cell[o])*(label[o]-output_cells[o])

self.hidden_deltases = ∂Error/∂(weight) weight是指hidden_ws中的元素。

hidden_deltases[k][o]=fit_function_deriv(hidden_result[k][o])*(deltas[i]*weight[o][i]

这里的deltas是指的上一层神经元的deltas

 def get_deltas(self, label):
        self.output_deltas = [0.0] * self.output_n
        #输出层 deltas
        for o in range(self.output_n):
            error = label[o] - self.output_cells[o]
            self.output_deltas[o] = fit_function(self.output_cells[o],True) * error
        #隐藏层deltas
        tmp_deltas = self.output_deltas
        tmp_w = self.output_w
        self.hidden_deltases = [0.0]*(len(self.hidden_ns))
        k = len(self.hidden_ns) - 1
        while k >= 0:
            self.hidden_deltases[k] = [0.0] * (self.hidden_ns[k])
            for o in range(self.hidden_ns[k]):
                error = 0.0
                for i in range(len(tmp_deltas)):
                    error += tmp_deltas[i] * tmp_w[o][i]
                self.hidden_deltases[k][o] = fit_function(self.hidden_results[k][o],True) * error
            k = k - 1
            if k>=0:
                tmp_w = self.hidden_ws[k]
                tmp_deltas = self.hidden_deltases[k+1]
            else:
                break

5. renew_w(self,learn): 更新weight的函数，仍然分成三个部分，先更新最后一层隐藏层到输出层的权重，再是隐藏层之间的权重，然后再更新第一层隐藏层到输入层的权重。更新weight的公式为：

Weight[i][o] += deltas[o]*input[i]*learn，其中的o是输出层神经元的index，i是输入层的神经元的index，input是指输入层的输入，learn是学习率。

 def renew_w(self, learn):
        #更新隐藏层→输出层的权重
        k = len(self.hidden_ns)-1
        for i in range(self.hidden_ns[k]):
            for o in range(self.output_n):
                change = self.output_deltas[o] * self.hidden_results[k][i]
                self.output_w[i][o] += change * learn

        #更新隐藏层的权重
        while k > 0 :
            for i in range(self.hidden_ns[k-1]):
                for o in range(self.hidden_ns[k]):
                    change = self.hidden_deltases[k][o] * self.hidden_results[k-1][i]
                    self.hidden_ws[k-1][i][o] += change * learn
            k = k - 1

         #更新输入层→隐藏层权重
        for i in range(self.input_n):
            for o in range(self.hidden_ns[0]):
                change = self.hidden_deltases[0][o] * self.input_cells[i]
                self.input_w[i][o] += change * learn

6. renew_b(self,learn): 更新bias的函数，分成两个部分，第一部分是隐藏层的bias，第二部分是输出层的bias。更新bias的公式为：

bias[i]+= deltas[i]*learn

 def renew_b(self,learn):
        #更新隐藏层bias
        k = len(self.hidden_bs)-1
        while k>=0:
            for i in range(self.hidden_ns[k]):
                self.hidden_bs[k][i] = self.hidden_bs[k][i] + learn * self.hidden_deltases[k][i]
            k = k - 1
        #更新输出层bias
        for o in range(self.output_n):
            self.output_b[o] += self.output_deltas[o] * learn

7. back_propagate(self, input, label, learn):先进行前向传播，再进行反向传播，然后获取deltas，更新weight和bias，之后再计算此次正向传播得到的损失值，并返回。这个函数的每一行都在调用其他的函数，是一次完整的反向传播。

 def back_propagate(self, input, label, learn):
        self.forward_propagate(input)
        self.get_deltas(label)
        self.renew_w(learn)
        self.renew_b(learn)
        return self.get_loss(label,self.output_cells)

8. get_loss(self,label,output_cell)：用损失函数获取损失值，公式为

Σo输出值的个数=0((label[o]-output_cell[o])**2) *0.5

  #计算损失值
    def get_loss(self,label,output_cell):
        error = 0.0
        for o in range (len(output_cell)):
            error += 0.5 * (label[o] - output_cell[o]) ** 2
        return error

9. test(self):设置bp网的结构，然后得到20组数据进行训练，然后再用200组数据进行测试。直接调用test()方法就可以测试。

  #测试
    def test(self):
        input_datas,labels = self.get_train()
        self.setup(1,1,[10,10])
        self.train(input_datas,labels,0.05,3000)

        test,test_label = self.get_test()
        error = self.get_average_loss(test,test_label)
        print(error)
        '''ylabels = []
        error = 0
        for i in range(len(test)):
            ylabels.append(self.forward_propagate(test[i]))
            error += self.get_loss (test_label[i], self.output_cells)

        print("---测试误差---")
        error = error/200
        print(error)

深度学习：手写反向传播网络拟合sinx，可设置网络层数

猜你喜欢