算法工程师修仙之路:TensorFlow(八)

TensorFlow 入门

TensorFlow实现神经网络


完整神经网络样例程序

  • 训练神经网络的过程可以分为以下三个步骤:

    • 定义神经网络的结构和前向传播的输出结果;
    • 定义损失函数以及选择反向传播优化的算法;
    • 生成会话并且在训练、数据上反复运行反向传播优化算法。
  • 训练神经网络解决二分类问题

    import tensorflow as tf 
    
    # NumPy是一个科学计算的工具包,这里通过NumPy工具包生成模拟数据集。
    from numpy.random import RandomState
    
    # 定义训练数据batch的大小。
    batch_size = 8
    
    # 定义神经网络的参数和结构。
    w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
    w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))
    
    """ 
    在shape的一个维度上使用None可以方便使用不同的batch大小。
    在训练时需要把数据分成比较小的batch,但是在测试时,可以一次性使用全部的数据。
    当数据集比较小时这样比较方便测试,但数据集比较大时,将大量数据放入一个batch可能会导致内存溢出。 
    """
    x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
    y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
    
    # 定义神经网络前向传播的过程。
    a = tf.matmul(x, w1)
    y = tf.matmul(a, w2)
    
    # 定义损失函数和反向传播的算法。
    y = tf.sigmoid(y)
    cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)) + 
                    (1-y) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
    train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)
    
    # 通过随机数生成一个模拟数据集。
    rdm = RandomState(1)
    dataset_size = 128
    X = rdm.rand(dataset_size, 2)
    """ 
    定义规则来给出样本的标签。
    在这里所有xl+x2<1的样例都被认为是正样本,而其他为负样本。
    在这里使用0表示负样本,1表示正样本。
    大部分解决分类问题的神经网络都会采用0和1的表示方法。 
    """
    Y = [[int(x1+x2<1)] for x1,x2 in X]
    
    # 创建一个会话来运行TensorFlow程序。注意:这里不能使用with,不然会话会被关闭,无法执行训练。
    sess = tf.Session()
    init_op = tf.global_variables_initializer()
    # 初始化变量。
    sess.run(init_op)
    
    print(sess.run(w1))
    print(sess.run(w2))
    
    """ 
    在训练之前神经网络参数的值:
    w1=[[-0.81131822  1.48459876  0.06532937]
     [-2.4427042   0.0992484   0.59122431]]
    w2=[[-0.81131822]
     [ 1.48459876]
     [ 0.06532937]]   
     """
    
    # 设定训练的轮数。
    STEPS = 5000
    for i in range(STEPS):
        # 每次选取batch_size个样本进行训练。
        start = (i * batch_size) % dataset_size
        end = min(start+batch_size, dataset_size)
        
        # 通过选取的样本训练神经网络并更新参数。
        sess.run(train_step, feed_dict={x:X[start:end], y_:Y[start:end]})
        if i % 1000 == 0:
            # 每隔一段时间计算在所有数据上的交叉熵并输出。
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x:X, y_:Y})
            print("After %d training step(s), cross entropy on all data is %g" % (i, total_cross_entropy))
       
        """  
        输出结果:
        After 0 training step(s), cross entropy on all data is 0.314006
        After 1000 training step(s), cross entropy on all data is 0.0684551
        After 2000 training step(s), cross entropy on all data is 0.033715
        After 3000 training step(s), cross entropy on all data is 0.020558
        After 4000 training step(s), cross entropy on all data is 0.0136867
        通过这个结果可以发现随着训练的进行,交叉煽是逐渐变小的。
        交叉炳越小说明预测的结果和真实的结果差距越小。 
        """
    
    print(sess.run(w1))
    print(sess.run(w2))
    sess.close()
    
    """ 
    在训练之后神经网络参数的值:
    w1=[[-2.54865503  3.07930899  2.89517093]
     [-4.11127424  1.62590718  3.3972702 ]]
    w2=[[-2.32309365]
     [ 3.30116868]
     [ 2.4632082 ]]
    可以发现这两个参数的取值已经发生了变化,这个变化就是训练的结果。
    它使得这个神经网络能更好地拟合提供的训练数据。 
    """
    

猜你喜欢

转载自blog.csdn.net/faker1895/article/details/86347804
今日推荐