1、我们经常在训练完一个模型之后希望保存训练的结果,这些结果指的是模型的参数,以便下次迭代的训练或者用作测试。Tensorflow针对这一需求提供了Saver类。
- Saver类提供了向checkpoints文件保存和从checkpoints文件中恢复变量的相关方法。Checkpoints文件是一个二进制文件,它把变量名映射到对应的tensor值。
- 只要提供一个计数器,当计数器触发时,Saver类可以自动的生成checkpoint文件。这让我们可以在训练过程中保存多个中间结果。例如,我们可以保存每一步训练的结果。
- 为了避免填满整个磁盘,Saver可以自动的管理Checkpoints文件。例如,我们可以指定保存最近的N个Checkpoints文件。
- import tensorflow as tf
- import numpy as np
- isTrain = True
- train_steps = 100
- checkpoint_steps = 50
- checkpoint_dir = '/home/jdlu/jdluTensor/test/tmp/'
- x = tf.placeholder(tf.float32, shape=[None, 1])
- y = 4 * x + 4
- w = tf.Variable(tf.random_normal([1], -1, 1))
- b = tf.Variable(tf.zeros([1]))
- y_predict = w * x + b
- loss = tf.reduce_mean(tf.square(y - y_predict))
- optimizer = tf.train.GradientDescentOptimizer(0.5)
- train = optimizer.minimize(loss)
- isTrain = False
- train_steps = 100
- checkpoint_steps = 50
- checkpoint_dir = ''
- saver = tf.train.Saver() # defaults to saving all variables - in this case w and b
- x_data = np.reshape(np.random.rand(10).astype(np.float32), (10, 1))
- with tf.Session() as sess:
- sess.run(tf.initialize_all_variables())
- if isTrain:
- for i in xrange(train_steps):
- sess.run(train, feed_dict={x: x_data})
- if (i + 1) % checkpoint_steps == 0:
- saver.save(sess, checkpoint_dir + 'model.ckpt', global_step=i+1)
- else:
- ckpt = tf.train.get_checkpoint_state(checkpoint_dir)
- if ckpt and ckpt.model_checkpoint_path:
- saver.restore(sess, ckpt.model_checkpoint_path)
- else:
- pass
- print(sess.run(w))
- print(sess.run(b))
说明:
训练的过程:
1、先设置isTrain=True,然后会保存模型,设置isTrain=False会将训练好的模型加载进来进行测试
2、train_steps:表示训练的次数,例子中使用100
3、checkpoint_steps:表示训练多少次保存一下checkpoints,例子中使用50
4、checkpoint_dir:表示checkpoints文件的保存路径,例子中使用当前路径
- if isTrain:
- for i in xrange(train_steps):
- sess.run(train, feed_dict={x: x_data})
- if (i + 1) % checkpoint_steps == 0:
- saver.save(sess, checkpoint_dir + 'model.ckpt',global_step = i+1)
测试的过程:
1、测试的过程就是加载训练模型好的模型
- ckpt = tf.train.get_checkpoint_state(checkpoint_dir)
- if ckpt and ckpt.model_checkpoint_path:
- saver.restore(sess, ckpt.model_checkpoint_path)
- else:
- pass
- print(sess.run(w))
- print(sess.run(b))
说明:
checkpoint的文件内容:
保存model的路径下的文件内容:
- saver.save(sess, checkpoint_dir + 'model.ckpt',global_step = i+1)
每次保存一次都会相应生成三个文件,分别是.data-00000-of-00001,.index,.meta
==================================================================================================================