前言：很久没有更新了，主要是最近也有很多事情，一个人学习新知识总是有点坚持不下来，前面的知识也没能很好的理解，存在的问题比较多。调试比较难调，在虚拟机里面总是报 “memory error” 或者 “已杀死”，但是重开一遍又没有了，在运行途中也总会出现这样的问题，让我很烦恼，只有自己一个人慢慢调。这几天也坚定了学习代码的心，后面的更新应该会更规律更频繁。本节内容其实是一小节，我觉得也很有必要整理一下，就单独拿出来了。

本节内容：1、实现断点续训

2、输入真实图片，输出预测结果

一、断点续训

关键处理：加入 ckpt 操作：

ckpt = tf.train.get_checkpoint_state(MODEL_SAVE_PATH)

if ckpt and ckpt.model_checkpoint_path:

    saver.restore(sess, ckpt.model_checkpoint_path)

注解：

（1）函数 tf.train.get_checkpoint_state(checkpoint_dir, latest_filename = None)

该函数表示如果断点文件夹中包含有效断点状态文件，则返回该文件。

参数说明：checkpoint_dir : 表示存储断点文件的目录

latest_filename = None : 断点文件的可选名称，默认为 “checkpoint”

（2）saver.restore(sess, ckpt.model_checkpoint_path)

该函数表示恢复当前会话，将 ckpt 中的值赋给 w 和 b。

参数说明：sess ：表示当前会话，之前保存的结果将被加载入这个会话

ckpt.model_checkpiont_path：表示模型存储的位置，不需要提供模型的名字，它会去查看 checkpoint 文件，看看最新的是哪一个，名称是什么。

这三句话实现了给所有的 w 和 b 赋保存在 ckpt 中的值，实现断点续训，有了断点续训就不用担心电脑断电而导致参数白跑的情况。再次运行这段代码时时候，程序会自动找到断点并从断点处继续训练模型。

将这段代码加在 mnist_backward.py 里面

上一小节的 mnist_backward.py (没加入断点续训) 的结果为

然后加入断点续训代码之后，程序从端点处开始训练

二、输入真实图片，输出预测结果

过程模型：

网络输入：将一张图片中的像素变成一维数组（784个像素点）

像素点：0-1之间的浮点数（接近0越黑，接近1越白）

网络输出：一维数组（是个可能性概率），数组中最大的那个元素所对应的索引号就是预测结果

整个识别代码中包括了上一节的 mnist_forward, py mnist_backward.py, mnist_test.py 多加入了 mnist_app.py

mnist_app.py 代码

最关键的函数是 application()。

其中任务分成两个函数来完成

（1）testPicArr = pre_pic(testPic) 对手写数字图片做预处理

（2）preValue = restore_model(testPicArr) 将符合神经网络输入要求的图片喂给复现的神经网络模型，输出预测值。

注解：

（1）main函数中的 application 函数：输入要识别的几张图片（注意要给出待识别图片的路径和名称）

（2）代码的处理过程：

模型的要求是黑底白字，但是输入的图片是白底黑字，所以需要对每个像素点的值改为 255 减去原值以得到互补的反色。
对图片做二值化处理（这样以滤掉噪声，另外调试中可适当调节阈值）。
把图片形状拉成 1 行 784 列，并把值变为浮点型（因为要求像素点是 0-1 之间的浮点数）。
接着让现有的 RGB 图从 0-255 之间的数变为 0-1 之间的浮点数。
运行完成后返回到 main 函数。
计算球的输出 y，y 的最大值所对应的列表索引号就是预测结果。

手写图片的提供：本文使用的是 ipad 并用Apple pencil在OneNote上写九个数字

然后分别截取这九个数字

实验结果

实际上这个识别准确率还是比较低的，错误率很高。可以说这个模型训练的很不好，识别率很低。然后我将其中的 “3” 写的更好正规一点

最后的识别结果

这个结果表明，如果写的更正规一点，识别率还是不错的，代码本身的逻辑是没有问题的，我觉得问题应该出在训练数据集上面，训练的数据集泛化性不够好，才导致这个不能很好的识别不是太正规的数字，但是改进方法暂时还不知道。

Tensorflow学习之手写数字识别

一、断点续训

二、输入真实图片，输出预测结果

猜你喜欢