神经网络的学习(二)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/soulmate_uu/article/details/92840340

《Python神经网络编程》一书的学习

全书详解了代码的来源,除此之外,还提供了一些数据可供学习:

完整代码详见:Python实现神经网络

关于MNIST数据集:

1、由受人尊敬的神经网络研究员Yann LeCun的网站可以得到原始格式的MNIST手写数据集参见:MNIST数据库(1.0)

2、由于上述的MNIST数据库的格式不容易使用,因此其他人创建了相对简单的数据文件格式,参见:MNIST数据库(2.0)
这些文件称为CSV文件,这意味着纯文本中的每一个值都是由逗号分隔的,我们可以轻松地在任何文本编辑器中查看这些数值,大部分的电子表格和数据分析软件也兼容CSV文件。
在此网页下,可下载测试集 train set 和训练集 test set 这两个CSV文件.

用excel打开:
在这里插入图片描述
用文本编辑器打开:
在这里插入图片描述
第一列的值是标签,即书写者实际希望表示的数字,如“5”“0”或者“7”“2”等,这是我们希望神经网络学习得到的正确答案。
(每一行共785个值,编辑器自动换行了,例如,用文本编辑器打开测试集,第一列的第一个值是7,第二个值是2……)

为什么每一行除标签外剩下的共有784个数字?是因为,后面的值,是手写体数字的像素值,像素数组的尺寸是28X28,因此在标签后有784个值。

3、MNIST数据的数据文件是相当大的,因此在深入研究之前,我们应该下载MNIST数据集中的一个较小的子集。较小的字体意味着我们可以实验、尝试和开发代码,而不会由于大量的数据集而拖慢计算机的速度。一旦确定了乐于使用的算法和代码,我们就可以使用完整的数据集。

以下是MNIST数据集中较小子集的链接,也是以CSV格式存储的:
MNIST测试数据集中的10条记录和训练数据集中的100条记录——参见:https://github.com/makeyourownneuralnetwork/makeyourownneuralnetwork/tree/master/mnist_dataset

猜你喜欢

转载自blog.csdn.net/soulmate_uu/article/details/92840340