UCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库,这个数据库目前共有335个数据集,其数目还在不断增加,UCI数据集是一个常用的标准测试数据集。 网址: http://archive.ics.uci.edu/ml/index.php
到uci上下载数据集会发下下载下来的都是(.data)格式的,但是使用weka需要(.arff)格式的文件
步骤:
1、新建一个文件(.txt)
2、打开网址你想要下载的数据集
3、点击进去data folder, 会看到(xxx).data的数据文件,点击文件,看到里面的数据
4、复制全选数据,张贴到第一步新建的文件中,重命名将文件名改为数据集的名字,后缀改为(.csv)数据格式
5、打开weka的ui界面选择Explorler, 先打开之前保存的数据文件(.csv),然后保存成(.arff)格式的文件。