如何下载kaggle上的数据集


下载kaggle数据集一共有两种方法,一种是直接下载,一种是用kaggle提供的API进行下载


1 直接下载

这里以10 monkey数据集介绍:
1、10 monkey数据集在kaggle的地址

https://www.kaggle.com/slothkong/10-monkey-species
在这里插入图片描述
2、直接下载
这种直接点击下载即可

2 通过kaggle提供的API下载数据集

有些数据集是没有提供这种 直接下载的button,例如下面要下载的Cifar10数据集,值提供下载的API地址。

2.1 Cifar10 数据集地址

https://www.kaggle.com/c/cifar-10/data

2.2 kaggle如何通过kaggle提供的API下载数据集

1、安装kaggle

pip installl kaggle

2、下载kaggle.json文件
点击My account,进去之后,点击Create New API Token就可以下载kaggle.json文件了
在这里插入图片描述
在这里插入图片描述

3、把下载的kaggle.json文件放到用户目录下
根据上面的提示Ensure kaggle.json is in the location ~/.kaggle/kaggle.json to use the API.,下载的kaggle.json文件要放到用户目录下的隐藏文件.kaggle文件夹下,我在安装完kaggle之后是没有看到这个文件夹,如果没有就手动创建一下即可。

4、用kaggle下载Cifar-10 数据集
在这里插入图片描述
然后直接在命令行下输入下面命令即可下载数据集

kaggle competitions download -c cifar-10

3 错误 : 404 - Not Found

我在下载cifar-10数据集的时候,出现了404 - Not Found错误,但是我用上面的10 monkey 测试下载是正常的

kaggle datasets download -d slothkong/10-monkey-species

在这里插入图片描述

解决方法:

这个问题是由于kaggle的版本导致的,应该是一个bug,我默认下载的最新kaggle版本是1.5.6,把版本降低即可,我将版本降为1.5.3,解决了这个问题

pip install -U kaggle==1.5.3

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠

猜你喜欢

转载自blog.csdn.net/weixin_41010198/article/details/102687207