如何下载kaggle上的数据集
下载kaggle数据集一共有两种方法,一种是直接下载,一种是用kaggle提供的API进行下载
1 直接下载
这里以10 monkey数据集介绍:
1、10 monkey数据集在kaggle的地址
https://www.kaggle.com/slothkong/10-monkey-species
2、直接下载
这种直接点击下载即可
2 通过kaggle提供的API下载数据集
有些数据集是没有提供这种 直接下载的button,例如下面要下载的Cifar10数据集,值提供下载的API地址。
2.1 Cifar10 数据集地址
https://www.kaggle.com/c/cifar-10/data
2.2 kaggle如何通过kaggle提供的API下载数据集
1、安装kaggle
pip installl kaggle
2、下载kaggle.json文件
点击My account
,进去之后,点击Create New API Token
就可以下载kaggle.json
文件了
3、把下载的kaggle.json
文件放到用户目录下
根据上面的提示Ensure kaggle.json is in the location ~/.kaggle/kaggle.json to use the API.
,下载的kaggle.json文件要放到用户目录下的隐藏文件.kaggle
文件夹下,我在安装完kaggle之后是没有看到这个文件夹,如果没有就手动创建一下即可。
4、用kaggle下载Cifar-10 数据集
然后直接在命令行下输入下面命令即可下载数据集
kaggle competitions download -c cifar-10
3 错误 : 404 - Not Found
我在下载cifar-10数据集的时候,出现了404 - Not Found
错误,但是我用上面的10 monkey
测试下载是正常的
kaggle datasets download -d slothkong/10-monkey-species
解决方法:
这个问题是由于kaggle的版本导致的,应该是一个bug,我默认下载的最新kaggle版本是
1.5.6
,把版本降低即可,我将版本降为1.5.3
,解决了这个问题
pip install -U kaggle==1.5.3
♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠ ⊕ ♠