前记:小伙伴们在参与kaggle比赛的过程中,如果在linux服务器截面下载数据,进行模型训练的话,必不可少的是kaggle命令行的使用。这里就阐述下kaggle的安装及使用说明。
- 安装
linux界面中,推荐安装命令:(kaggle 命令行工具安装在当前登陆用户目录 ~/.local/bin 下。)
pip install --user kaggle
安装完成功后,确保 ~/.local/bin 添加到 PATH 环境变量中。使用以下命令查看环境变量
echo $PATH
对于不太熟悉 linux 的读者,还是增加一点提示,这里看到的不是我们添加的 ~/.local/bin , 而是形如 /Users/ken/.local/bin 或 /home/ken/.local/bin 的路径,因为 ~ 代表的是当前用户目录,在添加后,被实际用户目录替代了。
接下来是kaggle官网的授权部分
注册登录后,进入个人界面,进入Acount,点击Create New API Token,得到API 的 json文件,
将此文件放到 ~/.kaggle/kaggle.json 路径下(Windows 系统路径是 C:\Users\<Windows-username>\.kaggle\kaggle.json)。
kaggle -v
此时使用上述命令,验证是否已安装好。 不出意外会warning,提示如下:
Warning: Your Kaggle API key is readable by other users on this system! To fix this, you can run 'chmod 600 /home/xiaozh/.kaggle/kaggle.json'
Kaggle API 1.5.12
是因为可能存在其他用户,能使用你的kaggle账户,为了确保在linux界面的私密性和使用安全,建议给 API 凭证设置权限:
chmod 600 ~/.kaggle/kaggle.json
- 使用
kaggle支持的命令总览:
扫描二维码关注公众号,回复:
15471609 查看本文章
kaggle competitions {list, files, download, submit, submissions, leaderboard}
kaggle datasets {list, files, download, create, version, init}
kaggle kernels {list, init, push, pull, output, status}
kaggle config {view, set, unset}
详细的使用说明,可参考官网:https://www.kaggle.com/docs/api
我主要用来下载数据:
kaggle competitions download -c 比赛名称