版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ygdxt/article/details/84074849
创作缘由
这几天发现了一个很好的图片网站,图虫
但是里面的图片大部分有版权,要么需要付费下载,要么需要关注作者才能下载,而且在图片上不能右击,这让我们下载图片有了很大的问题,为了解决这个问题,上网搜索了许多图虫网的爬虫,发现都是千篇一律,功能都是搜索关键字后下载
,而且代码神似,估计是copy来copy去的结果,所以我想自己写个爬虫,只爬取制定图库的图片,而不需要胡乱下载一通,为了得到一条鱼而干了整条河。
如何使用
下载工程源码
或者git bash;git clone [email protected]:inspurer/PythonSpider.git
下载相关依赖
在命令行下依此输入
pip install requests
pip install pyquery
打开图虫网
选择你喜欢的图库链接,比如https://tuchong.com/4293835/23849565/
复制并替换到tuchong_gallery.py代码里面的gallery_url,解释一下这个链接的作用,
前一个数字串是作者的id,后一个数字串是作者该图库的id
注意,在打开这个图库时,复制地址前最好不要左右浏览
运行tuchong_gallery.py
你就可以看到在下载这个图库的图片了
图库保存在工程目录下,文件夹名为作者和图库的id
每一张图片保存在该文件夹下,格式为:imageid.jpg
计划更新
增加自动搜索
版权声明
经本爬虫下载后的图片用于商用而引起的纠纷,本博主概不负责。