python爬取图虫网图库

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ygdxt/article/details/84074849

创作缘由

这几天发现了一个很好的图片网站,图虫
在这里插入图片描述但是里面的图片大部分有版权,要么需要付费下载,要么需要关注作者才能下载,而且在图片上不能右击,这让我们下载图片有了很大的问题,为了解决这个问题,上网搜索了许多图虫网的爬虫,发现都是千篇一律,功能都是搜索关键字后下载,而且代码神似,估计是copy来copy去的结果,所以我想自己写个爬虫,只爬取制定图库的图片,而不需要胡乱下载一通,为了得到一条鱼而干了整条河。

如何使用

下载工程源码

点击下载

或者git bash;git clone [email protected]:inspurer/PythonSpider.git

下载相关依赖

在命令行下依此输入

pip install requests   
pip install pyquery   

打开图虫网

在这里插入图片描述
选择你喜欢的图库链接,比如https://tuchong.com/4293835/23849565/
复制并替换到tuchong_gallery.py代码里面的gallery_url,解释一下这个链接的作用,
前一个数字串是作者的id,后一个数字串是作者该图库的id
注意,在打开这个图库时,复制地址前最好不要左右浏览

运行tuchong_gallery.py

你就可以看到在下载这个图库的图片了
图库保存在工程目录下,文件夹名为作者和图库的id
每一张图片保存在该文件夹下,格式为:imageid.jpg
在这里插入图片描述

计划更新

增加自动搜索

版权声明

经本爬虫下载后的图片用于商用而引起的纠纷,本博主概不负责。

猜你喜欢

转载自blog.csdn.net/ygdxt/article/details/84074849