爬虫---批量下载美女图片 - 代码天地

爬虫---批量下载美女图片

其他 2018-11-14 13:42:41 阅读次数: 0

import urllib.request
import os #创建一个文件夹

def url_open(url):
req=urllib.request.Request(url)#为它添加一个request头，这样更像是浏览器访问
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0')
response=urllib.request.urlopen(url)
html=response.read()

return html

def get_page(url):
html=url_open(url).decode('utf-8')
#查找，字符串查找用find方法
a=html.find('current-comment-page')+23#加上偏移，正好到44这个4的位置
b=html.find(']',a)
return html[a:b]
def find_imgs(url):
html=url_open(url).decode('utf-8')
img_addrs=[]#用一个列表进行保存

a=html.find('img src=')
while a!=-1:#当a能找到就继续循环，找不到则停止
b=html.find('.jpg',a,a+255)

if b!=-1:
img_addrs.append(html[a+9:b+4])
else:
b=a+9
a=html.find('img src=',b)#a的下一次起始位置就是上一次的最终位置
return img_addrs

def save_imgs(folder,img_addrs):
for each in img_addrs:
filename=each.split('/')[-1]#把它最后的名字拿出来
with open(filename,'wb') as f:
img=url_open(each)
f.write(img)

def download_mm(folder='ooxx',pages=10):
os.mkdir(folder)#创建一个文件名为floder的文件夹
os.chdir(folder)#当前工作目录切换过去

url=' https://jandan.net/ooxx'
page_num=int(get_page(url))#获取后是字符型，要把它转换为整型

for i in range(pages):
page_num-=i
#https://jandan.net/ooxx/page-43#comments
page_url=url+'/page-'+str(page_num)+'#comments'
#获取图片的地址，然后写成列表返回
img_addrs=find_imgs(page_url)
#保存页面到指定文件夹
save_imgs(folder,img_addrs)

if __name__=='__main__':
download_mm()

猜你喜欢

转载自blog.csdn.net/weixin_39338645/article/details/83059241

爬虫---批量下载美女图片

Python爬虫实战批量下载高清美女图片

python批量下载美女图片

Python爬虫爬取贴吧美女图片批量下载成功了

Python 爬虫批量下载美女图片，给枯燥的工作添加点乐趣！

python批量抓取美女图片

Python 批量爬取美女图片

Python爬虫 —— 抓取美女图片

新浪微博美女图片的爬虫

python爬虫-爬取美女图片

PYTHON 爬虫 baidu美女图片

使用爬虫下载千张美女图片！（Qt版）

爬美女图片

python爬虫之美女图片爬取

Python爬虫 —— 抓取美女图片（Scrapy篇）

Python爬虫学习之爬美女图片

使用爬虫xpath提取数据-爬取美女图片

Python瀑布流爬虫-爬取360美女图片+爬取百度美女图片（嘿嘿~）

美女图爬虫小试

美女图片爬取

爬取美女图片

保存美女图片.py

python利用多线程批量下载高清美女图片(350秒下载近3600张1.2个G的照片,地址可变)

python爬虫---数据解析、神级龙卫小说获取、批量获取4K美女图片、获取免费简历模板等10个案例讲解

【Python爬虫程序】抓取MM131美女图片，并将这些图片下载到本地指定文件夹。

Python爬虫初接触，学会爬虫不抓美女图片干啥！

python使用requests爬虫抓取美女图片网站图片

python批量采集美女图片数据~这不得看一下

Python2 scrapy 图片下载爬美女图片

SpringBoot+SpringMVC+MybatisPlus框架整合练习之【美女图片】爬虫---图文详细流程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)