原创:Python爬虫实战之爬取美女照片 - 代码天地

原创:Python爬虫实战之爬取美女照片

其他 2020-02-19 09:01:13 阅读次数: 0

　　这个素材是出自小甲鱼的python教程，但源码全部是我原创的，所以，猥琐的不是我

　　注:没有用header（总会报错），暂时不会正则表达式（马上要学了），以下代码可能些许混乱，不过效果还是可以的。

　　爬虫目标网站:http://jandan.net/ooxx/ #如有侵权请联系我

　　代码如下

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 import urllib.request
 4 import base64
 5 import time
 6 
 7 url_a = 'http://jandan.net/ooxx/'#网站前一部分
 8 need = '20200217-'#后一部分
 9 need_a = 147#后一部分的后一部分
10 
11 
12 def base(word):#base64编码
13     outcome = base64.b64encode(word.encode("utf-8"))#编码后
14     url = url_a + outcome.decode('utf-8') + '#comments'
15     web(url)
16 
17 def web(url):
18     response = urllib.request.urlopen(url)
19     html = response.read().decode('utf-8')
20     a = html.find('<img src="//')#从这个下标开始
21     i = 0#用来区别文件名
22     while a != -1:
23         b = html.find('.jpg',a,a+250)#到这个下标为止
24         if b != -1:
25             c = 'http://' + html[a+12:b+4]#图片网址    
26             name = 'picture\\' + str(i) + str(need_a) + '.jpg'#文件名
27             get_jpg(c,name)
28         else:
29             b = a + 12
30         a = html.find('<img src="//',b)#循环查找
31         i += 1
32 
33 def get_jpg(address,filename):
34     get = urllib.request.urlopen(address)#打开新网址
35     jpg = get.read()
36     with open(filename,'wb') as f:#写入图片
37         f.write(jpg)
38     print("Succeed!")
39 
40 while need_a >=100:#逐减
41     addition = need + str(need_a)
42     base(addition)
43     need_a -= 1
44     time.sleep(10)#停顿防止被反爬

　效果图:

　　未经博主允许，不得转载

猜你喜欢

转载自www.cnblogs.com/vhhi/p/12329671.html

原创:Python爬虫实战之爬取美女照片

Python爬取网站美女照片

python爬虫之美女图片爬取

Python爬虫实战：爬取淘女郎照片

【Python爬虫】表弟用Python爬下今日头条上万美女照片，玩的不亦乐乎！

python爬虫-爬取美女图片

Python爬虫-爬取照片并保存

Python爬虫实战——爬取今日头条美女图片

原创:Python爬虫实战之爬取代理ip

Python爬虫-爬取伯乐在线美女邮箱

Python采集外网美女照片，又是养眼的一天

Python爬虫实战之爬取网站全部图片(一)

python实战之网络爬虫（爬取新闻内文信息）

Python爬虫实战项目之小说信息爬取

03 Python爬虫之Requests网络爬取实战

Python爬虫实战之爬取网站全部图片(二)

python爬虫实战之爬取中国农药网

Python之Scrapy爬虫实战--爬取妹子图

python爬虫实战之异步爬取数据

python爬取照片

Python爬虫之Scrapy框架系列（14）——实战ZH小说爬取【多页爬取】

Python瀑布流爬虫-爬取360美女图片+爬取百度美女图片（嘿嘿~）

python学习之爬取煎蛋网美女图

最新现实美女照片大集合

Photoshop合成雪景天使美女照片

ps合成玫瑰花丛中漂亮美女照片

Python爬虫学习之爬美女图片

python爬虫实战——爬取腾讯新闻！

Python爬虫实战：爬取股票信息

Python爬虫 | 爬取环境新闻实战

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)