python的一次简单爬虫··· - 代码天地

python的一次简单爬虫···

其他 2019-12-12 21:17:28 阅读次数: 0

import requests
from lxml import etree

headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:71.0) Gecko/20100101 Firefox/71.0",
    "Referer":"https://www.mzitu.com/",
}
response = requests.get("https://www.mzitu.com/" , headers=headers)   #获得网页源码
# print(response.text) 查看是否录入网页源码

html = etree.HTML(response.text)
#response.text为字符串类型
#etree.HTML()可以用来解析字符串格式的HTML文档对象，将传进去的字符串转变成_Element对象。
#作为_Element对象，可以方便的使用getparent()、remove()、xpath()等方法。

src_list = html.xpath('//img[@class="lazy"]/@data-original')    
alt_list = html.xpath('//img[@class="lazy"]/@alt')
#xpath返回一个列表

for src,alt in zip(src_list,alt_list):
    response = requests.get(src, headers=headers)
    FileName = "img\\" + alt + ".jpg"
    print("正在保存图片：" + FileName)
    with open(FileName,"wb") as p:
    #二进制写入，说明response内容为二进制
    #text 返回的是unicode 型的数据，一般是在网页的header中定义的编码形式。content返回的是bytes，二进制型的数据。
        p.write(response.content)

　　加油加油加油！！！

猜你喜欢

转载自www.cnblogs.com/xikl/p/12031556.html

python的一次简单爬虫···

一次简单Python爬虫代码记录

python - 记录一次爬虫练习

记一次简单爬虫(豆瓣/dytt)

一次爬虫事件

对一次爬虫的总结

第一次用python写爬虫

python爬虫-第一次尝试

Python爬虫的一次提问，引发的“乱码”问题

python爬虫--一次爬取小说的尝试

python关于链家网房子的一次爬虫

python关于一次淘宝商品信息的爬虫

记录一次爬虫实战 python+selenium

一次简单的逆向

python爬虫框架scrapy一次执行多个爬虫文件

Python爬虫实战导航索引，29个爬虫项目让你一次吃到撑！！！

我用java玩爬虫之第一次爬CSDN就是这么简单！

记录一次对[https://www.acg81.cn/]的简单爬虫

第一次使用爬虫

记第一次爬虫

第一次爬虫实例

第一次爬虫与测试

记一次爬虫实现

第一次接触爬虫

简单的记录一次简单的优化

记录一次python爬虫批量下载一个校花网站的妹子图片

python爬虫入门（一）-----环境配置——第一次爬数据

爬虫，记录第一次爬虫

小说爬虫（第一次写爬虫）

32个Python爬虫项目让你一次吃到撑

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)