python爬虫之站长之家图片抓去 - 代码天地

python爬虫之站长之家图片抓去

其他 2020-08-08 13:32:43 阅读次数: 0

import requests
import re
import os
#1.1 获取抓取的链接
url='http://sc.chinaz.com/tupian/'
#1.2 定义存放文件的路径
download = "picture/"
#1.3 判断文件夹是否存在，如果存在直接使用，如果不存在创建
if(not os.path.exists(download)):
    #创建目录
    os.mkdir(download)
#2.使用requests库发请求
response=requests.get(url)
#response.status_code:获取响应码
#response.text获取响应页面内容(字符串)
#response.content:获取响应的二进制内容
#print(response.content.decode("utf-8"))
#with open("picture.html","wb") as file:
#    file.write(response.content)
#imgPath='<img src2="http://pic.sc.chinaz.com/Files/pic/pic9/202006/bpic20497_s.jpg" alt="一颗黄柠檬图片">'
#4.编写正则表达式
imgPattern= r'<img src2="(.*?)" alt=".*">'
#5.读取picture.html文件内容
#with open("picture.html","r",encoding="utf-8") as file:
#    text = file.read()
#print(text)
#6.使用正则提取图片路径
#imgUrls =re.findall(imgPattern,text);
#print(imgUrls)
imgUrls=re.findall(imgPattern,response.text);
list=[]
i=0
for imgurl in imgUrls:
    #print(imgurl)
    list.append(imgurl)
    with open(download+f"{i}.jpg","wb") as file:
        file.write(requests.get(imgurl).content)
    print(f"第{i}张图片")
    i+=1
#print(list)

猜你喜欢

转载自blog.csdn.net/qq_26018075/article/details/106979114

python爬虫之站长之家图片抓去

【python爬虫实战】批量爬取站长之家的图片

【python数据挖掘】批量爬取站长之家的图片

爬虫之汽车之家

Python爬虫 --- 2.5 Scrapy之汽车之家爬虫实践

爬取汽车之家新闻图片的python爬虫代码

爬取站长之家

详解站长之家之站长工具四大新功能

python3爬虫系列16之多线程爬取汽车之家批量下载图片

python爬虫利用Scrapy框架爬取汽车之家奔驰图片--实战

Python爬虫之妹子图片

python学习之图片爬虫

Python 定向爬虫爬取汽车之家

Python爬虫汽车之家新闻消息

python爬虫——爬取汽车之家新闻

小项目爬虫爬取图片 --站长素材网

汽车之家网站为例-爬虫的编写，爬取图片

python爬虫精选07集（汽车之家增量爬虫案例）

www.chinaz.com 站长之家

Python爬虫之——爬取妹子图片

Python爬虫之网页图片抓取

Python爬虫之gif图片抓取

python爬虫之爬取图片

python爬虫之爬取网站图片

简易python爬虫 - 爬取站长论坛信息

爬虫之字体反爬（三）汽车之家

爬虫之汽车之家（正则表达式）

站长爬虫协议robots

Python爬取最新反爬虫汽车之家口碑

python爬虫实战爬取汽车之家上车型价格

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)