python实现顺序结构基本爬虫,爬取福利图片

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_39928244/article/details/79269941

Python安装

1、  版本2.7,直接百度上下载即可

2、  傻瓜式安装,记得勾选将python加入Path环境变量,不然一会儿还得手动配置

3、  安装成功,来个helloworld

Python代码

1、  爬获校花网的基本代码

import re

import requests

 

respose=requests.get('http://www.xiaohuar.com/v/')

# print(respose.status_code)# 响应的状态码

# print(respose.content)  #返回字节信息

# print(respose.text)  #返回文本内容

urls=re.findall(r'class="items".*?href="(.*?)"',respose.text,re.S)  #re.S 把文本信息转换成1行匹配

url=urls[5]

result=requests.get(url)

 

img_url=re.findall(r'class="dropdown-menu".*?src="(.*?)"',result.text,re.S)[0]

image=requests.get(img_url)

with open('D:\\c.jpg','wb') as f:

f.write(image.content)

 

mp4_url=re.findall(r'id="media".*?src="(.*?)"',result.text,re.S)[0]

video=requests.get(mp4_url)

with open('D:\\Uknow.mp4','wb') as f:

f.write(video.content)

问题

         Importrequests的时候,抛出异常

解决

         Windows下进入cmd,cd python所在目录,并进到Scripts目录,直接通过pip installrequests命令安装第三方库requests即可,类似linux系统的自带源

结果


猜你喜欢

转载自blog.csdn.net/weixin_39928244/article/details/79269941