python网络爬虫requests库请求返回response属性解析 - 代码天地

python网络爬虫requests库请求返回response属性解析

其他 2020-02-08 11:12:00 阅读次数: 0

python网络爬虫requests库请求返回response属性解析

首先要想使用requests库，就得先下载这个库，使用快捷键win+r输入cmd打开后，在命令行直接输入以下命令即可：

pip install requests

基本的get请求，用来获取网页的源码的内容

import requests
url = 'http://soft.sxau.edu.cn/info/1013/1942.htm'
r = requests.get(url,timeout=200)

timeout参数用来设置请求访问时间，可有可无

这里的 r 便是访问返回的response对象，接下来将对其的5个基本属性方法来进行基本的解析

.staus_code 方法

print(r.status_code)  #若访问链接成功则返回200，若返回其它则表示返回失败

.text 方法

print(r.text[:100])   #用来返回响应内容的字符串格式，返回的为列表形式，在实际爬虫编写当中可以用来测试返回的网页源代码是否正确，若网页源代码量巨大可以返回指定数量的代码来进行查看

.enconding 方法

print(r.encoding)    #返回的是网页的编码方式，该编码方式为网页头部信息当中的编码方式，若头部信息中没有规定则返回 ISO-8859-1

.apparent_encoding 方法

print(r.apparent_encoding)  #返回的也是网页的编码方式，与.encoding不同的是，该方法返回的是从返回根据网页内容的解析的编码方式，更加可靠，一般为UTF-8-SIG

.context 方法

print(r.content) #返回HTTP响应的二进制形式，一般用来对爬取并保存图片等二进制形式的信息的使用

下面是一个爬取并保存定向指定网页图片的简单方法（图片后缀为.jpg），用到了.context方法:

#爬取并保存网页上的一张图片到本地当前目录下
url = 'https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1580821861516&di=5aebc72b125d7a4ec85d0c6858508579&imgtype=0&src=http%3A%2F%2Fpic2.16pic.com%2F00%2F15%2F80%2F16pic_1580467_b.jpg'
r = requests.get(url)
f_name = 'kebi.jpg'
with open(f_name,'wb') as f:
    f.write(r.content)

cici_vivi

发布了2 篇原创文章 · 获赞 5 · 访问量 384

私信关注

猜你喜欢

转载自blog.csdn.net/zc666ying/article/details/104186607

python网络爬虫requests库请求返回response属性解析

python 爬虫 requests模块（response常用属性）

python：解析requests返回的response（json格式）

Python爬虫requests请求库

python—网络爬虫（Requests库主要方法解析）

requests库（http的请求方法）及response对象的属性

Python-网络爬虫模块-requests模块之响应-response

Python--网络爬虫模块requests模块之响应--response

Python爬虫【二】请求库requests

Python爬虫的开始——requests库建立请求

python爬虫5--requests请求库

Python 网络爬虫笔记1 -- Requests库

初探Python网络爬虫：Requests库

Python网络爬虫Requests库入门

Python网络爬虫基本之 requests库

Python网络爬虫| Requests库的基本使用

python网络爬虫 Requests库入门

Python网络爬虫二requests库

爬虫系列爬虫的Robots协议请求库之requests库解析库beautifulsoup 爬取汽车之家新闻搭建免费代理池验证码破解模拟自动登录网站 xpath路径 selenium简介与安装 selenium的使用 Scrapy 架构介绍 scrapy 框架的安装与启动 scrapy项目架构与配置文件 Scrapy中response属性以及内容提取爬取数据并解析 Scrapy 持久化

网络爬虫——Requests库

python网络爬虫指南一：网页基础（html/css/JavaScript）、网络请求（urllib/requests)、数据解析(XPath/BeautifulSoup)

python3 requests请求response.text返回\u 16进制数字，转换中文

02爬虫requests请求库

爬虫请求库 requests requests模块

Python网络爬虫之requests库Scrapy爬虫比较

Python爬虫——Response对象的属性

Python爬虫-Requests库

Python爬虫 --requests库

Python爬虫------requests库

Python爬虫——Requests库

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)