数据爬取——requests库 - 代码天地

数据爬取——requests库

其他 2021-03-06 06:13:24 阅读次数: 0

学习路径
北京理工大学的国家精品课程（中国大学MOOC）

Python网络爬虫与信息提取

requests库的安装
win平台：以管理员身份运行”cmd“，执行
pip install requests

运行环境：Python 3.6.8（IDLE）

测试Requests库是否安装成功
在这里插入图片描述
status_code —— 状态码
乱码了，这个是因为编码格式不对造成的，但你的requests库安装成功了，恭喜你。

Requests库有7个主要方法
这些概念不太想记，自己也不是很懂

get（）方法
上面那段程序已经用过这个方法了，这个就是发送一个请求，得到一个响应。具体看图

顺便了解了一下url，就是万维网的地址标识（单指此处）
这个截个图，以后应该会用到

Requests库的2个重要对象

Request
Response（包含爬虫返回的内容）
Response对象的属性

乱码问题解决
理解Response的编码

理解Requests库的异常
（这个图表备自己以后翻阅记忆）
在这里插入图片描述

爬取网页的通用代码框架
网络连接有风险，异常处理很重要

#爬取网页的通用代码框架

import requests
import time

def getHTMLText(url):
    try:
        r = requests.get(url, timeout = 30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

if __name__ == "__main__":
    url = "http://www.baidu.com"
    print(getHTMLText(url))

猜你喜欢

转载自blog.csdn.net/qq_41685741/article/details/114401229

数据爬取——requests库

Python爬取数据之Requests库!

数据分析——Requests库网络爬取实战

requests库爬取需要登录的网站

requests简单爬取网站数据

Requests爬取chinadaily海量新闻数据

requests模块爬取数据操作流程

requests+正则爬取猫眼电影并将数据存储到mysql数据库

猫眼电影爬取(三)：requests+pyquery，并将数据存储到mysql数据库

猫眼电影爬取(二)：requests+beautifulsoup，并将数据存储到mysql数据库

requests库+ajax数据分析+多线程爬取头条图集

requests库爬取豆瓣热门国产电视剧数据并保存到本地

Python之requests+xpath爬取猫眼电影并写入数据库(图文教程)

python的requests库构造的爬虫即不报错也不继续爬取数据的问题

python requests库爬取冒险岛发布站数据

python战反爬虫：爬取猫眼电影数据 (一）（Requests, BeautifulSoup, MySQLdb,re等库)

Python爬虫之Requests库爬取海量图片！数据都是钱啊

python爬虫爬取虎牙数据（简单利用requests库以及Beautifulsoup）

Python3.x使用requests库将爬取数据存储到MySQL

使用requests库爬取百度翻译

requests和re库爬取淘宝商品信息

python学习(23)requests库爬取猫眼电影

Python 利用Requests库爬取单个网页实例

使用requests 库爬取百度图片

Python-Requests库网络爬取实战

Python爬虫使用requests库爬取表情包

使用Requests+xpath实现简单的数据爬取

python requests爬取高德地图数据

python 使用selenium和requests爬取页面数据

python：Requests+正则爬取网页数据

今日推荐

deepseek热度已过？

MOOC习题:“GPS数据处理”题目个人解析(C语言)

DeepSeek接入微信公众号小白保姆教程

图+语义：RDF语义处理组件Neosemantics功能列表

大语言模型Prompt工程之使用GPT4生成图数据库Cypher

大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher

GPT-3.5 生成 Fabric Cypher

生成 Cypher 能力：GPT3.5 VS ChatGLM

LangChain 2 ONgDB：大模型+知识图谱实现领域知识问答

生成 Cypher 能力：MOSS VS ChatGLM

Neo4j/ONgDB 图数据库快速处理 Excel 文件

LangChain-Agents 入门指南

周排行

blog公告

Lucene：基本增删改查（Java方式）

1、类库

android环信集成单聊功能

删除数据库表数据SQL语句

rhel6.3安装Percona XtraDB Cluster 5.7时错误的解决方法

天梯赛-堆栈（线段树）

ES6原生Class

20120607

张正友标定算法原理详解

每日归档

更多

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)

2025-04-02(0)