爬虫学习(一)---requests库的使用 - 代码天地

爬虫学习(一)---requests库的使用

其他 2020-03-16 10:33:34 阅读次数: 0

文章目录

1. requests库的安装
2. requests库的方法
3. requests库抓取网站框架

1. requests库的安装

通过 cmd 安装 requests库：

pip install requests

2. requests库的方法

函数	作用
request()	构造一个请求，支撑一下个方法的基础方法
get()	获取HTML网页的主要方法，对应于HTTP的GET
head()	获取HTML网页信息头部的方法，对应于HTTP的HEAD
post()	向HTML网页提交POST请求方法，对应HTTP的POST
put()	向HTML网页提交向URL位置存储一个资源，覆盖原URL位置的资源　，对应HTTP的PUT
patch()	向HTML网页提交局部修改请求，对应于HTTP的PATCH
delete()	请求删除URL位置存储的资源

requests中除了“request()” 方法，其余六个方法都是request方法的调用

3. requests库抓取网站框架

这里调用了bs4库对源代码进行了美化处理写进txt文档

import requests as req
from bs4 import BeautifulSoup


def get_html_text(url):
    try:
        kv = {'User-Agent': 'Mozilla/5.0'}  # 通过该字典修改标识
        r = req.get(url, headers=kv, timeout=30)  # 修改为浏览器标识后，避免被识别为爬虫
        r.raise_for_status()  # 如果状态不是200，引发HTTPError异常
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"


if __name__ == '__main__':
    url = "http://www.baidu.com"  # 可以随意修改网址
    text = get_html_text(url)
    soup = BeautifulSoup(text, "html.parser")
    text = soup.prettify()
    with open('baidu.txt', 'w', encoding='utf-8') as file:  # 把源码写进这个txt文档中
        file.write(text)
    file.close()

AshenYou

发布了145 篇原创文章 · 获赞 22 · 访问量 9642

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_44778155/article/details/104458984

爬虫学习(一)---requests库的使用

爬虫学习—requests库使用

Python爬虫学习（一）使用requests库和robots协议

[python爬虫学习] requests库的使用

《爬虫学习》（三）（requests库使用）

Python爬虫学习（一）Requests库入门

python爬虫学习笔记一：爬虫学习概览与Requests库的安装与使用

爬虫：requests库的使用

【爬虫】Requests库的使用

初学python爬虫，记录一下学习过程，requests库使用代理

Py爬虫学习_requests库

【爬虫】Requests 库的入门学习

【Python爬虫学习笔记3】requests库的基本使用

Python爬虫学习总结——Requests库的基本使用

python网络爬虫学习笔记（六）：Requests库的使用

python3爬虫（一）requests库的学习

python3爬虫（一）requests库学习

网络爬虫学习笔记（一）——Requests库入门

Python从零开始写爬虫（一）requests库使用

爬虫基本库的使用---requests库

一起学爬虫——通过爬取豆瓣电影top250学习requests库的使用

初学python爬虫，记录一下学习过程，requests库模拟登录02，使用 for循环处理cookies

Python爬虫：HTTP协议、Requests库（爬虫学习第一天）

Python爬虫学习1：requests库

python爬虫Requests库：学习心得

python爬虫学习1——Requests库

Python爬虫学习笔记(requests库)

Python爬虫学习笔记(Requests库补充)

Python学习爬虫（2）—requests库

爬虫学习笔记之requests库

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)