Python笔记-使用requests获取网页数据及re中用正则表达式获取指定数据 - 代码天地

Python笔记-使用requests获取网页数据及re中用正则表达式获取指定数据

其他 2020-03-26 10:31:35 阅读次数: 0

如下代码：

import re
import requests


class HandleLaGou(object):
    def __init__(self):
        self.laGou_session = requests.session()
        self.header = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
        }
        self.city_list = ""

    #获取全国城市列表
    def handle_city(self):
        city_search = re.compile(r'zhaopin/">(.*?)</a>')
        city_url = "https://www.lagou.com/jobs/allCity.html"
        city_result = self.handle_request(method = "GET", url = city_url)
        self.city_list = city_search.findall(city_result)


    def handle_request(self, method, url, data = None, info = None):
        if method == "GET":
            response = self.laGou_session.get(url = url, headers = self.header)
        return response.text


if __name__ == '__main__':
    laGou = HandleLaGou()
    laGou.handle_city()
    print(laGou.city_list)
    pass

运行截图如下：

从中可以学到如下的知识点：

把网页数据后，可以使用notepad++先模拟下正则表达式匹配：

这里是这样的正则表达式：

zhaopin/">(.*?)</a>

(.*?)匹配这里面任意数据，但只匹配一次。

这里的re.conpile(r'')这个r就是指Regular expression。

IT1995

发布了1312 篇原创文章 · 获赞 2429 · 访问量 185万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qq78442761/article/details/104813271

Python笔记-使用requests获取网页数据及re中用正则表达式获取指定数据

使用正则表达式，从网站上获取指定数据

python3-正则表达式(re)之获取网页全部url

初识python 之爬虫：使用正则表达式爬取“糗事百科 - 文字版”网页数据初识python 之爬虫：使用正则表达式爬取”古诗文“网页数据

使用cURL和正则表达式抓取网页数据的示例 - PHP

初识python 之爬虫：使用正则表达式爬取”古诗文“网页数据

正则表达式获取网页

通过正则表达式，获取股票数据（re.findall的应用）

python利用re正则表达式提取数据

利用Matlab正则表达式爬取网页数据

python 爬虫使用正则表达式获取文本

正则表达式，获取a href后面的数据

jmeter正则表达式获取数组类型的数据

Python Re 正则表达式数据匹配提取基本使用

如何用正则表达式获得页面中的指定数据？

获取网页指定内容,终于不用正则表达式.

python学习笔记——提取网页中的信息正则表达式re

第二篇，使用re正则表达式获取古诗文信息

Python爬虫学习（一）使用Requests和正则表达式爬取简单网页

Python笔记五（正则表达式与re模块）

python 正则表达式re库相关笔记

re正则表达式笔记

在C#中使用正则表达式自动匹配并获取所需要的数据

jmeter使用正则表达式获取多个数据

使用Logstash过滤插件Grok直接写正则表达式获取日志数据

python正则表达式(re)

python re 正则表达式

python正则表达式re

python正则表达式（re）

【Re】python正则表达式

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)