《精通python网络爬虫》学习笔记二

其他 2018-08-18 10:14:04 阅读次数: 0

正则表达式
正则表达式常见函数

正则表达式

原子

普通字符
非打印字符（如\n）
通用字符 \w任一字母数字下划线 \d任一十进制数 \s任一空白字符
原子表
[xyz]一组地位平等的原子
[^xyz]代表除了xyz之外的原子均可以匹配

元字符

. 匹配除换行符以外的任意字符
^ 匹配字符串的开始
$ 匹配字符串的结束
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
|模式选择符
()模式单元符

cd{1,}
(cd){1,}
py.*n

模式修正

I匹配时忽略大小写
M多行匹配
L做本地化识别匹配
U根据unicode字符及解析字符
S让.匹配包括换行符

result=re.search(pattern, string, re.I)

贪婪模式与懒惰模式

贪婪模式

p.*y

匹配到最后一个y
懒惰模式

p.*?y

匹配到就近的一个y

正则表达式常见函数

re.match()

re.match(pattern, string, flag)

从字符串的起始位置开始匹配

re.research()

搜索字符串全文

全局匹配函数

找所有匹配到的

扫描二维码关注公众号，回复： 2832928 查看本文章

#预编译
pattern=re.complie(".python.")
#找出符合模式的所有结果
result=pattern.findall(string)
print(result)

或整合成：

pattern = ".python."
result = re.compile(pattern).findall(string)

re.sub()

实现替换某些字符的功能

#全部替换
result = re.sub(pattern, "php", string)
#最多替换两次
result = re.sub(pattern, "php", string, 2)

猜你喜欢

转载自blog.csdn.net/sinat_25721683/article/details/81112133

《精通python网络爬虫》学习笔记二

《精通python网络爬虫》学习笔记三

《精通python网络爬虫》学习笔记一

《精通python网络爬虫》学习笔记四——多线程爬虫

Python网络爬虫学习笔记（二）

精通python网络爬虫笔记一

python网络爬虫学习笔记（二）：爬虫基本概述

Python网络爬虫学习（二）

python网络爬虫学习笔记

Python（学习笔记—网络爬虫）

《精通Python网络爬虫》读书笔记—— Urllib库(1)

《精通Python网络爬虫》读书笔记—— Urllib库(2)

Python爬虫学习笔记（二）

《用Python写爬虫》学习笔记（二）编写第一个网络爬虫

网络爬虫学习笔记（二）——实例

Python 3网络爬虫开发实战+精通Python爬虫框架Scrapy学习资料

Python实现网络爬虫基础学习（二）

Python网络爬虫学习笔记（五）

Python网络爬虫学习笔记（四）

Python网络爬虫学习笔记（三）

Python网络爬虫学习笔记（一）

python网络爬虫学习笔记2

python 学习笔记----网络爬虫(详细)

python网络爬虫学习笔记（1）

python网络爬虫学习笔记（2）

Python学习（笔记3-网络爬虫）

Python学习笔记-网络爬虫基础

python学习笔记4---（python网络爬虫-爬虫前奏）

Python网络爬虫快速入门到精通

python学习笔记5---（python网络爬虫-网络请求）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)