re模块与正则 - 代码天地

re模块与正则

其他 2019-07-17 19:18:15 阅读次数: 0

一.正则

正则就是用来筛选字符串中的特定的内容

正则表达式与re模块的关系:

　　1.正则表达式是一门独立的技术,任何语言都可以使用

　　2.python中药想使用正则表达式需要通过调用re模块

正则应用场景:

　　1.爬虫

　　2.数据分析

正则字符:

元字符	匹配内容
.	除换行符以外的任意字符
\n	换行符
\w	字母或数字或下划线
\s	任意的空白字符
\d	数字
\W	非字母或数字或下划线
\S	非空白字符
\D	非数字
\t	制表符
^	字符串的开始
$	字符串的结尾
\b	单词的结尾
a\|b	字符 a 或 b
()	匹配括号内的表达式,也表示一个组
[...]	匹配字符组中的字符
[^...]	匹配出了字符中的所有字符

量词	说明
*	重复零次或多次
+	重复一次或多次
?	重复零次或一次
{n}	重复 n 次
{n,}	重复 n 次或多次
{n,m}	重复 n 到 m 次

字符组概念

在同一位置可能出现各种字符 组成了一个字符组,在正则表达式中用[ ]表示,一个字符组内每次只能匹配一个字符,[ ]内的字符是或的关系

例:

匹配0-9数字 : [0123456789] 或 [1-9]
匹配A-Z字母 : 同上
匹配a-z字母 : 同上

　　ps: 字符组内范围必须从小到大必须按ASCII码表排序

^:以什么开头

　　^[1-9] : 匹配字符是否以1-9其中的数字为开头

$:以什么结尾

　　[a-z]$ : 匹配的字符是否以a-z其中的字母结尾

^...$:精准匹配固定长度的目标字符
- 　　^waller$ : 匹配waller
| :或
- 　　ab|abc 优先匹配 | 前面的内容,若前面内容匹配上 | 后面的内容不再匹配(在书写时把长的写在 | 前面)

　　　　　　

[^...] : 除括号内的内容其他都匹配

量词只能和元字符配合使用,并且是贪婪匹配

+ : 匹配1次或多次
- 　　匹配 13555555555 ,用 \d 每次只能匹配单个数字,要想把数字一次都匹配上要用 \d+
- 匹配到 1 条结果
* : 匹配零次或多次
- 　　匹配到 2 条结果
{n} : 指明重复个数

题:

轨道通道地道魔道人道
逐个匹配出后面的道:
- 　　
取出词:
- [^\s]{2} : 去掉空格,每次取两个字符
- .道 : 取出 .和道组成的词
- [^\s]. : [^\s]本身占了一个位置加 . 共取两个位置
-

匹配人名: 海燕海娇海东

　　

海.	取海和.组成的词	海燕海娇海东	匹配所有"海."的字符
^海.	只取以海和.为开头	海燕	只从开头匹配"海."
海.$	只取以海和.为结尾	海东	只匹配结尾的"海.$"

正则	待匹配字符	匹配结果	说明
李.?	李杰和李莲英和李二棍子	李杰李莲李二	?表示重复零次或一次，即只匹配"李"后面一个任意字符
李.*	李杰和李莲英和李二棍子	李杰和李莲英和李二棍子	*表示重复零次或多次，即匹配"李"后面0或多个任意字符
李.+	李杰和李莲英和李二棍子	李杰和李莲英和李二棍子	+表示重复一次或多次，即只匹配"李"后面1个或多个任意字符
李.{1,2}	李杰和李莲英和李二棍子	李杰和李莲英李二棍	{1,2}匹配1到2次任意字符

猜你喜欢

转载自www.cnblogs.com/waller/p/11203007.html

python的正则——re模块

复习&正则&re模块

正则re模块

python正则re模块

RE模块正则

正则（re 模块）

re模块（详解正则）

正则和re模块

Python(re模块,正则)

正则 re模块

正则匹配模块re

正则与re模块

re模块和正则

re模块与正则

python 正则 re模块

正则法则 re模块

Python正则、re模块

python的re模块（正则）

（python）正则之re模块

python - re正则匹配模块

python正则运算模块re

python之正则模块Re

008---re正则模块

python_正则_re模块

Python 正则处理_re模块

日志(logging)与正则(re)模块

Python_re正则模块

re正则匹配模块_python

python之正则re模块

23-re正则模块

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)