正则表达式——常用的匹配规则

常用的匹配规则

匹配字符

符号 匹配规则
. 匹配任意1个字符,除了换行符\n
[ ] 这是一个集合,匹配[ ]中的任意一个字符
\d 匹配一个数字,即0-9
\D 匹配非数字,即不是数字
\s 匹配空白,即空格,tab键
\S 匹配非空白
\w 匹配单词字符,即a-z,A-Z,0-9
\W 匹配非单词字符
* 匹配前一个字符出现0次或无数次,即可有可无
+ 匹配前一个字符出现1次或无数次,即至少出现1次
\ ? 匹配前一个字符出现1次或0次,即要么有一次,要么没有
{m} 匹配前一个字符出现m次
{m,} 匹配前一个字符至少出现m次
{n,m} 匹配前一个字符出现从n到m次
^ 匹配字符串开头
$ 匹配字符串结尾

分组匹配

符号 匹配规则
() 将括号里的字符作为一个分组看待
\num num可取1,2,3,……,引用分组匹配到字符串
(?P) 分组起别名
(?P=name) 引用别名为name分组匹配到的字符串

补充: | :匹配左右任意一个表达式

修饰符

修饰符 描述
re.I 使匹配时,忽略字母的大小写
re.L 做本地化识别(local—aware)匹配
re.M 多行匹配,影响^和$
re.S 匹配时,包括换行在内的所有字符
re.U 根据Unicode字符集解析字符
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更容易理解

更详细的可参考:正则表达式

猜你喜欢

转载自blog.csdn.net/qq_44921056/article/details/112536233