一、概念
正则表达式可以识别正则字符串,“如果给我的字符串符合规则,我就返回它”
下边这个列表并不是全部符号另外就像之前所说的,但是这12个符号是Python的正则表达式中最常用的,可以用来查找和收集绝大多数数据类型
二、使用
(1) 一个简单案例
案例要求:
- 字母“a”至少出现一次
- 后面跟的字母“b”出现5次
- 后边跟着的字母“c”出现偶数次
- 最后一个是字母“d”可以有也可以没有
以下为答案的一种:
aa*bbbbb(cc)*(d | )
- a* 出现任意次数的a,包括0次
- (cc)*任意偶数个字符可以编组,这个规则就是用括号两个c,然后后边跟一个*,表示任意次的两个c
- (d | )这个或者那个,增加一个后边跟着空格的d,或者只有一个空格
(2)邮箱案例
案例要求:
- 邮箱的第一部分至少包括一种内容:大写字母,小写字母、数字0-9、点号、+号,或者下划线 === [A-Za-z0-9\._+]+
- 之后邮箱地址会跟一个@符号 ===@
- 在符合@之后,邮箱地址还必须包含,至少一个大写或者小写字母 ===[A-Za-z]+
- 最后邮箱地址用com、org、edu、net结尾(实际上顶级域名可以有很多,但是作为试例,我们只展现这几种) === (com|org|edu|net)
答案的一种:
[A-Za-z0-9\._+]+@[A-Za-z]+\.(com|org|edu|net)
总结:当我们动手写正则表达式的时候,我们最好先写一个步骤描述你的目标字符串结构