正则表达式:通常用来检索,替换那些符合某个模式(规则)的文本
以下是三个主要的方法:
match
功能:尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,返回Nonere.match()函数 原型:match(patter,string,flags=0) patter:匹配的正则表达式 string:要匹配的字符串 flags:标志位,用于控制正则表达式的匹配方式 re.I 忽略大小写 re.L 做本地化识别 re.M 多行匹配,影响^和$ re.S 是.匹配包括换行符在内的所有的字符 re.U 根据Unicode字符集解析字符,影响\w \W \b \B re.X 使我们以更灵活的方式理解正则表达式
- 代码内容
# 扫描整个字符串,返回从起始位置成功的匹配
print(re.match('www','www.baidu.com'))
print(re.match('www','ww.baidu.com'))
print(re.match('www','.baiduwww.com'))
# 忽略大小写
print(re.match('www','wwW.baidu.com'))
print(re.match('www','wwW.baidu.com',flags=re.I))
search
功能:扫描整个字符串,并返回第一个成功的匹配re.search 函数 原型:match(patter,string,flags=0) patter:匹配的正则表达式 string:要匹配的字符串 flags:标志位,用于控制正则表达式的匹配方式
- 代码内容
print(re.search('fqx','cc fqx goodman fqx headsome fqx nice'))
findall
功能:扫描整个字符串,并返回结果列表re.findall 函数 原型:match(patter,string,flags=0) patter:匹配的正则表达式 string:要匹配的字符串 flags:标志位,用于控制正则表达式的匹配方式
- 代码内容
print(re.findall('fqx','cc fqx goodman fqx headsome fqx nice'))