re正则表达式模块

import re
print(re.match('^chenrong','chenronghua123')) # ^ 表示开头
#<_sre.SRE_Match object; span=(0, 8), match='chenrong'>
# span=(匹配到的结果第几位开始,匹配到的长度)
#有返回表示匹配到了，没返回表示没有匹配到
print(re.match('^chen','chengronghua123').group()) #group 获取匹配的字段
res=re.match('^chen','chengronghua123')
print(res.group())

res=re.match('^chen\d','chen321ronghua123') # \d 表示数字 匹配一个数字
print(res,'--------',res.group())

res=re.match('chen\d+','chen321ronghua123') #\d+ 表示一个或多个数字 match从头开始
print(res,'--------',res.group())

res=re.match("c.+","chen321ronghua123") # .点表示匹配任意字符
print(res)

res=re.search("r.+a$","chen321ronghua123a")
#search从整个文本搜索 a$表示整个字符串a结尾
print(res)

res=re.search('R[a-zA-Z]+a','chen321RongAhuaRonghua123arongHua12') #只匹配第一个
print(res)

res=re.search("aaa?",'aalexaaa') #a? 表示0次或1次 都会返回结果 也就是有或没有 有或没有前面的那个a
print(res)

res=re.search("[0-9]{1,3}",'aa1x2a345aa') #{1,3} 表示出现的1到3次
print(res)

res=re.findall("[0-9]{1,3}","aa1x2a345aa") #findall 找出所有
print(res)

res=re.findall("abc|ABC","ABCabcCD") # | 或的意思
print(res)

res=re.search("(abc){2}(\|=){2}","alexabcabc|=|=") # \| 斜杠对 | 进行转译
print(res) #(abc){2}(\|=){2} 分组匹配

res=re.search("\A[0-9]+[a-z]\Z","123a") #\A[0-9] 数字开头 [a-z]\Z 数字结尾
print(res) # \A开头 \Z结尾

res=re.search("\D+","123$- \r\n a") #\D 匹配非数字
print(res)

res=re.findall("\w","aB123- \r\n a") #\w匹配数字字母
print(res)

res=re.findall("\W","1ddDFR23$ - \r\n a") #\W匹配特殊字符
print(res)

res=re.findall("\s","1dd ng yh\r\n ") #\s匹配空白字符 包括空格 tab键换行
print(res)

res=re.search("(?P<id>[0-9]+)(?P<name>[a-zA-Z]+)","abcd1234daf@345").groupdict()
print(res)

#特殊用法 (?P<自定义key>[需要找的]{个数})
res=re.search("(?P<province>[0-9]{2})(?P<city>[0-9]{2})(?P<county>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict()
print(res)

print(re.search("(?P<province>[0-9]{2})(?P<city>[0-9]{2})(?P<county>[0-9]{2})(?P<birthyear>[0-9]{4})(?P<birthday>[0-9]{4})", \
"360732199307030689").groupdict()['birthday'])

#split分隔
res=re.split("[0-9]+","abc12de3f45Gh") #按数字进行分隔 split：分隔
print(res)

#sub替换
res=re.sub("[0-9]+","----","abc12de3f45Gh",count=2) #所有的数字替换成----,替换前面2处
print(res)

# 只能匹配 \\ 2个斜杠
res=re.search(r"\\","abc12de\\3f45GH")
print(res)

#忽略大小写 flags=re.I 或 flags=re.IGNORECASE flags:标示，标注，定义
res=re.search("[a-z]+","ancdA",flags=re.IGNORECASE)
print(res)

#多行模式 flags=re.M 同flags=re.MULTILINE 一样 改变开头 ^ 结尾$的行为
res=re.search("[a-z]+e$","abcdA\r\nsecondline\r\nthirdline",flags=re.M)
print(res,'---',res.group())

#S(DOTALL)模式 匹配包括换行符的任意字符 flags=re.DOTALL 同 flags=re.S
res=re.search(r".+","\r\nabc\r\neee",flags=re.DOTALL)
print(res)

re正则表达式模块

猜你喜欢