python正则表达式findall()方法匹配(个人笔记)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/yu_1628060739/article/details/102767158

使用findall()方法匹配

简介:
       findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,并以列表的形式返回。如果匹配成功。则返回包含匹配结构的列表,否则返回空列表。

re.findall(pattern,string,flags)

在这里插入图片描述
例子1:

import re
pattern=r'mr_\w+'
string='MR_SHOP mr_shop'
match=re.findall(pattern,string,re.I)
print(match)

结果

['MR_SHOP', 'mr_shop']

例子2:

import re
string='项目名称MR_SHOP mr_shop'
match=re.findall(pattern,string,re.I)
print(match)

结果

['MR_SHOP', 'mr_shop']

注意:

import re
pattern=r'[1-9]{1,3}(\.[0-9]{1,3}){3}'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
print(match)

结果

['.1', '.66']

如果在指定的模式字符串中包含分组,则返回与分组匹配的文本列表。(也就是只匹配小括号中的模式字符串)

pattern=r'(\.[0-9]{1,3}){3}'
str1='127.0.0.1 192.168.1.66' 
match=re.findall(pattern,str1)
print(match)

结果:

['.1', '.66']

这里分析一下,模式字符串(.[0-9]{1,3}){3}的意思。
       首先,[0-9]和 \d 的意思完全相同都表示匹配数字,{1,3}表示匹配前面的字符最少1次,最多3次。{3}表示匹配前面的字符3次。
在这里也就是: 匹配 . (点)开始后面是数字(可以是0到9任意)然后面的数字可以是,一个或者两个,最多三个。也就是以下几种情况:
.0或者0.66,或者.192等。
        {3}匹配3次,也就是这种类型连续出现三次,‘127.0.0.1 192.168.1.66’ 中,可以看到.0.0.1,出现了3次,.168.1.66也连续出现了三次。 所以结果:[’.1’,’.66’]。

如果要不匹配分组里面的则需改成如下:

第一种写法:
将整个模式字符串使用一对小括号进行分组。然后返回列表的每一个元素(是一个元组)的第一个元素。

import re 
pattern=r'([1-9]{1,3}(\.[0-9]{1,3}){3})'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
for i in match:
    print(i[0])

结果:

127.0.0.1
192.168.1.66

第二种方法:
在原有分组里加上?: 就把捕获组转变为一个非捕获组。

import re 
pattern=r'[1-9]{1,3}(?:\.[0-9]{1,3}){3}'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
print(match)
['127.0.0.1', '192.168.1.66']

完毕…

猜你喜欢

转载自blog.csdn.net/yu_1628060739/article/details/102767158