python3进阶之正则表达式之re模块之分组（group）、贪心匹配、编译 - 代码天地

python3进阶之正则表达式之re模块之分组（group）、贪心匹配、编译

其他 2018-04-24 23:41:44 阅读次数: 5

1.group

　　除了简单地判断是否匹配之外，正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组（Group）。比如：^(\d{3})-(\d{3,8})$分别定义了两个组，可以直接从匹配的字符串中提取出区号和本地号码

m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345')
print(m.group(0))
print(m.group(1))
print(m.group(2))

# 010-12345
# 010
# 12345

如果正则表达式中定义了组，就可以在Match对象上用group()方法提取出子串来。

注意到group(0)永远是原始字符串，group(1)、group(2)……表示第1、2、……个子串。

t = '19:05:30'
m = re.match(r'^(0[0-9]|1[0-9]|2[0-3]|[0-9])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])$', t)
print(m.groups())

#输出：
# ('19', '05', '30')

2.贪心匹配

print(re.match(r'^(\d+)(0*)$', '102300').groups())
# ('102300', '')
print(re.match(r'^(\d+?)(0*)$', '102300').groups())
# ('1023', '00')

由于\d+采用贪婪匹配，直接把后面的0全部匹配了，结果0*只能匹配空字符串，加个?就可以让\d+采用非贪婪匹配；

3.编译

如果一个正则表达式要重复使用几千次，出于效率的考虑，我们可以预编译该正则表达式

# 编译
tele = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用：
print(tele.match('010-12345').groups())
# ('010', '12345')
print(tele.match('010-8086').groups())
# ('010', '8086')

猜你喜欢

转载自www.cnblogs.com/max520liuhu/p/8934491.html

python3进阶之正则表达式之re模块之分组（group）、贪心匹配、编译

python3进阶之正则表达式之re模块

python3进阶之正则表达式之re模块之切分字符串

【Python3 爬虫】U13_正则表达式之group分组

python3 正则表达式 re模块之辣眼睛计算器

Python3 re模块(正则表达式)

python3 正则表达式 re模块

python 正则表达式的用法re模块，match和search区别，匹配分组group

python模块之re模块（正则表达式）

Python 正则表达式，re模块，match匹配(默认从开头匹配)，分组

python基础之：re(正则表达式)模块

Python模块之re正则表达式

python正则表达式之re模块使用

Python之re(正则表达式)模块详解

python之re模块和正则表达式

【转】Python之正则表达式（re模块）

python之正则表达式：re模块

python基础之正则表达式，re模块

Python 之【re模块的正则表达式学习】

Python 之Re模块(正则表达式)

Python之Re模块匹配正则表达式详解

Python3笔记之正则表达式re

Python进阶-Ⅹ 正则表达式（RexEx）、re模块

Python3之正则表达式实例

Python3之正则表达式详解

python3之正则表达式

python3中的RE(正则表达式)

Python学习笔记模式匹配与正则表达式之贪心和非贪心匹配

Python正则表达式之编译正则表达式（3）

Python3网络爬虫——（5）正则表达式（re模块）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)