说说 Python 正则表达式中的那些字符类别码 - 代码天地

说说 Python 正则表达式中的那些字符类别码

其他 2020-01-12 10:34:44 阅读次数: 0

字符类别码	说明
\d	0 到 9 之间的任意数字，d 是 digit 的缩写。
\D	0 到 9 的数字以外的任意字符。
\w	任意字母、数字或下划线字符，w 是 word 的缩写。
\W	字母、数字和下划线以外的任意字符。
\s	空格、制表符或换行符，s 是 space 的缩写。
\S	空格、制表符和换行符以外的任意字符。

比如 \d 就是正则表达式 (0|1|2|3|4|5|6|7|8|9) 的缩写，使用它可以大大缩短正则表达式的长度。

data_regex=re.compile(r'\d+\.\s[\u4E00-\u9FA5]+')
print(data_regex.findall('1. 科技:xxx,2. 娱乐:xxx,3. 体育:xxx'))

运行结果：

[‘1. 科技’, ‘2. 娱乐’, ‘3. 体育’]

正则表达式 \d+\.\s[\u4E00-\u9FA5]+中的 \d+ 表示一个或多个 0 到 9 之间的任意数字；接着是一个 . ，因为这个点是特殊字符，所以在之前加了转义符；然后是 \s 表示空格、制表符或换行符；最后是 [\u4E00-\u9FA5]+ 表示一个或多个中文字符。

也可以使用方括号来自定义字符集。例如，下例中的字符集 [1x] 将匹配所有的 1 与 x：

custom_regex=re.compile(r'[1x]')
print(custom_regex.findall('1. 科技:xxx,2. 娱乐:xxx,3. 体育:xxx'))

注意： 在方括号内的普通正则表达式符号（比如 .、*、? 或 () 字符）不会被解释。因此，我们不需要对其进行转义。

在自定义字符集的左边中括号之后加一个插入字符（ ^），就可以得到相反结果，即不是自定义字符集中的字符，会被匹配出来：

custom_regex=re.compile(r'[^1x]')
print(custom_regex.findall('1. 科技:xxx,2. 娱乐:xxx,3. 体育:xxx'))

运行结果：

[’.’, ’ ', ‘科’, ‘技’, ‘:’, ‘,’, ‘2’, ‘.’, ’ ', ‘娱’, ‘乐’, ‘:’, ‘,’, ‘3’, ‘.’, ’ ', ‘体’, ‘育’, ‘:’]

deniro_li

发布了601 篇原创文章 · 获赞 668 · 访问量 88万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/deniro_li/article/details/103541122

说说 Python 正则表达式中的那些字符类别码

说说 Python 的正则表达式

说说 Python 正则表达式中的通配符

说说 Python 正则表达式中的插入字符、美元字符

说说 Python 正则表达式的高级用法

说说 Python 正则表达式的匹配类型

说说 Python 正则表达式中，如何实现文本替换

说说 Python 正则表达式中，如何实现不区分大小写

说说如何在 Python 的正则表达式中使用分组

说说Python中的iterator，yield表达式及generator，coroutine

正则表达式在Python中的常用匹配字符

说说 Python 的条件测试表达式

说说 Python 的生成器表达式

说说正则表达式的基础语法

Python中的正则表达式

Python 中的正则表达式

python 说说字符串中的format

python与正则表达式的那些事

说说 Python 装饰器「参数」的那些事儿。

Python中的正则表达式教程 Python中的正则表达式教程

说说Python中，返回函数return

也说说Python中__init__.py的作用

说说在 Python 中如何遍历字典

说说 Python 存储在模块中的函数

说说在 Python 中如何创建与使用类

说说在 Python 中如何测试函数

说说在 Python 中如何处理异常

说说在 Python 中如何导入类

说说在 Python 中，如何写入文件

说说 Python TestCase 中的断言方法

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)