正则表达式
通用的字符串表达框架
简洁表达一组字符的表达式
针对字符串表达“简洁”和“特征”思想的
工具
判断某字符串的特征归属
正则表达式的使用
编译:将符合正则表达式语法的字符串转换
成正则表达式特征
正则表达式的语法
字符和操作符组成
.表示任何单个字符
[]字符集,对单个字符给出取值范围,
[abc]表示a、b、c , [a-z]表示a到z单个字
符
[^]非字符集,对单个字符给出排除范围。
[^abc]表示非a或b或c的单个字符
前一个字符0次或无限次扩展。abc表示ab
、abc、abcc、abccc等
+前一个字符1次或无限次扩展。abc+表示
abc、abcc、abccc等
?前一个字符0次或1次扩展。abc?表示ab
、abc
|左右表达式任意一个。abc|def表示abc|
def
{m}扩展前一个字符m次。ab{m}c表示abbc
{m,n}扩展前一个字符串m-n次。ab{1,2}c
表示abc、abbc
匹配字符串开头。abc表示abc且在一个字
符串的开头
表示abc且在字符串
的结尾
()分组标记,内部只能使用|操作符。
(abc)表示abc,(abc|def)表示abc、
def
\d数字,等价于[0-9]
\w单词字符,等价于[A-Z-z0-9_]
正则表达式库Re
表示类型raw string(原生字符串类型,不
包含转义符)
string类型,更繁琐。
re.search()在一个字符串中搜索匹配正则
表达式的第一个位置,返回match对象
re.match()从一个字符串的开始位置起匹配
正则表达式,返回match对象
re.findall()搜索字符串,以列表类型返回
全部匹配的子串
re.split()将一个字符串按照正则表达式匹
配进行分割,返回列表类型
re.finditer()搜索字符串,返回一个匹配
结果的迭代类型,每个迭代元素是match对
象
re.sub()在一个字符串中替换所有匹配正则
表达式的子串,返回替换后的字符串