为什么要学正则表达式 - 2

除了前面介绍的"^“和”$"之外,表达式里还有还有许多元字符,今天我们就继续来看看这些元字符所代表的意思。
前言
在处理正字符串的时候,经常会有一些复杂规则的字符串需求,
正则表表达式就是描述这些规则的公工具。
换句话说
正则表达式就是记录文本规则的代码。

行定位符部分请参考:
为什么要学正则表达式 - 1

元字符

\n匹配换行符。
\t匹配制表符。
\w匹配字母、数字、下划线。
\W匹配除了字母、数字、下划线的字符串。字母大写相当于非(个人总结)
\d匹配十进制数字
\D匹配除了十进制数字的字符串
\s匹配空白字符
\S匹配非空白字符
\b匹配单词的开始或结束,单词的分界通常是空格、标点符号或者换行

接下来我们来看一组\b的实例

def match_str(string):
    regex_str = "\\bapple\\b"  #匹配规则
    match_regex = re.match(regex_str, string)

    if match_regex:
        print('match!')
    else:
        print('not match')

if __name__ == '__main__':
    match_str('apple')  #进行匹配的字符串
#match

上面这组表达式有什么含义呢?
\b匹配apple开头的单词,最后是单词结尾(\b)。
注意\b匹配的是位置,而不是任意字符,匹配的是单词的边界。

接下来我们再看一看\s的具体含义。请看以下实例

def match_str(string):
    regex_str = 'six\s*students'  #匹配规则
    match_regex = re.match(regex_str, string)

    if match_regex:
        print('match!')
    else:
        print('not match')

if __name__ == '__main__':
    match_str('six         students')  #进行匹配的字符串
#match

上面这组表达式有什么含义呢?
使用\s去匹配空白字符,如果含有多个空白字符的话需要使用使用\s*匹配。

刚才演示了一下\s的意思。接下来我们再看一看\S的具体含义。请看以下实例

String = 'six+-*/students'
regex_str = 'six\S*students'
match_str = re.match(regex_str, String)

if match_str:
    print('match!')
else:
    print('Not match!')
#match

这个表达式的意思很简单,除了空格之外的所有都可以匹配得到。
好了,今天分享到此结束。明天咱们继续!

猜你喜欢

转载自blog.csdn.net/qq_36807888/article/details/107630257