为什么要学正则表达式 - 2

除了前面介绍的"^“和”$"之外，表达式里还有还有许多元字符，今天我们就继续来看看这些元字符所代表的意思。
前言
在处理正字符串的时候，经常会有一些复杂规则的字符串需求，
正则表表达式就是描述这些规则的公工具。
换句话说
正则表达式就是记录文本规则的代码。

行定位符部分请参考：
为什么要学正则表达式 - 1

元字符

\n匹配换行符。
\t匹配制表符。
\w匹配字母、数字、下划线。
\W匹配除了字母、数字、下划线的字符串。字母大写相当于非（个人总结）
\d匹配十进制数字
\D匹配除了十进制数字的字符串
\s匹配空白字符
\S匹配非空白字符
\b匹配单词的开始或结束，单词的分界通常是空格、标点符号或者换行

接下来我们来看一组\b的实例

def match_str(string):
    regex_str = "\\bapple\\b"  #匹配规则
    match_regex = re.match(regex_str, string)

    if match_regex:
        print('match!')
    else:
        print('not match')

if __name__ == '__main__':
    match_str('apple')  #进行匹配的字符串
#match

上面这组表达式有什么含义呢？
\b匹配apple开头的单词，最后是单词结尾(\b)。
注意\b匹配的是位置，而不是任意字符，匹配的是单词的边界。

接下来我们再看一看\s的具体含义。请看以下实例

def match_str(string):
    regex_str = 'six\s*students'  #匹配规则
    match_regex = re.match(regex_str, string)

    if match_regex:
        print('match!')
    else:
        print('not match')

if __name__ == '__main__':
    match_str('six         students')  #进行匹配的字符串
#match

上面这组表达式有什么含义呢？
使用\s去匹配空白字符，如果含有多个空白字符的话需要使用使用\s*匹配。

刚才演示了一下\s的意思。接下来我们再看一看\S的具体含义。请看以下实例

String = 'six+-*/students'
regex_str = 'six\S*students'
match_str = re.match(regex_str, String)

if match_str:
    print('match!')
else:
    print('Not match！')
#match

这个表达式的意思很简单，除了空格之外的所有都可以匹配得到。
好了，今天分享到此结束。明天咱们继续！

为什么要学正则表达式 - 2

猜你喜欢