正则表达式-零宽断言

今天在codewars.com做练习,遇到一个正则表达式相关的题目Regex Password Validation

题目很简单,对字符串进行校验,规则如下:

1.长度至少有6位

2.包含小写字母

3.包含大写字母

4.包含数字

5.仅由数字和字母组成


对于2.3.4这3个条件,没办法写在一个正则里面,于是搜索发现了零宽断言这种正则形式,这种形式是以括号包起来的子表达式存在的,由以下两种形式:

  • 正向零宽断言     表达式为:(?=exp)       意为当该位置的字符需满足正则exp才能,整个正则表达式才能成功匹配

  • 负向零宽断言     表达式为:(?!exp)        意为当该位置的字符不能满足正则exp时,整个正则表达式才能成功匹配

所谓零宽断言,其实语义上分两部分:零宽就是指这个括号内的正则表达式长度位零,不用作正则提取;断言就是指这是一个判断语句类似与if。


回到刚才的题目,答案可以这么写:

regex = '^(?=.*?[0-9])(?=.*?[a-z])(?=.*?[A-Z])[0-9a-zA-Z]{6,}$'

^后的3个括号的意思分别是包含数字,包含小写字母,包含大写字母


虽然答案通过了,但是还是觉得不对劲,按照以前的正则知识,正则是有顺序的,^后的3个括号体现出来的顺序应该是 数字-小写字母-大写字母,但是事实上正则并没有按照这种顺序解释,于是又回到零宽这个属性上来,既然是"零宽"的,那么单独看这3个括号中的任意一个括号时,其它两个括号都是零宽即可以忽略的,也就是说他们之间是互不影响的,这一点纯属个人理解,如果有不对,欢迎指正。


这个题不适合用负向零宽断言,不过稍微变通一下还是能写出来的:

regex = '^(?![0-9a-z]+$)(?![a-zA-Z]+$)(?![0-9A-Z]+$)[0-9a-zA-Z]{6,}$'






猜你喜欢

转载自blog.csdn.net/xiaozengtongxue/article/details/80787954