今天在codewars.com做练习,遇到一个正则表达式相关的题目Regex Password Validation
题目很简单,对字符串进行校验,规则如下:
1.长度至少有6位
2.包含小写字母
3.包含大写字母
4.包含数字
5.仅由数字和字母组成
对于2.3.4这3个条件,没办法写在一个正则里面,于是搜索发现了零宽断言这种正则形式,这种形式是以括号包起来的子表达式存在的,由以下两种形式:
- 正向零宽断言 表达式为:(?=exp) 意为当该位置的字符需满足正则exp才能,整个正则表达式才能成功匹配
- 负向零宽断言 表达式为:(?!exp) 意为当该位置的字符不能满足正则exp时,整个正则表达式才能成功匹配
所谓零宽断言,其实语义上分两部分:零宽就是指这个括号内的正则表达式长度位零,不用作正则提取;断言就是指这是一个判断语句类似与if。
回到刚才的题目,答案可以这么写:
regex = '^(?=.*?[0-9])(?=.*?[a-z])(?=.*?[A-Z])[0-9a-zA-Z]{6,}$'
^后的3个括号的意思分别是包含数字,包含小写字母,包含大写字母
虽然答案通过了,但是还是觉得不对劲,按照以前的正则知识,正则是有顺序的,^后的3个括号体现出来的顺序应该是 数字-小写字母-大写字母,但是事实上正则并没有按照这种顺序解释,于是又回到零宽这个属性上来,既然是"零宽"的,那么单独看这3个括号中的任意一个括号时,其它两个括号都是零宽即可以忽略的,也就是说他们之间是互不影响的,这一点纯属个人理解,如果有不对,欢迎指正。
这个题不适合用负向零宽断言,不过稍微变通一下还是能写出来的:
regex = '^(?![0-9a-z]+$)(?![a-zA-Z]+$)(?![0-9A-Z]+$)[0-9a-zA-Z]{6,}$'