正则表达式之<四>重复匹配

1、有多少个匹配
(1)匹配一个或多个字符
在给定字符(或字符集合)后面加上一个 +字符作为后缀,即可以匹配一个或多个字符(至少一个,不匹配零个字符)。

当‘+’‘.’在字符集合里使用,可以不转义,在普通字符中必须转义

tips:
在给一个字符集合加上+后缀的时候,必须把+放在字符集合的后面,比方说[0-9]+是正确的
,[0-9+]则不是。
但是实际上 [0-9+]也是一个合法的正则表达式,但他匹配的不是一个或者多个数字。他 定义了一个由数字0-9和+构成的字符集合,因此只能匹配单个数字或加号

(2)匹配零个或多个字符
在给定字符(或字符集合)后面加上一个 *字符作为后缀,即可以 匹配零个或多个字符

(3)匹配零个或一个字符
在给定字符(或字符集合)后面加上一个 ?字符作为后缀,即可以 匹配零个或一个字符
ex:
如何表示:http://,https://
regex:
https?:// 或者 http[s]?://

tips:

?等价于{0,1}
+等价于{1,}


2、匹配的重复次数
使用{和}字符来给出需要匹配的重复次数——把数值写在{}之间

{}也是元字符,需要转义

(1)为重复匹配次数设定一个精确的值:ex:{3} 重复3次

(2)为重复匹配次数设定一个区间:ex:{2,4}  最少2次,最多4次

(3)匹配至少重复多少次:ex:{3, } 最少重复3次

3、防止过度匹配
在 *, +, {n,},后加上?,就可以变成最少匹配。


先来盘鲜果--上案例:如何构造一个电子邮件的正则表达式?
[email protected]

开始你可能会写成这样:
\w@\w\.\w
这种写法没有任何实际的用处,因为它只能匹配[email protected]形式的电子邮件。只有单个字符嘛。

于是我们改成这样
\w+@\w+\.\w+

Send personal email to [email protected] or 
[email protected]. For questions about a
book use [email protected]. If your message
is urgent try [email protected]. Feel
free to send unsolicited email to
[email protected] (wouldn't it be nice if it
were that simple,huh?).


匹配结果:




.的部分我们没有匹配起来,所以改成
[\w.]+@[\w.]+\.\w+

结果




tips:
[\w.]在集合中.不需要转义他的写法与 [\w\.]是一样的。

猜你喜欢

转载自fengshayage.iteye.com/blog/1885409
今日推荐