常见问题的正则表达式解决方案(持续更新)

在构造一个正则表达式模式的时候,我们不仅要考虑到匹配结果的准确性,还必须考虑到它的执行效率。

常见场景

场景1:北美电话号码,由一个三位数的区号和一个7位数的号码构成(这7位数字又分成一个3位数的局号和一个4位数的线路号,局号和线路号之间用连字符分隔)。每位号码可以是任意数字,但区号和局号的第一位数字不能是0或1

  文本:Le : 248-555-1234

     Ben : (313)  555-1234

     Dee :(810)555-1234

  正则表达式:\(?[2-9]\d\d\)?[ -]?[2-9]\d\d-\d{4}

解析:首先\(?  ,对(进行转义,可以匹配(的括号,?表示可以有括号 也可以没有

   因为第一个是非1或0,所有取[2-9],\d是其他的表示任意数字

   后面\)?表示结尾的括号,也是可有可无

   [ -]?表示三种情况,可以是空格,可以是-,也可以是直接什么都没有,后面的就是基本的数字匹配,{4}表示重复四次

但是其实上面的还是不够全面,比如当出现 888)222-1234即只有一边)的情况,也会被匹配成功。

所以改成(\()?[2-9]\d\d(?(1)\)|-)[ -]?[2-9]\d\d-\d{4}不知道为什么有问题,思路是要进行条件查询

 中国固定电话号码类似:

规则:一开始固定0,表示长途,接着是2,3,4位数字组成的区号,然后是7位或者8位的电话号码。

正则表达式:\(?0[1-9]\d{1,3}\)?[ -]?[2-9]\d{2,3}[ -]?\d{4}

 

猜你喜欢

转载自www.cnblogs.com/ljg1998/p/12701377.html
今日推荐