正则表达式的总结

缘由:当前写一些SQL和整理数据类的文件,使用到正则表达式,也将之前零散的使用汇总到一起,记录一下~分享一下~

一、热身小案例

需求:将SQL中美化的格式转换为无换行,无空格的

程序中使用正则表达式:`\\s+`
编辑器中使用正则表达式:`\s+`
 
解释说明:
  `\`:将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。(在java或者phython等程序中需要添加,与编译有关)
  `\s`:匹配任何不可见字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
  `+`:匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。
例图:
 二、正则表达式的介绍
    开始传统教育思维的步骤哈~,咱们先说概念,啥是正则表达式呢?
  + 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
  + 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
 
三、使用范围
  各种文本编辑器,代码编辑器均可使用
  小到著名编辑器EditPlus、notepad++,大到Microsoft Word、Visual Studio、eclipse、IDE等大型编辑器,都可以使用正则表达式来处理文本内容
 
四、常用的元字符
1、定位符
  `^`:标记开始的位置(*特别说明,^在方括号表达式中使用,此时它表示不接受该字符集合,即"非"*)
  `$`:标记结束的位置
  `\b`:匹配一个单词边界,也就是指单词和空格间的位置(单词边界不仅指空格)
  `\B`:匹配非单词边界
2、 限定符
  `*`:匹配前面的子表达式零次或多次。等价于{0,}
  `+`:匹配前面的子表达式一次或多次。等价于{1,}
  `?`:匹配前面的子表达式零次或一次。等价于{0,1}
  `{n}`:n 是一个非负整数。匹配确定的 n 次。等价于{0,}
  `{n,}`:n 是一个非负整数。至少匹配n 次。等价于{1,}
  `{n,m}`:m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。等价于{0,1}
3、 表达式
  `()`:标记一个子表达式的开始和结束位置
  `[`:标记一个中括号表达式的开始[]
  `{`:标记限定符表达式的开始{}
4、 贪婪与非贪婪
  \*、+限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配
  实例:“kkss>介绍正则表达式>”
  **贪婪**:/k.\*>/匹配: kkss>介绍正则表达式>
  **非贪婪**:/k.\*?>/匹配:kkss>
5、字符簇
  `[a-z]` :匹配所有的小写字母
  `[A-Z]` :匹配所有的大写字母
  `[a-zA-Z]` :匹配所有的字母
  `[0-9]` :匹配所有的数字
  `[0-9\.\-]` :匹配所有的数字,句号和减号
  `[ \f\r\t\n]` :匹配所有的白字符
  `(x|y)` :匹配x或y
5、 其他特殊字符
  `\w`  匹配字母数字及下划线,等价于[a-zA-Z0-9_]
  `\W` 匹配任何非单词字符。等价于 [^A-Za-z0-9_]
  `\s` 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]
  `\S` 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]
  `\d` 匹配一个数字字符。等价于 [0-9]
  `\D` 匹配一个非数字字符。等价于 [^0-9]
  `.`  匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符,请使用象 '[.\n] ' 的模式
6、 正向反向
  `(?:pattern).`:匹配 pattern 但不获取匹配结果,非获取匹配。例:industr(?:y|ies) =>'industry|industries' 。
  `(?=pattern)`:正向肯定预查,例:Windows(?=95|98|NT|2000)"能匹配"Windows2000"中的"Windows",但不能匹配"Windows3.1"中的"Windows"。
  `(?!pattern)`:正向否定预查,例:Windows(?!95|98|NT|2000)"能匹配"Windows3.1"中的"Windows",但不能匹配"Windows2000"中的"Windows"。
  `(?<=pattern)`:反向(look behind)肯定预查,与正向肯定预查类似,只是方向相反.例:"(?<=95|98|NT|2000)Windows"能匹配"2000Windows"中的"Windows",但不能匹配"3.1Windows"中的"Windows"。
  `(?< !/pattern)`:反向否定预查,与正向否定预查类似,只是方向相反。例:"(?< !95|98|NT|2000)Windows"能匹配"3.1Windows"中的"Windows",但不能匹配"2000Windows"中的"Windows"。
 
--未完待续。。。。。。。。。

猜你喜欢

转载自www.cnblogs.com/latter/p/9013262.html