目录
1 重复结构
同一个内容连续出现n次(你>=0)
+ 前面的内容连续出现1次或更多次元字符
“ a+b+ ”
详细:
+ 前面的内容连续出现1次或更多次
* 前面的内容出现任意次,包括0次
? 前面的内容出现0次或者1次
{n} 正好出现n次
{n,m} 出现 n 到 m 次
2、指代特定内容的元字符
[一-龥!-~]+ 所有的文字
\d 数据字符
\D 所有非数字字符
\w 文字(包括数字和下划线)
\W 所有非文字字符
\s 空白字符(空格、换行)
\S 所有非空白字符
. 表示任意字符
拓展:
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
## 高级:
匹配中文汉字
[\u4e00-\u9fa5]
\b\w*q[^u]\w*\b匹配包含后面不是字母u的字母q的单词
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
3、转义字符
转义字符(\):
在正则表达式当中,改变后面字符的含义。比如将元字符转变为普通文字
4、分列显示
用括号
例如
\s*a(\W\w)(\d)\s*