一 grep工具

grep是行过滤工具，用于根据关键字进行行过滤

语法：
grep -选项 “关键字” 文件名

1.1 常用选项

测试文本内容如下
在这里插入图片描述
grep -w
命令： grep -w ‘cen’ sedtest.txt

由图可见，在不包含选项-w的时候，只要文本中有“cen”就会过滤出来，而加上-w之后需要文本中存在这个单词才会过滤出来

grep -o
命令： grep -o ‘cenjeal’ sedtest.txt
在这里插入图片描述

由图可见，不包含-o的时候会输出一整行，而使用-o选项后则只显示匹配的字符串

grep -P
命令：grep -P ‘\d’ sedtest.txt 匹配数字
命令：grep -P ‘\w’ sedtest.txt 匹配字母数字下划线
命令：grep -P ‘\s’ sedtest.txt 匹配字符串
在这里插入图片描述

正则表达式（Regular Expression、regex或regexp，缩写为RE），也译为正规表示法、常规表示法，是一种字符模式，用于在查找过程中匹配指定的字符。
支持正则表达式的程序如：find| vim| grep| sed |awk

1.匹配邮箱、匹配身份证号码、手机号、银行卡号等
2.匹配某些特定字符串，做特定处理等等

元字符

指那些在正则表达式中具有特殊意义的专用字符,如:点(.) 星(*) 问号(?)等

前导字符

位于元字符前面的字符. abc* aooo.

普通常用元字符

其他常用元字符

常用扩展元字符
grep必须加 -E 或者使用egrep

sed必须加 -r

扩展元字符	功能	示例
+	匹配一个或多个前导字符
？	匹配零个或一个前导字符
\|	或	匹配a或b
()	组字符（看成整体）	(my\|your)self：表示匹配myself或匹配yourself
{n}	前导字符重复n次
{n,}	前导字符重复至少n次
{n,m}	前导字符重复n到m次