리눅스 고급 명령 ==> 찾을 그렙, 나오지도, AWK

A, 찾기

  지정된 디렉토리에있는 파일을 찾는 명령을 찾을 수 있습니다. 당신이 매개 변수를 설정하지 않습니다이 명령을 사용하는 경우, find 명령은 현재 디렉토리에서 하위 디렉토리와 파일을 찾을 수 있습니다. 그리고 모든 하위 디렉토리를 조사하고 파일이 표시됩니다.

문법

찾을    경로 - 옵션을 [-print] [간부 -ok 명령] {} \;

일반적인 옵션 :

-name  루트 디렉토리와 로그 파일의 마지막에 모든 하위 디렉터리를 찾을 수, 파일 이름은 예를 들어, 대소 문자를 구별 : 찾기 / -name '* logf'

-iname       현재 모든 테스트라는 디렉토리 파일과 하위 디렉터리를 찾을 수, 파일 이름은 대소의 영향을받지는 :.이 -name 테스트를 찾을 수와 같은 수 있습니다

-user    -user mysql을 찾을 : 파일이 예를 들어, 모든 파일을 MySQL로 사용자에게 속한 찾을 수 있습니다.

-group      예를 들어, 파일이 그룹에있는 모든 파일의 자식 속한 찾을 : -group 자식 찾을 수 있습니다.

- 형    모양의 종류에 따라 : 다음

  • F   파일 찾기. 타입 F
  • D  디렉토리 발견. 타입 D
  • C  문자 장치 파일 찾기. 타입 C
  • B  블록 장치 파일 찾기. B 형
  • L   링크 된 파일 찾기. 타입 L
  • P는  파이프 파일 찾기. 타입 P

-size    쿼리의 파일 크기에 따라

  • -n  댄 작은  크기  N  파일
  • + N은  보다 큰  크기  N  파일
  • 찾기 / 파일의 요법, 이하 10,000 바이트에서 디렉토리를. 발견은 / etc -size + 10000c
  • / etc 디렉토리 찾기, 1M보다 큰 파일. 발견은 / etc -size -1M

-mtime은    시간에 따라 파일 변경 사항을 찾아

  • 수정 된 파일 내에서 -n N 일.
  • N + N 수정 된 파일이 아닌 다른 일.
  • n은 정확히 n은 일 파일을 수정하는 방법
  • 쿼리 / etc 디렉토리에서 5 일 이내에 conf의 파일의 끝을 수정합니다. 찾기 / 등 -mtime -5 -name '*의 .conf'
  • 쿼리 / etc 디렉토리 10 일 수정 전에 양양 파일에 속한다. 찾기 / 등 -mtime +10 -user 양양

-mmin  

  • -n  n 분 내에서 파일을 수정
  • + N  N 분 전에 파일을 수정했습니다.
  • 삼십분 다음 쿼리 파일 / etc 디렉토리 전에 수정. 찾기 / 등 -mmin +30
  • 쿼리는 / etc 디렉토리는 디렉토리 30 분 전에 수정했습니다. 등 -mmin -30 형 D / 찾을

-mindepth N   검색 디렉토리를 시작하는 n 번째 단계에서

  • 세 번째 단계의 하위 디렉토리 등 /에서 검색을 시작합니다. 찾기 / 등 -mindepth 3

-maxdepth N   첫 단계 N-1 서브 디렉토리를 검색하도록 나타낸다.

  • 에 / etc 파일을 자격을 검색하지만, 대부분은 2 등급 하위 디렉토리를 검색합니다. 찾기 / 등 -maxdepth 3 -name '*의 .conf'
  • 찾기 / F 형 등 -name '*의 .conf'- 크기 + 10K -maxdepthc 2

작동은 파일을 찾을 수 있습니다 :

-print   인쇄 출력. 기본 옵션은, 발견 된 결과를 인쇄 할 수 있습니다.

간부는   파일, 검색 할 특정 작업을 수행하는 고정 된 형식 : 간부 'commond'{} \    ; 참고 : {} 쿼리의 결과를 나타냅니다.

  • 검색 / 파일 (비 카탈로그) 등 디렉토리, 파일을 그 conf의에서 종료하고 삭제 한 후 10K보다 큰합니다.
    • 찾기 / F 형 등 -name '*의 .conf'- 크기 + 10K 간부 RM -f {} \;
  • .LOG로 끝나는 파일에 대한 다음 / 데이터 / 로그 / 디렉토리는 삭제하고 7 일 이상으로 시간을 변경합니다.
    • -name / 로그 / 데이터를 찾을 수 '* .LOG'-mtime +7 간부 인 RM -f \;
  • 검색 조건은 실시 예 1과 동일하지만, 삭제하지, 그냥에 / 루트 복사 / conf 디렉토리
    • 찾기 / 등 타입 F -name '*의 .conf'-size + 10,000 간부 CP {} / 루트 / conf의 / \;

-ok      및  간부  기능이 동일하지만, 각 작업은 메시지를 사용자에게 제공 할 것입니다.

논리 연산자 :

함께 -a   (기본값 문의 조건 사이의 관계)

-o 또는

-not |!  

두, GREP

  그렙 (글로벌 검색 정규 표현식 (RE) 및 라인, 포괄적 인 검색 정규 표현식을 인쇄하고 라인을 출력) 강력한 텍스트 검색 도구입니다, 당신은 정규 표현식 검색 텍스트를 사용하고, 일치하는 라인을 인쇄 할 수 있습니다 아웃.

구문 :

그렙 [-abcEFGhHilLnqrsvVwxy] -은 <방송 열의 개수>] [- B <방송 열의 개수>] - C <열 표시 번호>] - D <동작>] [- E <스타일 템플릿>] [- F <서식 파일>] [- 도움말] [템플릿 스타일] [파일 또는 디렉터리 ...]

옵션 :

옵션 기술
-에이  바이너리 데이터를 무시하지 마십시오
-A <방송 열의 개수> 선 후 내용을 모델 외부의 스타일에 맞춰 라인을 표시하고, 표시에 추가 
-비 이 디스플레이 모델 외부의 스타일과 일치 행 및 표시 이전 행의 내용에서 
-씨 컬럼의 수는 템플릿 스타일에 맞춰 계산 
-C <쇼 열 수> 또는 - <디스플레이 순서> 전 모델 외부의 스타일 및 디스플레이 라인에 컬럼의 내용을 행을 표시하는 것 외에도 
-d <동작> 찾으려 할 때 지정하면 디렉토리 그렇지 않으면 grep 명령 정보 및 정지 조치를 반환합니다,이 매개 변수를 사용해야합니다 파일이 아닌 것입니다 
-e <스타일 템플릿> 문서 템플릿 스타일의 컨텐츠로 지정된 문자열 찾기 
-이자형 일반적인 표현의 템플릿 스타일은 확장 된 정규 표현식을 사용할 수 있습니다 사용 수단으로 확장 
-f <서식 파일> GREP이 조건을 충족 컨텐츠 템플릿 파일, 템플릿 스타일의 각 컬럼의 형식을 찾을 수 있도록 템플릿 파일, 하나 이상의 템플릿 스타일의 내용을 지정합니다 
-에프 고정 된 문자열 목록으로 볼 템플릿 스타일 
-지 사용에 표기의 표준 스타일로 템플릿 
-h 템플릿 스타일에 맞춰 행을 표시하기 전에, 컬럼의 파일 이름이 속한 표시하지 않습니다 
-H 템플릿의 스타일에 맞춰 행을 표시하기 전에, 열의 파일 이름 표시 
-나는 대소 문자 차이를 무시 
-엘 파일 이름과 일치 목록 문서의 내용은 템플릿 스타일에 지정된 
-엘 파일의 내용 목록은 템플릿 스타일에 지정된 파일 이름을 준수하지 않는 
-엔 템플릿의 스타일에 맞춰 행을 표시하기 전에, 컬럼의 수를 표시 
-큐 정보를 표시하지 않습니다 
-R / -r 그리고이 매개 변수의 효과는 동일한 "-d 같이 Recurse"매개 변수를 지정합니다 
-에스 오류 메시지가 없습니다 
-v 역방향 조회 
-w 단지 전체 단어 열을 맞춰보기 
-엑스 와 열 열 표시 만 준수
- 그리고 은 "-i"같은이 매개 변수의 효과
-o 만 출력 파일은 일부에 맞게

예 :

# 在文件中搜索一个单词,命令会返回一个包含“match_pattern”的文本行:
grep match_pattern file_name    
grep "match_pattern" file_name

# 在多个文件中查找
grep "match_pattern" file_1 file_2 file_3 ...

# 输出除之外的所有行 -v 选项
grep -v "match_pattern" file_name

# 使用正则表达式 -E 选项
grep -E "[1-9]+"
egrep "[1-9]+"

# 只输出文件中匹配到的部分 -o 选项
grep -o "match_pattern" file_name

# 统计文件或者文本中包含匹配字符串的行数 -c 选项
grep -c "text" file_name

# 输出包含匹配字符串的行数 -n 选项
grep "text" -n file_name
cat file_name | grep "text" -n
grep "text" -n file_1 file_2

# 打印样式匹配所位于的字符或字节偏移
echo gun is not unix | grep -b -o "not"

# 搜索多个文件并查找匹配文本在哪些文件中
grep -l "text" file1 file2 file3...

# 在多级目录中对文本进行递归搜索
grep "text" . -r -n

# 忽略匹配样式中的字符大小写
echo "hello world" | grep -i "HELLO"

# 选项 -e 制动多个匹配样式
echo this is a text line | grep -e "is" -e "line" -o

#只在目录中所有的.php和.html文件中递归搜索字符"main()"
grep "main()" . -r --include *.{php,html}

#在搜索结果中排除所有README文件
grep "main()" . -r --exclude "README"

#在搜索结果中排除filelist文件列表里的文件
grep "main()" . -r --exclude-from filelist

#不会输出任何信息,如果命令运行成功返回0,失败则返回非0值。一般用于条件测试
grep -q "test" filename

#显示匹配某个结果之后的3行,使用 -A 选项:
seq 10 | grep "5" -A 3
5
6
7
8

#显示匹配某个结果之前的3行,使用 -B 选项:
seq 10 | grep "5" -B 3
2
3
4
5

#显示匹配某个结果的前三行和后三行,使用 -C 选项:
seq 10 | grep "5" -C 3
2
3
4
5
6
7
8

#如果匹配结果有多个,会用“--”作为各匹配结果之间的分隔符:
echo -e "a\nb\nc\na\nb\nc" | grep a -A 1
a
b
--
a
b
grep 示例

三、sed

sed 命令是利用脚本来处理文本文件。

sed 可依照脚本的指令来处理、编辑文本文件。

Sed 主要用来自动编辑一个或多个文件、简化对文件的反复操作、编写转换程序等。

语法:

sed [选项] [脚本命令] 文件名

选项与参数

  • -n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
  • -e :直接在命令列模式上进行 sed 的动作编辑;
  • -f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
  • -r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
  • -i :直接修改读取的文件内容,而不是输出到终端。

动作:

  • a :新增行, a 的后面可以是字串,而这些字串会在新的一行出现(目前的下一行)
  • c :取代行, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行
  • d :删除行,因为是删除,所以 d 后面通常不接任何参数,直接删除地址表示的行;
  • i :插入行, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
  • p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行
  • s :替换,可以直接进行替换的工作,通常这个 s 的动作可以搭配正规表示法,例如 1,20s/old/new/g 一般是替换符合条件的字符串而不是整行

一般动作的前面会有一个地址的限制,例如 [地址]动作,表示我们的动作要操作的行。下面我们通过具体的例子直观的看看 sed 的使用方法。

删除行

// example.txt 内容如下
11 aa
22 bb
33 cc
23 dd
55 2e

sed '1,2d' example.txt

输出:
33 cc
23 dd
55 2e

  其中1,2d中的d表示删除,而d前面的表示删除的行的地址,而1,2表示一个地址范围,也就是删除第1行和第2行。地址范围的表示一般是  m,n 表示对m和n行之间的所有行进行操作,也包含第m行和第n行。sed的地址寻址中可以使用$表示最后一行,例如 m,$ 表示对m行以及其后面的所有行进行操作,包括最后一样。m,$d就是删除m行以及其后面的所有行内容。当然我们还可以对某一行进行操作,例如2d表示仅仅删除第2行。除了使用数字范围 m,n 表示多行区间,以及m表示单行以外,我们还可以使用正则表达式选出符合条件的行,并对这些行进行操作,同样的是上面的文件:

sed '/2/d' example.txt

输出:
11 aa
33 cc

  上面的命令中 /2/ 是一个正则表达式,在sed中正则表达式是写在 /.../ 两个斜杠中间的,这个正则的意思是寻找所有包含2的行,执行相应的操作,也就是删除所有包含2的行,如果我们只想删除以2开头的行呢,只需要修改一下正则表达式就可以了:

sed '/^2/d' example.txt

输出:
11 aa
33 cc
55 2e

新增行

sed '1a hello world' example.txt

输出:
11 aa
hello world
22 bb
33 cc
23 dd
55 2e

  其中a命令表示在指定行的后面附加一行,1a则是在第一行的后面添加一行,添加的内容就是a后面的内容,如果a的前面没有地址限定则在所有行的后面都会添加指定的字符串

sed '1i hello world' example.txt

输出:
hello world
11 aa
22 bb
33 cc
23 dd
55 2e

命令i表示在指定的行的前面插入一行,插入的内容为其后面的字符串

替换行

sed '1c hello world' example.txt

输出:
hello world
22 bb
33 cc
23 dd
55 2e

  命令c会替换指定的行的所有内容,替换成其后面的字符串,所有的新增,删除,替换行,这些命令前面的地址修饰都可以指定地址空间,也都可以使用正则表达式,命令会应用在选出的符合地址条件的所有行上面,例如:

sed '/^2/c hello world' example.txt

输出:
11 aa
hello world
33 cc
hello world
55 2e

替换以2开头的行,其内容是c命令后面的字符串 

替换部分字符串而不是整行

  sed中除了上面的命令是针对整行进行操作的之外,还提供一个替换命令,该命令对某一行中的部分字符串进行操作,下面举一个简单的例子,还是同样的文本内容,执行下面的命令:

sed 's/aa/AA/' example.txt

输出:
11 AA
22 bb
33 cc
23 dd
55 2e

  我们这里说的就是s命令,执行的结果是我们文件中的 aa 被替换成 AA ,我们看一下s命令后面接的是3个斜杠分隔的两串字符串,其含义是   s/待替换的字符串/新字符串/ 也就是说使用后面的 AA 替换文件中出现的前面的 aa 。实际上这里的替换仅仅替换每一行遇到的第一个aa,我们修改一下文件的内容:

// example.txt
11 aa
22 bb
33 cc
23 dd
55 2e
66 aaff ccaa
zz ggaa

sed 's/aa/AA/' example.txt

输出:
11 AA
22 bb
33 cc
23 dd
55 2e
66 AAff ccaa
zz ggAA

  可以看到第6行的ccaa中的aa是没有被替换的,也就是说此时仅仅替换了每一行搜索到的第一个aa字符串进行操作,那么如果要对一行里面的所有的符合条件的字符串都做替换操作呢,我们可以使用参数g,例如修改命令如下:

sed 's/aa/AA/g' example.txt

输出:
11 AA
22 bb
33 cc
23 dd
55 2e
66 AAff ccAA
zz ggAA

  在最后一个斜杠后面加上g选项之后,表示进行全局替换,也就是说一行中所有符合条件的旧字符串都会被替换成新字符串,而不仅仅是第一个。与其他针对行的操作一样,s命令也可以进行地址选择,其地址使用方法与我们之前的一样,也就是在s的前面加上地址空间限定,例如:

sed '1s/aa/AA/g' example.txt

输出:
11 AA
22 bb
33 cc
23 dd
55 2e
66 aaff ccaa
zz ggaa

可以看到仅仅对第一行进行了替换操作,其他的地址限定方法同样也是可以使用的,我们可以使用m,n的限定,例如:

sed '5,$s/aa/AA/g' example.txt

输出:
11 aa
22 bb
33 cc
23 dd
55 2e
66 AAff ccAA
zz ggAA

  表示对第5行直到文件末尾的所有行进行搜索替换操作,同样s命令的地址限定也支持使用正则表达式限定符合条件的行,然后在这些行中进行字符串的搜索替换操作,例如:

sed '/^[0-9]/s/aa/AA/g' example.txt

输出:
11 AA
22 bb
33 cc
23 dd
55 2e
66 AAff ccAA
zz ggaa

我们在s命令前面添加了 /^[0-9]/ 这个修饰,该正则表达式表示对所有以数字开头的行,执行s操作

另外一个要说明的是  s/待替换的字符串/新字符串/ 这种格式中 / 作为分隔符并不是一定的,当使用s命令时候,我们可以使用别的分隔符,实际上s后面紧接着的字符就是分隔符,所以不一定是 / 符号。例如:

echo 'aabbccaadd' | sed s#aa#AA#g

输出:
AAbbccAAdd

这里s命令后面跟着的#符号被当作分隔符了

搜索并输出行内容

sed还提供一个p命令用于搜索符合条件的行,并输出该行的内容,而不做其他的任何修改,例如:

// example.txt
11 aa
22 bb
33 cc
23 dd

sed '2p' example.txt

输出:
11 aa
22 bb
22 bb
33 cc
23 dd

  可以看到第二行被输出来了,但是sed好像将文件的所有内容输出了一遍,而第2行则多输出了一次,实际上sed默认情况下是会将所有标准输入的数据又重新输出到标准输出的,我们可以加上 -n 选项让sed仅仅是输出经过处理之后的那些行,而不是输出之前从标准输入中获取到的所有行内容,例如:

sed -n '2p' example.txt

输出:
22 bb

  这样仅仅会输出p命令的处理结果了,-n 选项一般是与p命令联合使用的,其他的增加,删除,替换行的命令是不需要 -n 选项的

将修改应用到文件当中

我们之前做的所有实验,实际上都没有修改test.txt文件的内容,也就是说我们看到的修改结果仅仅输出到控制台上,而文件test.txt的内容是没有修改的,我们可以使用 -i 选项告诉sed直接修改文件的内容,而不是将修改结果输出到终端上,例如:

sed -i '2d' example.txt 

命令运行之后,我们发现example.txt的第2行没有了

sed正则中的元字符

我们知道sed中的命令前面可以使用地址范围进行限制,表示对文件的某些符合条件的行执行相应的操作,其中我们可以使用正则表达式选出要操作的行,而sed中正则的语法可能与我们其他命令的正则语法有一些不同,这里我们有必要列出sed中常用的正则元字符:

$ 表示行尾
^ 表示行首
[a-z0-9]表示字符范围
[^]表示除了字符集中的字符以外的字符

sed的正则中  \(\)  和 \{m,n\} 需要转义 
. 表示任意字符 
* 表示零个或者多个 
\+ 一次或多次  
\? 零次或一次    
\| 表示或语法

四、awk

https://www.cnblogs.com/wangqiguo/p/5863266.html (转) 

五、grep、sed、awk总结

  • grep:适合单纯的查找或匹配文本;
  • sed:适合对匹配到的文本进行编辑;
  • awk:适合对文本进行较复杂的格式化处理;

추천

출처www.cnblogs.com/L-Test/p/11801789.html