文本处理器—sed工具

sed概述

sed(Stream EDitor)是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。默认情况下,所有的 sed 命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。

sed 的主要工作流程

  • 读取:sed 从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space)
  • 执行:默认情况下,所有的 sed 命令都在模式空间中顺序地执行,除非指定了行的地址,否则 sed 命令将会在所有的行上依次执行
  • 显示:发送修改后的内容到输出流。再发送数据后,模式空间将会被清空。

在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完

sed命令常见用法

通常情况下调用 sed 命令有两种格式,如下所示。其中,“参数”是指操作的目标文件,当存在多个操作对象时用,文件之间用逗号“,”分隔;而 scriptfile 表示脚本文件,需要用“ -f ”选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。

  • sed [选项] ‘操作’ 参数
  • sed [选项] -f scriptfile 参数

常见的 sed 命令选项主要包含以下几种

  • -e 或–expression=:表示用指定命令或者脚本来处理输入的文本文件
  • -f 或–file=:表示用指定的脚本文件来处理输入的文本文件
  • -h 或–help:显示帮助
  • -n、–quiet 或 silent:表示仅显示处理后的结果
  • -i:直接编辑文本文件

“操作”用于指定对文件操作的动作行为,也就是 sed 的命令。通常情况下是采用的“[n1[,n2]]”操作参数的格式。n1、n2 是可选的,不一定会存在,代表选择进行操作的行数,如操作需要在 5~20 行之间进行,则表示为“5,20 动作行为”。常见的操作包括以下几种:

  • a:增加,在当前行下面增加一行指定内容
  • c:替换,将选定行替换为指定内容
  • d:删除,删除选定的行
  • i:插入,在选定行上面插入一行指定内容
  • p:打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以 ASCII 码输出。其通常与“-n”选项一起使用
  • s:替换,替换指定字符
  • y:字符转换
示例

输出符合条件的文本(p表示正常输出)
在这里插入图片描述在这里插入图片描述

输出所有奇数行,n表示读入下一行资料
[root@localhost opt]# sed -n 'p;n' test.txt

he was short and fat.
The home of Football on BBC Sport online.
google is the best tools for search keyword.
PI=3.141592653589793238462643383249901429
Actions speak louder than words

#woooooood#
I bet this place is really spooky late at night!
I shouldn't have lett so tast.

输出所有偶数行,n表示读入下一行资料
[root@localhost opt]# sed -n 'n;p' test.txt

He was wearing a blue polo shirt with black pants.
the tongue is boneless but it breaks bones.12!
The year ahead will test our political establishment to the limit.
a wood cross!

#woood#
AxyzxyzxyzxyzC
Misfortunes never come alone/single.

在这里插入图片描述
查看偶数行或者奇数行时,只是相对于指定的起始位置开始的偶数行或者奇数行,不是直接输出整个文本指定的偶数行或者奇数行

以下是sed命令与正则表达式结合使用:
在这里插入图片描述在这里插入图片描述
删除符合条件的文本(d)
使用nl命令可以用于计算文件的行数,结合此命令可以更加直观地查看命令执行的结果
在这里插入图片描述在这里插入图片描述

删除包含cross的行
[root@localhost opt]# nl test.txt | sed '/cross/d'
删除不包含cross的行,用!符号表示取反操作,如’/cross/!d’
删除以小写字母开头的行
[root@localhost opt]# sed '/^[a-z]/d' test.txt
删除以’.'结尾的行
[root@localhost opt]# sed '/\.$/d' test.txt
删除所有的空行
[root@localhost opt]# sed '/^$/d' test.txt

若是要删除重复的空行,即连续的两个空行只保留一个,执行“sed –e '/^$/{n;/^$/d}' test.txt”命令即可实现,n表示读取下一行数据
替换符合条件的文本
使用 sed 命令进行替换操作时需要用到 s(字符串替换)、c(整行/整块替换)、y(字符转换)命令选项,常见的用法如下所示:

将每行中的第一个the替换为THE
[root@localhost opt]# sed 's/the/THE/' test.txt
将每行中的第2个l替换为L
[root@localhost opt]# sed 's/l/L/2' test.txt
将文件中的所有the替换为THE
[root@localhost opt]# sed 's/the/THE/g' test.txt
将文件中的所有o删除(替换为空串)
[root@localhost opt]# sed 's/o//g' test.txt
在每行行首插入#号
[root@localhost opt]# sed 's/^/#/' test.txt
在包含the的每行行首插入#号
[root@localhost opt]# sed '/the/s/^/#/' test.txt
在每行行尾插入字符串EOF
[root@localhost opt]# sed 's/$/EOF/' test.txt
将第3~5行中的所有the替换为THE
[root@localhost opt]# sed '3,5s/the/THE/g' test.txt
将包含the的所有行中的o都替换为O
[root@localhost opt]# sed '/the/s/o/O/g' test.txt

迁移符合条件的文本

  • H:表示复制到剪贴板
  • g、G:表示将剪贴板中的数据覆盖/追加到指定行
  • w:表示保存为文件
  • r:表示读取指定文件
  • a:表示追加指定内容

将包含the 的行迁移至文件末尾,{;}用于多个操作
[root@localhost opt]# sed '/the/{H;d};$G' test.txt
将第 1~5 行内容转移至第 17 行后
[root@localhost opt]# sed '1,5{H;d};$G' test.txt
将包含the 的行另存为文件aaa.txt
[root@localhost opt]# sed '/the/w aaa.txt' test.txt
将文件/opt/aaa.txt的内容添加到包含the的每行后
[root@localhost opt]# sed '/the/r /opt/aaa.txt' test.txt
在第3行后插入一个新行,内容为New
[root@localhost opt]# sed '3aNew' test.txt
在包含the的每行后插入一个新行,内容为New
[root@localhost opt]# sed '/the/aNew' test.txt
在第3行后插入多行内容,中间的\n表示换行
[root@localhost opt]# sed '3aNew1\nNew2' test.txt

发布了74 篇原创文章 · 获赞 150 · 访问量 6532

猜你喜欢

转载自blog.csdn.net/weixin_45682995/article/details/103360899