Linux中的常用文本处理命令

1.sort命令

sort命令是以行为单位对文件内容进比较;原则是从首字符向后,依次按照ASCII码进行比较,最后将他们升序输出行排序,也可以根据不同的数据类型来排序。

格式1:sort [选项] 参数(文件)

格式2:cat file | sort 选项

常用选项 作用
-n 按照数字进行排序(默认升序)
-r 反向排序(倒序)
-u 等同于uniq,表示相同的数据仅显示一行(去重,必须是连续重复的数据)
-t 指定字段分隔符,默认使用Tab键分隔
-k 指定排序字段(不指定默认第一个字段)
-o 输出文件 将排序后的结果转存到指定文件
-f 忽略大小写,会将小写字母都转换为大写字母来进行比较
-b 忽略每行前面的空格

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.uniq命令

uniq命令用于报告或者忽略文件中连续的重复行,常与sort命令结合使用。

格式1:uniq 【选项】 参数

格式2:cat file | uniq 选项

常用选项 作用
-c 统计连续重复的行的次数,并且删除重复的行
-u 仅显示出现一次(不连续重复)的行
-d 仅显示连续出现的行

在这里插入图片描述

3.tr命令

tr命令常用来对来自标准输入的字符进行替换、压缩和删除。

格式1:tr 【选项】 参数

格式2:cat file | tr 【选项】 参数

选项 作用
-c 保留参数1的字符,其他字符包括换行符\n用参数2的字符集替换
-d 删除所有属于字符集1的字符
-s 将连续重复的字符压缩成一个
-t 参数2的字符集替换参数1的字符集,和不加选项一样

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.cut命令

cut命令用于截取字段或者字符串

格式1:cut 【选项】 参数

格式2:cat file | cut 选项

选项 作用
-d 指定分隔符
-f n 指定第n个字段;1-3表示从第1个字段到第3个字段;4,5,7表示第4,第5,第7个字段;与-d一起使用
-b 以字节为单位进行截取
-c 以字符为单位进行截取
–complement 排除所指定的字段
–output-delimiter 更改输出内容的分隔符

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.split命令

split命令用于在Linux下将大文件拆分为若干小文件

格式:split 【选项】 参数 原始文件 拆分后文件名前缀

选项 作用
-l 指定行数
-b 指定大小

在这里插入图片描述

6.eval命令

命令字前加上eval,shell会在执行命令之前扫描它两次,eval命令首先会先扫描命令行进行所有的置换,然后再执行命令,该命令适用于那些一次扫描无法实现功能的变量,该命令会对变量进行两次扫描。

简单来说,eval会扫描命令两次,第一次会把变量转换成值,然后再执行命令。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_40707090/article/details/124203801