cut sort uniq wc

cut

cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。
一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。


-c :
    以字符为单位进行分割。

    cut -c1-3 test.txt:打印第1个到第3个字符
    cut -c5- test.txt:打印从第5个字符开始到结尾

-d :
    自定义分隔符,默认为制表符。

    cut -d';' -f 1

-f :
    用-d将文本分隔成一段一段后,-f用来取出第几段

    cut -f1 test.txt:取出一行分割后的第一个

    cut -f2,3 test.txt:取出一行分割后的第2到3个

sort

sort将文件的每一行作为一个单位,相互比较。
比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

-u : 
    它的作用很简单,就是在输出行中去除重复行。

-r : 
    sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。

-n : 
    以数值来进行排序。

-f : 
    忽略大小写


cat ld | sort -n

uniq

uniq命令可以在排序后处理重复的行。

常用选项:

-i
    忽略大小写

-c
    在行的开头输出该行出现的次数

-d
    只输出重复的行

-u
    只输出出现过一次的行


sort -n ld | uniq -c

wc

wc统计文件里面有多少单词,多少行,多少字符。

-l
    仅列出行;

-w
    仅列出多少字(英文单字);

-m
    多少字符;

猜你喜欢

转载自www.cnblogs.com/loveer/p/11621718.html