处理数据文件

1、排序数据

sort命令按照会话指定的默认语言的排序规则对文本文件中的数据行排序。默认情况下， sort命令会把数字当做字
符来执行标准的字符排序，产生的输出可能根本就不是你要的。解决这个问题可用-n参数，它会告诉sort命令把数字识别成数字而不是字符，并且按值排序。如：sort -n file。另一个常用的参数是-M，按月排序。

用-t参数来指定字段分隔符，然后用-k参数来指定排序的字段。如sort -t ':' -k 3 -n /etc/passwd，结果如下：

root:x:0:0:root:/root:/bin/bash
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin
bin:x:2:2:bin:/bin:/usr/sbin/nologin
sys:x:3:3:sys:/dev:/usr/sbin/nologin
……//太长，省去
gaopeng:x:1033:1013:,,,:/home/gaopeng:/bin/bash
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
现在数据已经按第三个字段——用户ID的数值排序。

显示文件大小的命令：du -sh * | sort -nr，结果如下：

229M no_delta_r2_modify
203M no_delta_r2
32G thread_test
25M x264
16K capture.txt
6.1G have_delta_r2_opt_modify
6.1G have_delta_r2_opt
4.0K file.c
1.7G capture1
1.3G capture2
0 ttttest
0 test

2、搜索数据

grep [options] pattern [file]
如：grep three file1，搜索文件file1中包含three的行，并显示该行。

grep -v t file1 //-v表示反向搜索

grep -n t file1 //-n显示匹配模式所在的行号

grep -c t file1 //-c表示有多少航含有匹配的模式

grep -e t -e f file1 //-e制定多匹配模式

egrep支持POSIX扩展正则表达式，POSIX扩展正则表达式含有更多的可以用来指定匹配模式的字符。 fgrep支持将匹配模式指定为用换行符分隔的一列固定长度的字符串。
3、压缩数据

Linux上的文件压缩工具：

gzip是Linux上最流行的压缩工具。
 gzip：用来压缩文件。如：gzip myprog
 gzcat：用来查看压缩过的文本文件的内容。
 gunzip：用来解压文件。
4、归档数据
tar命令的格式：tar function [options] object1 object2 ...
function参数定义了tar命令应该做什么：

tar命令使用的常见选项：

tar -cvf test.tar test/ test2/ 创建名为test.tar的归档文件，含有test和test2目录内容。

tar -tf test.tar 列出tar文件test.tar的内容（但并不提取文件）。

tar -xvf test.tar 从tar文件test.tar中提取内容。

猜你喜欢