文本编辑awk的一些初略认知

awk介绍
awk:Aho, Weinberger, Kernighan,报告生成器,格式化文本输出
有多种版本:New awk(nawk),GNU awk( gawk)(一般默认是gawk)
gawk:模式扫描和处理语言
基本用法:
选项 ' 处理方式' 文件
awk [options] ‘program’ var=value file…
awk [options] -f programfile var=value file…
处理文本前执行 处理文本的模式 处理完文本后执行
awk [options] 'BEGIN{ action;… } pattern{ action;… } END{ action;… }' file ...
awk 程序通常由:BEGIN语句块、能够使用模式匹配的通用语句块、END语句块,共3部
分组成
program通常是被单引号或双引号中
选项:
-F 指明输入时用到的字段分隔符
-v var=value: 自定义变量
awk语言
基本格式:awk [options] 'program' file…
program:pattern{action statements;..}
pattern和action:
• pattern部分决定动作语句何时触发及触发事件
BEGIN,END
• action statements对数据进行处理,放在{}内指明
print, printf
分割符、域和记录
• awk执行时,由分隔符分隔的字段(域)标记$1,$2..$n称为
域标识。$0为所有域,注意:和shell中变量$符含义不同
• 文件的每一行称为记录
• 省略action,则默认执行 print $0 的操作(即是默认以回车结束的一行)
awk工作原理
第一步:执行BEGIN{action;… }语句块中的语句
第二步:从文件或标准输入(stdin)读取一行,然后执行
pattern{ action;… }语句块,它逐行扫描文件,从第一行到最后一
行重复这个过程,直到文件全部被读取完毕。
第三步:当读至输入流末尾时,执行END{action;…}语句块
BEGIN语句块在awk开始从输入流中读取行之前被执行,这是一个
可选的语句块,比如变量初始化、打印输出表格的表头等语句通常
可以写在BEGIN语句块中
END语句块在awk从输入流中读取完所有的行之后即被执行,比如
打印所有行的分析结果这类信息汇总都是在END语句块中完成,它
也是一个可选语句块
pattern语句块中的通用命令是最重要的部分,也是可选的。如果没
有提供pattern语句块,则默认执行{ print } ,即打印每一个读取到的
行,awk读取的每一行都会执行该语句块
awk
print格式: print item1, item2, ...
要点:
(1) 逗号分隔符
•(2) 输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式
•(3) 如省略item,相当于print $0
示例:
awk '{print "hello,awk"}' 输出就是hello,awk
awk –F: '{print}' /etc/passwd 将passwd的每一个以回车的行用:进行分割

猜你喜欢

转载自blog.51cto.com/14167037/2348279
今日推荐