linux文本处理之awk

awk介绍

AWK是一种优良的文本处理工具。它不仅是 Linux 中也是任何环境中现有的功能最强大的数据处理引擎之一。这种编程及数据操作语言(其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母)的最大功能取决于一个人所拥有的知识。AWK 提供了极其强大的功能:可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。它具备了一个完整的语言所应具有的几乎所有精美特性。实际上 AWK 的确拥有自己的语言:AWK 程序设计语言, 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。

最简单地说, AWK 是一种用于处理文本的编程语言工具。AWK 在很多方面类似于 shell 编程语言,尽管 AWK 具有完全属于其本身的语法。它的设计思想来源于 SNOBOL4 、sed 、Marc Rochkind设计的有效性语言、语言工具 yacc 和 lex ,当然还从 C 语言中获取了一些优秀的思想。在最初创造 AWK 时,其目的是用于文本处理,并且这种语言的基础是,只要在输入数据中有模式匹配,就执行一系列指令。该实用工具扫描文件中的每一行,查找与命令行中所给定内容相匹配的模式。如果发现匹配内容,则进行下一个编程步骤。如果找不到匹配内容,则继续处理下一行

截取列(功能比cut更多,使用更加复杂)

使用方法:awk '条件1{动作1}条件2{动作2}....' 文件名

df -h|awk '{printf $1 "\t" $3}'

awk 'BEGIN{printf"this is file"}{printf $2}' 在执行前打印this is file

awk 'END{printf"this is file"}{printf $2}'   在执行后打印

awk 'BEGIN{FS="G"}{printf $1 "\t" $2 "\n"}'  可以通过FS="G"指定分隔符为G



awk '{print NR,NF,FILENAME}' file                ###统计行列并在每一行,NR:行号 NF:列 FILENAME:文件名
 awk 'BEGIN{print "name"}' file                   ###初始化代码块(先处理,在处理其他),只能出现一次
 awk 'END{print WESTOS}' file                     ###结束代码块(处理完结果后在处理),只能出现一次
 awk -F ":" '/\<bash$/{print $1}' file            ##找出含有bash关键字的行并以分号为分隔符,打印出第1列,F:指定分隔符
 awk -F "[: ]+" 'print $1' file                   ###以分号和空格为分隔符,打印出第1列     
 awk 'BEGIN{a=1;print a+1}' file                  ###先给a赋值在进行加法
 awk '/bash\>/{a++}END{print a}' file             ###找出可登陆的用户,并统计出个数
 awk -F ":" '/^root/{print}' file                 ###找出以root开头的并打印出来
 awk -F ":" '/^a|nologin$/{print $1,$7}' file     ###找出以a开头的或者nologin结尾的,打印出第1,7列
 awk -F ":" '$6~/bin$/{print $1,$7}' file         ###以冒号为分隔符,找出第6列为bin结束的行,打印出其第1,7列
 awk -F ":" '$6!~/bin$/{print $1,$7}' file        ###以冒号为分隔符,找出第6列不是bin结束的行,打印出其第1,7列

 awk 'NR==2,NR==5{print}' file                    ###显示出2,5行
 awk '/a/,/b/{print}' file                        ###匹配出有a字符的行到有b字符的行,并打印出来

显示当前系统可登陆用户的name和id

awk -F ":" 'BEGIN{print "name id"}/\<bash$/{print $1" "$3}' /etc/passwd

统计行数可登陆行数:

awk 'BEGIN{n=0}/\<bash$/{n++}END{print n}' /etc/passwd

能够登陆且家目录不在home下的用户

awk -F ":" '/\<bash$/&&$6!~/^\/home/{print $1}' /etc/passwd

显示文本中3-5行的内容

awk -F ":" 'NR>=3&&NR<=5{print}' /etc/passwd

显示文本中6和8的内容

awk -F ":" 'NR==6||NR==8{print}' /etc/passwd

抓取ip地址

ifconfig eth0 |awk 'NR==2{print $2}'


猜你喜欢

转载自blog.csdn.net/u010489158/article/details/80778266