linux之awk命令

awk是一个非常棒的数据处理工具。相比于sed常常作用于一整行的处理，awk则比较倾向于将一行分成数个“字段”来处理。因此，awk 相当适合处理小型的数据处理。awk通常运行模式是这样的：

[root@www ~]# awk '条件类型1{动作1} 条件类型2{动作2} 。。。' filename

awk 后面接两个单引号并加上大括号来设置想要对数据进行的处理动作。awk 可以处理后续接的文件，也可以读取来自签个命令的standardoutput。但如前面所说的，awk主要是处理每一行的字段内的数据，而默认的字段的分隔符为空格键或[tab]键。举例来说，我们用 last 可以将登陆者的数据取出来，但我只想要取出账号与登录者的IP，且账号和IP之间以[tab]隔开

[root@www ~]# last -n 5 | awk '{print $1 "\t" $3}'        <==可先用last -n 5 查看登录者数据，再进行操作

root    192.168.1.100

root    192.168.1.100

root    192.168.1.100

dmtsai    192.168.1.100

root    Fri

上面是 awk 最常使用的动作。通过print 的功能将字段数据列出来！字段的分隔以空格或[tab] 隔开。第5行数据有点奇怪；这是因为数据格式的问题。所以使用awk的时候，请先确认一下你的数据，如果是连续性的数据，请不要有空格或[tab] 在内，否则就会像上面那样，发生误判。

另外，在每一行的每个字段都是有变量名称的，那就是$1,$2等变量名称。以上面的例子来说，root就是$1，因为它是第一列，至于192.168.1.100 是第三列，所以它就是 $3，后面以次类推。还有个变量$0，$0代表一整行数据的意思。

由此，上面5行当中，整个的awk处理流程是：

1.读入第一行，并将第一行数据填入$0，$1，$2等变量中；

2.依据条件类型的限制，判断是否需要进行后面的动作；

3.做完所有动作与条件类型；

4.若还有后续的“行”的数据，则重复上面1~3 的步骤，直到所有的数据都读完为止。

经过这样的步骤，你会晓得，awk 是以行为一次处理的单位，而以字段为最小的处理单位。那么awk 又怎么知道整个数据到底有几行和几列？这就需要 awk 的内置变量的帮忙了

NF：    每一行($0) 拥有的字段总数

NR：    目前awk 所处理的是 “第几行”数据

FS：    目前的分隔符，默认是空格

(责任编辑：IT)

搜索

热门标签:

linux之awk命令