当前位置: > Linux命令 >

awk print实例入门教程

时间:2015-05-02 01:29来源:linux.it.net.cn 作者:IT
有关awk print语句的用法,介绍了awk语法,awk的默认行为,awk打印匹配的行,awk仅打印指定的域,awk开始和最后的动作等内容。

awk通常被用来进行格式扫描和处理。

通过扫描一个或多个文件中的行,查看是否匹配指定的正则表达式,并执行相关的操作。

awk主要特性:
1、Awk以记录和字段的方式来查看文本文件
2、和其他编程语言一样,Awk 包含变量、条件和循环
3、Awk能够进行运算和字符串操作
4、Awk能够生成格式化的报表数据

Awk从一个文件或者标准输入中读取数据,并输出结果到标准输出中。

1.  Awk的语法
Syntax:    
    
awk '/search pattern1/ {Actions}    
     /search pattern2/ {Actions}' file    
 
在上述语法中:
1、search pattern是正则表达式
2、Actions 输出的语法
3、在Awk 中可以存在多个正则表达式和多个输出定义
4、file 输入文件名
5、单引号的作用是包裹起来防止shell 截断

2.  Awk的工作方式:

1) Awk 一次读取文件中的一行

2)对于一行,按照给定的正则表达式的顺序进行匹配,如果匹配则执行对应的 Action

3)如果没有匹配上则不执行任何动作

4)在上诉的语法中, Search Pattern 和 Action 是可选的,但是必须提供其中一个

5)如果 Search Pattern 未提供,则对所有的输入行执行 Action 操作

6)如果 Action 未提供,则默认打印出该行的数据

7) {} 这种 Action 不做任何事情,和未提供的 Action 的工作方式不一样

8) Action 中的语句应该使用分号分隔

创建一个包含下面内容的文本文件employee.txt 。

文件内容:
 

$cat employee.txt    
100  Thomas  Manager    Sales       $5,000    
200  Jason   Developer  Technology  $5,500    
300  Sanjay  Sysadmin   Technology  $7,000    
400  Nisha   Manager    Marketing   $9,500    
500  Randy   DBA        Technology  $6,000    
 

 
3、awk 的默认行为
默认awk 打印文件中的每一行:
 

$ awk '{print;}' employee.txt    
100  Thomas  Manager    Sales       $5,000    
200  Jason   Developer  Technology  $5,500    
300  Sanjay  Sysadmin   Technology  $7,000    
400  Nisha   Manager    Marketing   $9,500    
500  Randy   DBA      Technology  $6,000   

以上例子中,匹配的正则表达式未给出,因此后续的Action 适用所有的行, Action 中的 print 没有任何参数的情况下将打印整行,注意其中的 Action 必须使用 {} 括起来。

4、awk打印匹配的行
 

 
$ awk '/Thomas/    
> /Nisha/' employee.txt    
100  Thomas  Manager    Sales       $5,000    
400  Nisha   Manager    Marketing   $9,500   

 
将打印包含Thomas 和 Nisha 的行,上面的列子包含两个正则表达式。 Awk 可以接受任意数量的正则表达式,但是每个组合 ( 正则表达式和对应的 Action) 必须用新行来分隔。

5、awk仅打印指定的域

Awk包含许多内建的变量,对于每行的记录, Awk 默认按照空格进行分割,并将分隔后的值存入对应的 $n 变量中。如果一行还有 4 个单词,将被分别存储进 $1 $2 $3 $4 中,其中 $0 代表整行。 NF 也是一个内建的变量,代表该行中分割后的变量数。
 

 
$ awk '{print $2,$5;}' employee.txt    
Thomas $5,000    
Jason $5,500    
Sanjay $7,000    
Nisha $9,500    
Randy $6,000    
$ awk '{print $2,$NF;}' employee.txt    
Thomas $5,000    
Jason $5,500    
Sanjay $7,000    
Nisha $9,500    
Randy $6,000   
 

 
$2 和 $5 分别代表名字和薪水,也可以使用 $NF 获得薪水,其中 $NF 代表最后一个字段,在打印语句中逗号是一个连接符号。

6、awk开始和最后的动作

Awk包含两个重要的关键字 BEGIN 和 END
 

Syntax:     
    
BEGIN { Actions}    
{ACTION} # Action for everyline in a file    
END { Actions }    
# Awk中的注释    
 

 
在BEGIN 节中的 Actions 会在读取文件中的行之前被执行。

而END 节中的 Actions 会在读取并处理文件中的所有行后被执行。

例子:
 

$ awk 'BEGIN {print "Name/tDesignation/tDepartment/tSalary";}    
> {print $2,"/t",$3,"/t",$4,"/t",$NF;}    
> END{print "Report Generated/n--------------";    
> }' employee.txt    
Name Designation Department Salary    
Thomas   Manager   Sales           $5,000    
Jason   Developer   Technology   $5,500    
Sanjay   Sysadmin   Technology   $7,000    
Nisha   Manager   Marketing   $9,500    
Randy   DBA     Technology   $6,000    
Report Generated    
--------------    
 

输出结果增加头和尾描述

7、Awk找出员工 ID 大于 200 的员工
 

 
$ awk '$1 >200' employee.txt    
300  Sanjay  Sysadmin   Technology  $7,000    
400  Nisha   Manager    Marketing   $9,500    
500  Randy   DBA        Technology  $6,000    
 

$1 代表员工 ID ,如果员工 ID 大于 200 则执行默认的打印整行的 Action 。

8、awk打印技术部员工

$4代表员工所在的部门,如果等于 Technology 则打印出整行
 

 
$ awk '$4 ~/Technology/' employee.txt    
200  Jason   Developer  Technology  $5,500    
300  Sanjay  Sysadmin   Technology  $7,000    
500  Randy   DBA      Technology  $6,000 

~操作符是和正则表达式中的值进行比较,如果匹配则打印整行

9、awk打印技术部门的员工数
检查员工的部门是否是Technology,如果是则递增 count 变量的值。
Count 变量的值在BEGIN 的 Actions 中被初始化为 0 。
 

 
$ awk 'BEGIN { count=0;}    
$4 ~ /Technology/ { count++; }    
END { print "Number of employees in Technology Dept =",count;}' employee.txt    
Number of employees in Tehcnology Dept = 3  

在处理的最后(END 的 Actions) ,仅仅打印出 Technology 部门的人数。

(责任编辑:IT)
------分隔线----------------------------
栏目列表
推荐内容