awk 多文件操作代码实例

awk命令进行多文件操作的例子，通过外部命令合并文件，然后通过排序与awk合并文件，awk文件合并实例详解，需要的朋友参考下。

将2个有关联文本文件进行合并处理，分别从不同文件获取需要的列，然后，整体输出到一起。

awk进行多文件处理时，会有两个问题：
一是，合并多个文件为一个文件。
二是，将多行合并为一行显示。

实例文本：

复制代码代码示例:

	[chengmo@centos5 shell]$ awk 'FNR==1{print "\r\n"FILENAME}{print $0}' a.txt b.txt            

	a.txt

	100     wang    man

	200 wangsan woman

	300 wangming man

	400 wangzheng man

	b.txt

	100 90 80

	200 80 70

	300 60 50

	400 70 20

合并后结果：
100     wang    man 90 80
200 wangsan woman 80    70
300 wangming man 60     50
400 wangzheng man 70    20

awk多文件操作方法一：

实现思路：
通过外部命令合并文件，然后通过排序，然后通过awk进行合并操作。

首先：

复制代码代码示例:

	[chengmo@centos5 shell]$ cat a.txt b.txt | sort -n -k1 |awk '{print}'

90 80

	100     wang    man

80 70

wangsan woman

60 50

wangming man

70 20

wangzheng man

把第一列相同的处理合并到一行，这里需要用“next”语句。

继续：

复制代码代码示例:

	[chengmo@centos5 shell]$  cat a.txt b.txt | sort -n -k1 |awk  'NR%2==1{fd1=$2"\t"$3;next}{print $0"\t"fd1}'    

	100     wang    man     90      80

	200 wangsan woman       80      70

	300 wangming man        60      50

	400 wangzheng man       70      20

需要把几行合并，经常用到方法是：NR%num 然后将行值保存下来，next该行。在输出时候打印出来。

awk多文件操作方法二

实现思路：
不借助第3放工具打开，直接通过awk 打开多个文件。

通过：FILENAME获得当前处理文件名。

NR总记录 FNR当前文件记录，以及ARGC传入参数总数，ARGV是数组，各个参数值。

实例：

复制代码代码示例:

	[chengmo@centos5 shell]$ awk 'BEGIN{print ARGC,ARGV[0],ARGV[1],ARGV[2]}{print FILENAME,NR,FNR,$0}' a.txt b.txt                       

	3 awk a.txt b.txt

	a.txt 1 1 100   wang    man

	a.txt 2 2 200 wangsan woman

	a.txt 3 3 300 wangming man

	a.txt 4 4 400 wangzheng man

	b.txt 5 1 100 90 80

	b.txt 6 2 200 80 70

	b.txt 7 3 300 60 50

	b.txt 8 4 400 70 20

代码：

复制代码代码示例:

	[chengmo@centos5 shell]$ awk '

	BEGIN{

	if(ARGC<3)

	{

	  exit 1;

	} 

	file="";

	}

	{

	aData[FILENAME,$1]=ARGV[1]==FILENAME?$0:$2"\t"$3;

	}

	END{

	for(k in aData)

	{

	    split(k,idx,SUBSEP); 

	    if(idx[1]==ARGV[1] && (ARGV[2],idx[2]) in aData)

	    {

	        print aData[ARGV[1],idx[2]],aData[ARGV[2],idx[2]] | "sort -n -k1";

	    }

	}

	}' a.txt b.txt

	100     wang    man 90  80

	200 wangsan woman 80    70

	300 wangming man 60     50

	400 wangzheng man 70    20

代码说明：
这里用到2维数组，aData[文件名,关联列对应值]，这种方法可以将多个文件内容。
放入一个统一二维数组。
然后，循环数组，通过if((i,j} in array) 查找对应列值，在其它文件中是否存在。

以上是2种实现方法，其中第一种思路较为简单。
第二种处理起来较为复杂。

(责任编辑：IT)

搜索

热门标签:

awk 多文件操作代码实例