当前位置: > Linux命令 >

linux命令:grep,sort,find,uniq用法详解(2)

时间:2015-05-02 00:45来源:linux.it.net.cn 作者:IT


2、命令:sort命令
sort命令可以用来对文件的内容进行排序。
sort认为文件的每一行由一个个由空格(可以用-t选项指定其他分隔符)分隔的field组成的。
Sort可将许多不同的域按不同的列顺序分类
sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出
格式:
sort –cmu –o out-putfile [other options] *pos1 *pos2 input-files
选项:
-c
测试文件是否已经分类,如果乱序,则输出第一个乱序的行的相关信息,最后返回1.若非乱序,无输出,返回0
-m
合并两个分类文件
-u
删除所有重复行
-o
存储sort结果的输出文件名
【sort默认是把结果输出到标准输出,所以需要用重定向才能将结果写入文件,但是如果你想把排序结果输出到原文件中,用重定向不可使用.-o就可以解决这个问题】
-t
域分隔符;默认 空格,tab,可定义
用-t选项指定关键字。
它的格式是POS1[,POS2]
POS1指定关键字开始的列,POS2指定关键字结束的列,如果没有POS2,则从POS1到行末都是关键字。
其中POS的格式是F[.C][OPTS],F[.C][OPTS]。F指定第几个field(从1开始数),C指定这个field里的第几个字符(也是从1开始数)。
-b
使用域进行分类时,忽略首个空格【会忽略每一行前面的所有空白部分,从第一个可见字符开始比较】
-n
指定分类是域上数字分类【默认使用字符排序的,若是要数字,使用-n】
-r
对分类次序或比较求逆【默认是升序】
–kn
按照第n个域进行排序
【sort [-t delimiter][+filed[column]] [option]】
【常用组合 –t ‘分隔符’ -kn】
-k选项的语法格式,如下:
[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]
逗号(“,”)分为Start部分和End部分
如果不设定End部分,那么就认为End被设定为行尾
Modifier部分类似n和r的选项部分。

FStart.CStart,其中FStart就是表示使用的域,而CStart则表示在FStart域中从第几个字符开始算“排序首字符”, CStart可以省略的,省略的话就表示从本域的开头部分开始。
同理,在End部分中,你可以设定FEnd.CEnd,如果你省略.CEnd,则表示结尾到“域尾”,即本域的最后一个字符。或者,如果你将CEnd设定为0(零),也是表示结尾到“域尾”。

例子,sort命令的用法:
1、保存输出
 

$sort –o result sortfile
$sort sortfile > result
 

Sort的启动方式,sort认为一空格/多空格为分隔符,要加入其他的,必须使用-t,执行时,先查看-t,若是有,使用其进行分割,若是无,使用空格

2、查看文件是否已排序
 

$sort –c sortfile
若未排序,输出信息  $?=1
若已排序,无信息输出$?=0

3、使用其他分隔符
 

$sort –t  : sortfile

4、排完序后求逆
 

$sort –t : -r sortfile

5、唯一分类,原文件中重复行去除
 

$sort –u sortfile

6、指定分类域,1开始
 

$sort –t : -k 4 sortfile    【第四个域开始】
$sort –t : -k 4 –k 1 sortfile
 

【sort分隔符+ -k指定列  完成根据某列进行排序】

7、指定sort序列
 

$sort +0 -2 +3 sortfile

8、将两个分类文件合并
 

$sort –m sorted-file1 sorted_file2


【将两个已排序文件整合,类似合并排序的后半部分】
具体示例:

9、对以下文件进行排序
 

153 6
314 5
222 4
114 3
sort -k 1.1,1.2 sort.test
指定了按开始的两列进行排序,即比较"15","31","22","11"来排序
结果:
114 3
153 6
222 4
314 5
sort -k 1.3,2.1 sort.test
指定了通过比较"3 6","4 5", "2 4", "4 3"(注意其中的空格)来排序
结果:
222 4
153 6
114 3
314 5
sort -k 1.3,1.3 sort.test
指定只按第3列来排序,则因为第2和第4行都 是"4",它们相同,则会再比较一下整行
[如果关键字相同,则sort会把整行再比较一次]
222 4
153 6
114 3
314 5


(责任编辑:IT)
------分隔线----------------------------
栏目列表
推荐内容