awk 数组排序-- asort 与 asorti


两者排序区别:
asort 是对数组的值进行排序,并且会丢掉原先键值;
asorti是对数组的下标进行排序。

数据文件:
12 34
78 90
23 45

1. awk是关联数组。for…in循环输出时候,默认打印出来是无序数组。
[root@zhenjiang ~]# awk '{a[$1]=$2}END{for(i in a) print i,a[i]}' test 
78 90
12 34
23 45

2. asort排序输出
[root@zhenjiang ~]# awk '{a[$1]=$2}END{slen=asort(a,b);for(i=1;i<=slen;i++) print i" "a[i]" "b[i]}' test 
134
245
390
在最后执行命令,END中 asort对数组a的值进行排序,把排序后的下标存入新生成的数组b中,丢弃数组a下标值,再把数组a的长度赋值给变量slen。
b[1]=34
b[2]=45
b[3]=90
此时a已经是空数组。
数组的值是无法直接print(输出)的,使用for循环取出数值的下标,输出排序后的数组b下标值及对应数值


3. asorti 排序输出
[root@zhenjiang ~]# awk '{a[$1]=$2}END{slen=asorti(a,b);for(i=1;i<=slen;i++) print i" "b[i]" "a[b[i]]}' test 
112 34
223 45
378 90
在最后执行命令,END中 asorti对数组a的下标进行排序,并把排序后的下标存入新生成的数组b中,并把数组a的长度赋值给变量l。
b[1]=12
b[2]=23
b[3]=78
数组的值是无法直接print(输出)的,使用for循环取出数值的下标,输出排序后的数组b下标值及对应数值,再把数组b的值当作数组a的下标值打印数组a的值。


转自:http://blog.chinaunix.net/uid-21374062-id-3189744.html


一个统计文件大小并排序的脚本:

 ls -l |  gawk '{  if(NR!=1){array[$5]=$9;} }  END { n=asorti(array,dest); for(i=1;i<=n;i++) print dest[i],array[dest[i]];   } '
1040 test_uuid.py
241 test_fun.pyc
43 test_os.py
58 test_fun.py

原文地址:https://www.cnblogs.com/catkins/p/5270405.html