文本处理器 wc cut sort uniq

　　word count统计文本文件中的字符个数

　　用法： wc filename

　　行数字符个数文件大小 (字节) 文件名

　　-l

　　-w

　　-c

cut

　　用来做文件分隔

　　-d 指定分隔符（delimiter）

　　　　-d[ :]不行

　　-f 指定输出的列数据:

　　　　-f2

　　　　-f1-3

　　　　-f1,3

　　--output-delimiter='xx'

　　[cut的局限性：1、-d指定分隔符，不能同时指定多个2、不能做高级的格式化输出；所以我要熟练掌握awk]

sort

　　排序，默认查看第一个字符（包括数字字母以及空格和特殊字符），以ASCII码来排序（大小写不是）

　　-f 忽略大小写的差异，例如A与a视为编码相同；
　　-b忽略最前面的空格符部分；
　　-M以月份的名字来排序，例如JAN DEC等等的排序方法；
　　-n使用纯数字进行排序，默认是以文件形态来排序的；
　　-r反向排序；
　　-u就是uniq，相同的数据中，仅出现一行代表；
　　-t分隔符，默认是用tab键分割；
　　-k以那个区间（field）来进行排序的意思

uniq

　　连续且相同的命令，才被视为重复

　　建议，先排序，后去重

tar 归档-》对目录

　　-c统计某些字符重复次数（重要）

　　sort filename | uniq -c