文本处理器 wc cut sort uniq

wc 

  word count统计文本文件中的字符个数

  用法: wc filename

  行数  字符个数  文件大小 (字节)  文件名

  -l

  -w

  -c

cut 

  用来做文件分隔

  -d   指定分隔符(delimiter)

    -d[ :]不行

  -f  指定输出的列数据:

    -f2

    -f1-3

    -f1,3

  --output-delimiter='xx'

  [cut的局限性:1、-d指定分隔符,不能同时指定多个2、不能做高级的格式化输出;所以我要熟练掌握awk]

sort

  排序,默认查看第一个字符(包括数字字母以及空格和特殊字符),以ASCII码来排序(大小写不是)

  -f 忽略大小写的差异, 例如A与a视为编码相同;
  -b忽略最前面的空格符部分;
  -M以月份的名字来排序,例如JAN DEC等等的排序方法;
  -n使用纯数字进行排序,默认是以文件形态来排序的;
  -r反向排序;
  -u就是uniq,相同的数据中,仅出现一行代表;
  -t分隔符,默认是用tab键分割;
  -k以那个区间(field)来进行排序的意思

uniq

  连续且相同的命令,才被视为重复

  建议,先排序,后去重

tar 归档-》 对目录

  -c统计某些字符重复次数(重要)

  sort filename | uniq -c

原文地址:https://www.cnblogs.com/yjkyjk/p/11344166.html