文本处理工具 -wc、cut、sort、uniq的用法及参数

文本处理工具 -wc,cut,sort,uniq
  wc:word count 统计文本文件中的字符个数
    用法:wc filename
    行数 字符个数 文件大小(字节) 文件名
    -l 行数
    -w 字符个数
    -c 文件大小(字节)

  cut:用来做文件分割
    默认使用 空格 做文件分隔
    -d 指定分隔符(delimiter)
    -d[ :] //不可以这样写,cut的局限性:1、-d指定分隔符,不能同时指定多个。2、不能做高级的格式化输出,所以需要熟练的掌握awk
    -f 指定提取那一列
    -f1 输出第一列
    -f1-3 输出1到3列
    -f1,3 输出第一列和第三列
    --output-delimiter=‘xx’ 将输出的分隔符,替换为自己想用的分隔符

  sort:排序,根据ASCLL码排序
    -n 按数字大小排序
    -r 逆序
    -f 忽略字符大小写
    -t 指定分隔符
    -k 指定第几段进行排序
    -u 排序去重复

 

  uniq:去重,连续且重复的命令才视为重复

    建议先排序后去重
    -d 显示重复的行
    -c 统计某些字符重复的次数
    sort FINENAME | uniq -c

原文地址:https://www.cnblogs.com/4443056bdH/p/11348487.html