linux 通过md5查找重复文件

代码如下：

md5sum *|sort  |uniq -w32  -D|awk -F ' ' '{print $2}'

　uniq          部分参数　

-c             #在每行前显示该行重复次数。
-d             #只输出重复的行。
-D             #只输出重复的行，有几行输出几行。
-f             #-f 忽略的段数，-f 1 忽略第一段。
-i             #不区分大小写。
-w             #忽略第n个字符以后的内容 。
-s             #-s 5忽略后面5个字符

md5sum * 先查看所有文件的md5值，重复的文件的md5值相同。

uniq 处理时是处理相邻两行，所以需要先排序。

因为处理完后会显示md5值影响观看，可以通过 awk 命令显示文件名

awk -F ' ' '{print $2}'        #-F指定分隔符，{print $2}指定第几列