Linux之文件过滤分割与合并

  1 文件过滤分割与合并
  2 1、grep命令
  3     grep（global regular expression print）全面搜索正则表达式并把行打印出来，是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。
  4 
  5     -a 不要忽略二进制数据。
  6     -A<显示列数> 除了显示符合范本样式的那一行之外，并显示该行之后的内容。
  7     -b 在显示符合范本的数据之外，并显示该行之前的内容。
  8     -c 计算符合范本样式的列数。
  9     -C<显示列数> 除了显示符合范本样式的那一列之外，并显示该列之前后的内容。
 10     -d<进行动作> 当指定要查找的是目录而非文件时，必须使用这参数，否则grep命令将回报信息并停止动作。
 11     -e<范本样式> 指定字符串作为查找文件内容的范本样式。
 12     -E 能使用扩展正则表达式
 13     -f<范本文件> 指定范本文件，其内容有一个或多个范本样式，让grep查找符合范本条件的文件内容，格式为每一列的范本样式。
 14     -F 将范本样式视为固定的字符串列表。
 15     -G 将范本样式视为普通的表示法来使用。
 16     -h 在显示符合范本样式的那一列之前，不标示该列所属的文件名称。
 17     -H 在显示符合范本样式的那一列之前，标示该列的文件名称。
 18     -i 忽略大小写的差别。
 19     -l 列出文件内容符合指定的范本样式的文件名称。
 20     -L 列出文件内容不符合指定的范本样式的文件名称。
 21     -n 在显示符合范本样式的那一列之前，标示出该列的编号。
 22     -q 不显示任何信息。
 23     -R/-r 此参数的效果和指定“-d resource”参数相同。
 24     -s 不显示错误信息。
 25     -v 反转查找。
 26     -w 只显示全字符合的列。
 27     -x 只显示全列符合的列。
 28     -y 此参数和 -i效果相同。
 29     -o 只输出文件中匹配到的部分。
 30 
 31 
 32 grep命令的常见用法
 33     在文件中搜索一个单词，命令会返回一个包含“match_pattern”的文本行：
 34     grep match_pattern file_name
 35     grep "match_pattern" file_name
 36 
 37     在多个文件中查找
 38     grep match_pattern file_name1 file_name2
 39 
 40     输出除匹配到的所有行之外的 -v选项
 41     grep -v match_pattern file_name
 42 
 43     标记匹配颜色选项
 44     grep match_pattern file_name --color=auto
 45 
 46     使用正则表达式-E选项：
 47     grep -E "[1-9]+"
 48 
 49     只输出文件中匹配到的部分 -o选项
 50     echo this is a test line. | grep -o -E "[a-z]+.
 51     echo this is a test line. | egrep -o -E "[a-z]+.
 52 
 53     统计文件或者文本中包含匹配字符串的行数-c选项
 54     grep -c "match_pattern" file_name
 55 
 56     输出包含字符串的行数-n选项
 57     grep “text” -n filename    或 cat file_name | grep "text" -n
 58 
 59     打印样式匹配所位于的字符或者字节偏移
 60     echo gun is not unix | grep -o -b "not"
 61 
 62     搜索多个文件并查找匹配文本在哪些文件中：
 63     grep -l "text" file1 file2 file3……
 64 
 65     在多级目录中对文本进行递归搜索：
 66     grep “text” . -r -n
 67 
 68     忽略匹配样式中的字符的大小写
 69     echo hello world | grep -i "hello"
 70 
 71     选项 -e 制动多个匹配样式：
 72     echo this is a text line | grep -e "is" -e "line" -o
 73 
 74     在grep搜索结果中包括或者排除指定文件：
 75     //只在目录中搜索所有的.php和.html文件中递归搜索字符“main()”
 76     grep "main()" . -r --include *.{php,html}
 77 
 78     grep静默输出
 79     grep -q “test” filename
 80 
 81     打印出匹配文本之前或者之后的行；
 82     //显示匹配某个结果之后的3行，使用-A选项
 83     seq 10 | grep "5" -A 3
 84     //显示匹配某个结果之前的3行，使用-B选项
 85     seq 10 | grep "5" -B 3
 86     //显示匹配某个结果的前三行和后三行，使用-C选项
 87     seq 10 | grep "5" -C 3
 88     //如果匹配结果有多行，会用“--”作为各匹配结果之间的分隔符：
 89     echo -e "a
b
c
a
b
c" | grep a -A 1
 90 2、sort命令
 91     sort命令是在Linux中非常有用，它将文本尽心排序，并将排序结果标准输出。sort命令既可以从特定的文件，也可以从stdin中获取输入
 92 
 93 语法
 94     sort（选项）（参数）
 95 选项
 96     -b：忽略每行最前面的空格
 97     -c：检查文件是否按顺序排序
 98     -d：处理英文字母、数字及空格字符外，忽略其他的字符；
 99     -f：排序时将小写字母视为大写字母；
100     -m：将几个排序号的文件进行排序；
101     -n：按照数值的大小排序；
102     -o<输出文件>：将排序后的结果存入制定的文件；
103     -r：以相反的顺序来排序；
104 
105 参数
106     文件：指定待排序的文件列表
107 
108 实例
109     sort sort.txt
110     sort -u sort.txt    //忽略相同行
111     或者    uniq sort.txt
112 
113     将第二列按数字从小到大的排列
114     sort -nk 2 -t: sort.txt
115     将第三列按数字从大到小的顺序排列
116     sort -nrk 3 -t: sort.txt