第六章

这一章主要讲了程序驱动统计单词个数。

统计一个文件中某个字符串的个数，其实就能当成是在一块沙地里面找石头，有人看到石头以后，在上面做标记grep，然后记住做过多少个标记；有人看到石头以后，把它挖（tr），最后统计自己挖多少石头；有人看到石头以后，把它跳过去（awk），然后统计自己跳多少次。

[root@bzhou test]# cat file
hafsdha
hahafsdfsdhaha
haha

假如我想匹配的是‘haha’这个字符串
1.grep的-o选项

最开始的时候是用-c这个选项，不过-c只能统计一行的，如果一行里面有多个匹配的字符串，那-c就无能为力了。
这个是正确的

[root@bzhou test]# grep -o 'haha' file | wc -l
3
[root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file

-v 去设定一个变量的值，RS是记录的分隔符，默认的是新行( )，就是说awk按照一行一行读数据，但是现在RS为'haha'后，就按'haha'读数据了，NR为已读的记录数，n个记录是被n-1个分隔符分开的，所以就是NR了。
严格意义说，tr匹配不了字符串，只能去匹配单个字符。这里就匹配这个文件中‘h’的个数。

[root@bzhou test]# tr -cd 'h' <file | wc -c
8
[root@bzhou test]# grep -o 'h' file | wc -l
8

-d可以删除某个字符，如果只有-d就会输出删除特定字符后的字符串，但是-c可以反显，这就是显示被删除的字符。然后用wc -c去统计下字符的个数。