分析文件中频率出现最多的前十个词

当想到要做这个小程序的时候,分了下步骤:
1.读取文件到内存
2.计算各个词出现的频率
3.找出频率前十名的单词
读取文件主要靠文件流读取,这样第一步便完成了。
建立一维数组记录字母出现的频数,其中数组下标与单词的首字母的ASII代码相关联。例如在A[0]中,首字母为A的单词,在读取后,通过建立一个结构体,插入到A[0]后,其中数据域存储个数与单词。
在读取的过程中,依次按照单词给所对应的数据域累加。这样便能计算出各个单词出现的频数。
通过循环遍历出最大值的对应的数组的下标,记录下来,赋值为零的方式找到前十名的字母。
2014 3月2日8点半到10点半。

原文地址:https://www.cnblogs.com/liyanzhui/p/3577751.html