201671010446-姚良 词频统计软件项目报告

gitub代码地址:https://github.com/qsy0723/yl5282

1.需求分析:

1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。

2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。

2.功能设计:

2.1 基本功能:

1.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。

2.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。

3.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

2.2 扩展功能:

将单词按字典顺序输出。

3.设计实现:

该程序通过java语言进行编译来实现词频统计,它的步骤是
1.存储过滤后单词的列表
2.过滤出只含有字母的
3.去除长度为0的行
4.存储单词计数信息
5.词频统计
6.按值进行排序

4.测试运行

5.部分代码


6.总结

在此次试验中,还是发现了自己的代码量不足,有些代码还需要通过上网借鉴前辈们的代码才能完成自己的作业,不能够独立完成,但是通过此次试验,我会多加练习代码,保证自己的代码量上去,只要代码量上去,就一定能都作出自己满意的作品。

7.PSP

PSP2.1 任务内容 计划共完成需要的时间(min) 实际完成需要的时间(min)
Planning 计划 5 5
Estimate 估计这个任务需要多少时间,并规划大致工作步骤 8 7
Development 开发 180 150
Analysis 需求分析 (包括学习新技术) 20 25
Design Spec 生成设计文档 10 20
Design Review 设计复审 (和同事审核设计文档) 30 20
Coding Standard 代码规范 (为目前的开发制定合适的规范) 20 15
Design 具体设计 15 40
Coding 具体编码 50 60
Code Review 代码复审 10 12
Test 测试(自我测试,修改代码,提交修改 5 10
Reporting 报告 20 15
Test Report 测试报告 15 10
Size Measurement 计算工作量 5 3
Postmortem & Process Improvement Plan 事后总结 ,并提出过程改进计划 20 10
原文地址:https://www.cnblogs.com/yl5282/p/10559123.html