202103226-1编程作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/zswxy/computer-science-class3-2018/homework/11879
这个作业要求在哪里 https://edu.cnblogs.com/campus/zswxy/computer-science-class3-2018/homework/11879
这个作业的目标 学会使用gitee并且完成词频统计编程
学号 20188463
其他参考文献 《构建之法》

gitee地址
https://gitee.com/zuoshuai1234/project-java
https://gitee.com/zuoshuai1234/project-java/commit/8dc9d3114598f875bd1a160613ae1f74147e5ce0

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 500 800
• Estimate • 估计这个任务需要多少时间 30 40
Development 开发
• Analysis • 需求分析 (包括学习新技术) 20 30
• Design Spec • 生成设计文档 30 40
• Design Review • 设计复审 20 30
• Coding Standard • 代码规范 (为目前的开发制定合适的规范) 30 40
• Design • 具体设计 30 40
• Coding • 具体编码 120 150
• Code Review • 代码复审 20 20
• Test • 测试(自我测试,修改代码,提交修改)
Reporting 报告
• Test Repor • 测试报告 30 40
• Size Measurement • 计算工作量
• Postmortem & Process Improvement Plan • 事后总结, 并提出过程改进计划
合计 300 370

1.统计文件的字符数(对应输出第一行):

只需要统计Ascii码,汉字不需考虑
空格,水平制表符,换行符,均算字符

2.统计文件的单词总数(对应输出第二行)

单词:至少以4个英文字母开头,跟上字母数字符号,单词以分隔符分割,不区分大小写。
英文字母: A-Z,a-z
字母数字符号:A-Z, a-z,0-9
分割符:空格,非字母数字符号

3.统计文件的有效行数(对应输出第三行)

任何包含非空白字符的行,都需要统计。

4.统计文件中各单词的出现次数(对应输出接下来10行)

最终只输出频率最高的10个。频率相同的单词,优先输出字典序靠前的单词。

设计与实现过程:

1.判断是否存在
2.进行排序
3.计算总单词数
4.得到每一个单词以及次数, 并且记录到Map集合中

运行结果




心路历程与收获

需要多多的敲代码,懂得东西还是太少了,需要努力的学习多汲取一些知识,对于作业要求看不太明白,和朋友一起请教了大佬,才能够有一些思路,希望以后的作业要求不要这么复杂,真的看得人头大。

原文地址:https://www.cnblogs.com/zuoshuai/p/14607883.html