第二周词频统计

作业的要求参见https://edu.cnblogs.com/campus/nenu/2018fall/homework/2126

代码地址https://git.coding.net/xucs/cptj.git

 

 功能一

实现小文件输入,先用open打开文件后,将字符替换成空格,大写字母转化为小写字母,然后将文本转化为列表。进行词频统计后排序输出

name = raw_input('enter the novel:')
file = open(name)
novel = file.read()

然后将字符替换成空格,大写字母转化为小写字母

 for ch in ['~','!','@','#', '$','^','&','*',':','(',')','_','+','=','[',']','"','{','}',',','.','?',';','|','/']:
        novel = article.replace(ch, ' ')
        exchange = novel.lower()

然后将文本转化为列表。进行词频统计后排序

list = exchange.split()
xs = {}
for i in list:
    count = list.count(i)
    xs[i] = count
xs1 = sorted(xs.items(), key=lambda d: d[1], reverse=True)

结果如下:

功能二

配置Python运行的环境变量后在cmd输入Python后空格再输入文件名即可

功能三

 先调用三个模块

import os
import os.path
import glob

然后读取目录下的txt文件

elif path1 != '':
    os.chdir(path1)
    files = glob.glob('*.txt')
    for file in files:
        # name = os.path.basename(file)
        # path2 = os.path.abspath(name)
        novel = open(file)
        novel = novel.read()

运行之后没有结果,我没能实现这个功能。

功能四

从控制台输入英文单篇作品

当从article输入是使用功能四。

article = raw_input('enter the article:')
if article != '':
    for ch in ['~','!','@','#', '$','^','&','*',':','(',')','_','+','=','[',']','"','{','}',',','.','?',';','|','/']:
        novel = article.replace(ch, ' ')
        exchange = novel.lower()

 

 psp表格

Psp阶段

估计时间

实际时间

时间差原因

实现功能一

120分钟

207分钟

符号替换失误

实现功能二

20分钟

413分钟

不会命令行

实现功能三

100分钟

未能实现

 不会读取文件

实现功能四

20min

259min

编译错误

原文地址:https://www.cnblogs.com/xvcs/p/9696815.html