从文件中统计中文词语出现的频次

 1 import jieba
 2 
 3 with open('红楼梦.txt', 'r', encoding='utf-8') as f:
 4     txt = f.read()
 5 
 6 ls = jieba.lcut(txt)
 7 d = {}
 8 for w in ls:
 9     d[w] = d.get(w, 0) + 1
10 
11 for k in d:
12     if d[k] >= 200 and len(k) >= 2:
13         print(f'"{k}"出现了"{d[k]}"次')

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/waterr/p/14801163.html

推荐文章
ArcGIS Server 10.1发布结果地图服务——与10.0的区别及过程
IDAPro学习
Pwn学习——格式化字符串漏洞之基本知识
BUUCTF FindKey
Window学习——内核对象(一)
Windows学习——进程(一)
[GUET-CTF2019]number_game
[HDCTF2019]Maze
wdb2020 signed
babyheap_0ctf_2017——堆入门1
BUUCTF CrackMe
thinkpad的break键的实现
windows 消除文件名中的快捷方式
Python 3 智能发音
Python 3.3.3 使用requests模拟登录网站
Windows 为右键菜单瘦身
Scheme call/cc 研究
[文摘]Quick Start to Client side COM and Python
Eric5 for Python 3.3.3安装指南
PAT甲级——A1134 Vertex Cover【25】
PAT甲级——A1133 Splitting A Linked List【25】
PAT甲级——A1132 Cut Integer
PAT甲级——A1131 Subway Map【30】
PAT甲级——A1130 Infix Expression【25】
PAT甲级——A1129 Recommendation System【25】
PAT甲级——A1128 N Queens Puzzle【20】
PAT甲级——A1127 ZigZagging on a Tree【30】
PAT甲级——A1126 Eulerian Path【30】
PAT甲级——A1125 Chain the Ropes【25】
集合的一个小发现