NLTK的基本使用

NLTK词频统计（Frequency）

import nltk
tokens=[ 'my','dog','has','flea','problems','help','please',
         'maybe','not','take','him','to','dog','park','stupid',
         'my','dalmation','is','so','cute','I','love','him'  ]
#统计词频
freq = nltk.FreqDist(tokens)
 
#输出词和相应的频率
for key,val in freq.items():
    print (str(key) + ':' + str(val))
 
#可以把最常用的5个单词拿出来
standard_freq=freq.most_common(5)
print(standard_freq)

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/yongyuandishen/p/14908731.html

推荐文章
sql注入总结
南邮ctf writeup
哈希表相关题目-python
堆的相关题目—滑动窗口
二分查找（二）
二分查找
什么时候用BFS，什么时候用DFS
幂方
逻辑覆盖
元类
什么时候用多线程什么时候用多进程呢？GUL
Python标准异常
VS挂EXE调试代码
关于openal报错找不到采集或播放设备
pcm混音的一种方式
关于交叉编译工具链的一些问题
pcm音频的格式类型
关于window PC机的预定义宏win32
iOS硬解码获取宽高
声明，定义初始化
PCM存储格式 Intel 和 Motorola
shell 命令行
机器学习 | 算法笔记- 集成学习（Ensemble Learning）
基于深度学习的目标检测综述
机器学习 | 算法笔记- 逻辑斯蒂回归（Logistic Regression）
机器学习 | 算法笔记- 朴素贝叶斯（Naive Bayesian）
机器学习 | 算法笔记- 支持向量机（Support Vector Machine）
机器学习 | 算法笔记- k近邻（KNN）
机器学习 | 算法笔记- 决策树（Decision Tree）
机器学习 | 算法笔记- 线性回归（Linear Regression）