使用jieba库与wordcloud库第三方库进行词频统计

一、jieba库与wordcloud库的使用

1.jieba库与wordcloud库的介绍

  jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。

  wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。

2.安装jieba库与wordcloud库

  在运行里输入 pip install wordcloud和pip install jieba,等待安装完成。

二、jieba函数介绍

三、调用库函数

from wordcloud import WordCloud
with open("斗破苍穹.txt" ,encoding="utf-8")as file:
    #1.读取文本内容
    text=file.read()
    #2.设置词云的背景颜色、宽高、字数
    wordcloud=WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",
    background_color="black",width=600,
    height=300,max_words=50).generate(text)
    #3.生成图片
    image=wordcloud.to_image()
    #4.显示图片
    image.show()
原文地址:https://www.cnblogs.com/loverboy88/p/10652357.html