12月11日总结观影数据集之大数据分析what

 5.2.1 电影类型:定义一个集合,获取所有的电影类型

注意到集合中存在多余的元素:空的单引号,所以需要去除。

genre = set()
for i in df['genres'].str.split(','): # 去掉字符串之间的分隔符,得到单个电影类型
   
genre = set().union(i,genre)    # 集合求并集
   
# genre.update(i) #或者使用update方法
genre.discard('') # 去除多余

5.2.1.1 电影类型数量(绘制条形图)

5.2.1.2 电影类型占比(饼图)

5.2.1.3 电影类型变化趋势(折线图)

5.2.2 电影关键词,云词图

 

 

原文地址:https://www.cnblogs.com/lkwkk/p/15677205.html