大数据竞赛练习题三

5 筛选数据

使用数据分析师最喜欢的一个语法:

 

票房、预算、受欢迎程度、评分为____0___的数据应该去除;

评分人数过低的电影,评分不具有统计意义,筛选评分人数大于___50__的数据。

 

此时剩余____2961__条数据,包含____19__个字段。

6 json 数据转换

**说明:**genres,keywords,production_companies,production_countries,cast,crew 6 列都是

json 数据,需要处理为列表进行分析。

处理方法:

json 本身为字符串类型,先转换为字典列表,再将字典列表转换为,以’,'分割的字符串4

 

7 数据备份

 

原文地址:https://www.cnblogs.com/D10304/p/15695762.html