2021.12.9 观影大数据分析

一、今日学习内容

今天进行了对观影大数据的分析,对数据进行了数据清洗、数据分析,要求数据清洗要用大数据分析平台,数据分析用python

数据清洗

1、导入数据

2、缺失值处理

缺失记录仅___3___条,采取网上搜索,补全信息。

21补全release_date

缺失记录的电影标题为《_America Is Still the Place 》,日期为_2014-06-01__。

2、2补全runtime

3、重复值处理

运行结果:有__4803___个不重复的 id,可以认为没有重复数据。

原文地址:https://www.cnblogs.com/wmdww/p/15644069.html