B站14天数据分析笔记5次课作业

(1)读取数据。读取之前作业保存的“酒店数据1.xlsx”

请添加图片描述

(2)将“类型”和“名字”设置为层次化索引,并交换索引的位置。然后将层次化索引取消

请添加图片描述

(3)将数据集转置,获取转制后的index和columns。

请添加图片描述

(4)用Groupby方法来计算每个地区的评分人数的总和以及均值。请添加图片描述

(5)用Grouby方法计算每个类型的平均价格,最高价和最低价。

请添加图片描述

(6)数据离散化,按照价格将酒店分为3个等级,0-500为C,500-1000为B,大于1000为A,列名设置为“价格等级”。

请添加图片描述

(7)获取评分均值最高和最低的地区的数据,分别使用append和concat方法将获取的两个数据集合并。

请添加图片描述

(8)数据离散化,按照评分人数将酒店平均分为3个等级,三个等级的酒店数量尽量保持一致。评分人数最多的为A,最少的为C。列名设置为“热门等级”。

请添加图片描述

(9)选出评分人数为A,价格也为A的酒店数据,计算其平均评分。

请添加图片描述

(10)取价格最高的5个酒店的数据,使用stack和unstack方法实现dataframe和Series之间的转换。

请添加图片描述

(11)纵向拆分数据集,分为df1和df2,df1包含名字,类型,城市,地区,df2包含名字,地点,评分,评分人数,价格,价格等级,热门等级。

请添加图片描述

(12)将df2按照价格进行排序,重新设置df2的索引。索引值等于价格排名。

请添加图片描述

(13)使用merge方法将df1和df2合并。

请添加图片描述

原文地址:https://www.cnblogs.com/most-silence/p/15495352.html