开课吧--Python数据分析--第8节 搭上时间分析的飞剑--互动练习:销售额的华山论剑

题目要求
现在我们有一份某电商超市从2016年到2019年的部分销售数据,路径为:/data/course_data/data_analysis/Commerce.xls 我们的字段有订单 ID,客户对象,订单日期,邮寄方式,地区,地区经理,销售额,数量,退回,折扣等,在这些字段下面,一共有近一万条数据。
题目讲解
请根据数据完成下面的需求: 1. 分别算出2016年到2019年,每年5月份的总销售额。 2. 2018年各地区的5月份的总销售额对比。

书写代码

import pandas as pd

df = pd.read_excel('/data/course_data/data_analysis/Commerce.xls')

# 读取数据
df.set_index('订单日期',inplace=True)

# 将"订单日期"设为行索引

# 1. 分别算出2016年到2019年,每年5月份的总销售额
sales16 = df['2016-5']['销售额'].sum()
sales17 = df['2017-5']['销售额'].sum()
sales18 = df['2018-5']['销售额'].sum()
sales19 = df['2019-5']['销售额'].sum()

# 2. 2018年各地区的5月份的总销售额对比
sales2018 = df['2018-5']

# 筛选2018年5月份数据

groups = sales2018.groupby('地区')

# 按"地区分组"

groups['销售额'].sum()

# 计算各地区总销售额

for group_name,group_df in groups:
  print(group_name,group_df['销售额'].sum())

# 第二种计算方法

原文地址:https://www.cnblogs.com/lao4/p/13670096.html