【数据分析&数据挖掘】相关性计算+数据分析流程

 1 import pandas as pd
 2 
 3 detail = pd.read_excel("../day05/meal_order_detail.xlsx")
 4 # print("detail: 
", detail)
 5 print("detail的列名称: 
", detail.columns)
 6 
 7 # corr
 8 print("相关系数为: 
", detail.loc[:, ["counts", "amounts"]].corr())
 9 print("spearman相关系数为: 
", detail.loc[:, ["counts", "amounts"]].corr(method="spearman"))
10 print("kendall相关系数为: 
", detail.loc[:, ["counts", "amounts"]].corr(method="kendall"))
11 
12 # data = detail.loc[:, ["detail_id", "order_id", "dishes_id", "counts", "amounts"]]

# 完整的机器学习算法流程
# 1、导包
# 2、加载数据
# 3、筛选出有用的列
# 4、检测并处理缺失值
# 5、处理异常值
# 6、数据标准化
# 7、构建算法模型进行运算
# 8、算法结果展示---数据可视化
# 9、结论

# 纯数据分析
# 1、导包
# 2、加载数据
# 3、筛选有用的数据
# 4、检测并处理缺失值
# 5、处理异常值
# 6、结果可视化--数据分布、走势的可视化
# 7、书写结论---非常重要