某保险公司参保客户分析 Table of Contents¶ 1 读取数据 2 了解数据 2.1 统计一下每一列中有多少空值 2.2 查看数据中是否有重复值 2.3 可视化数据查看数据分布 2.3.1 看一下目标变量是否平衡 2.3.2 绘制年龄分布情况 2.3.3 两类样本的年龄分布 2.3.4 学历情况 2.3.5 查看不同的学历之间是否购买保险的人数 2.3.6 不同的县级别是否购买保险的人数 2.4 数据处理 2.4.1 空值填充 2.4.2 变量编码 2.5 建模 2.5.1 尝试使用最小叶节点样本数量和最小分割样本数量进行调参 2.5.2 对数据进行PCA压缩 详情链接:https://nbviewer.jupyter.org/github/lvzw94/Ipynb/blob/master/保险行业案例分析.ipynb