Python机器学习3

  1. 获取原始数据

    • 拿到的数据不能全部用来训练一个模型。需要划分数据集。分为训练数据(训练、构建模型)和测试数据(在模型检验时使用,用于评估模型是否有效)

    • 划分比例:训练集70%、75%、80%

  2. 数据处理

  3. 特征工程

  4. 机器学习算法训练,得到模型

  5. 模型评估(不合格的话返回到第二步)

  6. 应用(离线/在线服务)

原文地址:https://www.cnblogs.com/OFSHK/p/15031969.html