机器学习笔记

什么是机器学习?

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测.
机器学习工作流程总结:

  1.获取数据
  2.数据基本处理
  3.特征工程
  4.机器学习(模型训练)
  5.模型评估
    结果达到要求,上线服务
    没有达到要求,重新上面步骤

获取到的数据集介绍【掌握】

  1. 数据集中一行数据一般称为一个样本,一列数据一般称为一个特征。
  2.数据集的构成:
  3.由特征值+目标值(部分数据集没有)构成
  4.为了模型的训练和测试,把数据集分为:
  5.训练数据(70%-80%)和测试数据(20%-30%)

特征工程包含内容【了解】

特征提取
特征预处理
特征降维

matplotlib

import matplotlib.pyplot as plt
from pylab import mpl

# 设置显示中文字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]

# 设置正常显示符号
mpl.rcParams["axes.unicode_minus"] = False
原文地址:https://www.cnblogs.com/liuChang888/p/15056206.html