机器学习算法

  机器学习算法分类:

  监督学习:

    定义:输入数据是由特征值和目标值组成,函数的输出可以是一个连续的值(称为回归),或是输出连续个离散值(称为分类)。

    目标值:类别——分类问题

      算法:K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归...

    目标值:连续型的数据——回归问题

      算法:线性回归、岭回归

  无监督学习:

    定义:输入数据是由特征值组成。

    目标值:无——聚类

      算法:聚类K-means

  

  机器学习开发流程:

  ①:获取数据

  ②:处理数据

  ③:特征工程

    特征抽取/特征提取:(sklearn库中:sklearn.feature_extraction包含字典特征提取、文本特征提取)

      文本数据等——>数值数据

  ④:机器学习算法训练——模型

  ⑤:模型评估

  ⑥:应用

  

原文地址:https://www.cnblogs.com/liyuchao/p/12531688.html