监督学习、无监督学习与半监督学习

监督学习：训练集的每一个数据已经有特征和标签，即有输入数据和输出数据，通过学习训练集中输入数据和输出数据的关系，生成合适的函数将输入映射到输出。比如分类、回归。

无监督学习：训练集的每一个数据都只有特征，即只有输入数据，算法需要学习训练集中的特征关系，进行建模，试图使类内差距最小、类间差距最大。比如聚类。

半监督学习：训练集中一部分数据有特征和标签，另一部分只有特征，综合两类数据来生成合适的函数。

区别：

（1）监督学习需要有训练集和测试集，在训练集中寻找规律，在测试集中检验；而无监督学习只有一堆数据，需要从中寻找某种规律，没有训练集没有检验的过程。

（2）监督学习就是识别事物，按照标记好的特征和标签学习。无监督学习没有标签，如果经过学习发现数据集呈现某种聚集性，则可按照数据集现实的聚集性分类，但并不以某些样本最终和预先标记的标签相符合作为检验，没有检验的过程。

（3）无监督学习是在寻找数据的规律性，这种规律性最终不一定表现为分类数据集，也就是说不一定要“分类”。