监督学习、无监督学习与半监督学习

监督学习:训练集的每一个数据已经有特征和标签,即有输入数据和输出数据,通过学习训练集中输入数据和输出数据的关系,生成合适的函数将输入映射到输出。比如分类、回归。

无监督学习:训练集的每一个数据都只有特征,即只有输入数据,算法需要学习训练集中的特征关系,进行建模,试图使类内差距最小、类间差距最大。比如聚类。

半监督学习:训练集中一部分数据有特征和标签,另一部分只有特征,综合两类数据来生成合适的函数。

区别:

(1)监督学习需要有训练集和测试集,在训练集中寻找规律,在测试集中检验;而无监督学习只有一堆数据,需要从中寻找某种规律,没有训练集没有检验的过程。

(2)监督学习就是识别事物,按照标记好的特征和标签学习。无监督学习没有标签,如果经过学习发现数据集呈现某种聚集性,则可按照数据集现实的聚集性分类,但并不以某些样本最终和预先标记的标签相符合作为检验,没有检验的过程。

(3)无监督学习是在寻找数据的规律性,这种规律性最终不一定表现为分类数据集,也就是说不一定要“分类”。

原文地址:https://www.cnblogs.com/zwtgyh/p/10724670.html