对半监督学习的理解

半监督学习介于监督学习和无监督学习之间,描述的是拥有少量有标记样本和大量无标记样本的情况,非常符合现实世界中的实际场景,数据很多,标签很少。

半监督学习的目的就是将大量无标签样本利用起来,发挥它们的价值,因为数据本身就蕴藏着大量有价值的信息,标签只是帮助我们提取信息的手段,如果没有标签,我们依然应该努力从数据中获取有价值的信息,不然也是一种浪费。

半监督学习可以进一步分为纯半监督学习和直推学习(transductive learning),前者利用有标记数据和无标记数据来预测其它未知数据,后者就是局限在已有的数据,当训练模型完成后,能预测无标记数据即可。

原文地址:https://www.cnblogs.com/wzyuan/p/10312013.html