机器学习的几个问题探讨

只有正样本的分类问题(Learning from Positive and Unlabeled examples)

对于一个分类问题,有时候训练样本只有正样本,没有负样本。比如,文本分类中,假设我们有一些标定好的训练样本,有n个类,我们用这些训练样本去训练一个分类器,用于把新的文本分成n类。问题的关键是我们没有负样本,而只有一些未标定正样本与负样本的训练数据。这样的问题叫做PU学习。
待续。。。

参考文献:
Bing Liu

训练样本中一些数据标记有错误

一些训练样本的一些特征缺失,依据这些缺失特征的训练样本构建分类器

原文地址:https://www.cnblogs.com/goodluckcwl/p/5686099.html