监督式学习和无监督式学习

根据训练期间接受的监督数量和监督类型，可以将机器学习系统分为一下四个主要类别：监督式学习、无监督式学习、半监督式学习、强化学习。

监督式学习

在监督式学习中，提供给算法的包含所需解决方案的训练数据，称为标签或者标记。

分类任务是一个典型的监督式学习任务。垃圾邮件过滤系统就是一个很好的例子，通过大量的电子邮件示例以及其所属的类别（垃圾邮件或者常规邮件）进行训练，然后学习如何对新邮件进行分类。

还有典型的任务，是通过预测变量，也就是组给定的特征（里程、使用年限、品牌等）来预测一个目标数值，例如：汽车的价格。这种类型的任务称为回归任务。要训练这样一个系统，需要提供大量的汽车示例，包括他们的预测变量和标签（也就是它们的价格）。

一些回归算法也可以用于分类任务，反之亦然。例如：逻辑回归就被广泛地用于分类，因为它可以输出“属于某个给定类别”的概率。

这里是一些最重要的监督式学习的算法：

无监督式学习的训练数据都是未经标记的。

这里列出一些最重要的无监督式学习的算法：

聚类算法：
- k-平均算法（k-Means）
- 分层聚类算法（Hierarchical Cluster Analysis）
- 最大期望算法（Expectation Maximization）

通过聚类算法来检测访问博客的相似的访客，并进行分组，无法告诉这个算法每个访客属于哪个分组——希望算法自己去寻找这种关联，而无需我们的帮助，例如：算法可能注意到40%的访客喜欢夜晚访问博客、20%的访客喜欢阅读科幻小说。如果使用层次聚类算法，还可以将每一组分成更小的组。

可视化算法也是无监督式学习算法的好例子。提供大量复杂的、未标记的数据，得到轻松绘制而成的2D或者3D

的数据呈现作为输出。这些算法会尽其所能的保留更多的结构（例如：尝试保持让输入的单独集群在可视化中不会重叠），便于理解这些数据是如何组织的，甚至识别出一些特殊的模式。

与之相关的另一个任务是降维，目的是在不丢失太多信息的前提下，简化数据。方法是将多个特征合并为一个。

例如：汽车的历程与汽车的使用年限有很强的相关性，降维算法会将其合并成为一个代表汽车磨损的特征。这个过程叫作特征提取。

通常比较好的做法是，先使用降维算法减少训练的训练数据的维度，再将其提供给另一个机器学习算法（例如：监督式学习算法）。这会使他运行的更快，数据占用的磁盘空间和内存都会更小，执行性能可能也会更好。

另一个很重要的无监督式任务式异常检测，例如：检测异常信用卡从而防止欺诈行为，或者是在提供数据给一种机器学习算法之前，自动从数据集中移除异常值。系统使用正常的实例进行训练，然后看到新的实例时，他就可以判断出新的实例时正常还是异常。

最后，还有一个常见的无监督式任务时关联规则学习，其目的是挖掘大量数据，发现属性之间有趣的联系，例如：购买了牛排的人也很喜欢购买薯片。

这些算法可以处理部分标记的训练数据——通常是大量未标记的数据和少量标记的数据，这被称为半监督学习。

照片托管服务就是很好的例子，例如：Google相册，算法中的无监督部分会先自动识别出人物A出现在了照片1、2、4中，人物B出现在了照片4、6、7中，我们只需要标记这些出现在不同照片中同一个人的名字，他就可以给每个照片的每个人命名，便于图片的搜索。

大多数半监督式学习算法是无监督式与监督式算法的结合，例如：深度信念网络（DBN）。它基于一种互相堆叠的无监督式组件，这个组件叫作受限玻尔兹曼机（RBM）。受限玻尔兹曼机以无监督的方式进行训练，然后使用监督式学习对整个系统进行微调。

强化学习的学习系统能够观察环境，做出选择，执行操作，并获得回报，或者是以负面回报的形式获得惩罚。

他必须自行学习什么是最好的策略，从而随着时间的推移获得最大的回报。策略代表强化学习算法在特定情况下应该选择的操作。

目前，许多机器人通过强化学习算法来学习如何行走，AlphaGo和DeepMind也是强化学习的好例子。