机器学习第一讲

机器学习课程包括四个部分：

第一：监督式学习(supervised learning)，有两种类型：回归和分类。采集了某地区的房屋价格和面积的一组数据，然后推测此地区面积为100平的房子个价格应该是多少？这就属于回归型监督式学习算法。然后另外一个根据肿块的大小，预测肿瘤是良性还是恶性，0表示恶性，1表示良性，这种问题就属于分类型监督式学习算法。分类(classification)，对于一个classifier来说，就是告诉它”这个数据属于XX类“，然后classifier会在提供的训练集中"学习"，然后具有对某个未知数据分类的能力，这种提供提供训练数据的过程称为监督式学习。监督式学习是已有正确答案。

第二：学习理论(learning theory)

第三：无监督学习(unsupervised learning)。聚类(clustering),就是把相似的东西集中到一起，聚类的时候，我们不关心某一类是什么，我们的目标是将相似的类聚在一起，因此一个聚类算法只需要知道如何计算相似度就可以开始了，并不提供训练数据，我们称这种为无监督学习。无监督式学习适合不知道正确答案的情况下，发现数据集的结构性。例如录音机录制了两个人一起说话的声音，无监督学习可以将两个声音分别提取出来。无监督学习还可以用于文本处理。

第四：强化学习(reinforcement learning):被用在不必进行一次决策的情形之中，强化学习通常是在一段时间之内作出一系列的决策。在强化学习中有一个回报函数的概念。然后需要定义好的行为和坏的行为，肯定好的行为，程序会不断学习实现好的行为，以此获得好的回报。

就像你说蹲下，旺财立即蹲下的时候你会说，”good dog“，否则，”bad dog“。旺财想听到夸奖，所以它会学习在你说出蹲下的时候立马蹲下。同样的对于采用了强化学习的直升机来说，当其摔下时，触发的坏的行为，它就会学习下次不再摔下，以此获得好的回报。

强化学习经常用在机器人领域。