《机器学习基石》笔记（三）（台大林轩田版Lecture3

3.分别从{Y,yn,procol,X}角度对学习算法进行分类

3.1 根据输出的标签Y可以将学习算法分为二分类，多分类，回归，结构化学习四种类型。

{binary classification;multiclassification;regression;structured learning}，其中，二分类

和回归算法最常见。

structure learning 例子：

①识别句子是否为病句（涉及语法结合：自然语言处理？）（与序列结构有关）

②根据蛋白质成分折叠顺序的不同判断蛋白质的种类（与序列结构有关）

3.2 根据输入的标签yn是否已知，已知数量的多少可以将学习算法分为有监督学习，无监督

学习，半监督学习，强化学习。

{supervised learning;unsupercised learning;semi-supervised learning；reinforcement learning}。

强化学习（reinforcement learning）的例子：假如你要训练你的狗狗，需要将“sit down”这个语音命令

与“坐下”动作链接起来，但是狗狗不能理解“坐下”与“sit down”之间的关系。这个时候你能做的就是给出

“sit down” 命令，狗狗如果做出“打滚”动作，你进行惩罚，告诉狗狗这个链接是不对的；再给出“sit down”

命令，狗狗做出“仰面躺倒”动作，你进行惩罚，继续告诉狗狗这个链接不对；直到狗狗最终做出“坐下动作”，

你做出正确反馈（奖励食物之类），告诉狗狗这是对的。

3.3 根据机器对数据的不同读取方式protocol可以将算法分成批处理学习，在线学习，主动学习三种。

{batch learning;on-line learning;active learning}。

protocol数据读取方式有三种，分别是batch,online和active。batch表示机器一次性将数据全部读取，

训练后直接得出一个最好的预测函数g；online表示数据有序列地每次读取一部分（或一个），每次

都会根据读取的数据修正当前的g，迭代结束后得到一个最优的g。(可以类比之前的博客PLA的解释)。

active方式表示当机器不确定某数据x对应的y时，会主动地询问y的信息，active方式可以减少y的人工

标注工作。

【附：强化学习一般是online learning】

protocol含义如下图所示：

三种protocol读取数据的方式如下：

3.4 输入数据集X的特征形式通常可以分为三种，分别是{concrete feature；raw feature；abstract feature}，

concrete feature一般指具体可以量化的特征，比如说一个公司的净收入，收益增长率等；raw feature一般

可以是图像像素点信息，语音信息等；abstract feature一般指没有实际物理意义的特征，比如一个人的名字，

学号，ID等等。raw feature 和 abstract feature 在实际应用中一般会经过特征工程这一步骤，将其转化成

concrete feature。

具体例子如下：帮助理解concrete feature/raw feature/abstract feature

3.5 Lecture3 小结

参考资料：

1.B站《机器学习基石》林轩田版，https://www.bilibili.com/video/BV1Cx411i7op?p=10 p10~p13