基本概念

1.概念学习:是指从某个布尔函数的输入输出训练样例中推断出来该布尔函数。

2.训练集(training set/data)/训练样例(training example):用来进行训练,也就是产生模型或者算法的数据集。

3.测试集(testing set/data)/测试样例(testing example):用来专门进行测试已经学习好的模型或者算法的数据集。

4.特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属一个实例。

5.标记(label):c(x),实例类别的标记。

6.正例(positive example)

7.反例(negative example)

8.分类(classification):目标标记为类别型数据(category)。

9.回归(regression):目标标记为连续性数值(continuous numeric value)。

10.有监督学习(supervised learning):训练集有类别标记(class label)。

11.无监督学习(unsupervised learning):无类别标记(class label)。

12.半监督学习(semi-supervised learning):有类别标记的训练集+无类别标记的训练集。

13.机器学习步骤框架:

①把数据拆分为训练集和测试集。

②用训练集和训练集的特征向量来训练算法。

③用学习来的算法运用在测试集上来评估算法(可能要设计到调整参数(parameter tuning),用验证集(validation set))。

每接触一个新领域,我就像一块掉进水里的海绵,四面八方的养分都让我不断充实。O(∩_∩)O~
原文地址:https://www.cnblogs.com/zhzcode/p/9780441.html