机器学习基本概念

周志华

 
第一章绪论
 
基本术语:
例子:西瓜
数据集 (列表及数组)(每条记录都是关于一个事件或者对象的描述) 
样本(示例):一条完整整的数据,则称为样本
特征(属性):对数据维度的称呼  称为属性空间
特征向量: X,Y,Z 中 西瓜的三个属性都能在其中对应的,一个点.
d 维样本空间, d 称为样本的维数
学习:从数据中获得模型的过程为训练
训练样本:用来训练数据的样本    --
假设:学得关于数据的潜在规律
模型:有时称为学习器
标记: 对西瓜的标识 (好瓜)
样例:拥有的标记的信息
标记空间:所有标记的集合
分类: 预测的是离散值, 好瓜或者坏瓜
回归:预测的连续值,西瓜成熟度0.95, 0.37
二分类: 一个正类,一个反类.
多分类: 多个分类 , y = r r为实数集
测试:预测过程
预测样本:预测样本
聚类: 识别我们不知道的标记信息.
泛化:适应整个样本空间.
 
原文地址:https://www.cnblogs.com/sakura3/p/12710876.html