第一章模式识别基本概念笔记

什么是模式识别

模式识别：根据已有知识的表达，针对待识别模式，判别其决策所属的类别或者预测其对应的回归值。
分类：输出量是离散的类型表达，即输出待识别模式所属的类别。
回归：输出量是单个/多个维度的连续信号表达（回归值）。
回归是分类的基础：离散的类别值是由回归值做判别决策得到的。

数学解释：模式识别可以看作一种函数映射f(x)，将待识别模式 x 从输入空间映射到输出空间。
输入空间：原始输入数据 x 所在的空间，空间维度：输入数据的维度
输出空间：输出的类别/回归值y所在的空间，空间维度：1维、类别的个数、回归值维度
特征向量：

欧式距离：

模型的参数和结构：

线性模型：

非线性模型：

样本量 vs 模型参数量

目标函数：以待学习的模型参数作为自变量，以训练样本作为给定量的函数。

优化算法：

机器学习流程示意图：

监督式学习：

无监督式学习：

训练集：模型训练所用的样本数据。
测试集：测试模型性能所用的样本数据。
误差：模型给出的预测/决策输出与真值之间的差异。
训练误差：模型在训练集上的误差。
测试误差：模型在测试集上的误差。它反映了模型的泛化能力，也称作泛化误差。
过拟合：模型训练阶段表现很好，但是在测试阶段表现很差。

留出法：

二分类问题性能指标：