十二、支持向量机

12.1 优化目标

SVM：support vector machine；
在这里插入图片描述

把代价函数分成两部分，比如左边：h_θ(X)=1/(1+e^-z)，当z趋向于很大的数时，h_θ(X)才能取到1；

支持向量机：

取出1/m，惯例不同而已，1/m不影响θ的结果；

这是支持向量机的总体代价函数：

12.2 大边界的直观理解

支持向量机=大间距分类器？
什么是向量机，我们如何理解它，有什么作用？
在这里插入图片描述
假设C非常大，那么我们优化代价函数只需将A部分尽力优化成0即可，那么可做出如下假设：
假设A被优化成0：

比如：

未使用支持向量机时，决策边界可能是紫色的或者绿色的那条，可以看出它们非常贴近数据集；
而使用支持向量机画出的决策边界的间距（黑色线），很明显拥有更大的间距，能够更好的夹在两个数据集中间；
更大间距->更好的鲁棒性；

在这里插入图片描述当C非常大的时候，决策边界会对某个异常点敏感，比如没有左下角的红×时，决策边界是黑线，当加上那么一个异常点时，决策边界可能立马变为紫色的线；而这都是基于C很大的情况；

如果C很小，那么决策边界并不会对某个或者一些异常点敏感，比如上面正集混入一些负集等等，它还是能划出一条合理的分类边界；

所以C的取值问题才是SVM的核心，C取得不那么大时，才能既有大边界又能对某个/些异常数据不敏感；

12.3 数学背后的大边界分类

为什么这么优化呢？如何得到大间距分类器的？
更好地理解SVM；

在这里插入图片描述
欧几里得长度；
v^Tu内积=v在u上的投影长度*u的长度；
p是有符号的；

当C取很大得值时，A部分就要最小化为0，此时代价函数=1/2||θ||²；

z=0时，假如边界函数如绿色线所示，θ与决策边界垂直，那么对于x⁽¹⁾和x⁽²⁾，它们在θ上的投影长度都很小，那么为了满足条件p^(i)·||θ|| ≥1或者p^(i)·||θ||≤-1，则||θ||就要取很大的值，这与之前最小化代价函数（1/2||θ||²）相矛盾；