支持向量机

《机器学习》周志华 读书笔记

1. 间隔与支持向量

给定样本集,在样本空间中找到一超平面将不同的类别的数据划分开。我们希望能够找到两类样本“正中间”的那个超平面。因为那个超平面的容忍度最好,鲁棒性最好。
超平面方程可使用下面的线性方程来描述:

wTx+b=0
w=(w1;w2;w3;..;wd) 为方程的法向量。b为位移量,决定超平面和原点之间的距离。
超平面可有法向量和位移量表示,记为(w,b)。
样本空间中任意点x的超平面的距离为
r=|wT+b|w

样本能被正确分类时,令
{wTx+b1yi=1wTx+b1yi=1

距离超平面最近的训练样本使上式等号成立,他们被称为支撑向量。
两个类别支持向量到超平面的距离之和为

γ=2w
, 这也被称为间隔(margin)。
寻找具有最大间隔的超平面就是要找满足
{wTx+b1yi=1wTx+b1yi=1
中约束的参数wb,使γ最大。即:
maxw,b2w
s.t.yi(wTxi+b)1,i=1,2,...,m.
这里乘以类别yi能够把两个式子统一成一个式子。

上面的表示等价于:

minw,bw2
s.t.yi(wTxi+b)1,i=1,2,...,m.

这就是SVM的基本型。

原文地址:https://www.cnblogs.com/siucaan/p/9623109.html