【统计学习】SVM之超平面方程来源

摘要

       本文主要说明SVM中用到的超平面方程是怎么来的,以及各个符号的物理意义,怎么算空间上某点到该平面的距离。

正文

《 统计学习方法》一书给出如下说明:

  

首先说明我对超平面的理解:

在三维坐标系里,XoY平面把三维坐标系”分割”成两个空间,这个分割平面引申到一维,二维,四维空间…来,他就是一个超平面。一维里是一个点分割空间,二维里是条线,3维刚好是个平面,4维的用几何已经无法表示了,但是我们赋予这个分割的东西为超平面,就比较形象了。

对于这个分离超平面方程时怎么来的,书中如此解释:

这里的符号造成了一定的误解,w时向量还是矩阵,b是向量吗…

不失一般性,我们在二维里面推导这个方程和其物理意义,然后推广到多维空间。

符号说明:w (超平面的法向量<这里的法向量尚未归一化>,黑体,斜体),x(空间的任意向量,黑体,斜体),b(实数)。

下面来看法向量w的提出有什么意义:

对于x在这里可以看做由[0,0]到超平面任意‘’的向量;

w法向量 的大小是[0,0]到分离超平面的距离,方向由分离超平面决定,或者说其方向决定了分离超平面,就像是先有鸡还是先有蛋的问题。

 

至此,我们论述了该方程确实可以表示一个二维空间里的超平面,推广到多维也是如此。接下来我们看下怎么计算空间里任一点A到该超平面的距离。

 

 

知行合一
原文地址:https://www.cnblogs.com/guiguzhixing/p/6012222.html