【统计学习】SVM之超平面方程来源

摘要

本文主要说明SVM中用到的超平面方程是怎么来的，以及各个符号的物理意义，怎么算空间上某点到该平面的距离。

正文

《统计学习方法》一书给出如下说明：

首先说明我对超平面的理解：

在三维坐标系里，XoY平面把三维坐标系”分割”成两个空间，这个分割平面引申到一维，二维，四维空间…来，他就是一个超平面。一维里是一个点分割空间，二维里是条线，3维刚好是个平面，4维的用几何已经无法表示了，但是我们赋予这个分割的东西为超平面，就比较形象了。

对于这个分离超平面方程时怎么来的，书中如此解释：

这里的符号造成了一定的误解，w时向量还是矩阵，b是向量吗…

不失一般性，我们在二维里面推导这个方程和其物理意义，然后推广到多维空间。

符号说明：w (超平面的法向量<这里的法向量尚未归一化>，黑体，斜体)，x(空间的任意向量，黑体，斜体)，b(实数)。

下面来看法向量w的提出有什么意义：

对于x在这里可以看做由[0,0]到超平面任意‘点’的向量；

w法向量的大小是[0,0]到分离超平面的距离，方向由分离超平面决定，或者说其方向决定了分离超平面，就像是先有鸡还是先有蛋的问题。

至此，我们论述了该方程确实可以表示一个二维空间里的超平面，推广到多维也是如此。接下来我们看下怎么计算空间里任一点A到该超平面的距离。

知行合一