支持向量机原理(五)线性支持回归

　　　　在前四篇里面我们讲到了SVM的线性分类和非线性分类，以及在分类时用到的算法。这些都关注与SVM的分类问题。实际上SVM也可以用于回归模型，本篇就对如何将SVM用于回归模型做一个总结。重点关注SVM分类和SVM回归的相同点与不同点。

1. SVM回归模型的损失函数度量

　　　　回顾下我们前面SVM分类模型中，我们的目标函数是让

　　　　但是我们现在是回归模型，优化目标函数可以继续和SVM分类模型保持一致为

　　　　SVM需要我们定义一个常量

　　　　如下图所示，在蓝色条带里面的点都是没有损失的，但是外面的点的是有损失的，损失大小为红色线的长度。

　　　　总结下，我们的SVM回归模型的损失函数度量为：

e r r (x i, y i) = {0 | y i - w ∙ ϕ (x i) + b | - ϵ

2. SVM回归模型的目标函数的原始形式

　　　　上一节我们已经得到了我们的损失函数的度量，现在可以可以定义我们的目标函数如下：

m i n

　　　　和SVM分类模型相似，回归模型也可以对每个样本

m i n

s . t .

ξ \lor i \geq 0,

　　　　依然和SVM分类模型相似，我们可以用拉格朗日函数将目标优化函数变成无约束的形式，也就是拉格朗日函数的原始形式如下：

L (w, b, α \lor, α \land, ξ \lor i, ξ \land i, μ \lor, μ \land) =

　　　　其中

3. SVM回归模型的目标函数的对偶形式

　　　　上一节我们讲到了SVM回归模型的目标函数的原始形式,我们的目标是

m i n ������ w, b, ξ \lor i, ξ \land i

　　　　和SVM分类模型一样，这个优化目标也满足KKT条件，也就是说，我们可以通过拉格朗日对偶将我们的优化问题转化为等价的对偶问题来求解如下：

m a x ������ μ \lor \geq 0, μ \land \geq 0, α \lor i \geq 0, α \land i \geq 0

　　　　我们可以先求优化函数对于

　　　　首先我们来求优化函数对于

\partial L \partial w = 0

\partial L \partial b = 0

\partial L \partial ξ \lor i = 0

\partial L \partial ξ \land i = 0

$w, b, ξ$

m a x ������ α \lor, α \land

s . t .

0 < α \lor i < C

0 < α \land i < C

　　　　对目标函数取负号，求最小值可以得到和SVM分类模型类似的求极小值的目标函数如下：

m i n ������ α \lor, α \land

s . t .

0 < α \lor i < C

0 < α \land i < C

　　　　对于这个目标函数，我们依然可以用第四篇讲到的SMO算法来求出对应的

4. SVM回归模型系数的稀疏性

　　　　在SVM分类模型中，我们的KKT条件的对偶互补条件为：

α \lor i (ϵ + ξ \lor i + y i - w ∙ ϕ (x i) - b) = 0

α \land i (ϵ + ξ \land i - y i + w ∙ ϕ (x i) + b) = 0

　　　　根据松弛变量定义条件，如果

　　　　我们定义样本系数系数

β i = α \land i - α \lor i

　　　　根据上面

5. SVM 算法小结

　　　　这个系列终于写完了，这里按惯例SVM 算法做一个总结。SVM算法是一个很优秀的算法，在集成学习和神经网络之类的算法没有表现出优越性能前，SVM基本占据了分类模型的统治地位。目前则是在大数据时代的大样本背景下,SVM由于其在大样本时超级大的计算量，热度有所下降，但是仍然是一个常用的机器学习算法。

　　　　SVM算法的主要优点有：

　　　　1) 解决高维特征的分类问题和回归问题很有效,在特征维度大于样本数时依然有很好的效果。

　　　　2) 仅仅使用一部分支持向量来做超平面的决策，无需依赖全部数据。

　　　　3) 有大量的核函数可以使用，从而可以很灵活的来解决各种非线性的分类回归问题。

　　　　4)样本量不是海量数据的时候，分类准确率高，泛化能力强。

　　　　SVM算法的主要缺点有：

　　　　1) 如果特征维度远远大于样本数，则SVM表现一般。

　　　　2) SVM在样本量非常大，核函数映射维度非常高时，计算量过大，不太适合使用。

　　　　3）非线性问题的核函数的选择没有通用标准，难以选择一个合适的核函数。

　　　　4）SVM对缺失数据敏感。

　　　　之后会对scikit-learn中SVM的分类算法库和回归算法库做一个总结，重点讲述调参要点，敬请期待。