SVM(2)Linear Nonseparable

左边的是线性可分的(Separable),margin = 2M = 2/||w||，右边的是线性不可分(Nonseparable)，其中标有 ξ 的点是在它们边界的另一边(未正确区分的点)，离边界 ξ^∗_j = Mξ_j 。所有正确可分的点有 ξ^∗_j = 0. 因此 ∑ ξ^∗_j 就是所有未正确区分点偏离距离，我们在最大化margin时要限制 ∑ ξ^∗_j ≤ constant C.

我们用soft margin(a decision boundary that is tolerable to small training errors)，这个margin需要权衡margin的大小和允许错误区分点的个数。引入slack variables ξ = (ξ₁, ξ₂, . . . , ξ_m), 使得

(w^Tx⁽ⁱ⁾ + b) ≥ 1- ξ_i if y⁽ⁱ⁾ = 1

(w^Tx⁽ⁱ⁾ + b) ≤ -1+ ξ_i if y⁽ⁱ⁾ = -1

其中ξ_i≥ 0，它控制着允许错误区分点的个数，当ξ_i≥1时，就会出现区分错误，因此我可以限制 ∑ ξ^∗_j来调节允许错误数。

此时原始问题就转化为