带约束优化问题拉格朗日对偶问题 KKT条件

转自：七月算法社区http://ask.julyedu.com/question/276

咨询：带约束优化问题拉格朗日对偶问题 KKT条件

咨询下各位，在机器学习相关内容中，每次看到带约束优化问题，总是看到先用拉格朗日函数变成无约束问题，然后转成求拉格朗日对偶问题，然后有凸函数假设，满足KKT条件时原问题最优解和对偶问题最优解等价。

每次看到这个，总不是很理解为什么要这么做？
为什么首先转为无约束问题（这个相对好理解一点，因为容易处理）
为什么拉格朗日函数无约束问题要转变成求拉格朗日对偶问题求解？
如果一开始的约束问题f(x)不是凸函数，那怎么办？

忘各位了解的可以将这里的流程和原理可以详细解答一下，看过前面有些人解答问题将问题的前世今生都讲解一遍，很清晰。这个问题一直都让我有点混乱，希望能在各位帮助下了解更清楚

补充一个：带惩罚的优化问题是不是跟这一样是通过求对偶问题还求解的

看你的问题，我猜测你应该是在看SVM，关于SVM这东西，我认为它可以分成三个独立的成分：
1.最优分离超平面
2. kernel映射
3. 拉格朗日对偶
这三个部分中的每一个都有一套理论，最优分离超平面就不说了，这就是SVM的根基，kernel并不是SVM独有的（只是在SVM里比较出名），kernel有一套核方法，主要是为了解决映射到高维空间后引起的维数灾难问题。我们知道，SVM只靠最优分离超平面的话只能实现线性分割，而使用了kernel映射后就可以实现非线性分割了，在这个转换过程中，拉格朗日对偶起了中间桥梁的作用。拉格朗日对偶也不是SVM特有的，它属于凸优化的内容。在SVM的很多教程中都跳过了拉格朗日对偶的讲解，下面我们将进一步讨论拉格朗日对偶这个问题（并不完全讲，也只是讲个大概）

在此之前，我们要再重申一遍什么是凸函数

跟我念：凸凸凸凸凸凸凸凸凸凸凸凸凸凸
（威廉王子：我都躺这么远了还TM中枪？！）

此外，我们还需要讲清楚一些前置内容，首先：什么是优化问题？
所谓优化问题，也就是要实现

min f 0 (x)

s . t . f i (x) \leq b i, i = 1, \dots, m

f i (α x + β y) \leq α f i (x) + β f i (y)

f i (α x + β y) = α f i (x) + β f i (y)

==================================================

f (x) = sup {g (x) | g 仿射，且 \forall z, g (x) \leq f (z)}

f (x) = max {f 1 (x), f 2 (x), \dots}

g (x) = sup y \in A f (x, y)

==================================================

min f 0 (x)

s . t . f i (x) \leq 0, i = 1, \dots, m

h i (x) = 0, i = 1, \dots, p

L (x, λ, μ) = f 0 (x) + \sum i = 0 m λ i f i (x) + \sum i = 1 p μ i h

g (λ, μ) = inf x \in D L (x, λ, μ) = inf x \in D f 0 (x) + \sum i = 0 m λ

\sum i = 0 m λ i f i (x) + \sum i = 1 p μ i h i (x)

L (x^, λ, μ) = f 0 (x^) + \sum i = 0 m λ i f i (x^) +

g (λ, μ) = inf x \in D L (x, λ, μ) \leq L (x^, λ, μ) \leq f 0 (x^)

min x T x

s . t . A x = b

L (x, μ) = x T x + μ T (A x - b)

Δ x L (x, μ) = 2 x + A T μ = 0

x = - 1 2 A T μ

g (μ) = inf x L (x, μ)

g (μ) = inf x L (- 1 2 A T μ , μ ) = - 1 4 μ T A A T μ - b T μ

- 1 4 μ T A A T μ - b T μ \leq inf { x T x | A x = b }

min C T x

s . t . A x = b

x \geq 0

L (x, λ, μ) = C T x - \sum i = 1 n λ i x i + μ T (A x - b) = - b T μ + (C

g (λ, μ) = inf x L (x, λ, μ) = - b T μ + inf x (C + A T μ - λ) T x

g (λ, μ) = - b T μ, 如果 A T μ - λ + c = 0

g (λ, μ) = - \infty, 其他

max - b T μ

s . t . A T μ - λ + c = 0

λ \geq 0

max - b T μ

s . t . A T μ + c \geq 0

max C T x

s . t . A T x \leq b

L (x, λ) = C T x + λ T (A x - b) = - b T λ + (A T λ + C) T x

g (λ) = inf x L (x, λ) = - b T λ + inf x (A T λ + C) T x

g (λ) = - b T λ, 如果 A T λ + c = 0

g (λ) = - \infty, 其他

max - b T λ

s . t . A T λ + c = 0

λ \geq 0

带约束优化问题 拉格朗日 对偶问题 KKT条件

咨询：带约束优化问题 拉格朗日 对偶问题 KKT条件

==================================================

==================================================

==================================================

==================================================

带约束优化问题拉格朗日对偶问题 KKT条件

咨询：带约束优化问题拉格朗日对偶问题 KKT条件