理解机器为什么可以学习（三）---Theory of Generalization

前边讨论了我们介绍了成长函数和break point，现在继续讨论m是否成长很慢，是否能够取代M。

成长函数就是二分类的排列组合的数量。break point是第一个不能shatter（覆盖所有情形）的点。

我们希望

这里引入上限函数 bound function:给了break point，看看可以组成多少排列组合，下面证明boundfunction是多项式成长的。

右上角相当于没有加条件限制，对角线就是全部的减1嘛，因为全部不可能，小一点，找个上限。

接下来填剩余部分，通过转换得到B(4, 3) = B(3, 3) + B(3,2)

所以得到，

同理得到，

由数学归纳法可以证明：

所以，我们就得到：成长函数会被上限函数bound住，上限函数会被上限函数的上限函数bound住，上限函数的上限会被一个与break point有关的多项式bound住。

接下来，我们回到最之前的Hoeffding不等式转换式：

接下来证明它们。

由于Eout是无限个点的，因此我们不能直接带入上限，现在想办法转化，类似于交叉验证，现在选择一个Ein'，那么有，

所以，最终我们得到，

对于PLA来说，由于我们知道4是一个break point，所以最终成长函数会被限制住，也就是learning是可以的。

下一节引入VC Bound继续解释为什么机器可以学习。http://www.cnblogs.com/futurehau/p/6260332.html