【dlbook】机器学习基础

【dlbook】机器学习基础

【机器学习基础】

模型的 vc dimension 如何衡量？

如何根据网络结构衡量模型容量？有效容量和模型容量之间的关系？

统计学习理论中边界不用于深度学习之中，原因？

　　1、边界通常比较松，

　　2、深度网络的容量估计非常困难，主要原因是受优化算法的能力限制！

深度学习中正则化：偏向于范数较小的权重！原因？

validation集必要的原因！超参数的存在。

超参数的必要性：

　　1、很难优化（情况少见）

　　2、是控制模型容量的参数，不能放入train set优化，否则结论一定是模型越复杂越好。

验证集存在的意义在于挑选超参数。

偏差和方差：

最小化的是均方误差，也就是偏差 + 方差，在欠拟合阶段，偏差比较高，在过拟合截断，方差比较高。

监督学习：

大部分基于估计概率分布 p(y|X)，

例如，对于线性回归来说，p(y|X; theta) = N(y: theta . x, I)

支持向量机：重要创新核技巧。

深度学习的挑战：

1、维数灾难：随着X维数的增长，在一些高维区域中没有点。

2、先验：复杂任务先验不一定平滑，可能引入不平滑的先验来解决统计问题。

3、流形学习：

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/yesuuu/p/8359076.html