Set_ML

参考资料：斯坦福（http://cs231n.github.io/linear-classify/；http://cs231n.stanford.edu/slides/2017/）

　　　　　Mastering Machine Learning With scikit-learn

假设函数（Hypothesis Function）模型的知识表达：

　　然后利用已知的数据对其中的参数进行求解，再将该函数用于新数据的预测，其中参数的求解过程称为“训练（Training） or 学习（Learning）”

待优化参数 θ₀，θ₁
损失函数(loss function)，或叫代价函数(cost function)

　　损失函数越小，就代表模型拟合的越好。

损失函数最小目标转换为经验风险最小化

　　由于我们输入输出的 $(X,Y)$ 遵循一个联合分布，但是这个联合分布是未知的，所以无法计算。但是我们是有历史数据的，就是我们的训练集， $f(X)$ 关于训练集的平均损失称作经验风险(empirical risk)，即 $frac{1}{N}sum_{i=1}^{N}L(y_{i},f(x_{i}))$ ，所以我们的目标就是最小化 $frac{1}{N}sum_{i=1}^{N}L(y_{i},f(x_{i}))$ ，称为经验风险最小化。