机器学习中数理统计与参数估计的相关基础概念

统计和概率的关系：

重要的统计量：

从而有下面：

　　　　独立性是指两个变量的发生概率一点关系没有，而相关性通常是指线性关系。如果两个变量不相关，指的是线性关系里不相关，但是不能说它们没

有关系，可能是线性以外的其他关系。

　　　　类似上图中，X1、X2、X3、、、Xn都是列向量，表示整个数据集中一个“特性”的数据，放在一个列向量中，则上图中的特性矩阵可以表示为X={X1、X2、X3、、、Xn}

　　则其中任意的一对Xi和Xj都可以求一次协方差，而这些协方差组成的矩阵就是协方差矩阵。如下：

　　　　协方差矩阵是一个对称矩阵，这矩阵中的每一项Cij表示Xi和Xj的两个特征的协方差，如果Cij等于0表示这两个特征不相关（这里指线性相关，当在二

维中两个变量不相关则可以得出这两个变量独立），两个变量不相关并不一定表示这两个变量相互独立，有可能是在其他高维相关或者非线性相关。

重要的定理和不等式：

　　　　　　该重要的推论叫做伯努利定理，这也是最找到的大数定理的形式。该定理表明事件A发生的频率Na/N依概率收敛于事件A的概率P。

用样本估计参数