协方差

协方差

为什么提到这个概念呢?原因是,可能我们有些数学基础的都了解方差,均值,标准差,但是对于协方差可能了解的不是那么清楚,这个概念在数据分析、统计学领域是很常见的,他是衡量多变量关系的一种统计量。
在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量X与Y之间的协方差定义为:

COV(X,Y)=E[(X-E(X))(Y-E(Y))]
其中,E是期望值。它也可以表示为:

直观上来看,协方差表示的是两个变量总体误差的方差,这与只表示一个变量误差的方差不同。

如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。

如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

如果X与Y是统计独立的,那么二者之间的协方差就是0。

但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。

协方差cov(X,Y)的度量单位是X的协方差乘以Y的协方差。而取决于协方差的相关性,是一个衡量线性独立的无量纲的数。

协方差为0的两个随机变量称为是不相关的。

原文地址:https://www.cnblogs.com/gaoxing2580/p/12639341.html