方差和协方差

1.方差

        方差是各个数据与平均数之差的平方和的平均数。(方差方差,就是方了 数据与平均数之差)
        在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。

        例子:1, 5 ,9 方差大    4,5,6方差就小。


2.协方差

        在概率论统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

        期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量XY之间的协方差定义为:
COV(X,Y)=E[(X-E(X))(Y-E(Y))]=EXY-EX*EY
        
        直观上来看,协方差表示的是两个变量总体误差的方差,这与只表示一个变量误差的方差不同。

        如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。
 
如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
 
如果XY是统计独立的,那么二者之间的协方差就是0,因为两个独立的随机变量满足EXY=EXEY。
 
但是,反过来并不成立。即如果XY的协方差为0,二者并不一定是统计独立的。
        (比如Y是X的绝对值并且E(X)=0的情况,如果X的正负分布足够“均匀”,那么就有可能EXY=EX*EY=0;换句话说,Y和X的变化趋势没关系,但是Y和X绝对值的变化趋势一样。总结:协方差描述了”Y和X的步调一致性“的大小?)
 
 协方差cov(X,Y)的度量单位是X的协方差乘以Y的协方差。而取决于协方差的相关性,是一个衡量线性独立无量纲的数。
 
 协方差为0的两个随机变量称为是不相关的。
原文地址:https://www.cnblogs.com/Iknowyou/p/3446273.html