方差,标准差,平均数

 方差:

          当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大

          当数据分布比较集中时,各个数据与平均数的差的平方和就较小,方差就越小

          因此方差越大,数据的波动越大;方差越小,数据的波动就越小。 

          方差:衡量数据集中元素的分散程度。

 
     例1:  两人的5次测验成绩如下: X:  50,100,100,60,50      E(X)=72;      Y: 73, 70, 75,72,70    E(Y)=72。

                        平均成绩相同,但X 不稳定,对平均值的偏离大。

         方差: 描述随机变量对于数学期望的偏离程度(数据集  分散程度)。

         方差 = 各个数据分别与其平均数之差的平方的和的平均数。其中,分别为离散型和连续型计算公式。 称为标准差或均方差,方差描述波动程度。

    

 公式:         

      平均数:      

       方差公式:        其中,x表示样本的平均数,n表示样本的数量,xi表示个体,而s^2就表示方差。

     标准差:

    也被称为标准偏差,在某一个时段内误差上下波动幅度(eg: 班级平均身高 170cm ± 10cm)

          表示数据集的波动幅度,标准差就是为了描述数据集的波动大小而发明的。“波动大小”可以直观的替代“离散程度

    标准差,在描述一个波动范围。

    eg: 一个班男生的平均身高是170cm, 标准差是10cm。可以进行的比较简便的描述是本班男生身高分布是170±10cm (标准差/标准偏差)

想象你开着一架黑鹰直升机,得到命令攻击地面上一只敌军部队,于是你连打数十梭子,结果有一下几种情况:
1.子弹基本上都打在队伍经过的一棵树上了,连在那棵树旁边等兔子的人都毫发无损,这就是方差小(子弹打得很集中),偏差大(跟目的相距甚远)。
2.子弹打在了树上,石头上,树旁边等兔子的人身上,花花草草也都中弹,但是敌军安然无恙,这就是方差大(子弹到处都是),偏差大(同1)。
3.子弹打死了一部分敌军,但是也打偏了些打到花花草草了,这就是方差大(子弹不集中),偏差小(已经在目标周围了)。
4.子弹一颗没浪费,每一颗都打死一个敌军,跟抗战剧里的八路军一样,这就是方差小(子弹全部都集中在一个位置),偏差小(子弹集中的位置正是它应该射向的位置)。

方差,是形容数据分散程度的,算是“无监督的”,客观的指标,偏差,形容数据跟我们期望的中心差得有多远,算是“有监督的”,有人的知识参与的指标。



原文地址:https://www.cnblogs.com/chy2055/p/8328668.html