斯坦福【概率与统计】课程笔记(六):EDA | 标准差和方差

这一篇比较简单,就不展开记录了,方差和标准差的计算方法记住了就可以。

  1. 计算mean
  2. 计算每个样本与mean的差值的平方,将其累加后除以(样本数-1)【注:这里的除数可以是n-1也可以是n】,即得到方差
  3. 方差开根号,即得到标准差

另外,记得标准差和方差都是衡量样本集中程度的,方差或标准差越大,样本越向两边离散;方差或标准差越小,样本越向mean集中。

标准差在对称分布下面,有几个在统计学上非常有用的数字:68%,95%,99.7%,意思是:

  • 用median和标准差stdDev(下面简称SD)的1倍、2倍、3倍值,将整个分布分成8份
  • 68%的样本都会落在-1SD 到 +1SD之间
  • 95%的样本都会落在-2SD 到 +2SD之间
  • 99.7%的样本都会落在-3SD 到 +3SD之间
  • < -3SD和>+3SD的两部分,加起来只有0.3%的样本会分布到那里

举个例子:

这3个经验数据会用在非常多的领域:金融、IT、项目管理等等都会直接使用,他们省去了很多繁琐计算的过程

靠上述这种划分和统计方法,在大部分不需要很精确计算的场景下,直接套用来评估就可以了

原文地址:https://www.cnblogs.com/zhongmiaozhimen/p/11328321.html