【统计学】5.概率与概率分布

什么是概率？

一般而言，概率是0-1之间的一个数，告诉我们一个事件发生的经常性

5.1 随机时间及其概率

5.2 离散性随机变量及其分布

5.3 连续型随机变量的概率分布

学习目标

1.了解随机时间及其概率

2.解释随机变量及其分布

3.计算随机变量的数学期望和方差

4.计算离散型随机变量的概率和概率分布

5.计算连续型随机变量的概率

6.用excel计算分布的概率

5.1 随机事件及其概率

5.1.1 随机事件的几个基本概念

试验（experiment）

在相同条件下，对事物或现象所进行的观察

例如：掷一枚骰子，观察其出现的点数

试验的特点

可以在相同的条件下重复进行

每次试验的可能结果可能不止一个，但试验的所有可能结果在试验之前是确切知道的

在试验结束之前，不能确定该次试验的确切结果

事件的概念

事件（event）：随机试验的每一个可能结果（任何样本点集合）

例如：掷一枚骰子出现的点数为3

随机事件（random event）：每次试验可能出现也可能不出现的事件

例如：掷一枚骰子可能出现的点数

必然事件（certain event）：每次试验一定出现的事件，用

[Omega ]
1.例如：掷一枚骰子出现的点数小于7

4.不可能事件（impossible event）：每次试验一定不出现的事件，用

[Phi ]
  	1.例如掷一枚骰子出现的点数大于6
事件与样本空间

基本事件（elementary event）

一个不可能再分的随机事件

例如：掷一枚骰子出现的点数

样本空间（sample space）

一个试验中所有基本事件的集合，用

[Omega ]

例如：在掷一枚骰子的试验中

[Omega = lbrace 1,2,3,4,5,6 brace ]

在投掷硬币试验中
[Omega = lbrace 正面，反面 brace ]

5.1.2 事件的概率

事件的概率（probability）

事件A的概率是对事件A在试验中出现的可能性大小的一种度量

表示事件A出现可能性大小的数值

事件A的概率表示为P(A)

概率的定义有：古典定义、统计定义和主观概率定义

概率的古典定义

如果某一随机试验的结果有限，而且各个结果在每次试验中出现的可能性相同，则事件A发生的概率为该事件所包含的基本事件个数m与样本空间所包含的基本事件个数n的比值

[P(A) = frac{事件A所包含的基本事件个数}{样本空间所包含的基本事件个数} = frac{m}{n} ]
概率的统计定义

在相同条件下进行n次试验，事件A出现m次，则比值m/n称为事件A发生的频率。随着n的增大，该频率围绕某一常数P上下摆动，且波动的幅度逐渐减小，趋向于稳定，这个频率的稳定值即为事件A的概率，记为

[P(A) = frac{m}{n} = p ]
主观概率定义

对一些无法重复的试验，确定其结果的概率只能根据以往的经验人为确定

概率是一个决策者对某事件是否发生，根据个人掌握的信息对该事件发生的可能性的判断

5.1.3 关于概率计算的几个例子

5.2 离散型随机变量及其分布

5.2.1 随机变量的概念

随机变量（random variables）

一次试验的结果的数值性描述

一般用X、Y、Z来表示

例如：投掷两枚硬币出现正面的数量

根据取值情况的不同分为离散型随机变量和连续型随机变量

离散型随机变量（discrete random variables）

1.随机变量X去有限个值或所有取值都可以逐个列举出来

[X_1,X_2,... ]
2.以确定的概率取这些不同的值

3.离散型随机变量的一些例子

试验随机变量可能的取值

抽查100个产品取到次品的个数 0，1，2，...，100

一家餐馆营业一天顾客数 0，1，2，...

电脑公司一个月的销售销售量 0，1，2，...

销售一辆汽车顾客性别男性为0；女性为1

连续型随机变量(continuous random variables)

随机变量X取无限个值

所有可能取值不可以逐个列举出来，而是取数轴上某一区间内的任意点

连续型随机变量的一些例子

试验随机变量可能的取值

抽查一批电子元件使用寿命(小时) X>=0

新建一座住宅楼半年后工程完成的百分比 [0,100]

测量一个产品的长度测量误差(cm) X>=0

试验	随机变量	可能的取值
抽查100个产品	取到次品的个数	0，1，2，...，100
一家餐馆营业一天	顾客数	0，1，2，...
电脑公司一个月的销售	销售量	0，1，2，...
销售一辆汽车	顾客性别	男性为0；女性为1

试验	随机变量	可能的取值
抽查一批电子元件	使用寿命(小时)	X>=0
新建一座住宅楼	半年后工程完成的百分比	[0,100]
测量一个产品的长度	测量误差(cm)	X>=0

5.2.2 离散型随机变量的概率分布

列出离散型随机变量X的所有可能取值

列出随机变量取这些值的概率

通常用下面的表格表示

[egin{array}{cc} mathrm{X = x_i} & mathrm{x_1,x_2,...,x_n} \ hline \ P(X=x_i)=p_i & p_1,p_2,...p_n \ end{array} ]

[P(X = x_i) = p_i ]
称为离散型随机变量的概率函数

[p>=0 \ sum^n_{i=1}p_i =1 ]
离散型随机变量的概率分布形式（0-1分布）

一个离散型随机变量X只取两个可能的值

例如，男性用1表示，女性用0表示，合格品用1表示，不合格用0表示

列出随机变量取这两个值的概率

离散型随机变量的概率分布（均匀分布）

一个离散型随机变量取各个值得概率相同

列出随机变量取值及其取值的概率

例如，投掷一枚骰子，出现的点数及其出现各点的概率

离散型随机变量的期望值和方差

离散型随机变量的期望值（expected value）

在离散型随机变量X的一切可能取值的完备组中，各可能取值x_i与其取对应的概率p_i乘积之和

描述离散型随机变量取值的集中程度

计算公式为

[E(X) = sum^n_{i=1}x_ip_i (X取有限个值)\ E(X) = sum^n_{i=1}x_ip_i (X取无穷个值) ]
离散型随机变量的方差(variance)

随机变量X的每一个取值与期望值的离差平方和的数学期望，记为D(X)

描述随机变量取值的分散程度

计算公式为

[D(X) = E[X-E(X)]^2 \ 若X是离散型随机变量，则\ D(X) = sum^infty_{i=1}[x_i-E(X)]^2 cdot p_i ]
离散系数：可用来比较不同期望值得总体之间的离中趋势

几种常见的离散型概率分布

二项分布(贝努利试验)

二项分布与贝努利试验有关

贝努利试验具有如下属性

试验包含了n个相同的试验

每次试验只有两个可能的结果，即“成功”和“失败”

出现“成功”的概率p对每次试验结果是相同的，“失败”的概率q也相同，且p+q=1

试验是相互独立的

试验“成功”或“失败”可以计数

二项分布(Binomial distribution)

进行n次重复试验，出现“成功”的次数的概率分布称为二项分布

设X为n次重复试验中事件A出现的次数，X取x的概率为

[P lbrace X = x brace = C^x_np^xq^{n-x} (x = 0,1,2,..,n) \ 式中：C^x_n = frac{n!}{x!(n-x)!} ]
二项分布的性质

显然，对于

[P lbrace X=x geq0 brace,x=1,2,...,n\ sum^n_{x=0}C^x_np^xq^{n-x} = (p+q)^n = 1 ]

同样有

[Plbrace 0 leq X leq m brace = sum^m_{x=0}C^x_np^xq^{n-x} \ P lbrace m leq X leq n brace = sum^n_{x=m}C^x_np^xq^{n-x} ]

当n=1时，二项分布化简为

[P lbrace X = x brace = p^xq^{1-x} x=0,1 ]
二项分布的数学期望和方差

二项分布的数学期望为

[E(X) = np ]

方差为

[D(X) = npq ]

珀松分布(Poisson distribution)

用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布

珀松分布的例子

一个城市在一个月内发生交通事故次数

消费者协会一个星期内收到的消费者投诉次数

人寿保险每天收到的死亡声明的人数

珀松概率分布函数

[P lbrace X=x brace = frac{lambda e^{-lambda}}{x!} (x=0,1,2,...,n) ]
[lambda:给定的时间间隔、长度、面积、体积内"成功"的平均数\ e = 2.71828 \ x:给定的时间间隔、长度、面积、体积内"成功"的次数 ]
珀松分布的数学期望和方差

1.珀松分布的数学期望

[E(X) = lambda ]
2.方差为

[D(X) = lambda ]

珀松分布（作为二项分布的近似）

当试验的次数n很大，成功的概率p很小时，可用珀松分布来近似计算二项分布的概率，即

[C^x_np^xq^{n-x} approx frac{lambda e ^{-lambda}}{x!} ]

实际应用中，当
[P leq0.25 ,n>20 ,np leq5 ]
近似效果良好

5.3连续型随机变量的概率分布

连续型随机变量的概率分布

连续型随机变量可以取某一区间或整个实数轴上的任意一个值

它取任何一个特定的值得概率都等于0

不能列出每一个值及其相应的概率

通常研究它取某一区间值的概率

用数学函数的形式和分布函数的形式来描述

5.3.1 概率目的与分布函数

概率密度函数(probability density function)

设X为一连续型随机变量x，x为任意实数，X的概率密度函数记为f(x)，它满足条件

[(1)f(x) geq 0 \ (2)int ^{+infty}_{-infty} f(x)dx = 1 ]

f(x)不是概率

在平面直角坐标系中画出f(x)的图形，则对于任何实数

[x_1<x_2,P(x<xleq x_2) ]
是该曲线下从x_1到x_2的面积

[P(a<Xleq b) = int^b_a f(x)dx ]

分布函数(distribution function)

连续型随机变量的概率也可以用分布函数F(x)来表示

分布函数定义为

[F(x) = P(X leq x) = int^x_{-infty}f(t)dt \ (-infty<x<+infty) ]

根据分布函数，

[P(a<X<b) ]
可以写为

[P(a<X<b) = int^b_a f(x)dx = F(b)- F(a) ]
分布函数与密度函数的图示

密度函数曲线下的面积等于1

分布函数是曲线下小于x的面积

连续型随机变量的数学期望和方差

连续型随机变量的数学期望为

[E(x) = int^{+infty}_{-infty}xf(x)dx = mu ]

方差为

[D(X) = int^{+infty}_{-infty}[x-E(X)]f(x)dx = sigma^2 ]

5.3.2 正态分布

正态分布(normal distribution)

描述连续型随机变量的最重要的分布

可用于近似离散型随机变量的分布

例如：二项分布

经典统计推断的基础

概率密度函数

[f(x) = frac{1}{sigma sqrt{2 pi}}e^{-frac{1}{2 sigma^2}(x-mu)^2} \ -infty<x<+infty ]
[f(x) = 随机变量X的频数\ sigma^2 = 总体方差\ pi = 3.14159;e = 2.71828\ x = 随机变量的取值(-infty<x<+infty)\ mu = 总体均值 ]
正态分布的性质

概率密度函数在x的上方，即f(x)>0

正态曲线的最高点在均值μ，它也是分布的中位数和众数

正态分布是一个分布族，每一特定正态分布通过均值μ和标准差sigma来区分。μ决定了图形的中心位置，sigma决定曲线的平缓程度，即宽度

曲线f(x)相对于均值μ对称，尾端向两个方向无限延伸，且理论上永远不会与横轴相交

正态曲线下的总面积等于1

随机变量的概率由曲线下的面积给出

概率是曲线下的面积

标准正态分布

一般的正态分布取决于均值μ和标准差sigma

计算概率时，每一个正态分布都需要有自己的正态概率分布表，这种表格是无穷多的

若能将一般的正态分布转化为标准正态分布，计算概率时只需要查一张表

任何一个一般的正态分布，可通过下面的线性变换转化为标准正态分布

[Z = frac{X-mu}{sigma} acksim N(0,1) ]

标准正态分布的概率密度函数

[phi(x) = frac{1}{2pi}e^{-frac{x^2}{2}}\ -infty<x<+infty ]

标准正态分布的分布函数

[Phi(x) = int^x_{-infty}phi(t)dt = int^x_{-infty}frac{1}{sqrt{2pi}}e^{-frac{t^2}{2}}dt ]

标准正态分布表的使用

将一个一般的转换为标准正态分布

计算概率时，查标准正态概率分布表

对于负的x，可由

[phi(-x) = 1-phi(x) ]
得到

对于标准正态分布，即

[X acksim N(0,1) ]
[P(aleq X leq b) = phi(b)-phi(a)\ P(|X| leq a) = 2phi(a)-1 ]

对于一般的正态分布，即

[X acksim N(mu,sigma^2) ]
[P(a leq X leq b) = phi(frac{b-mu}{sigma}) - phi(frac{a-mu}{sigma}) ]

Win a contest, win a challenge