一维随机变量及其概率分布

1. 随机变量的概念

顾名思义，随机变量就是“其值随机会而定”的变量。随机变量的反面是“确定性变量”，即其值遵循某种严格的规律的变量，比如从北京到上海的距离。但是从绝对意义上讲，许多通常视为确定性变量的量，本质上都有随机性，只是由于随机性干扰不大，以至在所要求的精度之内，不妨把经作为确定性变量来处理。

根据随机变量其可能取的值的全体的性质，可以把随机变量分为2大类，一类是离散型随机变量，比如检验100件产品中的次品个数；一类是连续型随机变量，比如一个灯泡的寿命。但是连续型变量这个概念只是数学上的抽象，因为任何量都有单位，都只能在该单位下量到一定的精度，所以也一定是离散的，比如灯泡的寿命如果只精确到秒，那它的寿命也是可以离散表示的。

研究随机变量的根本原因是，我们需要研究一些事物身上表现出来的会变动的因子，这些因子的值随机而定，但可能存在某种规律（比如总是取到某些特殊的值），我们需要研究这些规律（比如分布规律），而对这些因子做预测。

2. 离散型随机变量的分布

我们研究随机变量，并不是只关心它能取到哪些值，往往也关心的是它取到某些值的频率如何，即取到该值的概率。这个特性，我们称之为分布。

定义2.1

设

p i = P (X = a i), i = 1, 2, \dots

称为

p i ⩾ 0, p 1 + p 2 + \dots = 1

可能值 概率 a 1 p 1 a 2 p 2 \dots \dots a i p i \dots

定义2.2

设

P (X \leq x) = F (x), - \infty < x < \infty

称为

对离散型随机变量而言，概率函数与分布函数在下述意义下是等价的。

F (x) = P (X \leq x) = \sum {i : a i \leq x} p i

由

F (i) = P (X \leq i) = P (X \leq i - 1) + P (X = i)

对于任何随机变量

1）

2）当

研究分布函数的直接原因是可以根据分布函数求概率，另一个原因我觉得是针对于连续型随机变量，因为它研究取某个值的概率没有意义，所以更多的关心的一个范围，比哪灯光寿命1万小时-1.2万小时的可能性大小，像这样范围内的概率用分布函数更容易求得。

3. 几个常见的离散型分布

3.1. 二项分布

某事件

p i = b (i; n, p) = (n i ) p i ( 1 - p ) n - i , i = 0 , 1 , \dots , n

在研究连续型随机变量分布后，我们发现二项分布概率分布与高斯分布密度函数曲线一致。

3.2. 泊松分布

若随机变量

P (X = i) = e - λ λ i / i!

则称

Poisson分布是用来描述稀有事件的概率的，比如：一定时间内红绿灯口发生事故的次数和总机接到电话的次数。

Poisson分布实际上是在

当

3.3. 超几何分布

设有N个产品，其中有M个不合格品，若从中不放回地随机抽取

P (X = k) = ( M k ) ( N - M n - k ) ( N n ) , k = 0 ,

其中

当

( M k ) ( N - M n - k ) ( N n ) ≅ ( n k ) p

3.4. 几何分布

在伯努利试验序列中，记每次试验中事件

P (X = k) = (1 - p) k - 1 p, k = 1, 2, \dots

几何分布的无记忆性：设

P (X > m + n | X > m) = P (X > n)

上面这个公式表明在一系列的事件中，若前m次实验中事件A没有出现，则接下来的n次试验中A仍未出现的概率只与n有关，似乎忘记了前m次试验结果。

3.5. 负二项分布

在伯努利试验序列中，记每次试验中事件A发生的概率为

P (X = k) = (k - 1 r - 1 ) p r ( 1 - p ) k - r , k = r , r + 1 , \dots

4. 连续型随机变量分布

对于连续型变量的概率分布，不能用像离散型变量那种方法去描述。原因在于，这种变量的取值充满一个区间，无法一一排出。若指定一个值

刻画连续型随机变量的概率分布的一个方法是利用概率分布函数，但是在理论和实用上更方便因则更常用的方法，是使用所谓“概率密度函数”或简称密度函数。

定义4.1

设连续性随机变量X有概率分布函数

连续型随机变量

1）

2）

3）对任何常数

4.1. 正态分布

由中心极限定理可知：

一个变量如果是由大量微小的、独立的随机因素的叠加结果，那么这个变量一定是正态变量。因此很多随机变量可以用正态分布描述或近似描述，譬如测量误差、产品重量、人的身高、年降雨量等。

若随机变量

称

当

f (x) = e - x 2 / 2 / 2 π--\sqrt

它是正态分布

若

4.2. 均匀分布

若随机变量

p (x) = {1 b - a , 0 , a < x < b ; 其 他 。

则称

4.3. 指数分布

若随机变量

p (x) = {λ e - λ x, 0, x \geq 0; x < 0 。

则称

下图显示了指数分布当

因为指数分布随机变量只可能取非负实数，所以指数分布被用作各种“寿命”分布，譬如电子元件的寿命，动物的寿命等。

P (x \leq X \leq x + h) | X > x) / h = λ, h \to 0

上式表明，如果元件在

指数分布描述的是一种无老化的寿命分布，在实际中是不可能的，因而只是一种近似。对一种元器件在使用初期老化现象很小，所以在这个阶段指数分布描述了其寿命分布情况。而人在50或60岁之前，生理老化而死亡的因素是次要的。排除那些意外情况，人的寿命在这个阶段也是接近指数分布的。

4.4. 威布尔分布

指数分布在寿命问题上忽略了老化问题，如果我们需要考虑老化问题，则显然失效率真应该随时间而上升，不能为常数，比如取为一个

F (x) = 1 - e - (λ / m + 1) x m + 1

取

F (x) = 1 - e - λ x α, x > 0

概率密度函数为：

f (x) = {λ α x α - 1 e - λ x α, 0, x > 0; x \leq 0

实际上指数分布是威布尔分布当