统计学基础之参数估计

目录：

一、点估计

　　1、矩估计法

　　2、顺序统计量法

　　3、最大似然法

　　4、最小二乘法

二、区间估计

　　1、一个总体参数的区间估计：

总体均值的区间估计
总体比例的区间估计
总体方差的区间估计

　　2、两个总体参数的区间估计：

两个总体均值之差的区间估计
两个总体比例之差的区间估计
两个总体方差比的区间估计

三、样本量的确定

　　1、估计总体均值时样本量的确定

　　2、估计总体比例时样本量的确定

一、点估计

点估计是用样本统计量来估计总体参数，因为样本统计量为数轴上某一点值，估计的结果也以一个点的数值表示，所以称为点估计。

点估计和区间估计属于总体参数估计问题。何为总体参数统计，当在研究中从样本获得一组数据后，如何通过这组信息，对总体特征进行估计，也就是如何从局部结果推论总体的情况，称为总体参数估计。

由样本数据估计总体分布所含未知参数的真值，所得到的值，称为估计值。点估计的精确程度用置信区间表示。

当母群的性质不清楚时，我们须利用某一量数作为估计数，以帮助了解母数的性质。如：样本平均数乃是母群平均数μ的估计数。当我们只用一个特定的值，亦即数线上的一个点，作为估计值以估计母数时，就叫做点估计。

点估计目的是依据样本X=(X1、X2…Xi)估计总体分布所含的未知参数θ或θ的函数g(θ)。一般θ或g(θ)是总体的某个特征值，如数学期望、方差、相关系数等。

1、矩估计法

利用样本矩来估计总体中相应的参数。首先推导涉及感兴趣的参数的总体矩（即所考虑的随机变量的幂的期望值）的方程。然后取出一个样本并从这个样本估计总体矩。接着使用样本矩取代（未知的）总体矩，解出感兴趣的参数。从而得到那些参数的估计。

最简单的矩估计法是用一阶样本原点矩来估计总体的期望而用二阶样本中心矩来估计总体的方差。在寻找参数的矩法估计量时，对总体原点矩不存在的分布如柯西分布等不能用，另一方面它只涉及总体的一些数字特征，并未用到总体的分布，因此矩法估计量实际上只集中了总体的部分信息，这样它在体现总体分布特征上往往性质较差，只有在样本容量n较大时，才能保障它的优良性,因而理论上讲，矩法估计是以大样本为应用对象的。

如果总体中有 K个未知参数，可以用前 K阶样本矩估计相应的前k阶总体矩，然后利用未知参数与总体矩的函数关系，求出参数的估计量。

2、顺序统计量法

顺序统计量设是总体X的样本，将它们自小到大排成，则这个排列称为样本顺序统计量。抽取一个样本，便有一组自小到大的观察值

与之相对应，其中

是观察值中最小者，

是观察值中最大者。例如，样本值为3.15，2.98，3.16，3.05，2.90，则其顺序统计量为2.90，2.98，3.05，3.15，3.16

顺序统计量估计法顺序统计量估计法是直观简便的估计法，常常是对总体的数学期望与标准差进行。

设

为总体X的样本顺序统计量，则称

为样本中位数。样本中位数

的观察值

的取值规则是：将样本观察值

自小到大排成顺序统计量观察值

，当n为奇数(即n=2k+1)时，

取居中的数据

；当n为偶数(n=2k)时，

取居中两个数据的平均值

，即

从中位数的含义可见，它带来了总体X取值的平均数信息，因此，用于估计总体X的数学期望是合适的。用样本中位数

估计总体X的数学期望的方法，称数学期望E(X)的顺序统计量估计法。其结果也有估计量与估计值之分。

3、最大似然法

　　给定一个概率分布D，假定其概率密度函数（连续分布）或概率聚集函数（离散分布）为fD，以及一个分布参数θ，我们可以从这个分布中抽出一个具有n个值的采样X1,X2,...,Xn，通过利用fD，我们就能计算出其概率：

。但是，我们可能不知道θ的值，尽管我们知道这些采样数据来自于分布D。如何估计θ？一个自然的想法是从这个分布中抽出一个具有n个值的采样X1,X2,...,Xn，然后用这些采样数据来估计θ。找到一个关于θ的估计。最大似然估计会寻找关于 θ的最可能的值（即，在所有可能的θ取值中，寻找一个值使这个采样的“可能性”最大化）。这种方法正好同一些其他的估计方法不同，如θ的非偏估计，非偏估计未必会输出一个最可能的值，而是会输出一个既不高估也不低估的θ值。要在数学上实现最大似然估计法，定义可能性：