非参数统计

非参数统计

统计中的参数是什么?

大多数统计检验(如一般的线性模型)都假定某种基本分布,如正态分布。

如果你知道正态分布的平均值和标准偏差,那么你就知道如何计算概率。

均值和标准差称为参数,所有的理论分布都有参数。

假设分布和使用参数的统计测试称为参数测试。

不假定分布或不使用参数的统计测试称为非参数测试。

================================================

为什么我们使用非参数检验?

虽然自然界中的许多东西都是正态分布的,但有些却不是。例如,在这些情况下,使用t检验可能是不适当的和误导的。

非参数检验对数据的假设或限制较少。

非正态分布的例子:

定性数据:种族、性别、

有序的分类数据:轻度,中度,重度

利克特量表:强烈不同意,不同意,没有意见,同意,强烈同意

================================================

非参数测试如何工作?

大多数非参数检验在假设检验中使登等级而不是原始数据。

例句:用等级法比较女生和男生的考试成绩。

零假设:中值平均数

================================================

非参数试验的优势

适用于任何尺度

容易计算----最初是在广泛使用计算机之前开发的

少作假设

不需要涉及总体参数

结果可能和参数程序一样精确。

==============================================

非参数试验的缺点

可能浪费信息

如果数据允许使用参数过程

示例:将数据从比率转换为序数比例尺

P()未广泛提供

非参数检验综述

不考虑组的排名数据

使用组排名的和(或其他函数)来计算测试统计量

在表中或在计算机中查找p

拒绝或失败以拒绝零假设

Sign test:略

如果没有真正的治疗效果,我们将假设有相同数量的+-体征。

两组之间是否有显着性差异(-)?我们如何计算p值?

===============================================

威氏符号秩次检验:略

==============================================

符号检验

不太强大

-- 不那么敏感

--更宽的置信区间

使用更少的信息

-只显示差异

威氏符号秩次检验

·更强大

-更敏感

-置信区间更窄

使用更多信息

-也是只显示差异。

=======================================

当我们有配对数据,并且不满足配对t检验的假设时,我们有两种方法来完成假设检验。

Wilcoxon符号等级测试总是比符号测试更好,因为它使用了更多的数据(因为它使用等级)Wilcoxon符号秩检验具有更强的检测差异的能力。

当正态假设成立时,使用Wilcoxon符号秩检验与t检验相比,没有大的功率损失。当正态假设不成立时,Wilcoxon要强大得多。

因此,如果正态假设有怀疑,使用Wilcoxon符号秩检验更合适,即Wilcoxon符号秩检验正态与否通吃。

===========================================

Wilcoxon秩和检验

我们想知道两组的成本是否相同。

既然我们有两个独立的样本,可以使用两个样本测试。

请注意,这两个图看起来不正常,并且有许多异常值。

由于我们有两个独立的样本,而t检验是不合适的,所以我们需要一个非参数检验。

我们感兴趣的是中位数,而不是平均数。

利息的假设检验是

摘要:Wilcoxon秩和检验也称为Mann-Whitney检验。

检验两个独立的总体概率分布

对应于2个独立手段的t检验。

如果n大于10可以用正态拟合

前提:1.随机抽样2.这两个样品是独立的。3.样本数据至少是顺序的。4.这两个总体仅是位置不同。

===========================================

比较

H0

固定信息

随机信息

测试统计量

Sign

+”的概率与“-”的概率相同

非零差数

每一种差异的符号

+S”数

理论上的二项分布

Wilcoxon

关于零的对称性

差异绝对值

每一种差异的符号

正秩和

Mann

来自同一分布的两组

两组中的等级

数据点的组成员

最小群的秩和

群随机分配

============================

Kruskal-Wallis(H)(用于序数数据)

原文地址:https://www.cnblogs.com/yuanjingnan/p/12025773.html