非参数统计

统计中的参数是什么？

大多数统计检验(如一般的线性模型)都假定某种基本分布，如正态分布。

如果你知道正态分布的平均值和标准偏差，那么你就知道如何计算概率。

均值和标准差称为参数，所有的理论分布都有参数。

假设分布和使用参数的统计测试称为参数测试。

不假定分布或不使用参数的统计测试称为非参数测试。

================================================

为什么我们使用非参数检验？

虽然自然界中的许多东西都是正态分布的，但有些却不是。例如，在这些情况下，使用t检验可能是不适当的和误导的。

非参数检验对数据的假设或限制较少。

非正态分布的例子：

定性数据：种族、性别、

有序的分类数据：轻度，中度，重度

利克特量表：强烈不同意，不同意，没有意见，同意，强烈同意

================================================

非参数测试如何工作？

大多数非参数检验在假设检验中使登等级而不是原始数据。

例句：用等级法比较女生和男生的考试成绩。

零假设：中值是平均数

================================================

非参数试验的优势

适用于任何尺度

容易计算----最初是在广泛使用计算机之前开发的

少作假设

不需要涉及总体参数

结果可能和参数程序一样精确。

==============================================

非参数试验的缺点

可能浪费信息

如果数据允许使用参数过程

示例：将数据从比率转换为序数比例尺

P值(表)未广泛提供

非参数检验综述

不考虑组的排名数据

使用组排名的和（或其他函数）来计算测试统计量

在表中或在计算机中查找p值

拒绝或失败以拒绝零假设

Sign test：略

如果没有真正的治疗效果，我们将假设有相同数量的+和-体征。

两组之间是否有显着性差异(和-)？我们如何计算p值？

===============================================

威氏符号秩次检验：略

==============================================

符号检验

不太强大

-- 不那么敏感

--更宽的置信区间

使用更少的信息

-只显示差异

威氏符号秩次检验

·更强大

-更敏感

-置信区间更窄

使用更多信息

-也是只显示差异。

=======================================

当我们有配对数据，并且不满足配对t检验的假设时，我们有两种方法来完成假设检验。

Wilcoxon符号等级测试总是比符号测试更好，因为它使用了更多的数据(因为它使用等级)。Wilcoxon符号秩检验具有更强的检测差异的能力。

当正态假设成立时，使用Wilcoxon符号秩检验与t检验相比，没有大的功率损失。当正态假设不成立时，Wilcoxon要强大得多。

因此，如果正态假设有怀疑，使用Wilcoxon符号秩检验更合适，即Wilcoxon符号秩检验正态与否通吃。

===========================================

Wilcoxon秩和检验

我们想知道两组的成本是否相同。

既然我们有两个独立的样本，可以使用两个样本测试。

请注意，这两个图看起来不正常，并且有许多异常值。

由于我们有两个独立的样本，而t检验是不合适的，所以我们需要一个非参数检验。

我们感兴趣的是中位数，而不是平均数。

利息的假设检验是

摘要：Wilcoxon秩和检验也称为Mann-Whitney检验。

检验两个独立的总体概率分布

对应于2个独立手段的t检验。

如果n大于10可以用正态拟合

前提：1.随机抽样2.这两个样品是独立的。3.样本数据至少是顺序的。4.这两个总体仅是位置不同。

===========================================

比较

	H0	固定信息	随机信息	测试统计量	注

Sign	“+”的概率与“-”的概率相同	非零差数	每一种差异的符号	“+S”数	理论上的二项分布
Wilcoxon	关于零的对称性	差异绝对值	每一种差异的符号	正秩和
Mann	来自同一分布的两组	两组中的等级	数据点的组成员	最小群的秩和	群随机分配

============================

Kruskal-Wallis(H)(用于序数数据)