卡方检验再次复习

两类问题介绍:

两个样本之间的比例是否一样,比如两个城市的有钱人和穷人比例是否一致。

两个分类变量之间是否独立,比如时间和级别是否存在依赖关系。时间可以划分n个等级,级别也可以划分几个等级,然后df为(r-1)*(c-1)

二者区别:

感觉上计算卡方值公式都是一样的,但实际上是由区别。

1:抽样顺序不同,前者是已经分好类,再抽,后者是直接抽再分类

2:假设检验的内容不同,前面是各类别的比例等于某个期望概率,后者是两个变量是否相互独立

3:计算前者卡方是∑(实际-期望)*2/期望,后者是概率相乘

计算方法:

1:excel可以用chitest函数

2:r语言用chisq.test

tablefc1<-matrix(c(36.67,66.66,90,93.33,93.33,33.33,63.34,63.33,76.67,76.67),nrow=2,ncol=5)

chisq.test(tablefc1)

原文地址:https://www.cnblogs.com/marszhw/p/12275398.html