列联表和crosstab(MATLAB)

二维列联表

二维列联表又称 (r imes s) 列联表。

我们从两种角度观察一组数据。第一种将被观察对象分为(r)类,比如,被调查群体吸烟和不吸烟的人数。第二种将被观察对象分为(s)类,比如,被调查群体中患肺癌和未患肺癌的人数。此时二维列联表是一个矩阵(X in mathbb{N}^{r imes s}),其中(x_{ij})表示同时属于第一种角度的第(i)类,和第二种角度的第(j)类的个数。比如,吸烟并患肺癌的人数。

卡方检验

Pearson 卡方检验,判断各变量之间的独立性。TBC

MATLAB中的函数crosstab

输入变量(a in \{ 1, dots, r \}^N, b in \{1, dots, s \}^N),其中(N)是被观察对象的个数。
[
[ m{table, chi2, p, labels} ] = m{crosstab}(a, b)
]
其中( m{table})就是二联表(X),其中(x_{ij} = sum_{p,q} (a_p == i)*(b_q == j))( m{chi2})是卡方检验。

labels是每一类的名称,按照我们上述的描述,第一种角度的第一类叫1,第二类叫2,等等。但也可能第一种角度第一类就叫2,也是可以的


--- 我是仙, 我不是神
原文地址:https://www.cnblogs.com/xyq-deeplearning/p/4171794.html