如何设计一个卡方检验

(0,1,··· ,2^n −1) 中随机取一个数, 取完后放回. 独立重复这个过程 k 次, 事件 (A_m):“此 k 个数中最大的数是 m”的概率(P_m)。((m≤2^n-1))

  • (P_A)为k次试验取得的数均小于等于m的概率,显然(P_A)中包含k次试验均取出小于m值的事件,则(P_A = (frac{m+1}{2^n})^k)

    (P_B)为k次试验取得的数均小于m的概率,则(P_B = (frac{m}{2^n})^k)

    (P_m = P_A -P_B = (frac{m+1}{2^n})^k-(frac{m}{2^n})^k = frac{(m+1)^k-m^k}{(2^n)^k})

  • 1)取n=3,k=3

    则P(0) = 1/512,P(1) = 7/512,P(2) = 19/512,

    P(3) = 37/512,P(4) = 61/512,P(5) = 91/512,

    P(6) = 127/512,P(7) = 169/512

    2)将试验结果分为以下四类:

    (e_1):取出来的数小于等于4 ,(P_1 = frac{125}{512})

    (e_2):取出来的数最大为5,(P_2 = frac{91}{512})

    (e_3):取出来的数最大为6,(P_3 = frac{127}{512})

    (e_4):取出来的数最大为7,(P_4 = frac{169}{512})

    3) 算法如下:

    独立重复n次试验后可得(e_1,e_2,e_3,e_4)出现的次数为(η_1,η_2,η_3,η_4)

    四项分布理论(ξ = sum_{i=1}^{4}{frac{(η_i-nP_i)^2}{nP_i}}) ~ (χ^2(3))

    则观察值为(ξ_{obs}= sum_{i=1}^{4}{frac{(η_i-nP_i)^2}{nP_i}})

    (P_{val} = Q(frac{3}{2},frac{ξ_{obs}}{2}))

    4)举例该算法检验过程如下:

    例如100010111101001010分为两组,一组为100(4)010(2)111(7),另一组为101(5)001(1)010(2)

    第一组属于(e_4),第一组属于(e_2),即对于这一组数据来说,(,e_1,e_3)出现了0次,(,e_2,e_4)

    出现了1次。

    则观察值(ξ_{obs}=2P_1 + 2P_3 + frac{(1-2P_2)^2}{2P_2} + frac{(1-2P_4)^2}{2P_4} = 2.328)

    借助MATLAB平台算出P值为0.7232

原文地址:https://www.cnblogs.com/poziiey/p/12522250.html