FFisher分布

一个服从F分布的随机变量是利用如下两个随机变量的比值来定义的:
*X/n,X\~\chi _n^2  (有着自由度n的卡方分布)
*Y/n,Y\~\chi _m^2  (有着自由度m的卡方分布)
* X, Y 相互独立
 
联合概率密度函数
因为X, Y相互独立,所以它们的联合概率密度函数{f_{XY}}(x,y)就是它们各自的PDF的乘积,又因为X,Y是服从卡方分布的随机变量,所以我们有:
{f_{XY}}(x,y) = \frac{{{2^{ - n/2}}{2^{ - m/2}}}}{{\Gamma (\frac{n}{2})\Gamma (\frac{m}{2})}}{x^{n/2 - 1}}{y^{m/2 - 1}}{e^{ - \frac{x}{2}}}{e^{ - \frac{y}{2}}}
 
累积分布函数
对于任意给定的正数z, 我们可以通过定义P{X/Y < z}来计算F'分布的累积分布函数
 
X, Y为联合概率密度函数f(x,y)的两个随机变量。 根据联合概率密度函数的定义
P\{ U \in A\} = \int {\int\limits_A {f(x,y)dxdy} }
一个服从F分布的随机变量是利用如下两个随机变量的比值来定义的:
*X/n,X\~\chi _n^2  (有着自由度n的卡方分布)
*Y/n,Y\~\chi _m^2  (有着自由度m的卡方分布)
* X, Y 相互独立
 
联合概率密度函数
因为X, Y相互独立,所以它们的联合概率密度函数{f_{XY}}(x,y)就是它们各自的PDF的乘积,又因为X,Y是服从卡方分布的随机变量,所以我们有:
{f_{XY}}(x,y) = \frac{{{2^{ - n/2}}{2^{ - m/2}}}}{{\Gamma (\frac{n}{2})\Gamma (\frac{m}{2})}}{x^{n/2 - 1}}{y^{m/2 - 1}}{e^{ - \frac{x}{2}}}{e^{ - \frac{y}{2}}}
 
累积分布函数
对于任意给定的正数z, 我们可以通过定义P{X/Y < z}来计算F'分布的累积分布函数
 
X, Y为联合概率密度函数f(x,y)的两个随机变量。 根据联合概率密度函数的定义
P\{ U \in A\} = \int {\int\limits_A {f(x,y)dxdy} }
由此可以看出,{X,Y}被定义在区域 x/y < z, y的范围在0到正无穷,x的区域被限制为0到yz。
P\{ X/Y < z\} = K.\int_0^\infty {\int_0^{yz} {{x^{\frac{n}{2} - 1}}{y^{\frac{m}{2} - 1}}{e^{ - \frac{x}{2} - \frac{y}{2}}}dxdy} }
 
我们并不关心真正的累积分布函数F',而是它对z的导数也就是我们需要的概率密度函数。它的内部积分的上极限仅依赖于z的函数yz,{f_{F'}}(z) = K.\int_0^\infty {\{ \frac{d}{{dz}}[\int_0^{yz} {{x^{\frac{n}{2} - 1}}{y^{\frac{m}{2} - 1}}{e^{ - \frac{x}{2} - \frac{y}{2}}}dx]\} dy} }
 
根据原函数定理
{f_{F'}}(z) = K.\int_0^\infty {{{(yz)}^{\frac{n}{2} - 1}}{y^{\frac{m}{2} - 1}}{e^{ - \frac{{yz}}{2} - \frac{y}{2}}}ydy}
 
也即:
{f_{F'}}(z) = K.{z^{\frac{n}{2} - 1}}\int_0^\infty {{y^{\frac{{m + n}}{2} - 1}}{e^{ - \frac{y}{2}(z + 1)}}ydy}
 
看到这里,我们发现这个函数是Gamma函数一族的
\Gamma (\alpha ) \buildrel \wedge \over = \int\limits_0^\infty {{t^{\alpha - 1}}{e^{ - t}}dt}
 
y(z + 1)/2 = t, 则dy = 2.dt / (z + 1). 替换入方程有
{f_{F'}}(z) = K.{z^{\frac{n}{2} - 1}}\int_0^\infty {{{(\frac{{2t}}{{z + 1}})}^{\frac{{m + n}}{2} - 1}}{e^{ - t.}}\frac{2}{{z + 1}}dt}
 
= K.{z^{\frac{n}{2} - 1}}{(\frac{2}{{z + 1}})^{\frac{{m + n}}{2} - 1}}\frac{2}{{z + 1}}\int_0^\infty {{t^{^{\frac{{m + n}}{2} - 1}}}{e^{ - t}}dt}
 
= K.{z^{\frac{n}{2} - 1}}{2^{\frac{{m + n}}{2}}}\frac{1}{{{{(z + 1)}^{(m + n)/2}}}}\Gamma (\frac{{m + n}}{2})
 
我们实际上需要的是F = F'.(m/n),而不是F', 所以我们用 zn/m替换z来得到F
{f_F}(z) = K.\Gamma (\frac{{m + n}}{2}){2^{\frac{{m + n}}{2}}}{(\frac{{nz}}{m})^{\frac{n}{2} - 1}}\frac{1}{{{{(\frac{{nz}}{m} + 1)}^{(m + n)/2}}}}.\frac{n}{m}
 
= K.\Gamma (\frac{{m + n}}{2}){2^{\frac{{m + n}}{2}}}{(\frac{n}{m})^{\frac{n}{2}}}{m^{\frac{{m + n}}{2}}}{z^{\frac{n}{2} - 1}}\frac{1}{{{{(nz + m)}^{(m + n)/2}}}}
 
= K.\Gamma (\frac{{m + n}}{2}){2^{\frac{{m + n}}{2}}}{n^{\frac{n}{2}}}{m^{\frac{m}{2}}}{z^{\frac{n}{2} - 1}}\frac{1}{{{{(nz + m)}^{(m + n)/2}}}}
 
K = \frac{{{2^{ - \frac{n}{2}}}{2^{ - \frac{m}{2}}}}}{{2\Gamma (\frac{n}{2})\Gamma (\frac{m}{2})}}
所以我们得到:
{f_{n,m}}(x) = {n^{\frac{n}{2}}}{m^{\frac{m}{2}}}\frac{{\Gamma (\frac{{m + n}}{2})}}{{2\Gamma (\frac{n}{2})\Gamma (\frac{m}{2})}}.\frac{{{x^{\frac{n}{2} - 1}}}}{{{{(nx + m)}^{(n + m)/2}}}}
 
众数:
n = 1时:
{f_{1,m}}(x)\~\frac{1}{{\sqrt x .{{(x + m)}^{\frac{{m + 1}}{2}}}}}{m^{m + \frac{1}{2}}}
n = 2时:
{f_{2,m}}(x) = 2{m^{\frac{m}{2}}}\frac{{\Gamma (\frac{{m + 2}}{2})}}{{\Gamma (\frac{m}{2})}}.\frac{1}{{{{(2x + m)}^{(2 + m)/2}}}}
 
{f_{2,m}}(0) = 2{m^{\frac{m}{2}}}\frac{{\Gamma (\frac{{m + 2}}{2})}}{{\Gamma (\frac{m}{2})}}.\frac{1}{{{m^{(2 + m)/2}}}} = 1
 
n = n;
y具有以下形式
y = \frac{{{x^a}}}{{{{(x + b)}^c}}}
 
* a = (n - 2)/2
* b = m/n
* c = (n + m)/2
 
y 有着 u/v 这样的形式,它的导数是(uv' - u' v)/v², 我们仅关注导数为0的极值情况,也就是uv' = u' v
然后算得 : x = ab/( c - a)
 
将a, b  c代入上式有
得到众数的通项公式为 \frac{{n - 2}}{n}.\frac{m}{{m + 2}}
 
 
F分布的一阶矩
F = ( X/n)/(Y/m )
 
E[F'] = \int {\int {g(x,y)f(x,y)dxdy} }
 
F = g(x,y) = \frac{{X/n}}{{y/m}}
 
E[F'] = \int {\int {\frac{{mx}}{{ny}}f(x,y)dxdy} } = \frac{m}{n}\int {x{f_X}(x)dx\int {\frac{1}{y}{f_Y}(y)dy} }
 
= {K_n}{K_m}(\frac{m}{n})\int {x.{x^{\frac{n}{2} - 1}}{e^{ - \frac{x}{2}}}dx\int {(\frac{1}{y}){y^{\frac{m}{2} - 1}}{e^{ - \frac{y}{2}}}dy} }
 
= {K_n}{K_m}(\frac{m}{n})\int\limits_0^\infty {{x^{\frac{n}{2}}}{e^{ - \frac{x}{2}}}dx\int\limits_0^\infty {{y^{\frac{m}{2} - 2}}{e^{ - \frac{y}{2}}}dy} }
 
 x = 2t, 则有 dx = 2dt, 
\int\limits_0^\infty {{{(2t)}^{\frac{n}{2}}}{e^{ - t}}2.dt = {2^{\frac{n}{2} - 1}}\int\limits_0^\infty {{t^{\frac{{n - 2}}{2}}}{e^{ - t}}dt = } } {2^{\frac{n}{2} - 1}}\Gamma (\frac{{n + 2}}{2})
 
\Gamma (\frac{{n + 2}}{2}) = \frac{n}{2}\Gamma (\frac{n}{2}),所以上式为{2^{\frac{n}{2} + 1}}\frac{n}{2}\Gamma (\frac{n}{2})
 
再来看第二项积分
y = 2t       dy = 2dt 有
 
\int\limits_0^\infty {{{(2t)}^{\frac{m}{2} - 2}}{e^{ - t}}2.dt}
= {2^{\frac{m}{2} - 1}}\int\limits_0^\infty {{t^{\frac{{m - 2}}{2} - 1}}{e^{ - t}}dt} = {2^{\frac{m}{2} - 1}}\frac{n}{2}\Gamma (\frac{{m - 2}}{2})
 
{2^{\frac{m}{2} - 1}}\frac{2}{{m - 2}}\Gamma (\frac{m}{2})
 
所以得到
E[F'] = \frac{m}{{m - 2}}
 
二阶矩
E[F] = {K_n}{K_m}{(\frac{m}{n})^2}\int\limits_0^\infty {{x^{\frac{n}{2} + 1}}{e^{ - \frac{x}{2}}}dx\int\limits_0^\infty {{y^{\frac{m}{2} - 3}}{e^{ - \frac{y}{2}}}dy} }
x = 2t然后有
\int\limits_0^\infty {{{(2t)}^{\frac{n}{2} + 1}}{e^{ - t}}2.dt}= {2^{\frac{n}{2} + 2}}\int\limits_0^\infty {{t^{\frac{{n + 4}}{2} - 1}}{e^{ - t}}dt} = {2^{\frac{n}{2} + 2}}\Gamma (\frac{{n + 4}}{2})
 
得到
{2^{\frac{n}{2}}}n.(n + 2)\Gamma (\frac{n}{2})
 
第二项积分
\int\limits_0^\infty {{{(2t)}^{\frac{m}{2} - 3}}{e^{ - t}}2.dt}
= {2^{\frac{m}{2} - 2}}\int\limits_0^\infty {{t^{\frac{{m - 4}}{2} - 1}}{e^{ - t}}dt} = {2^{\frac{m}{2} - 2}}\frac{n}{2}\Gamma (\frac{{m - 4}}{2})
= \frac{{{2^{\frac{m}{2}}}}}{{(m - 4)(m - 2)}}\Gamma (\frac{m}{2})
 
所以二阶矩为
E[{F^2}] = \frac{{{m^2}(n + 2)}}{{n(m - 4)(m - 2)}}
 
F分布的方差
Var( F) = E [F²] - E[F
 
根据以上结果可以得到:
Var[F] = 2.\frac{{{m^2}}}{{{{(m - 2)}^2}}}.\frac{{n + m - 2}}{{n(m - 4)}}
 
得到均值和方差的第二种方法:
{f_{n,m}}(x) = {K_{n,m}}\frac{{{x^{\frac{n}{2} - 1}}}}{{{{(nx + m)}^{\frac{{m + n}}{2}}}}}
 
E[{X^k}] = {K_{n,m}}\int_0^\infty {\frac{{{x^k}.{x^{\frac{n}{2} - 1}}}}{{{{(nx + m)}^{\frac{{m + n}}{2}}}}}dx}
 
首先让我们了解一下形如
I(\alpha ,\beta ) = \int_0^\infty {\frac{{{x^\alpha }}}{{{{(nx + m)}^\beta }}}dx}
的递归积分,α 和 β都是正数,且β > α + 2
 
第一种递归关系:
 
I(\alpha ,\beta ) = \int_0^\infty {\frac{{{x^\alpha }}}{{{{(nx + m)}^\beta }}}dx} = \int_0^\infty {\frac{{{x^{\alpha - 1}}.x}}{{{{(nx + m)}^\beta }}}dx}
 
= \frac{1}{n}\int_0^\infty {\frac{{{x^{\alpha - 1}}(nx + m - m)}}{{{{(nx + m)}^\beta }}}dx}
 
= \frac{1}{n}\int_0^\infty {\frac{{{x^{\alpha - 1}}}}{{{{(nx + m)}^{\beta - 1}}}}dx} - \frac{m}{n}\int_0^\infty {\frac{{{x^{\alpha - 1}}}}{{{{(nx + m)}^\beta }}}dx}
 
= \frac{1}{n}[I(\alpha - 1,\beta - 1) - mI(\alpha - 1,\beta )]
 
第二种递归关系:
 
u = x α
然后   u' = α xα -1
 
v =   n-1 (1 - β) -1( nx + m)1- β
然后   v' = (nx + m) - β
  
根据分布积分公式有
I(\alpha ,\beta ) = \int_0^\infty {\frac{{{x^\alpha }}}{{n(1 - \beta ){{(nx + m)}^{\beta - 1}}}}dx}+ \frac{\alpha }{{n(1 - \beta )}}\int_0^\infty {\frac{{{x^{\alpha - 1}}}}{{{{(nx + m)}^{\beta - 1}}}}dx}
 
= 0 + \frac{\alpha }{{n(1 - \beta )}}I(\alpha - 1,\beta - 1)
 
I(\alpha ,\beta ) = \frac{1}{n}[I(\alpha - 1,\beta - 1) - mI(\alpha - 1,\beta )] = \frac{1}{n}[\frac{{n(1 - \beta )}}{\alpha }I(\alpha ,\beta ) - mI(\alpha - 1,\beta )]
= \frac{{(1 - \beta )}}{\alpha }I(\alpha ,\beta ) - \frac{m}{n}I(\alpha - 1,\beta )
 
也就是
I(\alpha + 1,\beta ) = \frac{m}{n}\frac{{(\alpha + 1)}}{{\beta - \alpha - 2}}I(\alpha ,\beta )
 
现在来计算参数K,
 
\int\limits_0^\infty {{f_{n,m}}(x)} = {K_{n,m}}\int\limits_0^\infty {\frac{{{x^{\frac{n}{2} - 1}}}}{{{{(nx + m)}^{\frac{{m + n}}{2}}}}}dx} = {K_{n,m}}I(\alpha ,\beta ) = 1
* α = n/2 - 1
* β = (n + m)/2
 
I(\frac{{n - 2}}{2},\frac{{n + m}}{2}) = \frac{1}{{{K_{n,m}}}}
 
E[X] = {K_{n,m}}I(\alpha + 1,\beta ) = {K_{n,m}}\frac{m}{n}\frac{{\frac{n}{2} + 1 - 1}}{{\frac{{n + m}}{2} - \frac{{n - 2}}{2} - 2}}.\frac{1}{{{K_{n,m}}}}
 
E[X] = \frac{m}{{m - 2}}
 
同理可算得二阶矩为:
E[{X^2}] = \frac{{{m^2}(n + 2)}}{{n(m - 4)(m - 2)}}
 
原文地址:https://www.cnblogs.com/frischzenger/p/3008813.html