指数族分布:相关概念理解

一、指数族分布指的是概率密度函数都能够表述成以下形式的概率分布。

 其中fai(x)是充分统计量,A(ita)是对数配分函数。ita是规范化参数。【配分函数其实就是归一化因子的概念,为了使概率满足概率总和为1的约束】

指数族分布包括Gauss分布,bernoulli分布(0,1分布),beta分布,gamma分布,二项分布(多项式分布),Dirichlet分布等。这些分布的概率密度函数都可以表示成上图中式子的形式。

            对数配分函数的推导

举例将高斯分布的概率密度函数用指数族分布的形式表达如下:

三、指数族分布有三个重要性质,分别是充分统计量、共轭、最大熵。

①关于充分统计量:(sufficient statistic)的理解:比如高斯分布中的{均值、方差}就是一组充分统计量,通过{均值,方差}我们就能得到这一组数据的大部分信息。(待确定)

不仅是{均值,方差},也可以是{sum(xi),sum(xi)^2}...,【查找相关统计概念】

充分统计量“充分”指的就是参数组{ ..}包含的原始数据的信息足够多,可以用于压缩数据。

“统计量”指的就是数学意义上一组数据的统计量,比如均值,方差...。

 ②关于共轭:是通过似然和先验的共轭关系,将先验的分布与后验的分布联系起来。如果似然和先验共轭,那么后验的分布与先验的分布是同一种分布。

 ③关于最大熵:【待定:对未知参数的估计,往最随机的方向假定。】

四、指数族分布中A(ita)和fai(x)的关系、A'(ita)和fai(x)的关系

①:A'(ita)和fai(x)的关系

式①:配分函数Z(也叫作归一化因子)

        A'(ita)和fai(x)的关系: A'(ita)=E(fai(x)),条件是p(x|ita)。

②由极大似然的想法推出 g_MLE=1/N(sum(fai(xi)))。

即从样本的充分统计量进行求和平均,就能得到参数向量值 g_mle。

 可以应用于广义线性模型(回归/分类)、概率图模型(RBM)、和变分推断(简便运算)中。

参考:

1.https://www.bilibili.com/video/BV1QW411y7D3?p=2,B站UP主:shuhuai008

原文地址:https://www.cnblogs.com/feynmania/p/13405284.html