高斯判别分析 Gaussian Discriminant Analysis

如果在我们的分类问题中，输入特征

以二分类问题为例进行说明，模型建立如下：

样本输入特征为
样本类别
两类样本分别服从不同的高斯分布，即

对应的概率分布形式如下：

p (y) = ϕ y (1 - ϕ) 1 - y (1)

p (x | y = 0) = 1 ( 2 π ) n 2 | Σ | 1 2 exp ( -

p (x | y = 1) = 1 ( 2 π ) n 2 | Σ | 1 2 exp ( -

p (x | y) = 1 ( 2 π ) n 2 | Σ | 1 2 exp ( -

我们模型的参数包括

给定包含

通过最大似然进行参数估计，用似然函数

μ 1 = \sum m i = 1 1 { y ( i ) = 1 } x ( i ) \sum m i = 1 1

仔细分析一下估计出的四个参数，我们会发现

有了这些参数，我们怎样进行预测呢？这就很简单了，将各参数带入

a r g max y \in {0, 1}

最后，我们来分析高斯判别模型和Logistic回归之间的情缘。如果

= = = = p (y = 1 | x) p ( x | y = 1 ) p (

高斯判别分析在建模时提出了很强的假设，那就是各个类别的数据服从高斯分布。当建模的假设近似正确时，高斯判别分析对数据的应用更高效，因为模型知道数据服从高斯分布，并且直接获取了高斯分布的均值和方差，因此在数据量较少的情形下能有较好效果。如果数据的实际分布与假设相悖时，效果往往会比较差。Logistic回归做出的模型假设相比之下很弱，因此对模型的假设具有更好的鲁棒性。举个例子，如果数据呈现的不是高斯分布而是Poisson分布，但是我们仍然假设

以下是GDA相关实验的一个小Demo截图和简要说明，实验代码在这里下载。实验中用两个均值不同但方差相同的高斯模型随机生成了400个1维的样本点，其中两类样本之比为

作者：JeromeWang
邮箱：yunfeiwang@hust.edu.cn
出处：http://www.cnblogs.com/jeromeblog/