条件概率，全概率公式，贝叶斯公式，朴素贝叶斯

本文摘自黄清龙等编著的《概率论与数理统计》

-----------------------------------------------------------------------------------------------------------

条件概率

-----------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------

我们以一个例子来阐述朴素贝叶斯思想。例子来自朴素贝叶斯分类:原理。

假设根据以前的经验获得如下的数据。然后给你一个新的数据：身高“高”、体重“中”，鞋码“中”，请问这个人是男还是女？

判断是男还是女，是分类问题，记男为C₁，女为C₂。身高体重鞋码是样本X的属性，记x₁为身高，x₂为体重，x₃为鞋码。我们问题是，已知样本X的属性，求它最有可能属于哪一类。也就是说朴素贝叶斯分类法预测X属于C_i类，当且仅当

P(C_i|X)>P(C_j|X)，1<= j <=2，j!=i

这样，最大化P(C_i|X)。使P(C_i|X)最大的类C_i称为最大后验假设。根据贝叶斯公式：

由于P(X)对于所有类为常数，所以只需要P(X|C_i)P(C_i)最大即可。

打断一下，其实在这里，贝叶斯公式可以这样理解：

在本例中，新的样本的属性是x₁=高，x₂=中，x₃=中。

P(x₁|C₁)=0.5，P(x₂|C₁)=0.5，P(x₃|C₁)=0.25，P(C₁)=0.5，---> P(X|C₁)P(C₁)=0.5*0.5*0.25*0.5=0.03125

P(x₁|C₂)=0，P(x₂|C₂)=0.5，P(x₃|C₂)=0.5，P(C₂)=0.5，---> P(X|C₁)P(C₁)=0*0.5*0.5*0.5=0

所以新样本更可能属于C₁类，即男生。

总结朴素贝叶斯计算过程：