机器学习 —— 概率图模型（学习：综述）

　　今天Google的机器人AlphaGo获得了围棋对阵李世石的第二场胜利，我也进入到概率图模型学习模块的阶段。Machine Learning 令人着迷也令人畏惧。

——题记

1、基于PGM的学习

　　ANN网络的拓扑结构往往是类似的。同一套模型以不同的样本进行训练，可以获得不同的结果。PGM可以人为的向网络中添加先验知识，在设计以及分析时有更好的可读性。此外，概率图模型在序列变量的学习上，要优于常规机器学习算法。本质上，基于PGM的学习是在给定Dataset的基础上，对随机变量的分布进行估计。

2、学习可分为以下几种情况：

　　1、数据完整，网络结构完整

　　2、数据不完整，网络结构完整

　　3、数据不完整、网络结构不完整

　　4、数据完整，网络结构不完整

　　5、存在隐藏变量，且数据不完整

3、学习可分为以下几种目的：

　　1、针对新的实例回答概率询问：拿出三个香蕉一个苹果，箱子里水果比例是多少

　　　　特点：容易计算

　　2、针对新的实例进行预测：获得某个像素求label

　　　　特点：关心特定的目标。优化模型选择简单。

　　3、对给定数据挖掘其联系：奶粉与尿布的相关性

4、避免过拟合

　　使用超参数，将数据集分成：训练集，校正集，测试集，利用校正集来对超参数进行校正。