推荐的有些东东

宗成庆的统计自然语言处理 第二版,里面有最大熵的介绍,非常专业,你一看就能明白

最大熵一个是模型的特征期望,一个是经验期望,经验期望是从训练数据中的得到的,模型期望要逼近经验期望,之后使用拉格朗日乘子算法求出模型的数学公式,就是那个指数公式


http://www.cs.utexas.edu/~dana/MLClass/
原文地址:https://www.cnblogs.com/i80386/p/4255200.html