Data Mining --- Information theory:熵/条件熵/互信息(信息增益)/交叉熵(相对熵/KL距离)

一、Jensen不等式

若f为区间I上的凹函数,则Jensen不等式成立:

image

这里若函数f为凹函数,则有:

image

凹函数(上凸)如下图所示:

image

归纳证明:

image

Jessen不等式是凹函数的基本性质,在信息论中经常用到,常见的凹函数如下图:

image

image

二、信息论

1.熵(信息不确定性度量)

image

2.联合熵

image

3.条件熵

image

4.互信息(信息增益)

image

5.交叉熵(相对熵/KL距离)

image

image

总结:熵、联合熵、条件熵、互信息的关系

image

原文地址:https://www.cnblogs.com/jizhiyuan/p/3423821.html