熵的简单解释(科班同学勿入)

个人理解,专业人士笑一下就好了。

熵越小,信息量越大,越不稳定。举个例子,公司年会抽奖,假设有四个球ABCD,只有一个球是10万元现金奖。负责抽奖系统的是吃喝玩乐的狗肉朋友。

(1)朋友偷偷的告诉你:A的中奖概率25%,B的中奖概率25%,C的中奖概率25%,D的中奖概率25%。这朋友是不是太不厚道哦?为啥?

朋友提供的信息,惊喜度很小,也就是分布非常稳定,信息量很少(和没说一样),这个时候给出的信息很混乱,完全没有确定度,也就是熵值很大。

(2)朋友说:A的中奖概率1%,B的中奖概率1%,C的中奖概率97%,D的中奖概率1%

狗肉没有白吃呀:信息量巨大,熵值接近0。

熵的减小代表着进化,同时需要外界能量介入。熵最初是在热力学出现的,现在也用于很多领域。

据说华为任正非很喜欢熵理论,有本书:《熵减:华为活力之源 华为内训书系》推荐大家看看。

再从数学上解释熵:

公式:

假设有5个数据:true,false,true,false,true

上面有3个true(比例0.6),2个false(比例0.4),则数据集的熵值:

-  0.6 * log(0.6)/log(2)  - 0.4 * log(0.4)/log(2)    = 0.9709505944546686

这个熵值有些大了,除以log是底数为e的缘故,转为log2

再看看:(下面的l函数就是log函数),以下求单类数据的信息值:

-0.01 * l(0.01)/l(2)  = .06643856189774724695

-0.1 * l(0.1)/l(2) = .33219280948873623478

-0.2 * l(0.2)/l(2) = .46438561897747246957

-0.4 * l(0.4)/l(2) = .52877123795494493914

-0.6 * l(0.6)/l(2) = .44217935649972369984

-0.99 * l(0.99)/l(2) = .01435457399816392585

函数图像:

工具来自:https://zh.numberempire.com/graphingcalculator.php

 可以看看:https://www.cnblogs.com/shihuajie/p/5801408.html

原文地址:https://www.cnblogs.com/wjx0912/p/12181500.html