纳什均衡和帕勒托最优

囚徒困境

双方不能通信的前提下,选择招供是唯一的不管对方如何行为对方都不能增加收益的情况。----也就是在出于自身利益的前提下达到了纳什均衡。

个体的理性选择并不是整体的最优选择(因为不能确定对方的行为--零和静态(即同时,象棋就是动态)非合作博弈)

纳什均衡

任何行为者独自改变策略都不能再比对方增加收益

帕勒托曲线

不可能再在不损失任一方的前提下,使其他任一方获利。

但是帕勒托最优不一定我们想要的全局最优:如世界上只有一个富翁和一个流浪汉,只需给流浪汉一些钱,世界就没有了贫困。

显然纳什均衡不一定是帕勒托最优,如囚徒困境。

非零和博弈中,帕累托最优和纳什均衡是互相冲突的。

GAN基于博弈论, VAE变分基于贝叶斯先验

原文地址:https://www.cnblogs.com/Henry-ZHAO/p/14058237.html