混合策略求解

因为看到版上经常有人对此有疑问,特整理一个简单的方法供大家参考。

百度百科上的定义(感觉比较贴切):

在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。

一般解法(下面我们介绍一种简便的求解混合策略的方法,它不一定严谨,但是管用。 参照网上信息):
以“麦琪的礼物”为例来说明。我们假设丈夫卖表的概率为p,那么不卖表的概率为 1-p,为方便也可将这概率标记在赢利表旁边(如表1);假设妻子剪发的概率为q,那么不剪发的概率为 1-q,为方便把它们记在赢利表下边。 

                                                                                                                               麦琪的礼物

    剪发 不剪  
  买表 (0,0) (2,1) p
  不买 (1,2) (0,0) 1-p
    q 1-q  



各参与人在各策略下的预期赢利为: 
    丈夫:买表的预期赢利:0×q+2 ×(1-q)=2-2q           (1) 
        不卖的预期赢利:1×q+0 ×(1-q)=q                       (2) 

    妻子:剪发的预期赢利:0×p+2 ×(1-p)=2-2p              (3) 
        不卖的预期赢利:1×p+0 ×(1-p)=p                          (4) 

    注意,丈夫的某个策略的赢利是该策略对应的行中丈夫的赢利与妻子的概率积之和;而妻子的某个策略的赢利是该策略对应的列中妻子的赢利与丈夫的概率积之和。纳什均衡应满足,①妻子选择q使丈夫在各策略之间的预期赢利没有差异,即使式子(1) 
等于式子(2):2-2q=q,可解出q*=2/3;②丈夫选择q使妻子在各策略之间的预期赢利没有差异,即使式子(3)等于式子(4):2-2p=p,可解出p* =2/3。 
    由此,纳什均衡状态下丈夫的混合策略是(2/3,1/3),妻子的混合策略也是(2/3,1/3)。混合纳什均衡为{(2/3,1/3),(2/3,1/3)}。 


另外,如果开始时不是2*2的博弈,求混合策略应先剔除劣势策略 。

原文地址:https://www.cnblogs.com/huenchao/p/7743373.html