博弈论---3、囚徒困境

博弈论---3、囚徒困境

一、总结

一句话总结:

1、“囚徒困境”就是满足“背叛诱惑 > 合作报酬” 和 “受骗支付 > 背叛惩罚” 条件的博弈。
2、解决“囚徒困境”就是让“囚徒困境”的两个条件不成立:也就是让“背叛诱惑<合作报酬”和“受骗支付<背叛惩罚”
3、生活中的各种合作与背叛的事情,我们也可以提高合作报酬,提高背叛惩罚来降低被背叛的几率。

二、囚徒困境

博客对应课程的视频位置:3、囚徒困境-范仁义-读书编程笔记
https://www.fanrenyi.com/video/36/326

囚徒困境例子

A和B是犯罪同伙,被隔离审讯。

如果A和B都坦白罪行,会都被判刑8年;

如果一人坦白,一人不坦白,坦白的人直接释放,不坦白的重判15年;

如果两人都不坦白呢,则证据不足,都只判1年。

这,就是著名的“囚徒困境”。

...

虽然“都不坦白”是最优策略,但“都不坦白”是经不起考验的最优策略:我如果单方选择背叛,将立即获释,诱惑太大;而且就算我守口如瓶,万一他背叛了呢?我会被判15年,风险太高。

“都坦白”呢?那两人都获刑8年。这时,如果一名囚徒单方决定守口如瓶,他的8年刑期将立刻变为15年,而另一人则被释放。对于守口如瓶的人,这一点好处都没有。

所以,“都坦白”,是囚徒困境中唯一稳定的“纳什均衡”。

那,这背后的博弈论原理是什么呢?

囚徒困境

一个典型的囚徒困境,其实就是满足两个条件的博弈:

1、背叛诱惑 > 合作报酬

合作报酬是判刑1年,背叛诱惑却是立即释放。

2、受骗支付 > 背叛惩罚

背叛惩罚是判刑8年,受骗支付却是判刑15年。

这就是“囚徒困境”的基本原理。

...

那,要怎么“破”?

1、让“合作报酬 > 背叛诱惑”

我们看看电影里常见的桥段:

你很讲义气,死不招供,然后就会有人给你带话:大哥说了,你家里的事情不用担心,老人、嫂子、孩子,我们都会照顾好。你出来那一天,还会有一大笔dollar...这就是提高“合作报酬”;

一个坦白了的人刚被释放出来,坐上自己的汽车,汽车发动的一瞬间,bang!!!就算把你释放出来,也一样没有好果子吃,这就是降低“背叛诱惑”;

2、让“背叛惩罚 > 受骗支付”

我们还是看看电影里面的桥段:

电影里的古惑仔们,大多都很讲义气,崇尚“忠义”,不讲义气会被整个江湖唾弃,这种文化会在一定程度上,增加“背板惩罚”;

什么?你被人出卖了?大哥除了会给你钱,帮你赡养家人之外,你的仇人就是大哥的仇人。不管他走到天涯海角,你放心,这仇我帮你报了!这,就是降低“受骗支付”。

小结一下

“囚徒困境”就是“背叛诱惑 > 合作报酬”,“受骗支付 > 背叛惩罚”。

怎么破?

第一,提高合作报酬,降低背叛诱惑;

第二,提高背叛惩罚,降低受骗支付。

生活中的各种合作与背叛的事情,我们也可以提高合作报酬,提高背叛惩罚来降低被背叛的几率。

你,学会了么?

...

参考:https://www.toutiao.com/i6493100684932547086/

 
原文地址:https://www.cnblogs.com/Renyi-Fan/p/13323084.html