读书笔记: 博弈论导论

读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

战略协议(Strategic Bargaining)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。

一个两人协议博弈的过程:

  • 第一回合
    • 玩家1提出分配((x, 1-x)),玩家1得到x,玩家2得到1-x。
    • 如果玩家2表示接受,博弈结束,(v_1 = x, v_2 = 1-x)。如果玩家2反对,进入下一轮
  • 第二回合
    • 剩余变成了(1 - delta)。折扣率(0 < delta < 1)
    • 玩家2提出分配((x, 1-x)),玩家1得到x,玩家2得到1-x。
    • 如果玩家1表示接受,博弈结束,(v_1 = delta x, v_2 = delta (1-x))。如果玩家1反对,进入下一轮。
  • 第三回合及以后
    • 博弈如上继续,在奇数回合,玩家2的反对则导致其在下一轮变成提议者,反之亦然。
    • 每个回合的继续,到导致剩余的一次折扣,在第t个回合,剩余未(delta^{t-1})

协议博弈和之前博弈的不同之处:

  • 如果提议被接受,博弈会在任何回合结束。
  • 收益只有在整个博弈结束时才产生,而不是每个回合就会产生。

只有一轮的协议:最后的话博弈(The ultimatum game)

take it or leave it.
推论:11.1

在一个T=1的协议博弈中,剩余的任何分配都能被支持为一个纳什博弈:(x^* in [0, 1], (v_1, v_2) = (x^*, 1 - x^*)).
推论:11.2
在一个T=1的协议博弈中,允许一个唯一的子博弈精炼均衡,在这个均衡中,玩家1提供(x=1),并且玩家2接受任何(x leq 1)

有限回合的协议博弈

推论:11.3

任何子博弈精炼均衡必定导致玩家们可以在第一回合达成一致。
两人奇数回合的协议博弈的结果

[v_1^* = x_1 = frac{1 + delta^T}{1 + delta} and v_2^* = (1 - x_1) = frac{delta - delta^T}{1 + delta} \ lim_{T o infty} v_1^* = lim_{T o infty} frac{1 + delta^T}{1 + delta} = frac{1}{ 1 + delta} \ lim_{T o infty} v_2^* = lim_{T o infty} frac{delta - delta^T}{1 + delta} = frac{delta}{1 + delta} \ lim_{delta o 1} lim_{T o infty} v_1^* = lim_{delta o 1} frac{1}{1 + delta} = frac{1}{2} \ lim_{delta o 1} lim_{T o infty} v_2^* = lim_{delta o 1} frac{delta}{1 + delta} = frac{1}{2} \ ]

说明了

  • 玩家1拥有last-mover take-it-or-leave-it 优势和 first-mover折扣优势,意味着: (v_1^* > v_2^*)
  • 如果玩家都是有耐性的(也就是说不接受达到自己最低要求的提议),则last-mover take-it-or-leave-it优势消失了。
  • 长期的回合消除了last-mover take-it-or-leave-it优势。
  • (delta = 1)消除了first-mover优势。

无限回合的协议博弈

两人无限回合的协议博弈的结果

[overline{v}_1 = overline{v}_2 = overline{v} \ underline{v}_1 = underline{v}_2 = underline{v} \ underline{v} = 1 - delta overline{v} \ overline{v} = 1 - delta underline{v} \ underline{v} = overline{v} = frac{1}{1 + delta} \ where \ overline{v} ext{ : the best subgame-perfect equilibrium} \ underline{v} ext{ : the worst subgame-perfect equilibrium} \ ]

协议立法

封闭规则协议(Closed-Rule Bargaining)

博弈规则:

有N奇数个玩家,需要(frac{N+1}{2})个接受才能是提议通过。
在每个周期里,每个玩家都有相同的可能性称为提议者。
博弈结果:

[where \ k ext{ : the proposer's best response} \ v ext{ : the expected payoff for any player i} ]

提议者的最佳收益:需要得到n-1的人的同意,由于折扣优势,这个n-1个人的收益为(delta v)

[k = 1 - frac{N - 1}{2} delta v \ ]

回应者的收益:有(frac{1}{N})可能性成为提议者,拿到k;
(frac{N - 1}{N})的可能性成为回应者,并且只有(frac{1}{2})的可能性(因为提议者只提供收益给回应者中的一半人)拿到(delta v)

[v = frac{k}{N} + frac{N - 1}{2N} delta v \ ]

计算结果:

[v = frac{1}{N} \ k(N) = 1 - delta ( frac{N - 1}{2N}) \ ]

说明了

  • 当回扣率增加,提议者的收益变少。
  • 玩家越多,提议者收益越大,回应者收益越少。

开放规则协议(Opened-Rule Bargaining)

博弈规则:

有N奇数个玩家。
提议者提出一个协议,
有一个修订者提出一个修改协议。
如果提议者的协议通过了(frac{N+1}{2})。则被接受。
否则,修改协议变成主协议。
一个新的修订者提出一个修改协议。
再次投票,重复上面的过程。

保证方案(guaranteed success)

无论那个响应者成为修订者,都可通过的方案。
案例:3个玩家。

[where \ k ext{ : the proposer's best response} \ v(k) ext{ : the expected payoff for any player i} ]

回应者的收益:一方面为(frac{1 - k}{2}),一方面为(delta v(k))

[frac{1 - k}{2} = delta v(k) \ ]

修订者的收益:由于对称性,修订者的给自己的收益(v(k))应该是k。

[v(k) = k \ ]

计算结果:

[k = frac{1}{1 + 2 delta} \ ]

说明了

  • 玩家越有耐心,提议者的付出越多。
  • 封闭规则对提议者有利。

冒险方案(risky success)

冒一个部分响应者不会成为修订者的风险。

[where \ k ext{ : the proposer's value to himself} \ v(k) ext{ : the expected payoff for proposer} \ v(0) ext{ : the expected payoff for the player who will be offered 0} ]

回应者的收益:一方面为(1 - k),一方面为(delta v(k))

[1 - k = delta v(k) ]

提议者的期望收益:有(frac{1}{2})可能性拿到k;如果冒险失败,有(frac{1}{2})可能性拿到v(0)。

[v(k) = frac{1}{2} k + frac{1}{2} delta v(0) \ ]

得到0的玩家的期望收益:有一半的可能性得到v(k)。

[v(0) = frac{1}{2} delta v(k) \ ]

计算结果:

[k = frac{4 - delta^2}{4 + 2 delta - delta^2} \ v(k) = frac{2}{4 + 2 delta - delta^2} \ ]

说明了

  • (delta > sqrt{3} - 1)时,冒险方案更好。

参照

原文地址:https://www.cnblogs.com/steven-yang/p/8290494.html