0%

博弈论入门介绍

[TOC]

1.key elements

即博弈论中的一些不可或缺的因素:PSPIR

  • Players::$\geq 2$ (1个就变成规划了)
  • Strategies:player做的一些决策
  • Pay-Off:收益,即通过决策可以得到的东西(incentives)
  • Information:知道什么
  • Rationality:如何思考(是否理性)

实际上在实际中要考虑到道德等各方面的因素,无法做到完全理性,因此只能假设理性,这也是博弈论的缺陷所在

2.效益矩阵

player(横2纵1) Strategy C Strategy D
Strategy A $P_{11}$ $P_{21}$ $P_{12}$ $P_{22}$
Strategy B $P_{13}$ $P_{23}$ $P_{14}$ $P_{24}$
  • AB是Player1做出的策略;CD则是Player2做出的策略,P为收益,左边是1的收益矩阵,右侧则是2的收益矩阵
  • $P_{ij}$指的是玩家i在情况j下的收益

效益矩阵实例化:囚徒困境

player(横2纵1) Strategy C Strategy D
Strategy A -6 -6 0 -12
Strategy B -12 0 -1 -1
  • 这是囚徒困境的实例化,AC为坦白从宽,confess;BD表示抗阻从严
  • 很明显:对Player1来说,无论2如何做,自己坦白从宽都是最佳策略;对2亦然如此
    • 对他们来说,这个策略是纳什均衡的
      • 纳什均衡:每个人理性上都不想改变自己的决策
        • 一定存在
  • 全局视角下,很明显这不是最佳策略
    • 理性:不选择严格劣的策略
    • Each singal descison is not global optimum No-cooporativa,非合作下的决定不一定全局最优
  • 囚徒困境只是特例,实际上AC\BD的策略并不一定相同
  • 其他例子:
    1. Lesson for military
    2. Market Strategies
    3. Cooperation depend on morality, or the complicated dynamics of environment ?
田忌赛马(横田忌纵齐威王)
1 -1 1 -1 1 -1
-1 1 1 -1 1 -1
-1 1 -1 1 1 -1
  • 田忌能赢的原因:信息不对等

3.Person Game:Simple Sum

  • RULE:一堆金币,有两个人彼此博弈,每个人每次能拿k枚,轮换拿,拿到最后那枚金币的获胜
  • Lemma:当每人能拿k枚硬币的时候,能够拿完硬币剩下i(k+1)(i\k为非负整数)的人获胜
    • Proof:
      1. i=1时候显然成立(无论先手拿完多少后手都可以全部拿走而获胜,而且先手不可能全部拿完)
      2. 假设i=N的时候成立
      3. 那么i=N+1的时,总共有(N+1)(k+1)枚硬币,这时候假设先手拿t枚硬币,那么后手拿k+1-t枚硬币即可回到ii的状态,因此后手(剩下i(k+1))一定获胜
  • 因此对于上面这个结果,先手的人在金币数除以k+1取模剩余1~k的时候都必胜,后手只在为k+1的时候必胜
  • 这是一个序列博弈:Sequential Game Theory

4.五个海盗分金币

  • RULE:5个海盗偷到1000枚金币,怎么分?、

    • 按照A>B>C>D>E的方式进行分配,第一位海盗进行分配方案确定,加上自己共有半数同意即可通过分配方案;如果没有通过,则被杀死,换第二个进行分配;… 依次类推
    • 如果你是A,该怎么提方案?
  • 条件:理性的人在相同情况下倾向于让游戏后结束-边界条件

  • 采用树的形式,从尾部开始考虑:
    • 对D:(1000,0),因为自己能保证通过
    • 对C:(999,0,1),这样能让E通过,因为E如果不同意后面就一块拿不到
    • 对B:(999,0,1,0),这样能让D通过,刚好两票,原因同上
    • 对A:(998,0,1,0,1),,这样能让BD通过,原因同上

5.一些博弈类型分类

(1) 合作博弈与非合作博弈

  • 前者彼此不能通信,后者能有协定

囚徒困境就是非合作博弈,如果串供就是合作博弈

(2)零和博弈:总收益为0

石头剪刀布

Battle of sexes 性别战:非零和博弈

(3)瞬时和序列博弈

  • 后者一般采用树的动态过程,类似海盗类型题

(4)完美和不完美信息博弈

  • 后者不知道对方的决策
  • 完美博弈不等于完全博弈
    • 完美是知道对方的决策(如下围棋),而完全是知道对方的收益矩阵

最后通牒博弈:序列、完美博弈

打牌是不完美信息博弈