试用反应函数法求解“囚徒困境”博弈的纳什均衡。
答:囚徒困境的支付矩阵如图11-1所示:[img=590x180]17c96311c9fde49.png[/img]设A选择坦白的概率为p,选择抵赖的概率为1-p ;B选择坦白的概率为q,选择抵赖的概率为1-q。囚徒A的期望支付为:[tex=28.0x3.071]a0s3MH7cLIdmiBRR0YN06+uHBugq37O4e3pHw8wuMsLvb3eZBMd1dExTNe7IEDTpq16vfk5JcUc7+SzxyzaP9W0BkIMLXr+/hvr4S22UUU3GfEYYL51RFSNmHrAxh7nVhSOxk2Lv2C3WVn0v719V+cM0dGZZS0cxQeOTcgDkUMY=[/tex]囚徒B的期望支付为:[tex=28.857x3.071]a0s3MH7cLIdmiBRR0YN060rm70sN1vxImYQ/JeMAaKUMmkPm2cfF405v0iXgFb0cxeugBijcQ2VFkY9HJ2P9rOo9veQ2Sck8VUmZlEYPCE8xA0t/vAn6s2beTBwTllDYvYqPSrUsMArOrnBV4xLLxuOXrkno5rXsvdtMaBJtlF0=[/tex]根据期望最大化的一阶条件求反应函数:[tex=8.5x2.929]mpbqtAQiQz2ikKr9ltQnBUVg2pcoNBA4uK/7vMH6npdeuxx8VxAxxNMJlZuvu90f/2tbHyMbdJj2vQd4HtEM6WIu7oBEk0kqKT4FGZUrKIo=[/tex]上述两式无解。因此不能用代数求导方法寻找囚徒困境博弈的纳什均衡。理由:代数求导—寻找纳什均衡的方法,只能求导混合策略纳什均衡,而囚徒困境只有纯策略纳什均衡,不存在混合策略纳什均衡,故不能用代数求导方法求解。
举一反三
内容
- 0
求该博弈的纳什均衡。在这一囚徒困境似的博弈中,说明了什么问题?______
- 1
在囚徒困境的博弈中,两个囚徒合作的策略会形成()。 A: 纳什均衡 B: 占优策略均衡 C: 重复剔除的占优均衡 D: 非纳什均衡
- 2
请应用最优反应曲线来表示“囚徒困境”博弈中的纳什均衡点。[img=625x264]17b6d63d4e0ef69.png[/img]
- 3
在囚徒困境博弈中,纳什均衡对所有的选手来说都是最佳结果。
- 4
囚徒困境中的纳什均衡是( )。