试用反应函数法求解“囚徒困境”博弈的纳什均衡。

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-11

试用反应函数法求解“囚徒困境”博弈的纳什均衡。

答案：

答：囚徒困境的支付矩阵如图11-1所示：[img=590x180]17c96311c9fde49.png[/img]设A选择坦白的概率为p，选择抵赖的概率为1-p ；B选择坦白的概率为q，选择抵赖的概率为1-q。囚徒A的期望支付为：[tex=28.0x3.071]a0s3MH7cLIdmiBRR0YN06+uHBugq37O4e3pHw8wuMsLvb3eZBMd1dExTNe7IEDTpq16vfk5JcUc7+SzxyzaP9W0BkIMLXr+/hvr4S22UUU3GfEYYL51RFSNmHrAxh7nVhSOxk2Lv2C3WVn0v719V+cM0dGZZS0cxQeOTcgDkUMY=[/tex]囚徒B的期望支付为：[tex=28.857x3.071]a0s3MH7cLIdmiBRR0YN060rm70sN1vxImYQ/JeMAaKUMmkPm2cfF405v0iXgFb0cxeugBijcQ2VFkY9HJ2P9rOo9veQ2Sck8VUmZlEYPCE8xA0t/vAn6s2beTBwTllDYvYqPSrUsMArOrnBV4xLLxuOXrkno5rXsvdtMaBJtlF0=[/tex]根据期望最大化的一阶条件求反应函数：[tex=8.5x2.929]mpbqtAQiQz2ikKr9ltQnBUVg2pcoNBA4uK/7vMH6npdeuxx8VxAxxNMJlZuvu90f/2tbHyMbdJj2vQd4HtEM6WIu7oBEk0kqKT4FGZUrKIo=[/tex]上述两式无解。因此不能用代数求导方法寻找囚徒困境博弈的纳什均衡。理由：代数求导—寻找纳什均衡的方法，只能求导混合策略纳什均衡，而囚徒困境只有纯策略纳什均衡，不存在混合策略纳什均衡，故不能用代数求导方法求解。

举一反三

内容

0
求该博弈的纳什均衡。在这一囚徒困境似的博弈中,说明了什么问题?______
1
在囚徒困境的博弈中，两个囚徒合作的策略会形成（）。 A: 纳什均衡 B: 占优策略均衡 C: 重复剔除的占优均衡 D: 非纳什均衡
2
请应用最优反应曲线来表示“囚徒困境”博弈中的纳什均衡点。[img=625x264]17b6d63d4e0ef69.png[/img]
3
在囚徒困境博弈中，纳什均衡对所有的选手来说都是最佳结果。
4
囚徒困境中的纳什均衡是（）。