8.一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得1000元奖金。请分别用得益矩阵和扩展形表示该博弈,并作简单分析。
时间: 2024-04-04 14:33:31 浏览: 314
囚徒困境中的博弈策略的模拟:尝试了采用几种策略进行博弈使最终双赢的概率变大,matlab源码
得益矩阵如下:
| | 逃跑1 | 逃跑2 |
|-------|-------|-------|
| 追捕1 | 990 | 1000 |
| 追捕2 | 0 | -10 |
其中,逃跑1和追捕1代表逃犯选择第一条路线,看守选择追捕第一条路线,逃跑2和追捕2代表逃犯选择第二条路线,看守选择追捕第二条路线。逃犯的得益指的是少坐牢的年数,看守的得益指的是奖金(单位:元)。
扩展形表示如下:
```
/ 追捕1 / 追捕2
/ 990, 990 / 0, 1000
逃跑1/---------------/
/ 1000, 0 / -10, -10
/ 追捕1 / 追捕2
```
其中,左边的数字表示逃犯的得益,右边的数字表示看守的得益。在扩展形表示中,逃犯先选择逃跑的路线,看守再根据逃犯的选择来作出追捕的决策。
该博弈存在一个纳什均衡:逃犯选择逃跑1,看守选择追捕1。逃犯不会选择逃跑2,因为在任何情况下逃跑1都比逃跑2更优。看守不会选择追捕2,因为无论逃犯选择哪条路线,追捕1都比追捕2更优。因此,逃犯和看守的最优策略都是逃跑1和追捕1,此时逃犯的得益是990,看守的得益是1000。
阅读全文