双人完备信息博弈分析

需积分: 5 0 下载量 140 浏览量 更新于2024-08-03 收藏 3.12MB PPT 举报
"技术文档分享-第2-4讲 博弈-2021.ppt" 博弈论是研究在有冲突和合作的环境中如何决策的理论,它源自于对棋类游戏、扑克游戏以及战争等竞争性活动的数学建模。在本资料中,主要探讨的是最基础的二人零和、全信息、非偶然博弈类型,这些博弈具有以下特征: 1. 双人对弈:博弈由两个参与者进行,他们轮流进行操作。 2. 零和游戏:博弈结果对于一方是正向的,对于另一方则为负向,不存在双赢或无输赢的情况。 3. 信息完备:参与者拥有相同的信息,对博弈过程的了解是相同的,没有隐藏信息。 4. 理智决策:参与者基于当前局势理性选择最有利的策略,不存在随机因素。 双人完备信息博弈是指双方都知道对方过去和可能的未来行动,例如象棋和围棋。而在机遇性博弈中,如掷骰子,存在不可预知的因素,这部分不在本次讨论范围内。 在双人完备信息博弈中,我们关注的核心是如何选择行动方案。一方,我们称之为MAX,希望最大化自己的收益,所以它面对的选择是“或”的关系,因为它可以选择最有利的路径。另一方,MIN,则试图最小化MAX的收益,因此它的选择是“与”的关系,需要考虑所有可能的负面结果。 为了形象化这个过程,可以构建博弈树。博弈树是一种特殊的与/或树,其中每个节点代表博弈的一个状态,而分支代表可能的行动。MAX节点表示接下来是MAX行动,MIN节点表示接下来是MIN行动。博弈树的结构遵循以下规则: 1. 初始节点:代表博弈的起始状态。 2. 交替层次:MAX节点和MIN节点交替出现,反映出双方的轮流行动。 3. 胜利策略:树的叶子节点表示终局,所有能让MAX获胜的终局都被视为原始问题的解。 通过深入分析博弈树,可以运用策略迭代、最小最大搜索等算法来找到最优解。例如,最小最大算法是一种递归方法,它从顶层MAX节点开始,MAX节点总是选择使MIN节点可能获得的最差结果(最小值),而MIN节点则反过来选择使MAX节点可能获得的最好结果(最大值)。这种方法帮助玩家预测对手可能的行动并做出最佳响应。 博弈论的应用广泛,除了游戏,它还用于经济学、军事策略、政治决策等领域,因为其核心是对冲突和合作情境的理性分析。通过理解和应用博弈论,我们可以更好地理解和预测复杂互动环境中的行为模式。