UCT算法在A3课程设计中的博弈树探索与优化

需积分: 0 130 浏览量更新于2024-08-03 收藏 44KB DOCX 举报

在本篇2021年春季学期数据结构课程设计A3题实验报告中，来自计算机科学与技术学院2019级31班的郑修远、贾燕鹏、陈敏杰和郭军豪团队，针对博弈问题，应用了经典的UCB(Upper Confidence Bound)算法，也称为UCT(Upper Confidence Trees)算法。UCB算法是一种在决策过程中平衡探索未知选项与利用已知优势的策略，其核心思想是通过模拟多次博弈，评估每个节点的期望收益并结合置信区间来选择最优节点。该团队的主要任务是构建一个能够基于UCB公式确定行动策略的博弈树，其中，"Exploitation"指集中于具有高收益潜力的节点，而"Exploration"则确保对尚未充分探索的节点进行尝试，以防止潜在的更好选择被忽视。他们通过设置参数c来调整利用与探索的比例，优化有限时间内算力的使用。报告详细描述了团队成员的分工，郑修远负责框架搭建和算法实现，贾燕鹏负责代码实现和调试，陈敏杰则参与调试和参数调整，郭军豪则负责测试、参数调整以及报告撰写。算法的核心部分包括建立3x3的模拟对手矩阵，构建蒙特卡洛树结构，每个节点包含关键信息如分数、模拟次数等。在算法流程方面，他们利用UCB公式来确定节点的优先级，但具体流程图未在描述中提供。关于时间复杂度分析，虽然没有给出具体数值，但可以推测由于需要遍历和模拟整个博弈树，算法的时间复杂度会随着树的深度和每一步的模拟次数线性增加。报告还提到，团队通过一系列测试和参数调整，最终在28个队伍中排名第七，获得了55分的成绩。实验结果显示，他们的蛇形AI在面对不同情况时表现良好，展现出一定的学习和适应能力。这个项目展示了团队如何将理论的UCB算法应用到实际的博弈环境中，通过实验验证和不断优化，实现了一个能够有效利用资源和平衡探索的AI决策系统。通过这个过程，学生们不仅加深了对数据结构和算法的理解，也锻炼了解决实际问题的能力。

展开

数据结构课程设计报告（贪吃蛇）

1 / 4

2021 年春季学期

数据结构课程设计 A3 题实验报告

郑修远

1,*

贾燕鹏

陈敏杰

郭军豪

计算机科学与技术学院 2019 级 31 班

*表示队长

摘要：使用了 UCT 算法，即为 UCB 算法处理博弈树的思想：通过多次模拟的结

果，寻找到概率最高的那一个节点。将主要精力用在这一个节点上，避免不必要

的浪费，即利用（Exploitation）。但是，也要照顾到那些被“冷落”的节点，避

免失去机会，即探索（Exploration）。使用 UCB 公式来决定利用与探索的比重。

结果排名 7/28，分数 55/75。

关键字：UCB 算法蒙特卡洛树

1 分工与合作................................................................................................................................1

2 算法思想....................................................................................................................................2

2.1 总体思路....................................................................................................................2

2.2 所用方法的特别、新颖或创新之处........................................................................2

2.3 算法流程图................................................................................................................2

2.4 算法运行时间复杂度分析........................................................................................2

3 程序代码说明............................................................................................................................2

3.1 数据结构说明............................................................................................................2

3.2 函数说明....................................................................................................................2

3.3 程序限制....................................................................................................................2

4 实验结果....................................................................................................................................3

4.1 测试方法与数据........................................................................................................3

4.2 结果分析....................................................................................................................3

4.3 经典战局....................................................................................................................3

5 总结............................................................................................................................................3

6 参考文献....................................................................................................................................3

1 分工与合作

郑修远：进行框架搭建，算法代码实现

贾燕鹏：算法代码实现，程序调试与 bug 处理

陈敏杰：程序调试处理 bug，测评并进行参数的设定调整

下载后可阅读完整内容，剩余3页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

又可乐

粉丝: 964

UCT算法在A3课程设计中的博弈树探索与优化

改进FAST算法的高效角点检测

Django与Mysql实现增删改查入门教程

LeetCode刷题宝典：数据结构与算法核心技巧详解

求成绩表的每科每班的平均分的sql语句

创建型设计模式解析：简单工厂、工厂方法、抽象工厂

Matlab基础与应用获奖课件.pptx

铁路订票平台 2025免费JAVA微信小程序毕设

深部应力环境模拟中pfc-flac耦合代码的应用与实现

电力系统基于谐波线性化的阻抗建模与稳定性分析：考虑锁相环影响的逆变器输出阻抗模型设计及应用

SpringBoot的租房系统，你看这篇就够了(附源码）

最新资源