神经网络增强的UCT算法在国际跳棋中的精确搜索与优化
需积分: 0 180 浏览量
更新于2024-08-05
收藏 543KB PDF 举报
本文主要探讨了"结合神经网络的改进UCT在国际跳棋中的应用"这一主题,由作者王亚杰、祁冰枝、张云博和丁傲冬共同完成,发表于2021年重庆理工大学学报(自然科学)第35卷第7期。文章针对传统的UCT(Upper Confidence Bound for Trees)算法在搜索准确性和效率上存在的挑战,提出了一种创新方法。
UCT算法是一种常用的蒙特卡洛树搜索算法,在国际象棋、围棋等棋类游戏中广泛应用,但其性能受到搜索次数的影响较大。为了改善这一问题,作者提出了一个结合神经网络的改进版本。他们构建了一个神经网络模型,用于预测每一步棋的平均行动价值(Q值),这能够提供更精确的评估,减少搜索的盲目性。
改进的UCT算法分为三个阶段:首先,利用预先训练的神经网络对所有子节点进行初步搜索,挑选出具有高潜力的节点;接着,通过剪枝操作剔除低质量的子节点,优化搜索资源的分配;最后,对保留的高潜力节点进行深入的二次搜索,以获取最优策略。在这个过程中,作者引入了两个关键参数——节点保留数量因子R和搜索比例因子P,它们帮助控制搜索的深度和广度,从而提高搜索效率。
实验部分,作者将改进后的算法应用于国际跳棋游戏,并与传统算法进行了对比。结果显示,改进后的算法在胜率上有所提升,这验证了结合神经网络的改进UC
2021-09-25 上传
2022-08-04 上传
2022-09-23 上传
2024-09-14 上传
2023-03-20 上传
2023-05-11 上传
2023-01-11 上传
2023-12-13 上传
2023-06-12 上传
2023-07-10 上传
Orca是只鲸
- 粉丝: 36
- 资源: 317
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常