改进UCT算法在国际跳棋博弈系统中的应用与提升

需积分: 0 122 浏览量更新于2024-08-05 收藏 1.44MB PDF 举报

"基于改进UCT算法的国际跳棋博弈系统研究" 在计算机博弈领域，国际跳棋是一种复杂的两人对弈游戏，具有丰富的策略性和深度。针对国际跳棋的博弈系统，通常会采用各种算法来模拟玩家的决策过程。本文主要探讨的是如何通过改进UCT（Upper Confidence bounds applied to Trees）算法来提升国际跳棋的博弈水平。 UCT算法是一种在蒙特卡洛树搜索（Monte Carlo Tree Search, MCTS）框架下用于决策制定的算法，特别适用于有限但庞大的搜索空间，如棋类游戏。它的核心思想是平衡探索与利用：在每次搜索时，算法会优先选择那些未被充分探索的分支，以期待发现更好的策略，同时也会考虑到已有的胜率来优化当前选择。然而，UCT算法在游戏接近结束时，由于搜索空间的复杂性增加，可能会出现不稳定，导致决策质量下降。为了克服这一问题，作者张家铭、王静文和李媛提出了限制搜索深度和增加扩展条件的改进方法。限制搜索深度是为了减少在游戏后期因搜索范围过大而产生的计算复杂性，这样可以确保算法在有限的时间内更集中于关键的决策点。增加扩展条件则是为了更好地指导搜索过程，使得算法能够在更早的阶段识别出潜在的胜算局面，从而提高决策的准确性。文章中提到，改进后的UCT算法在实验中表现出了显著的胜率提升，这表明改进措施有效地减少了原算法的不稳定性，并提升了博弈系统的整体性能。对比传统的Alpha-Beta剪枝算法，Alpha-Beta在游戏终局时的稳定性是其优势，但在开局和中期，由于搜索空间大，效率较低。而改进后的UCT算法则在全阶段都能保持较好的性能。关键词涉及的“国际跳棋”是指游戏本身，“UCT算法”是研究的核心，而“Alpha-Beta算法”作为对比，是经典的博弈搜索算法。最后，“UCT算法的不稳定性”是本次改进要解决的主要问题。这篇研究展示了如何通过针对性的改进策略提升基于UCT算法的国际跳棋博弈系统，为类似的游戏开发和人工智能决策提供了一种可能的优化路径。通过限制搜索深度和添加扩展条件，不仅可以提高决策效率，还可以增强算法在复杂情况下的稳定性，从而在实际应用中实现更好的博弈性能。

第

卷第

期

Vol．12 No．1

智能计算机与应用

Intelligent Computer and Applications

2022

年

月

Jan． 2022

文章编号

: 2095

－

2163( 2022) 01

－

0128

－

中图分类号

: TP312

文献标志码

: A

基于改进

UCT

算法的国际跳棋博弈系统研究

张家铭

，

王静文

，

李媛

(

沈阳工业大学理学院

，

沈阳

110870)

摘要

国际跳棋的博弈系统中

，UCT

算法是一个比较新颖的算法

，

其效果得到了广泛认可

。

但是

UCT

算法的缺点也同样明

显

，

终局下的处理明显不如稳定性更强的

Alpha

－

Beta

算法

。

为避免

UCT

算法的不稳定性

，

本文采取限制搜索深度和增加扩

展条件的方法对

UCT

算法进行改进

，

改进后的

UCT

算法胜率远超过改进前的

UCT

算法胜率

，

使得博弈水平得到了极大的提

升

。

关键词

国际跳棋

; UCT

算法

; Alpha

－

Beta

算法

; UCT

算法的不稳定性

Draughts based on improve UCT algorithm

ZHANG Jiaming，WANG Jingwen，LI Yuan

( School of Science，Shenyang University of Technology，Shenyang 110870，China )

【Abstract】Against draughts game system，UCT algorithm is a relatively new algorithm，and its effect has been widely recognized．

However，the shortcomings of UCT algorithm are also obvious，which is obviously inferior to Alpha

－

Beta algorithm with stronger

stability in the final game，In order to avoid the instability of U CT algorithm，this paper adopts the method of limiting the search

depth and increasing the extension conditions to improve UCT algorithm，and compares with the improved UCT algorithm，it is

concluded that the improved UCT algorithm win rate is much higher than the improved UCT algorithm，which greatly improves the

game level．

【Ke y words】draughts; UCT algorithm; Alpha

－

Beta algorithm; instability of UCT algorithm

◆

哈尔滨工业大学主办专题设计与应用

作者简介

张家铭

( 2001

－

) ，

男

，

本科生

，

主要研究方向

计算机博弈

;

王静文

( 1965

－

) ，

男

，

学士

，

工程师

，

主要研究方向

人工智能

、

信息安全

;

李媛

( 1976

－

) ，

女

，

博士

，

教授

，

主要研究方向

人工智能和随机过程

。

通讯作者

王静文

Email: wangjingwen007@ 126．com

收稿日期

: 2021

－

引言

随着计算机博弈项目的发展

，

随之而来的研究

也变得越来越多元化

，

计算机战胜人类成为一个热

门的话题

。

国际跳棋在计算机博弈方面是比较受欢

迎的一个棋种

。

目前国际跳棋

格已经被解决

，

每

一种局面都算出了最优解

［1］

。

而国际跳棋

100

格却

有着更加复杂的情况

，

本文通过对国际跳棋

100

格

的研究

，

得出对棋盘的一种评估函数

，

并对

UCT

算

法进行改进与测试

，

并且通过对

UCT

算法改进前后

对比

，

得出改进

UCT

算法对局面的判断更为准确的

结论

。

国际跳棋简介

1．1

国际跳棋棋盘

国际跳棋是一种古老的游戏

，

棋盘为

黑

白格相间的棋盘

，

在整个对弈的过程中

，

白色格子自

始至终都是用不到的

，

棋盘放在对弈双方的中间

，

每

个玩家的右下角应是白色格子

，

如图

所示

。

黑棋

先手

，

然后双方轮流走动己方棋子

。

棋子自始至终都是沿着对角线移动和跳吃

，

对

弈的目标是将对方所有棋子吃掉或者形成一个局面

迫使对方棋子无法移动

。

图

国际跳棋棋盘

Fig． 1 The board of Draughts

下载后可阅读完整内容，剩余3页未读，立即下载

牛站长

粉丝: 31
资源: 299

改进UCT算法在国际跳棋博弈系统中的应用与提升

结合神经网络的改进UCT在国际跳棋中的应用_王亚杰1

结合神经网络的改进UCT在国际跳棋中的应用.pdf

uct_worker_progress(if_info->worker);函数用法

python用uct算法实现井字棋

用python实现UCT算法

pyhton实现UCT算法的人机交互五子棋

蒙特卡洛算法uct 五子棋python

使用python语言编写一个MCTS算法

python实现的基于蒙特卡洛树搜索(MCTS)与UCT 的五子棋游戏的代码

最新资源