深度学习与神经网络在计算机象棋博弈中的应用

需积分: 0 111 浏览量更新于2024-08-01 收藏 1.49MB PDF 举报

"这篇硕士学位论文来自哈尔滨工程大学，作者王一非，导师黄凤岗，研究主题是具有自学习功能的计算机象棋博弈系统。该论文深入探讨了计算机博弈，特别是中国象棋博弈中的关键技术和问题，包括棋盘和棋子的计算机表示、走法生成、搜索技术、估值函数等，并提出了一种结合BP神经网络和时间差分算法的新型估值函数，以解决传统线性估值函数的局限性。" 在计算机博弈领域，人工智能的应用尤为显著，它通过模拟人类思考和决策过程来与人进行对抗。中国象棋博弈作为这一领域的热点，其复杂性和策略性吸引了众多研究者的关注。论文首先对已有的博弈理论和技术进行了全面回顾，为后续的研究奠定了基础。第一部分，论文深入研究了博弈系统的基础技术。棋盘和棋子的表示是系统运行的基础，需要有效地存储和处理每一步棋的信息。走法生成涉及所有可能的合法移动，而搜索技术（如alpha-beta剪枝）则用于预测对手的可能行动和评估最佳策略。此外，估值函数是决定棋局优势的关键，它能评估棋盘当前的局面，为下一步决策提供依据。第二部分，论文集中在博弈树的极大极小搜索技术上，探讨了多种优化策略，如迭代加深、开局数据库、杀手启发式等，并提出了这些方法的组合应用。同时，论文分析了局面静态估值函数的优缺点，静态估值函数通常基于专家规则和棋类知识，但在复杂局面下的评估准确性有限。为解决上述问题，第三部分提出了创新性的解决方案。论文引入了人工神经网络结合时间差分（TD）学习算法，以动态地学习和改进估值函数。这种方法允许系统从实际对弈中学习，逐渐优化评估的准确性，减少对人类棋类知识的依赖。最后，论文实现的象棋系统通过这些改进，实现了棋力的提升，不仅具有实用性，也为未来的博弈研究提供了有价值的参考。关键词包括人工智能、中国象棋、估值函数、时间差分和神经网络，涵盖了研究的核心内容。这一工作为计算机博弈研究开辟了新的方向，尤其是在自主学习和动态评估方面。



󰂯󰁉󰅦󰄤󰁖󰇑󰁖󰇝



󰑏󰁱󰅎󰅕

󰄤󰂯󰆨󰑏



󰆗󰁉

󰄤󰁱󰅊󰁉󰇑

󰇧󰁉󰇧󰅰

󰇧󰅰󰂎󰅕󰄤

󰅣󰇑󰁖󰇑󰁉󰇔

󰇧󰂾󰁉󰅕󰇔

󰁖󰁖







󰨄







 









































󰯼



󰉂



󰉂





󰉂



󰉂

󰉂

󰆉

󰇧

󰅶󰅶󰁔󰆲

󰃾󰁉󰇵󰁉󰁱

󰀴󰁋󰄤󰇃󰁋󰅦󰇔









󰨙󰨙󰨙

󰉂󰉂󰉂󰟪

哈尔滨工程大学硕十学位论文

息无疑会快于９０个字节的棋盘，但这并不意味着所有的运算和操作都会更

快。使用３２个字节的数据表示，程序员在确定一个棋子的位置时往往需要增

加额外的移位操作以取出一个字节中含有的两个坐标信息。

２．２着法生成

走法产生是指将一个局面的所有可能的走法罗列出来的那一个模块，也

就是告诉其他部分下一步可以往哪里走的模块。由于各种棋类规则的不同，

走法产生的复杂程度也有很大的区别．例如，五子棋的棋盘上任意的空白点

都是合法的下子点。这样在五子棋的走法模块当中只要扫描棋盘，寻找所有

的空白，就可以罗列出所有符合规则的下一步下子点．

对于中国象棋，生成走法的时候，也可以有两种方法：棋盘扫描法和预

置表法。而且由于象棋的规则更加的复杂，所以就要根据具体的规则来设计

走法，比如象只可以走田字，马只可以走日字，兵不可后退只能前进一步，

用棋盘扫描法就要根据棋子的具体走法在棋盘上反复扫描有效区域，制约条

件和落子状况，时间开销巨大。

一

预置表法就是最经常使用的着法生成方法，它的基本思想就是时间换空

间的思想．为了节省博弈过程中的生成着法的扫描时间，将动子在棋盘任何

位置、针对棋子的全部可能分布，事先给出可能的吃子走法和非吃子走法的

关系写入一个预置表中，再通过查表，便很快可以得到可行的着法，虽然这

样需要占用一定的空间，但相对现在的硬件环境应该说还是可以接受的，它

可以将着法生成的速度提高几个数量级。

在进行走法产生的时候，往往伴随着搜索进行。对于一个局面的所有直

接后继，你可以有两种选择：一次产生一种走法然后搜索之；或者一次产生

其所有走法然后搜索之。由于存在着剪枝算法，对一个局面的某一走法搜索

之后往往可能不再需要搜索其他后继，也就是说：可能不用产生全部走法就

能够完成搜索。一次产生一种走法看起来似乎更有效率．但是，由于剪枝算

法的剪枝效率很大程度上依赖于节点的排列顺序，往往一次产生所有节点，

然后以某种方法调整其排列顺序会使搜索效率大大提高。所以，在实际使用

中，绝大部分程序都是一次产生一个局面的全部走法，然后调整其搜索顺序。

６

剩余58页未读，继续阅读

leixder

粉丝: 0
资源: 1

深度学习与神经网络在计算机象棋博弈中的应用

基于深度强化学习的智能博弈对抗关键技术.pdf

2017年中国智能物联系统会议(CINT'17)征文通知 (3).pdf

人工智能与专家系统(上海交大)34.pptx

机器博弈研究背景和意义

计算机博弈大赛五子棋python

联盟链在平台型电商信用评级系统中的作用机制博弈论研究

基于剪枝搜索算法的五子棋博弈系统的研究背景

通过调研RoboCup 3D领域涉及的研究问题和研究方法撰写一篇综述。 [1]感知 [2]定位 [3]运动 [4]决策 [5]合作 [6]博弈 [7]强化学习

复杂网络博弈模型的未来的研究方向

计算机博弈六子棋算法讲解

最新资源