没有合适的资源?快使用搜索试试~ 我知道了~
自然启发式算法与机器学习在板球队员分类中的应用
阵列14(2022)100144基于CS-PSO和机器学习算法Manoj Ishia,*,Jayantrao Patila,Vaishali Patil ba计算机工程系,R. C. 印度Shirpur理工学院b印度希尔布尔RCPETA R T I C L EI N FO保留字:团队形成球员评价功能优化自然启发式算法A B S T R A C T球员分类在板球比赛中至关重要,因为它有助于教练和队长确定球员在球队中的性能统计有助于将球员分类为击球手,保龄球手,击球全能,保龄球全能和守门员。这项研究的目的是正确地识别板球队在为期一天的国际格式分类球员分为五组。根据他们以前和现在的表现,球员被评为优秀,非常好,好,满意,或差。在这项研究中,一个增强的板球比赛模型,其中一个11名成员的球队选择使用无偏的技术。球员应该根据他们的表现,击球率,保龄球平均水平,对方球队的强弱等进行选择。自然启发算法用于特征优化,以提高机器学习预测模型的准确性。Cuckoo搜索和粒子群优化的混合被称为CS-PSO,它成功地集成了这两种方法的功能,以创建可靠和合适的解决方案,有效地完成全局优化。使用CS-PSO特征优化和支持向量机的混合,击球手,保龄球,击球全能,保龄球全能,和守门员的准确率分别为97.14%,97.04%,97.28%,97.29%和92.63%。1. 介绍板球的持续增长需要创新,以保持领先的竞争,并吸引新的球迷或追随者。一天国际赛(ODI)的形式就是一个突出的例子,因为它可能是任何团队运动中最重要的改变。击球和保龄球是 这两种能力在所有形式的板球中都很重要。板球中的每一个球都会产生大量数据。个别球员的击球和保龄球表现进行评估和平均,以确定一个团队的整体表现。击球平均数和击球率通常用于评估击球手在板球中的表现,而保龄球平均数,经济率和击球率通常用于分析投球手的表现。然而,目前记分卡上的大多数标准在确定球员的自然技能方面是无效的。例如,击球平均数告诉我们击球手在失去三柱门之前平均得分的次数。打击率定义了球员得分的潜力。虽然,它不能告诉如何有效的击球手是在得分迅速。同样,看经济率,人们理解投球手失去跑动的速度,但不理解他拿三柱门的能力。作为结果,许多绩效指标已被开发出来,以量化板球运动员的击球和保龄球的表现,通过整合标准的性能数据。保龄球队的点球保龄球和三柱门采取技能和击球队的边界打击熟练和50多个伙伴关系是至关重要的ODI的成功。组建一支球队与特定的对手队比赛是一个艰难的过程,因为必须考虑许多事情,包括双方之间的弱点和优势[1]。预测运动员在板球比赛中,在比赛开始时,正好有11名球员被选中,除非受伤,否则他们在整场比赛中都保持固定。个人的表现需要根据过去的记录和其他考虑因素来预测,以确定该球员是否是参加球队的特殊竞争者。选择球队的决定考虑了击球手,投球手和全能者的巨大平衡。这支球队应该包括一个守门员与显着的数字背后的小门和令人印象深刻的击球统计。虽然防守似乎是一场比赛的关键部分,但击球和控球技术比防守更有价值,* 通讯作者。电子邮件地址:ishimanoj41@gmail.com(M.Ishi),jbpatil@hotmail.com(J.Patil),vaishali. gmail.com(V. 帕蒂尔)。https://doi.org/10.1016/j.array.2022.100144接收日期:2021年12月29日;接收日期:2022年2月14日;接受日期:2022年4月1日2022年4月12日在线提供2590-0056/© 2022作者。爱思唯尔公司出版这是一篇基于CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)的开放获取文章。可在ScienceDirect上获得目录列表阵列期刊主页:www.sciencedirect.com/journal/arrayM. Ishi等人阵列14(2022)10014423]。 在选择阶段,一致性至关重要。专注于每个优化算法(WOA)、蝙蝠算法(BAT)和萤火虫算法(FFA)。所有算法都使用适应度函数来增加类,球员的质量,以获得一个令人印象深刻的球员名单,为印度板球队在ODI。在大多数体育运动中,团队选择是一个主观问题,基于广泛接受的对优秀团队构成的看法[4]。我们解决了从一组球员中根据他们的历史表现数据构建一个“好”阵容的挑战由于整个市场的球员是巨大的,确定最好的球队变得越来越具有挑战性,典型的逻辑程序可能无法建立一个伟大的团队在规则约束[5]。“板球是一项充满美丽的不确定性的运动,”正如俗话所说,正是这项运动极其出人意料的特点激起了球迷的好奇心。比赛的组织方式主要是由当天最有实力的球队来决定获胜的球队。有过这样的例子,得分较低的球队通过淘汰对手获得较低的分数而获胜。同时,我们也不能排除另一支球队积极追逐巨大比分的可能性。由于比赛的方式,比赛的结果是推翻了失去小门或连续的辉煌得分杆。这样的评论强调了板球的不稳定性[6]。决策者的选择和竞争者的排名用于根据优先级选择团队[7]。机器学习算法和相关的人工智能技术在预测和决策等各个领域都很有帮助。机器学习技术可以被团队管理人员用来评估对手团队成员的效率。在比赛之前,机器学习的使用允许球员和教练分析他们可以改进的领域。手动分析每个玩家的整个历史几乎是困难的。因此,一个智能系统,预测球员的表现,根据以前的表现可能有利于球队的管理和选择。由于大多数以前的研究采用了较短的时间框架,我们的主要重点是在更长的时间内使用球员以前的表现,以获得更好的准确性[ 8 ]。定量成分提供了信息,其中统计数据将是可比的两个球员,对不同的对手和表现相似。尽管如此,他们还是遗漏了一些关键的细节:在一个更强大的对手身上得分的球员应该得到更高的评价。对职业生涯记录较好的击球手的解雇应该比对职业生涯记录较低的击球手的解雇给予更高的评级[9]。这项工作演示了使用分类和预测方法构建团队预测模型。板球运动员可以根据他们的进化表现分为几类。尽管有大量的潜在类别,一个玩家语文课通过考虑球员的初始表现来预测他们即将到来的表现。任何一个没有收获的球员都会被贴上表现不佳的标签,并可能被从球队中除名。特征优化在机器学习中至关重要,因为高维数据集包括重复的、有噪声的和不相关的特征。特征优化降低了数据维度,只选择最重要的特征,以提高分类性能并降低计算成本。元启发式算法被认为是解决特征优化问题的一种可行方法。元启发式算法由于其随机性和非确定性的特点而受到广泛的关注。短语“自然启发算法“是指一类从自然现象演化而来的元启发式优化算法。群体智能是一种基于自然智能体行为的元启发式优化算法。群体结构代表了社会智能,它由许多同质的、自组织的、分散在整个生态系统中的代理人组成,如鱼群、蚁群和鸟群。在SI中,要获得最优解,需要群体系统成员之间的知识交流。SI通常用于大搜索空间优化问题的关键。本文研究并实现了蚁群优化算法、粒子群优化算法、布谷鸟搜索算法、灰狼优化算法、蛾焰优化算法、鲸鱼算法等。在显著减少入围参数数量的同时,提高了校准精度[11]。为了提高预测模型的精度,混合算法受到了越来越多的关注 混合算法可以利用两种或更多种方法的组合来提高算法的优化能力。有两种类型的混合优化技术。一个方向是采用一种机制来选择两种优化方法中的一种,然后在迭代优化过程中在两种算法之间交替另一种方法是利用一种算法的基本公式对不同的技术进行该方法结合了两种优化算法目前的研究旨在开发一种混合算法,结合CS和PSO,以实现更高的全局优化结果,并解决拟议的球员分类问题。选择最能被接受的板球阵容来赢得比赛是至关重要的本文● 提出了五种基于反映其实力的特征的算法来计算击球手、保龄球手、击球全能手、保龄球全能手和守门员的评分。● CS-PSO杂交被用来作为特征优化策略,以消除冗余,不相关,和嘈杂的功能。● 建议的方法● 采用CS-PSO与机器学习模型的混合方法,从一天国际比赛中对运动员的实力进行评估后得到的运动员组中找到合适的球队组合这种模式将有利于球员,球队和教练,因为他们会知道他们的球队应该在哪里以及如何专注于在比赛中获得更好的结果[2,3]。这些模型也有助于在游戏过程中在电视上播放的体育分析节目。新闻频道也为体育节目预留了时段在那个体育节目中,他们讨论了球员的关键点,球员这种选择球员的模式对他们也有帮助这个预测系统也是有用的其他现实世界的问题,如天气预报,股票市场预测等,在研究这些预测模型的变量,我们的模型将需要很少的变化,有效地运行。论文的其余部分组织如下:文献综述部分包含对以前发表的工作的参考。下一部分将通过数据选择程序,包括收集数据的描述性统计。方法部分讨论了机器学习方法。下一节将介绍这项研究的结果。最后,讨论与结论部分对本文进行了研究总结.2. 文献综述在板球运动中,一些学者专注于预测球队。其中一些将在下一节中讨论。I. Wickramasinghe在他的研究中使用他们的击球和保龄球平均数的平均值对全能运动员进行分类[2]。作者将全能运动员分为四种类型:真正的全能运动员、击球全能运动员、保龄球全能运动员和普通全能运动员。使用朴素贝叶斯(NB)、K最近邻(KNN)和随机森林(RF)进行预测。k折交叉验证方法用于测试所有的分析结果。根据实验结果,RF具有显著更高的预测精度。V.S. Vetukuri等人提出了一种混合方法,通过结合递归神经网络的概念来选择有效的参与者M. Ishi等人阵列14(2022)1001443(RNN)遗传算法(Genetic Algorithms,GA)[3]个体玩家然后,这个增强的特征矩阵X被发送到RNN中,RNN为每个参与者计算最终得分。这种建议的方法生成一个并发排名表,球队选择器可以使用它来为即将到来的比赛快速准确地选择球员。A. Khot等人提出了合作者的概念,以识别后起之秀并改善团队选择[4]。训练用于分类的判别分类器是支持向量机(SVM)。绘制超平面根据点的坐标将点分为两组:(1)新星(2)而不是一颗冉冉升起的新星RS分数是通过识别哪些合作者特征是有利的和不利的联系来计算的。RS分数用于编制击球领域的后起之秀的最终名单,准确率为60%,保龄球领域为70%,全面评估为40%。F. Ahmed等人提出了一种基于NSGA-II算法的多目标策略,以发现团队成员并优化整体击球和保龄球强度[5]。他们使用一名球员在国际T-20板球比赛中的击球平均数和保龄球平均数来衡量他们的击球和保龄球表现。在问题制定之后,他们采用精英非支配排序遗传算法(NSGAII)在整个团队中进行多目标遗传优化。他们使用通过膝盖区域分析创建的可行解决方案来确定他们在所有这些指标上的健身分数,以解决这些问题。A. Balasundaram等人使用K均值聚类、决策树、支持向量机和随机森林进行球员分类[6]。WEKA是用于对所提供的数据集执行操作的数据挖掘程序。交叉验证用于从类标记的数据中构建训练和测试数据。分类器的预测准确率为91.87%,而使用决策树,93.46%的支持向量机,95.78%的随机森林,表明所构建的模型是有效的预测最佳球员的选择球队。M. Bello等人介绍了一种改进的团队组建方法,其中两个组织通过从共享的申请人池中选择人员来组建团队[7]。本研究提出了蚁群优化算法(ACO)和最大最小蚁群系统的团队形成(MMAS-TS)元算法。每一个结构都出现在迭代中最好的一对蚂蚁发现的解中。从执行开始获得最有效解决方案的蚂蚁对接收信息素存款。每个决策者根据他对组建团队的偏好,同时保留整体质量,为申请人分配一个排名。C.卡帕迪亚等人试图预测一个击球手在特定的一天会得到多少分,一个投球手在给定的比赛中会得到多少分[8]。机器学习技术,如决策树,SVM,朴素贝叶斯和随机森林用于预测。他们提出了一种方法,使用天气数据集与板球比赛信息来预测球员的表现。在他们的模型中采用了一种新的加权随机森林分类器,包括超参数调整,准确率为92.25%。P. Chhabra等人提出使用半监督统计技术将球员建模为嵌入,以构建团队选择[9]。本文提出了“运动员素质指数”评分体系,该体系从定性和定量两个方面对运动员进行评价。CRICTRS是一个半监督的团队建议框架,需要玩家嵌入来建议团队专注于对手的优势和劣势。这种方法是从协同过滤和伯努利实验,排名球员的基础上,他们的运行和小门的质量。H. Ahmad等人使用监督机器学习模型通过击球和保龄球领域预测明星板球运动员[10]。使用贝叶斯规则函数和基于决策树的框架进行预测,并采用交叉验证方法来验证性能。每个特征对预测挑战的贡献是使用最先进的指标来确定的,例如信息增益、增益比率和卡方统计。支持向量机在击球领域取得了最显着的效果,准确率为86.59%。在保龄球数据集中,NB和CART以88.9%的准确率击败了所有其他模型P. Agrawal和T. Ganesh使用整数优化编程概述了印度板球队的球员选择程序[ 13 ]。击球统计是基于两个变量来确定一个球员一个投球手的表现是用他的保龄球平均,一致性和经济率评估。应用Spearman秩相关系数对典型的变值技术进行拟合。单位函数类型的决策变量已被用来挑选板球队使用整数规划。球员的稳定性是评分的一个重要因素。Z. Mahmood等人将篮球新星的预测作为一个机器学习问题,使用分类和回归树,支持向量机,最大熵马尔可夫模型,贝叶斯网络和朴素贝叶斯[14]。他们的目标是创建一个函数,可以根据一系列特征来预测一个类是否是一颗冉冉升起的新星。他们使用h指数来弥补每个合作者缺乏平均效率得分的情况。为了计算合作者的效率,他们采用了Hollinger线性公式。采用10重交叉验证方法来训练和验证它们,使用所有三个数据集来测量分类器的强度I. Kumarasiria和S.佩雷拉使用遗传算法来确定最好的板球队[15]。运动员然后计算每个染色体的适应度值以指示每个玩家的总适应度。每个团队的适应度值使用变异方法获得。这个任务的停止条件是重复这个过程,直到最好和最差球员的体能得分之间的差距M. Ishi和J.Patil广泛调查了板球中的团队形成和获胜者预测方法[24,25]。他们研究了用于评估球员的每一个参数和方法。在此基础上,提出了团队组建的参数和程序。每个参数都有其影响,并在此基础上,参数权重需要最终确定。3. 方法这项工作使用机器学习算法为为期一天的国际板球比赛挑选球队。在规则的范围内,击球手,保龄球手,击球全能,保龄球全能和守门员被选择组成一个平衡的阵容。在特征优化算法的帮助下,球员的特征可以动态地增加和提高预测精度。使用受自然启发的方法减少了输入变量的数量。九个分类器使用从Nature Inspired方法中选择的特征作为输入:Logistic回归,Naive Bayes,K最近邻,支持向量机,梯度提升算法,决策树,随机森林,XGBoost和CatBoost。CS-PSO混合优化方法与独立算法一起使用,以提高选择相关特征的特征优化性能。 图 1描绘Fig. 1. 团队预测的步骤。M. Ishi等人阵列14(2022)1001444机器学习框架用于预测板球比赛的球队。3.1. 数据收集和解释本次调查的数据来自公开来源。Web抓取是一种从网站中提取数据的方法。第二种方法是手动复制和粘贴数据。然而,由于时间的原因,这在技术上是不可行的。而不是手动复制数据,在线抓取自动化的过程,使数据可以快速访问,而不浪费时间。一个数据集包括101个击球手,101个保龄球手,101个击球全能手,101个保龄球全能手,和10个守门员与球员相关的性能变量,形成印度队。每个玩家的信息都包含在链接的数据集中。1989-2021年的数据来自ESPN Cricinfo的所有四个领域,即击球手,保龄球手,全能运动员和守门员[ 26 ]。在设计预测模型之前,对原始数据进行预处理。板球预测的许多基本特征将使用数据预处理技术从这些原始数据中提取为子集。利用标准预测方法来为这些选定的特征集生成模型。3.2. 特征提取领域专业知识是提取所需特征所必需的。击球统计数据来自比赛的数量,未出局局数,得分,最高得分,击球平均数,击球率,半个世纪和世纪的数量,以及击球手击中的四分和六分的数量。对于投球手,投球次数,三柱门,处女,保龄球平均,罢工率,经济率和4/5三柱门运输考虑。击球手和投球手的特征都被用来评估击球和保龄球全能运动员。一个球员的击球和保龄球平均水平之间的差异也影响他作为一个击球或保龄球全能者的成功。与比赛有关的因素,捕获的数量,和完成的树桩被用来评估守门员的质量。以下特征是研究明智的一年,明智的对手,明智的场地,明智的局,以确定一个球员的实力。二值化用于转换这些数据。定义了每个特征的阈值。阈值只是所有玩家对给定属性的值的总和。表1列出了表1击球手和投球手表2列出了击球员和保龄球手的指标以及描述,表2列出了击球全能者、保龄球全能者和守门员的特征。3.3. 特征优化优化是调整框架以确保某些方面更有效地工作或通过增强所需参数同时消除不愉快的参数在给定限制下尽可能有效地提供替代结果的过程。它是通过使用元启发式算法完成的。物理过程、动物行为和进化思想都是启发式算法的灵感来源。由于元分析的简单性,研究人员可以很容易地理解Meta分析并将其应用于他们的问题。对特征优化方法和机器学习算法的适当组合进行评估,以获得最佳精度。搜索开始于元启发式算法中的随机开始人口,然后通过迭代随着时间的推移而改进。几个最优解告诉我们关于解空间的知识,导致我们自发地跳向最合理的解。不同的申请人系统协同工作,避免在本地找到最佳解决方案。在这项研究中,我们采用了使用SI算法的特征优化方法,这些算法通常再现自然界中昆虫群,牛群,羊群或学校的社会行为[7,10,11,16为了有效地进行特征优化,我们使用CS-PSO算法的混合方法。性能与标准CS相比,粒子群算法 其他SIX 算法:Ant 群优化(ACO)[7],Grey Wolf Optimizer(GWO )[19],Whale OptimizationAl-出租m(WOA)[20]、蝙蝠启发算法(BBA)[21]、萤火虫算法(FFA)[22]和蛾焰优化(MFO)[23]。3.3.1. 粒子群优化算法PSO方法是一种基于群体的随机优化方法,模仿昆虫,牛,鱼和鸟类等动物的社会行为。这些群体遵循一种合作的食物寻找策略,每个群体成员根据自己和其他成员的学习经验改变搜索模式。粒子群算法中的粒子可以根据环境的变化来调整它们的位置和速度,以满足接近性和质量的要求。此外,群体不限制他的移动性与粒子群算法,而是寻求最佳解决方案,击球手描述保龄球手描述run_score得分次数no_of_maiden_overs未投过球no_of_novembernot outs inningno_of_runs_givenruns concerned by a bowlerbatting_avgaverage of battsmenbowling_avgaverage of bowlerbatting_strikerate击球手的击球率bowling_strikerate投球手的击球率no_of_100no_of_4highest_score单场比赛中击球手的最高得分no_of_max_wicketsbatting_score使用反映击球手实力的所有特征的击球手得分的加权平均值best_batting_position_score击球手位置得分的加权平均值明智的力量inningwise_batting_score使用inning wise的强度home_away_batting_score使用venue wise计算强度opponent_batting_score使用opponent的明智的力量yearwise_batting_score使用year wise的强度bowling_score使用所有特征的inningwise_bowling_score一个使用inning wise投球手力量的投球手得分的加权平均值home_away_bowling_score使用场地明智的投球手的力量的投球手得分的加权平均值opponent_bowling_score使用对手的明智的力量yearwise_bowling_score使用year wise的强度wickets_taken_performance投球手得分的加权平均值取决于Wickets采取的质量。captaincy_pointbatsmen is captain or notcaptaincy_pointbowler is captain or notoverall_batting_score反映击球手的所有特征的加权平均值各方面player_rating根据玩家的表现,玩家被分配为优秀、非常好、好、令人满意、差的评级overall_bowling_score反映保龄球的所有要素的加权平均值各方面player_rating根据玩家的表现,玩家被分配为优秀、非常好、好、令人满意、差的评级M. Ishi等人阵列14(2022)1001445我我表2击球全能,保龄球全能和守门员功能。打击全能选手描述保龄球全能选手描述守门员描述所有击球特征所有击球手的功能描述,所有击球特征所有击球手的功能描述,所有击球特征所有击球手的特征如表1所示表1所有保龄球功能所有保龄球功能描述表2bat_bowl_avg_diff球员击球和保龄球的平均差异overall_batting_all_rounder_score加权总得分打击全能得分player_rating_batting_allrounder取决于性能球员被分配评级为优秀,非常好,好,满意,差表1所有保龄球功能所有保龄球功能描述表2bat_bowl_avg_diff球员击球和保龄球的平均差异overall_bowling_all_rounder_scoreweighted overall保龄球全能得分player_rating_bowling_allrounder取决于性能球员被分配评级为优秀,非常好,好,满意,差no_of_catch_wk在三柱门后捕获的捕获数no_of_stumpings树桩数量整体守边能力加权守门员的能力,使用了一些捕获和树桩做overall_wicketkeeper_score加权得分击球和守门员特征player_rating_wicketkeeper取决于性能球员被分配评级为优秀,非常好,好,满意,差给定的解决方案空间。在PSO中,每个个体都被称为粒子,并被描述为解决方案空间中优化问题的合理替代方案。它可以记住蜂群的最佳位置以及速度。每一代结合粒子的数据来修改每个维度的移动,然后用于计算粒子的新位置。质点对自己存在的运动状态有信心,并根据自己的经验,按照自己的速度做惯性运动。“社会”因素区分了粒子的当前状态和群体的全局(或局部)理想位置。它利用社会学习因素来模仿正粒子的运动。据信,在PSO中使用惯性权重来均衡全局和局部搜索,其中较高的惯性权重有利于全局搜索,较低的惯性权重有利于局部搜索[16]。在执行该方法时,必须准确地选择粒子群大小N、最大重复次数M、惯性权重w和其它参数。以下两个等式用于更新所有粒子的位置和速度vik+1=wvik+c1r1(pbk-xk)+c2r2(gbk-xk)(1)通常会选择宿主鸟刚刚下蛋的巢。布谷鸟的卵比寄主的卵发芽稍早。当第一只布谷鸟的后代孵化出来时,它的本能是把寄主的蛋从巢里赶出来。这种行为的结果是,布谷鸟的幼鸟得到了宿主鸟提供的大部分食物。类似地,布谷鸟雏鸟可能会复制宿主雏鸟的叫声,以获得更多的进食机会。宿主鸟的幼鸟死于饥饿,只留下布谷鸟的幼鸟在巢中。杜鹃的繁殖行为可用于各种优化问题[ 17 ]。一个布谷鸟蛋表示一个新出现的解决方案,而且巢中的每一个蛋都意味着一个解决方案。其目的是消除不太理想的解决方案与新的,可能是改进的巢。适者生存和适应环境是两个基本素质。这些可以实际地转化为当代元哲学的两个关键方面:强化和多样性。多样化保证了算法可以成功地探索解空间,而集约化则试图探索现有的最佳解并选择最佳候选解或解[18]。下一个解决方案是发现与levy飞行策略表示我我我Xik+1=xk+vik+1(2)在上面的等式中,x ik是粒子的位置。vik表示速度,w是惯性权重,学习因子c1和c2,以及r1和r2是具有0和1之间的值的随机数。pbik是个人最好成绩的粒子和gbk代表的全局最好的群体。3.3.2. 布谷鸟搜索(CS)这种方法是建立在一些杜鹃物种的育雏寄生和利维飞行的随机运动。有些杜鹃鸟会将蛋放在宿主鸟巢中,并可能会破坏其他蛋以提高孵化的可能性。如果宿主鸟没有找到并杀死这些蛋,它们将孵化成一只成年的杜鹃。布谷鸟的迁徙和环境因素应该会理想地使它们聚集在一起,并选择最佳的繁殖和繁殖地点。如果宿主鸟发现蛋不是它们的,它们要么扔掉它们,要么放弃它们的巢,重新开始。寄生杜鹃等式(3)。xit+1=xt+α<$Levy(β)(3)Levy Flight是一种全局随机行走方法,其未来状态xit+ 1仅由当前状态xit和变迁决定概率Levy(β)。Levy飞行的随机步长由具有无穷方差和均值的Levy分布计算。征收 αu=t-1-β(0β2)(4)<<3.4. 混合粒子群和布谷鸟搜索算法众所周知的事实是,任何基于种群的算法都必须探索和利用才能有效地执行。粒子群算法容易陷入局部最优解.另一方面,布谷鸟算法的随机游走技术可以提高搜索空间中解的多样性。因此,本研究建议将随机游走方法融入粒子群算法,以创造一种新的混合优化方法。这种混合方法的目的是M. Ishi等人阵列14(2022)1001446=我我我是从击球手、投球手、全能运动员和守门员的数据中选择相关特征,以选择ODI比赛的最佳球队。随机数r1和r2被替换为Levy飞行策略,以改善全局最优解的搜索。CS-PSO混合优化算法的阶段如下所示,如图所示。第二章:算法1. 初始化布谷鸟搜索的参数。2. 把人口分成几组。3. 应用布谷鸟搜索算法,利用每个个体的适应值找到特征优化4. 将布谷鸟搜索得到的局部最优解作为粒子群算法的输入种群。5. 从PSO的输入种群初始化粒子。6. 为了有效地搜索最优解,将公式1和3集成到PSO算法中。vik+1=wvik+(c1<$Levy(β))(pbk-xk)+(c2<$Levy(β))(gbk-xk)(5)它有助于粒子群算法中的粒子有效地获得全局解。因为粒子的局部行走是通过levy飞行来改善的7. 从CS-PSO混合方法获得的最佳解是优化算法的最优输出。特征优化算法将表1和表2中的特征作为输入,以去除不相关的特征。使用特征优化算法发现对定义球员实力有更大影响的特征在特征优化算法之后获得的优化特征被提供作为机器学习分类器的输入。在此之后,机器学习算法将玩家分为五类。3.5. 学习算法/模型选择本研究使用逻辑回归、朴素贝叶斯、K近邻、支持向量机、决策树、随机森林、梯度提升方法、XGBoost和CatBoost算法。 由于分类问题,选择了这些算法。获胜者预测分类问题表示为y f(X),其中X似乎是单个或一组自变量,y是因变量[2,43.6. 训练和测试在这项调查中,用于估计板球比赛的球队的数据被分成70- 30%的训练和测试规模。这是因为在尝试基于先前的比赛记录来预测比赛结果时,重要的是保持体育结果预测数据的时间顺序。交叉验证方法不适用于体育预测,因为它涉及数据洗牌,可能会改变事件的顺序。因此,手动拆分训练和测试数据以保留发现的时间顺序是优选的。3.7. 参数整定和模型评估模型可以包含许多参数,并且找到适当的参数混合可能是一项困难的任务。在机器学习方法中,参数调整用于确定模型训练的最佳参数。超参数控制算法的学习过程,提高模型精度。GridSearchCV方法用于调整这项工作的参数。网格搜索使用字典中给出的任何参数组合来构造和评估模型。在使用网格搜索技术获得每种超参数的精度/损失之后,选择具有最佳性能的参数。预测是作为多类分类问题进行的,具有以下类别:EX优秀,非常好,好,令人满意和差。模型评估通过准确度、精确度、召回率和F1评分值进行[44. 模型制定和特征构建提出了五种算法来评估击球手,保龄球手,击球全能,保龄球全能,和守门员。利用反映球员击球力量的特征,计算了使用击球手力量算法的球队的击球手表现。类似地,显示保龄球手、击球全能者、保龄球全能者和守门员的影响的特征用于根据球员的优势为他们设计算法。球员的表现更关键的是要关注形成一个平衡的阵容。球队的整体实力取决于球员的实力及其对球队表现的影响。一支拥有高质量球员的球队增加了赢得比赛的机会。由于球员的统计数据因年份、场地、对手等而异, 我们研究了这些参数的每个特征。我们分析和评估每个球员的实力,不仅与他们的整体统计,而且与不同的条件,以选择质量的球员。球员的表现随局数而变化。有些球员在第一局表现得很好,而有些球员在第二局的压力下表现得很好。有些球员在主场条件很好,但不能在客场投球。同样,对手明智的表现分为两种类型:强和弱。拥有优秀球员和高ICC排名的球队被认为是强大的对手。虽然球队在ICC中没有很好的排名,球员的表现也不太稳定,但考虑一个弱对手。具体图二. 用于特征优化的PSO-CS混合方法。图三. 球员分类条件。M. Ishi等人阵列14(2022)1001447+++正+ +=+正+ ++=++将权重分配给每个特征。玩家在不同条件下的评价如图所示。 3.我们提出了第一个算法来评估击球手的力量。首先,在该算法中,每个球员作为击球手的实力(' α _batsmen_score')是使用运行得分,未出局局数,击球平均数,击球率,里程碑达到100和50的能力,4和6的数量,并与indivial最高得分。击球手的得分是用击球手位置1到10 的 相 同 参 数 计 算 的 。 然 后 , 在 评 估 击 球 手 的 每 个 位 置( “β_pos_score” ) 之 后 , 选 择 击 球 手 得 分 的 最 大 值 。'γ_inningwise_score '反映击球手在局数方面的表现,根据压力值将权重分配给第一局和第二局。比赛中的得分也与球队的保龄球攻击成正比算法2保龄球力量1:对于所有玩家P做2 : α_bowler_score= 0.30*wickets_taken+ 0.20 *bowl_avg+ 0.10*bowl_sr+0.15*eco_rate+0.10*no_of_4_5_wicket_haul+0.05*max_wickets_taken+ 0.10*maiden_overs第三章:β Inningwise分数=0.40*α_bowler_score_first_inning+0.60*第二局α投球得分四:γ场地=0.40 * α_bowling_score_home_matches+0.60*α_保龄球比分客场比赛玩家 同样,击球手在主客场比赛中第五章:X_对手=0.80*α_bowling_score_strong_opponent+ 0.20*(' X _VENUE'),对手明智的(' Y_CONSISTENT ')被计算。本年度和过去五 年 的 统 计 数 据 也 进 行 了 分 析 , 以 反 映 选 择 击 球 手 的 质 量(“w_yearwise”)。击球手的总体击球得分('bat- ting_score')是使用上述所有参数计算的,在研究每个参数的影响后分配特定权重。至少需要四名击球手才能形成高质量的一方。一支拥有高水平击球手的球队会增加赢得比赛的机会。因此,有必要选择好的击球手。算法1有助于找到每个参数都表现良好的击球手。算法1蝙蝠侠力量1:对于所有玩家P做2 : α_batsmen_score=0.30*run_scored+0.05*notout_innigs+0.20*bat_avg+0.15*bat_sr+0.15*milestone_reaching_ability+0.10*no_of_43:β_pos_score=max(α_batsmen_score_at_each_position)4:γ_inningwise_score=0.40*α_batsmen_score_first_inning+0.60*α_batsmen_score_seocnd_inningα保龄球得分弱对手6:w_yearwise=0.20*α_bowling_score_current_year+ 0.80*α_bowling_score_last_five_year7:保龄球_得分0.30*α_保龄球_得分0.15*β_局明智_得分0.10*X_场地0.15*X_对手0.10*w_按年计 0.15*wicket_taken_performance 0.05* 船长8:结束算法3用于为球队选择一个击球全能者。一个击球全能者是一个擅长击球和保龄球的球员。与保龄球相比,击球全能者的击球表现最好。算法1和算法2用于通过测量运动员的击球和保龄球强度来评估击球全能运动员。计算击球和保龄球的总得分。平均击球和保龄球得分之间的差异。最后,计算出击球得分比保龄球得分更大的权重。球队需要至少一个击球全能者来组成一个平衡的阵容。使用我们的算法,击球5:X_venue=0.35*α_batsmen_score_home_matches+ 0.65*全能者可以找到。α_batsmen_score_away_matters第六章:y_对手=0.70*α_batsmen_score_strong_opponent+0.30*α击球手得分弱对手7:w_yearwise=0.20*α_batsmen_score_current_year+ 0.80*最近五年的α击球手得分8:batting_score=0.25*α_击球手_得分+0.10*β_位置_得分+0.15*算法3击球全能1:对于所有玩家P做2:计算整体击球得分3:计算整体保龄球得分4:X_diff= batting_score-bowling_scoreγ一局得分 0.10*X_场地y_对手0.20*w_年0.05* 船长9:endfor+0.15*5:batting_allrounder_score0.50*batting_score 0.30*bowling_score 0.20*X_diff6:结束算法2用于计算运动员的保龄球力量。球员的保龄球实力是衡量采取的三柱门,保龄球平均,罢工率,经济率,总4/5三柱门拉,最大三柱门采取在一场比赛中,和计数的处女投球(' α _bowler_score')。投球手的效率也是根据局数('Β_INNINGWISE_SCORE')、场地('Γ_VENUE')、对手(' X _VENUE')和年度('W_YEARWISE')保龄球得分来衡量的。分配适当的权重来计算保龄球运动员的每个参数的值。最终的保龄球得分('bowling_score')组合了具有适当重要性的所有参数。获胜的机会算法4用于选择球队的保龄球全能选手。保龄球全能选手是一个既能打保龄球又能击球的球员。与击球相比,保龄球全能者是保龄球中最好的。算法1和算法2用于估计球员的击球和保龄球强度,以评估保龄球全能运动员。在计算总击球和保龄球得分后,计算平均击球和保龄球得分之间的差异。最后,保龄球全能得分被确定,接收比击球得分更大的权重。每一方至少需要一个保龄球全能建立一个平衡的阵容,可以使用我们的 方法确定 (见表5准确选择投球手。精度分类器没有功能优化GWOMFOWOAFFA蝙蝠PSOCSCS-PSOLogistic回归80.6484.2883.4382.3186.0486.9187.7991.5691.86朴素贝叶斯77.8579.5482.8581.2186.6491.0890.3590.5792.76KNN78.9280.3087.8789.8789.9789.6190.5691.8793.89SVM87.0989.2888.2989.3190.3390.7493.4694.3397.04决策树79.2882.3585.1784.0
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功