没有合适的资源?快使用搜索试试~ 我知道了~
虚拟现实智能硬件• 文章·2022年10月第4卷第5期:44410.1016/j.vrih.2022.08.008NPIPVis:一个包含NBA可视化分析和集成学习模型预测的石卓1,3,4,李明瑞2,3 *,王梦2,3,沈静1,陈伟4,罗晓楠2,31. 桂林电子科技大学艺术设计系,桂林541004;2. 桂林电子科技大学计算机与信息安全系,桂林541004;3. 桂林电子科技大学广西图像图形智能处理重点实验室,桂林541004;4. 浙江大学CAD/CG国家重点实验室浙江杭州310058接收日期:2022年7月12日;修订日期:2022年6月25日;接受日期:2022年8月28日摘要:背景数据驱动的事件分析已逐渐成为现代竞技体育分析的支柱。竞技体育数据分析任务越来越多地使用计算机视觉和机器学习模型进行智能数据分析。现有的体育可视化系统主要关注球员-球队数据的可视化,对于球队赛季胜负数据和比赛时间序列数据的可视化不够直观,忽略了对全明星球员的预测。方法采用并行聚合有序超图动态超图、Calliope可视化数据故事技术和iStoryline叙事可视化技术设计交互式可视化系统,可视化球员和球队的常规统计数据和比赛时间数据NPIPVis包括一个团队的胜利和失败的动态超图和游戏情节叙事可视化组件。此外,提出了一种基于学习的全明星球员预测模型SRR-voting,该模型从现有的少数和多数样本出发,采用合成少数过采样技术和RandomUnderSampler方法生成和剔除一定大小的样本,以平衡数据集中全明星球员和普通球员的数量其次,引入随机森林算法提取和构建球员特征,结合投票集成模型预测全明星球员,利用Grid-SearchCV优化集成学习中各模型的超参数,并结合五重交叉验证提高模型的泛化能力。最后,引入SHapley加性解释(SHAP)模型,以增强模型的解释能力。结果与6种常用模型的对比实验结果表明,SRR-投票模型在准确率、F1得分和召回率指标上都有显著提高,验证了SRR-投票模型的有效性和实用性。结论本研究结合数据可视化和机器学习设计了一个NBA数据可视化系统,帮助普通观众可视化比赛数据,预测全明星球员,这也可以推广到其他体育赛事或相关领域。关键词:运动可视化;并行聚合有序超图; Calliope; ISoryline;整合学习; SHAP模型国家自然科学基金资助项目(61862018);广西高校千名中青年骨干教师引文:石卓,李明瑞,王梦,沈静,陈伟,罗晓南。NPIPVis:一个可视化系统,涉及NBA可视化分析和集成学习模型预测。虚拟现实智能硬件,2022,4(5):444*通讯作者 ,19032303028@mails.guet.edu2096-5796/©版权所有2022北京中科学报出版有限公司有限公司、出版社:Elsevier B.V.我代表科爱通信有限公司公司 这是CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。445Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统1 介绍美国国家篮球协会(NBA)被认为是世界然而,对于普通观众来说,理解和分析NBA联盟的高维专业数据是困难的,数据可视化[1]和机器学习技术[2]数据可视化和机器学习技术可以结合起来,从这些数据中提取关键信息,以可视化图表的形式呈现复杂的数据,提高数据的可读性和可操作性,方便用户观察和理解数据的含义和模式,并利用数据预测NBA比赛的结果。本文详细研究了NBA球员和球队的常规统计数据和比赛时间序列数据,结合数据可视化和机器学习技术,进行探索和预测。NPIPVis系统首先使用并行聚合有序超图可视化(PAOHVis)[3]来创建NBA赛季输赢的超级动态图表,然后使用iStoryline[4]。此外,使用iStoryline定制了NBA比赛情节可视化组件,具有多种图表样式和用户友好的交互方式。此外,提出了一种集成学习算法SRR-voting来预测NBA全明星球员,并使用Calliope[5]NPIPVis对重要的NBA数据进行可视化和解读,可以帮助普通用户更好地了解和分析NBA球队和比赛,以及了解和预测全明星球员。1.1 体育可视化Buono等人通过特定的可视化分析了足球比赛,突出了球员的进球贡献,并帮助用户了解球员,球队表现以及进球和传球原因的演变[6]。Wu等人设计了一个时空可视化来表示团队的变化[7]。设计并开发了一个可视化分析系统ForVizor,使用户能够跟踪地层的时空变化,并了解变化及其原因。Sheng等人开发了一个名为GreenSea的基于视觉的评估系统,并提出了一种用于长期跟踪的新型递归判别BLS(RDBLS)[8]。Meng等人利用视频跟踪来捕获足球运动员的身体和战术信息,并将运动员跟踪技术与推荐算法相结合,提出了一种足球推荐系统Zhang等人提出了一种有效的方法来改善时空上下文学习,并通过组合来自多个视图的信息来提高准确性[10]。对于曲棍球,Carsting et al.创建了一个软件系统来可视化和过滤比赛数据,以帮助林雪平曲棍球俱乐部评估守门员的表现[11]。Chu等人提出了一个沉浸式视觉分析系统TIVEE,帮助用户从多个层面探索和解释羽毛球战术[12]。Wu等人提出了iTTVis,一种用于分析和探索乒乓球数据的可视化分析系统[13]。它从三个角度提供了一个整体的游戏可视化:时间导向,统计和战术。此外,Lan等人还介绍了SimuExplorer,这是一个可视化系统,可以帮助分析师探索球员行为如何影响乒乓球得分率,并开发可以帮助球员提高的训练计划[14]。对于篮球,Goldsberry提出了一种新的方法来量化NBA球员的投篮范围Lei等人将体育数据分为统计数据和多维数据,总结了体育数据可视化的现有工作、面向领域和常用方法,阐述了体育数据可视化分析的基本思想[16]。此外,Chen等人提出了NBA比赛可视化的三个细节层次(即,赛季,比赛和会话级别),并设计和实现了一个实时系统[17]。Losada等人提出了一个用于篮球比赛分析的可视化分析系统BKViz,专注于单个比赛以更好地理解比赛[18]。446虚拟现实智能硬件 2022年10月第4卷第5期Hung等人提出了BasketView,这是一个基于Web的可视化系统,使篮球专业人士能够从三个角度(赛季,比赛和锦标赛级别)分析比赛[19]。Perin等人从得分数据、跟踪数据和元数据的角度分析了当前体育数据可视化的过程[20]。Wang等人结合网络拓扑特点,建立旁路路径、通过质量、技术统计等[21]。为此,提出了一种新的视觉评价模型,并开发了一个名为PlayerNetVis的视觉分析系统。Ji等人提出了一个基于1985年至2019年NBA比赛数据的数据可视化系统,用于NBA比赛报告,并带有知识图,以帮助用户快速了解比赛[22]。Jin等人提出了一种基于图表的球员可视化系统,从多个角度分析篮球运动员[23]。上述现有的体育可视化研究,特别是对于NBA可视化,偏向于专家分析系统(例如,Losada等人[18]和Wang et al.[21]),并且所分析的数据通常是常规的球员和球队统计数据(例如,Jin等人[23])。NBA球队输赢和时间序列数据的可视化为了解决上述问题,拟议的NPIPVis系统使用PAOHVis根据NBA球队1980年至2022年的常规统计数据绘制赛季的输赢超图。该系统使用iStoryline处理NBA比赛时间序列数据,设计了比赛情节可视化组件。此外,NPIPVis还为普通观众提供了丰富的视觉图表,以更好地了解NBA球队和比赛。1.2 体育预测对于网球,Wilkens等人将机器学习技术应用于男女职业单打网球比赛,分析了2010年至2019年近39000场网球比赛的数据,并提出了一个网球比赛预测和投注模型来预测网球比赛结果和投注赔率。对于橄榄球,Xia et al.提出了一种网络驱动的体育排名和预测方法,根据国家橄榄球联盟和NBA比赛的结果定义球队的有向图,并推断使用这些网络确定排名的球队的重要性[25]。South等人使用现代建模技术,如神经网络和随机森林,来预测大学橄榄球比赛的结果[26]。对于篮球,Lam等人提出了一种基于堆叠贝叶斯回归的开创性建模方法,依靠稀疏多尺度高斯过程回归的高标准性能,根据NBA球队的助攻和篮板数据预测常规赛比赛方向,将球员的表现与球队的实力联系起来[27]。Pai等人提出了一种基于支持向量机(SVM)和决策树(DT)的混合模型滞后空间矢量调制决策树(HSVMDT),它提供了帮助教练制定策略的规则[28]。借助预测的比赛结果和HSVMDT模型生成的规则,教练可以轻松快速地了解增加获胜机会Giuliodori提出了一种基于人工神经网络(ANN)的模型,用于预测NBA比赛中的失败者,该模型训练ANN根据诸如输赢的比赛数量和球队的抢断数量等信息来预测NBA比赛中的获胜球队[29]。Özbalta等人使用基于NBA 2K 20 MyTeam比赛数据集和2019-2020赛季NBA球员表现统计的监督机器学习方法预测了新NBA合同球员的工资。Yang等人提出了一种改进的基于PageRank算法的NBA季后赛排名预测模型,从球队比赛数据的整体角度对球队实力进行排名,并预测季后赛结果[31]。Huang等人使用一维卷积神经网络和SVM来预测美国职业棒球大联盟比赛的结果,为球迷和球队经理提供一些参考信息[32]。Kaimakamis使用随机森林和SVM等机器学习算法来预测NBA球队在季后赛中的最终位置[33]。Albert等人提出了一种混合机器学习模型,447Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统预测NBA全明星球员,结合随机森林,AdaBoost和多层感知器模型,以提高预测NBA全明星球员的准确性[34]。上述体育预测研究,例如Wilkens[24]和Giuliodori[29],往往使用单一的机器学习模型来分析少量的低维比赛数据,泛化能力差,准确率低,内存开销大,速度慢。相比之下,集成学习LightGBM[35]具有训练速度快、效率高、拟合能力好针对上述问题,提出一种基于学习的全明星球员预测模型SRR-voting,方便普通观众了解NBA球员。采用Calliope叙事可视化技术展示全明星球员预测结果,自动生成全明星球员的可视化数据故事2 NBA数据描述NPIPVis使用美国领先的数据网站Basketball-Reference提供的NBA常规统计和比赛时间序列数据,设计了NBA常规统计和比赛时间序列数据的可视化视图。2.1 NBA常规数据NPIPVis使用爬虫技术从Basketball-Reference网站获取1980年至2022年的NBA常规赛球员和球队统计数据NBA常规赛球队的统计数据包括平均抢断,平均失误和平均上限。此外,还观察到27个场地属性,其中季后赛是标记场地。如果球队进入季后赛,则季后赛值为1,反之亦然,则记录了1165个数据点。NBA常规赛球员统计包括31个场域属性,例如,年龄和三分球命中率,其中类为标签场域。如果选手被选为全明星,职业值为1,反之亦然,那么就有21161个数据点2.2 NBA比赛计时数据NBA比赛年表记录了比赛的发展过程。NPIPVis游戏时间顺序数据的特定字段属性包括每个季度剩余的时间、A队事件详细信息、B队事件详细信息、球员、事件和分数(表1)。表 1定时数据字段属性时间序列数据字段属性时间12:00. 0B队赛事详情防守篮板由C。Kispert Team A Event Details T.杨在20英尺处跳投2分比分6-03 NPIPVis可视化系统3.1 系统概述NPIPVis由三个模块组成(数据处理、可视化和预测)。图1显示了常规统计数据和游戏时间序列数据的预处理。这些数据是建模、可视化和预测的信息源。建立了基于集成学习的全明星球员预测模型,并对模型进行了训练,绘制了NBA球队赛季胜负动态超图和NBA比赛情节叙事可视化组件。最后,全明星球员预测结果自动生成的可视化数据故事。448虚拟现实智能硬件 2022年10月第4卷第5期独热编码零填充正常化数据库DaDt atpar eopcreoscsenging独热编码零填充正常化可视化预测击杀RandomUnderSampler随机森林综合学习图 1NPIPVis可视化系统设计框架。3.2 软硬件环境硬件配置包括CPU型号(Intel Core i7-7700)和图形内存容量(4GB)。使用的软件包括Windows 10操作系统和PyCharm开发工具。使用的开发语言是Python 3.7,HTML,CSS和JavaScript,主要库包括Scikit-learn,Pandas,Numpy,React,PAOHvis,iStoryline和Calliope。4 NBA常规统计可视化设计PAOHvis可视化动态超图。超图是图的一种推广,其中边可以连接两个以上的顶点。PAOH将顶点表示为平行的水平条,将超边表示为连接两个或多个顶点的垂直线。PAOH是第一个具有高可读性和无重叠的动态超图表示技术,非常适合中型动态超图网络。在这项研究中,PAOHVis创建了一个动态超图,描绘了2021-2022赛季球队之间的输赢。动态超图组件分为七个部分:A(操作栏),B(颜色和组),C(原点),D(曲线),E(边缘轻拍)和F(下侧边栏)。操作栏允许数据集的上传和搜索。用户可以通过按颜色和团队的东部和西部划分对团队数据进行排序来按组单击颜色主界面分别使用赛季月份和球队名称作为水平和垂直坐标。默认情况下,球队按赛季中的比赛次数排序在每一列中,相应球队进行的所有比赛都按时间升序显示。本节描述了整个赛季每支球队的输赢。每支球队在整个赛季中所打的比赛都是从左到右按升序编码的。通过将鼠标悬停在诸如犹他爵士队之类的球队上,将突出显示与犹他爵士队相关的所有合同线和球队。将鼠标悬停在球队之间的合同上,如犹他爵士队和迈阿密热火队,将显示所有爵士队和热火队的如果两个相邻会话之间的空间太窄或太宽,用户可以单击侧边栏中的年份宽度和房屋高度进行放大和缩小,以便显示所有操作,而不会造成视觉混乱(图2)。449Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统图 2NBA球队赛季5 NBA比赛时间序列数据可视化设计在超级动态图表中看到一支球队整个赛季的输赢之后,用户可能想仔细看看每场比赛的细节。该系统使用叙事可视化来实现这一点。iStoryline生成具有各种粗略风格的故事情节可视化,其中线条代表故事中的角色此外,iStoryline.js使用强化学习框架来训练人工智能代理,以帮助用户有效地探索设计空间并生成优化的故事情节。用户可以使用游戏情节叙事可视化来可视化游戏(图3)。竞赛情节叙事可视化组件分为三个部分:菜单栏、主界面和侧边栏。用户可以通过菜单栏添加字体和更改线条的颜色,并通过侧边栏移动、缩放和弯曲线条本文以2022年4月6日华盛顿奇才队对亚特兰大老鹰队的主界面中的线条代表游戏中的玩家:巫师和鹰玩家分别由虚线和实值线表示。位置为大前锋、中锋、控球后卫和控球后卫的球员分别用红色、黄色、蓝色和绿色表示顶部和底部之间的间距表示玩家在游戏场景中的切换,而左侧和右侧之间的间距不同的球员边线有接触,以表明球员之间是否有对抗或协助关系。当鼠标移动到联系人节点时,它显示匹配或辅助关系和匹配细节(例如,玩家名称和事件)。下图中,比赛比分为26Gallinari取代D.Hunter和D.亨特休息。D. 加福德创造了两个自由行。此外,Hachimura(T。Young)。6 NBA比赛时间序列数据可视化设计提出了一种基于集成学习的全明星球员预测模型SRR-voting,并与8种机器学习模型进行了实验比较。SRR投票使用十个模型来预测2021年全明星球员。从1980年到2021年的NBA球员数据被输入模型。使用1980年至2020年的 NBA球员数据作为训练集,使用2021年的NBA球员数据作为测试集,450虚拟现实智能硬件 2022年10月第4卷第5期TP+FPTP+FN(a)菜单栏(c)侧边栏(b)主界面PFCSGPG战斗端26-29D.Gallinari进入游戏D.Hunter D. Gaffd免费掷2/2R犯规。Hachimura(由T.年轻)R.HachimuraK.PorzingisC.CapelaC.KispertC.KuerterD.KunterK.CaldwellT.YoungT.SatoranskyD.Gafford元素形状文本故事图 3竞赛情节叙事的可视化。模型输出2021年NBA全明星球员的预测结果。实验结果表明,SRR-投票预测的性能更好。6.1 预测性评价指标在这项研究中,精度和召回率指标被选择来评估模型的性能。选择F1评分指标来评价模型的总体能力。精确度、召回率和F1得分值在0和1之间,它们越接近1,模型性能越好TP、TN、FP和FN分别表示真阳性、真阴性、假阳性和假阴性病例精度=TP召回=TPF= 2*精确度*召回率(一)(二)(三)1精确度+召回6.2 数据预处理数据集分为分类和数值特征。使用独热编码处理分类特征一些数值特征,如助攻和三分球,被归一化以检查离群值,缺失值被填充为零。451Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统开始击杀端随机综合森林学习随机采样器3.02.52.01.51.00.50.0-0.5–33.02.52.01.51.00.50.0––36.3 综合学习模式现有NBA预测模型一般采用单一或简单的融合机器学习模型,在特征提取、速率和准确率等方面存在局限性,预测结果不理想。为了解决过拟合和训练速度慢的问题,构造有效的特征信息,提高预测精度,提出了一种集成的基于学习的全明星提出了一种运动员预测模型--SRR-投票模型,以提高运动员预测的速度和准确性有效特征(图4)。图 4SRR-表决算法流程图。(1) 使用合成少数民族过采样技术(SMOTE)[34]为少数民族类别中的全明星球员的现有样本生成一定的样本量。RandomUnderSampler方法排除了一定的样本量,以平衡大多数类别中现有平均球员样本数据集中平均球员和非全明星球员的数量(2) 采用随机森林算法对1980-2021年NBA常规赛球员数据进行预处理,去除冗余特征,滤除高阶特征构建新的特征模型,并通过t分布随机邻域嵌入(t-SNE)可视化验证随机森林算法的有效性。(3) 选择线性回归(LR),LightGBM和SVM进行集成学习,并使用GridSearchCV方法使用超参数优化每个模型6.4 预测实验过程6.4.1 SMOTE和RandomUnderSamplerSMOTE方法用于在一个小类中选择两个实例,并在它们的空间连接线上选择一个随机点作为新生成的小类实例。RandomUnderSampler方法使用某种策略从多数类中选择样本作为代表性样本。具体而言,对于本研究中的评价,使用SMOTE和RandomUnderSampler方法生成和拒绝一定大小的样本,以获得平衡数据集,该数据集用作随机森林算法下一步的输入(图5)。6.4.2 随机森林首先评估玩家数据和标记特征的特征重要性。选择更重要的特征作为新的特征模型,并将随机森林分析的特征模型用作SRR投票算法下一步的输入(表2)。6.4.3 t-SNEt-SNE[36]用于可视化高维数据的非线性降维在这图 5SRR-表决算法流程图。452虚拟现实智能硬件 2022年10月第4卷第5期研究中,t-SNE将NBA球员的多维数据简化为二维数据,并将其可视化,以验证随机森林方法的有效性。红色和绿色节点分别代表非明星球员和全明星球员。节点越远,分布越稀疏,表明随机森林方法有效地降低了维度(图6)。表 2定时数据字段属性数据特征特征重要性FG 0. 1432P 0.119黑色0.049STL 0.030AST 0.023... ...这是什么?3210–1–2–3–4–36420–2–4–610.0-7.5 -5.0 -2.5 0. 0 2.5 5.0 7.5图 6SRR-表决算法流程图。6.4.4 综合学习集成学习的基本原理是构造多个分类精度较低的弱分类器,并根据每个弱分类器的结果形成一个强分类器,遵循一定的策略来解决分类问题。在这项研究中,LR,支持向量机,K-最近邻(KNN),DT,随机森林(RF),装袋,随机梯度下降(SGD),梯度学习和分类的弱分类器。SGD、梯度提升、XGBoost、局部级联集合和GridSearchCV被用来优化具有超参数的每个模型。此外,三个分类器的最佳6.4.5 GridSearchCVGridSearchCV是一种调优技术,可自动计算参数的最佳组合,以提高当前研究中的预测分数将前一步得到的新特征模型输入到GridSearchCV优化的集成学习模型中,输出最终的预测结果。集成学习算法使用多个参数,需要进行调整以提高模型的鲁棒性训练,这可能直接影响预测结果。6.4.6 k折交叉验证在这项研究中,K-折叠被用来验证每个模型的结果。因为这项研究使用了一个小数据集,所以对NBA球员数据集进行了五次交叉验证,以减轻重新拟合的表 3算法核心超参数参数设置算法参数LR′penalty′:[′l1′,′l2′],′C′:[0.001,0.01,0.1,1,10]SVM'n_neighbors':list(range(2,5,1)),“algorithm”:[“auto”,“ball_tree”,“kd_tree”,“brute”]KNN′C′:list(range(0.5,1,0.1)),“内核”:[“rfb”,“多”,“sigmod”,“线性”]“准则”:[“基尼”,“熵”],学习的节奏。因此,80%和20%的数据是DT分别用作训练和测试数据。在每个迭代,记录评分并在RF处取平均值'max_depth':list(range(2,5,1)),'min_samples_leaf':list(range(3,7,1))'n_estimators':list(range(100,200,50)),“准则”:[“基尼”,“熵”],'max_depth':list(range(2,5,1))结束时,平均值用于比较每个模型的效果(表3)。Bagging“n_estimators”:list(range(10,20,5))SGD′penalty′:[′l2′,′l1′],'max_iter':list(range(1000,2000,500))453Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统6.5 预测模型效果为了验证SRR投票模型在NBA球员数据集上预测NBA球员的有效性,将SRR投票模型与LightGBM[35],Kaimakamis[33],XGBoost[35]和Wilkens[24]进行了比较。用Kai- makamis C中的LightGBM和XGBoost以及Wilkens S中的KNN等6个模型进行了比较实验。比较结果如下表所示在表中、+RandomUnderSampler+RF,XGBoost,bagging,LR+SVM+LGB、KNN和LightGBM模型,回归(表4)。表4十种NBA预测算法在球员数据集模型精度召回F1Ⓒ0.92380.94120.9324①③⑤0.92630.94310.9351ⒸⒸ0.92500.94230.9335ⒸⒶ0.93050.95920.9446Ⓒ0.91760.92290.9202Ⓓ0.92510.94330.9345ⒸⒸⒸ0.92890.91150.9200总之,所有七个模型在NBA球员数据集上都表现良好;然而,SRR投票模型总体上优于每个模型SRR-投票模型在预测相似条件下的球员时,与其余六种模型相比,在精确度、召回率和F1度量指标上最好,这验证了SMOTE、RandomUnderSampler、随机森林、LightGBM、SVM和RF算法的有效性 , 最 多 比 其 余 八 种 算 法 高 1.29 、 4.77 和 2.46 这 是 因 为 SRR 投 票 模 型 首 先 使 用 SMOTE 和RandomUnderSampler算法生成和拒绝一定的样本量,以平衡数据集中全明星和常规球员的数量,提高分类效果,然后使用RF算法为球员数据集提取和构建新的特征然后使用RF算法从球员数据集中提取和构建特征,保留有效特征以构建新的特征模型,并选择三种算法(SVM,LightGBM和RF)集成投票学习。此外,GridSearchCV被用来优化每个模型的超参数,结合五重交叉验证,以提高模型的泛化能力。SRR投票算法是一种有效的NBA全明星球员预测算法(图7)。6.6 基于SHAP模型解释分析在这项研究中,NBA全明星球员预测模型的结果进行了分析,使用SHapley加法解释(SHAP)框架。图8显示了影响全明星球员选择的因素,这些因素基于他们的特征的重要性。这些特征的数值越高,入选全明星的概率就越高。此外,图8显示了NBA球员一般统计数据的重要特征,从上到下,从最重要到最不重要的特征。所有NBA球员的常规数据特征对入选全明星(季后赛= 1)或未入选全明星(季后赛= 0)的贡献相等,因为NBA球员的常规数据中的全明星和常规球员的数量在SMOTE和随机下采样方法之后是平衡的。从图8可以看出,得分数(PTS)、罚球数(FT)和2分球数的特征差异对模型的影响很大,而投篮数和篮板数是最不重要的特征。图9显示,PTS、助攻和防守篮板等特征的差异对模型的影响更为显著,入选全明星的概率随着该值的增加而增加。相比之下,启动次数(GS)和出现次数(G)是最不重要的特征。NBA数据集中的第一个样本数据用于分析。y轴示出了不同的NBA数据特征值,并且x轴指示SHAP值。红色和蓝色分别表示正增益和负增益。图10显示,G、MP、PF和年龄对于第一个样本数据具有正增益,454虚拟现实智能硬件 2022年10月第4卷第5期Class1lass00.92290.21.00.92380.9263 0.9250.93050.9176 0.9251十种NBA预测算法在球员数据集0.94120.943110.94230.95920.94330.9324 0.93510.91150.8精确回忆F1分数评价指标图7在NBA球员数据集上比较7种算法PTSFT2PFGAFGFTAGSTOVMP2PAASTDRBGPFeFG%2P%STL 黑色TRBFG%C0.000 0.005 0.010 0.015 0.020平均值(lsHAP值)(模型输出幅度的平均影响)图 8SRR-表决算法流程图。图 9SHAP特征密度散点图。PTS、FTA、GS、TOV、BLK和其他17个特征对于第一样本数据具有正增益第一个样品表现出负增益。6.7 NBA全明星球员可视化数据故事球员可视化数据故事是使用Calliope叙事可视化技术自动生成的Calliope从输入的电子表格中创建可视化数据故事,并基于在线故事编辑器轻松修改生成的故事它使用面向逻辑的蒙特卡罗树搜索算法,该算法探索输入电子表格提供的数据空间,以逐步生成并按逻辑顺序组织故事片段Calliope自动将数据文件转换为各种可视化的数据洞察演示,包括情况说明书,大视觉屏幕,数据卡通,FGPTSFTAFT2个PGSMPTOVASTDPBZPAGeFG%PFTRBBLKORBSTLFT%–0.05SHAP值(对模型输出的影响)高低0.00.40.6精确度、召回率、F1评特征值455Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统266=PTS41=G486=MP29=FTA0=GS26=TOV1=黑色50=PF31=年龄SMOTE_R. Smot... SMO...SMOTE_R.Smot... SMO...SMOTE_R.RandomUnferSampler_RF_LR_S若我们比较Recall的极限SMOTE_RandomUnderSampler_RF_LR_SVM_LGB.精度分布极差分布将平均精度根据不同的模型进行平均分。The results shownin Figure.SMOTE_RandomUnderSampler_RF_LR_SVM_LGB和KNN在平均精度上The difference,SMOTE_RandomUnderSampler_RF_SVM_LGB的平均召回率等于 0.96,在所有的模型中是最大的数 据视 频最 后 ,Calliope Sheets 被 用于 可视 化NBA全明星预测实验的结果,并生成NBA球员的可视化数据故事。如图11所示,从左到右,图表的颜色分别为黄色、蓝色和绿色,展示要解释的图表极致价值,f(x)=0-0.05+0.01-0.01-0.01+0.02-0.01–0+0+0比较和分配。第一张图是一个条形图,它显示了17其他特色-0.010.00 0.01 0.02 0.03 0.04 0.05E[f(x)]-0.046本研究在评价指标召回率方面是最好的图 10单样本特征影响图与其他算法相比。第二张图是一个文本图表,表明本研究中的SRR-投票算法是最好的。与KNN算法相比,Voting算法在评价指标精度上相差0.01。第三张图是一个树形图,每个模块的大小代表了每个算法在评价指标精度上的高低7 客户反馈为评价可视化系统NPIPVis在完成篮球比赛数据分析目标方面的效果在评估过程中,共邀请了10名评估人员,其中包括8名NBA篮球迷,其中两名普通观众只听说过NBA。在指导之后,评估人员很快就了解了如何对比赛时间序列数据可视化设计(T2)和NBA球员可视化数据故事(T3)进行定量评价,得分为1.005.00 =非常好的效果)。NPIPVis系统的每个可视化方案的评分如表5所示。从表中可以看出,大部分评价者认为可视化系统NPIPVis的可视化方案能够高效、直观地分析篮球赛事数据,快速获取赛事信息,优于传统的竞技体育数据分析工具。在可视化方案中,评价用户对可视化设计的满意度最高图 11NBA球员可视化数据故事。456虚拟现实智能硬件 2022年10月第4卷第5期NBA常规统计数据,平均得分为4.02。大多数评价用户对NBA比赛时间序列数据的可视化设计表示满意大多数评价用户是表 5可视化解决方案客户端T1 T2 T3NBA球迷一般用户摘要4.02 3.96 3.64对NBA球员的视觉数据故事总体满意,得分最低。8 结论在这项研究中,一个可视化系统,NPIPVis的设计,为普通观众,其中包括NBA球队的胜利和失败的动态超图,和游戏情节叙事的可视化视图,以帮助用户了解NBA球队和比赛。此外,一个集成的学习模型,称为SRR投票已被提出来预测全明星球员。此外,一个集成的学习模型,SRR投票,提出了预测全明星球员使用的案例研究的球员数据从Basketball-Reference网站,并将其与六个预测模型进行比较。未来,NPIPVis将支持更多视图,如框线图等基础图表,并进一步优化比赛剧情可视化视图,从多角度分析球员、球队和比赛数据,提供丰富的可视化组件,让用户直观、轻松解读NBA球员、球队和比赛。竞合利益我们声明我们没有利益冲突引用1 陈伟,沈智,陶毅.大数据系列:数据可视化。北京:电子工业出版社,2013 DOI:CNKI:SUN:IGXN.0.2014-01-0402 Ji S,Li J,Du T.机器学习模型可解释性方法、应用和安全研究综述。计算机研究与开发,2019,56(10):2071DOI:10.7544/issn1000-1239.2019.201905403 [10]杨文忠,杨文忠,杨文忠.并行聚合有序超图可视化分析动态超图。IEEETransactions on Visualization and ComputerGraphics,2021,27(1):1DOI:10.1109/tvcg.2019.29331964 [10]张文,张文. iStoryline:有效融合手绘故事情节。IEEE TransactionsonVisualizationand Computer Graphics,2019,25(1):769DOI:10.1109/tvcg.2018.28648995 施东,徐新,孙芳,施英,曹宁。Calliope:从电子表格自动生成可视化数据故事IEEETransactions on VisualizationandComputerGraphics,2021,27(2):453DOI:10.1109/tvcg.2020.30304036 Buono P,Ceriani M,Costabile M F,Valdivia P.足球进球领先阶段的视觉分析。意大利SIGCHI分会第14届双年会议。意大利,博尔扎诺纽约,ACM,2021年,1DOI:10.1145/3464385.34647407 吴永,谢新,王军,邓丹,梁宏,张宏,程S,陈伟。ForVizor:可视化足球中的时空团队编队。IEEETransactions onVisualization and ComputerGraphics,2019,25(1):65DOI:10.1109/tvcg.2018.28650418 Sheng B,Li P,Zhang Y,Mao L,Chen C L P. GreenSea:Visual Soccer Analysis using broad learning system. IEEETransactionsonCybernetics, 2021,51(3):1463DOI:10.1109/tcyb.2020.29887929 孟新,李智,王S,Karambakhsh A,盛B,杨平,李平,毛L.一种视频信息驱动的足球推荐系统。计算机电气工程,2020,85106699DOI:10.1016/j.compeleceng.2020.10669910 张萍,郑玲,蒋英,毛玲,李智,盛波。多视角下利用时空情境学习追踪足球运动员457Zhuo SHI,et al.NPIPVis:一个包含NBA可视化分析和集成学习模型预测的可视化系统多媒体工具和应用,2018,77(15):18935-18955 DOI:10.1007/s11042-017-5316-311 作者:Carsting T.GoalMate:冰球统计可视化应用程序202112 Chu X,Xie X,Ye S,Lu H,Xiao H,Yuan Z,Chen Z,Zhang H,Wu Y. TIVEE:沉浸式可视化的羽毛球战术的视觉探索和解释。IEEETransactions on Visualization and ComputerGraphics,2022,28(1):118DOI:10.1109/tvcg.2021.311486113 吴毅,兰杰,舒旭,季春,赵克,王杰,张宏。iTTVis:乒乓球数据的交互式可视化。IEEE TransactionsonVisualizationandComputer Graphics,2018,24(1):709DOI:10.1109/tvcg.2017.274421814 兰军,周忠,王军,张宏,谢新,吴勇。SimuExplorer:乒乓球比赛模拟的可视化探索IEEETransactionsonVisualization andComputer Graphics,2021,991DOI:10.1109/tvcg.2021.313042215 戈德斯伯里湾Courtvision:NBA的新视觉和空间分析。http://www.sloansportsconference.com/wp-content/uploads/2012/02/Go
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功