def GeneratePredictData(stat,info): X=[] for index, rows in stat.iterrows(): #elo作为第一特征 team1 = rows['Vteam'] team2 = rows['Hteam'] elo_team1 = GetElo(team1) elo_team2 = GetElo(team2) fea1 = [elo_team1] fea2 = [elo_team2+100] #球队统计信息作为剩余特征 for key, value in info.loc[team1].iteritems(): fea1.append(value) for key, value in info.loc[team2].iteritems(): fea2.append(value) #两队特征拼接 X.append(fea1 + fea2) return np.nan_to_num(X)

时间: 2024-01-03 12:03:50 浏览: 123

这段代码是用于生成机器学习预测所需的数据。其中，stat 指代每个球队的统计数据，info 指代每个球队的基本信息数据。对于每一支球队，先获取其当前的 Elo 等级分，然后将其作为特征向量的第一个特征。接着，将球队的统计数据以及基本信息数据作为剩余的特征。最后，将两支球队的特征向量拼接起来，作为预测数据的特征向量。值得注意的是，这里也使用了 np.nan_to_num 函数将特征向量中的 NaN 值替换为 0。

def GenerateTrainData(stat, trainresult): X = [] y = [] for index, rows in trainresult.iterrows(): winteam = rows['WTeam'] loseteam = rows['LTeam'] winelo = GetElo(winteam) loseelo = GetElo(loseteam) # 主场加100 if rows['WLoc'] == 'H': winelo = winelo+100 else: loseelo = loseelo+100 # 把elo当为评价每个队伍的第一个特征值 fea_win = [winelo] fea_lose = [loseelo] for key, value in stat.loc[winteam].iteritems(): fea_win.append(value) for key, value in stat.loc[loseteam].iteritems(): fea_lose.append(value) if np.random.random() > 0.5: X.append(fea_win+fea_lose) y.append(0) else: X.append(fea_lose+fea_win) y.append(1) # 更新team elo分数 win_new_score, lose_new_score = CalcElo(winteam, loseteam) team_elos[winteam] = win_new_score team_elos[loseteam] = lose_new_score return np.nan_to_num(X),y

这段代码是用于生成机器学习所需的训练数据。其中，stat 指代每个队伍的统计数据，trainresult 指代比赛结果数据。对于每一场比赛，先获取胜利队伍和失败队伍的 Elo 等级分，并在主场胜者 Elo 等级分加 100。然后，将胜利队伍和失败队伍的 Elo 等级分以及统计数据作为特征值，组合成特征向量。接着，根据 0.5 的概率将特征向量和胜负标签（0 表示胜利队伍，1 表示失败队伍）加入到训练数据集中。最后，根据比赛结果更新每个队伍的 Elo 等级分，并返回训练数据集 X 和对应的标签 y。值得注意的是，这里使用了 np.nan_to_num 函数将特征向量中的 NaN 值替换为 0。

阅读全文

相关推荐

解决PHP 7编译安装错误：cannot stat ‘phar.phar’: No such file or directory

stat.xslnginx-rtmp-module-stat.xsl

JSON-stat:JSON-Stat Toolkit版本0

STAT215:STAT215课程

STAT461:Stat 461-ANOVA的回购

shortlab5_stat302:Stat 302 UW

STAT302:STAT 302的课程网页存储库

stat4701:最终项目

Stat3622:香港大学STAT3622数据可视化课程材料

STAT345:用于测试STAT 345的代码的工作空间

stat615:爱荷华州立大学 STAT 615 文件的网站

stat110:概率备忘单

欧拉公式求圆周率的matlab代码-stat665:STAT665的课程网站

Statman:游戏实时统计跟踪

STAT6180：R中的应用统计

stat133:2014 年秋季统计 133 Lec 1

Stat466:鲍恩施纳普森的统计数据-开源

multicraft_discord_channel_stat:Discord bot使用Multicraft api和discord.js不断更新您的Minecraft服务器上的在线播放器

stat479-machine-learning-fs19：STAT 479：机器学习（FS 2019）课程材料，由威斯康星大学麦迪逊分校的Sebastian Raschka教授

大家在看

东华his表结构新版.docx

CMOS反相器的掩膜版图-集成电路版图设计

低温制冷机产品汇总.pdf

CAN分析仪 解析 DBC uds 源码

中国移动5G规模试验测试规范--核心网领域--SA基础网元性能测试分册.pdf

最新推荐

MongoDB启动报错 Process: 29784 ExecStart=/usr/bin/mongod $OPTIONS (code=exited, status=14)

Vim pythonmode PyLint绳Pydoc断点从框.zip

springboot138宠物领养系统的设计与实现.zip

海康无插件摄像头WEB开发包(20200616-20201102163221)

PCNM空间分析新手必读：R语言实现从入门到精通

生成一个自动打怪的脚本

CarMarker-Animation: 地图标记动画及转向库

5G核心网元性能瓶颈揭秘

stm32连接红外传感器并将gsm900a短信收发实现报警

C语言时代码的实现与解析

CAN分析仪解析 DBC uds 源码