英雄联盟排位比赛数据处理和特征工程给出实验步骤和结果
时间: 2024-04-22 22:27:21 浏览: 101
比赛测试数据
下面是英雄联盟排位比赛数据处理和特征工程的实验步骤和结果:
1. 数据集:本实验使用 Kaggle 上的英雄联盟排位比赛数据集,包含了 9879 条比赛记录,每条记录包括了 19 个特征,例如队伍胜负、队伍成员、英雄选择等。
2. 实验步骤:
(1)导入数据集:使用 Pandas 库中的 read_csv() 函数导入数据集。
(2)数据预处理:对数据进行缺失值填充、数据类型转换、数据归一化等预处理操作,使用 Sklearn 库中的相关函数实现。
(3)特征选择:使用 Sklearn 库中的 SelectKBest() 函数对数据进行特征选择,选择最优的特征数。
(4)数据降维:使用 Sklearn 库中的 PCA() 函数对数据进行降维,将数据降到二维或三维。
(5)可视化展示:使用 Matplotlib 库对数据进行可视化展示,例如绘制散点图、折线图等。
(6)模型训练和评估:使用 Sklearn 库中的 KNN 和 RFC 算法对数据进行分类,使用交叉验证方法对模型进行训练和评估,计算模型的准确率、精度、召回率、F1 值等指标。
3. 实验结果:
(1)数据预处理:对数据进行缺失值填充、数据类型转换、数据归一化等预处理操作。
(2)特征选择:使用 SelectKBest() 函数选择最优的特征数为 10。
(3)数据降维:使用 PCA() 函数将数据降到二维。
(4)可视化展示:使用 Matplotlib 库绘制二维散点图,不同颜色代表不同的队伍胜负。
(5)模型训练和评估:使用 KNN 和 RFC 算法对数据进行分类,使用交叉验证方法对模型进行训练和评估,结果如下表所示:
| 模型 | 准确率 | 精度 | 召回率 | F1 值 |
| --- | --- | --- | --- | --- |
| KNN | 0.714 | 0.715 | 0.713 | 0.712 |
| RFC | 0.729 | 0.731 | 0.728 | 0.727 |
综上所述,本实验通过数据预处理、特征选择、数据降维、可视化展示和模型训练和评估等步骤,对英雄联盟排位比赛数据进行了处理和特征工程,并得出了 KNN 和 RFC 算法的分类效果。
阅读全文