python excel制作测试集和训练集
时间: 2023-08-24 21:05:00 浏览: 97
在Python中,可以使用Pandas和openpyxl等模块来操作Excel文件,制作测试集和训练集的过程如下:
1. 读取Excel文件
首先,需要使用Pandas模块读取Excel文件中的数据。例如,可以使用以下代码读取名为“data.xlsx”的Excel文件中的数据:
```python
import pandas as pd
# 读取Excel文件中的数据
data = pd.read_excel("data.xlsx")
```
2. 分割数据集
接下来,需要将数据集分割成测试集和训练集。可以使用sklearn模块中的train_test_split函数来实现数据集的分割。该函数需要指定要分割的数据集以及分割的比例。例如,可以使用以下代码将数据集分割成训练集和测试集:
```python
from sklearn.model_selection import train_test_split
# 将数据集分割成训练集和测试集
train_set, test_set = train_test_split(data, test_size=0.2, random_state=42)
```
上述代码将数据集分割成80%的训练集和20%的测试集。
3. 将数据保存到Excel文件中
最后,可以使用openpyxl模块将训练集和测试集保存到Excel文件中。例如,可以使用以下代码将训练集保存到名为“train_set.xlsx”的Excel文件中:
```python
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
# 创建一个Excel文件,并将训练集保存到其中
train_workbook = Workbook()
train_sheet = train_workbook.active
for r in dataframe_to_rows(train_set, index=False, header=True):
train_sheet.append(r)
train_workbook.save("train_set.xlsx")
```
类似地,可以使用上述代码将测试集保存到名为“test_set.xlsx”的Excel文件中。
阅读全文