python读取xlsx文件数据用于建立训练集和测试集,xlsx文件共有187个样本,样本数据的前5列为特征,第六列为标签,写代码
时间: 2024-04-11 20:28:28 浏览: 297
要读取XLSX文件并创建训练集和测试集,可以使用`pandas`库来处理Excel文件。以下是一个示例代码:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 设置XLSX文件路径
xlsx_file = 'path/to/your/xlsx/file.xlsx'
# 读取XLSX文件
data = pd.read_excel(xlsx_file)
# 提取特征和标签列
features = data.iloc[:, :5]
labels = data.iloc[:, 5]
# 划分训练集和测试集
train_features, test_features, train_labels, test_labels = train_test_split(features, labels, test_size=0.2, random_state=42)
# 打印训练集和测试集的大小
print("训练集大小:", len(train_features))
print("测试集大小:", len(test_features))
```
请确保将`'path/to/your/xlsx/file.xlsx'`替换为你实际的XLSX文件路径。以上代码使用了`pandas`库中的`read_excel`函数来读取XLSX文件,并使用`iloc`方法提取特征和标签列。最后,使用`train_test_split`函数将数据划分为训练集和测试集。你可以根据需要调整`test_size`参数来控制训练集和测试集的比例。
阅读全文
相关推荐


















