转换为np格式,保存为csv文件,将特征集按0.7:0.2:0.1的比例分为X_train、X_val和X_test,标签集按0.7:0.2:0.1的比例分为y_train、y_val和y_test
时间: 2024-03-24 09:37:06 浏览: 52
bdd100k数据集对应的yolo格式数据集(yolo格式标签+图片数据集).zip
5星 · 资源好评率100%
好的,以下是代码实现:
```python
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
# 读取数据集
data = pd.read_csv('data.csv')
# 将数据集最后一列放入标签集
y = data.iloc[:, -1].values
# 将数据集去除最后一列放入特征集
X = data.iloc[:, :-1].values
# 将特征集按0.7:0.2:0.1的比例分为训练集、验证集和测试集
X_train, X_val_test, y_train, y_val_test = train_test_split(X, y, test_size=0.3, random_state=42)
X_val, X_test, y_val, y_test = train_test_split(X_val_test, y_val_test, test_size=0.33, random_state=42)
# 将特征集和标签集转换为np格式
X_train_np = np.array(X_train)
X_val_np = np.array(X_val)
X_test_np = np.array(X_test)
y_train_np = np.array(y_train)
y_val_np = np.array(y_val)
y_test_np = np.array(y_test)
# 保存特征集和标签集为csv文件
np.savetxt("X_train.csv", X_train_np, delimiter=",")
np.savetxt("X_val.csv", X_val_np, delimiter=",")
np.savetxt("X_test.csv", X_test_np, delimiter=",")
np.savetxt("y_train.csv", y_train_np, delimiter=",")
np.savetxt("y_val.csv", y_val_np, delimiter=",")
np.savetxt("y_test.csv", y_test_np, delimiter=",")
```
此代码将数据集按照0.7:0.2:0.1的比例分为训练集、验证集和测试集,并将特征集和标签集转换为np格式,保存为csv文件。请将代码复制到您的编辑器中并保存为.py文件,确保数据集文件名与代码中一致。
阅读全文