写一段python代码加载德国帕德博恩轴承数据集,并划分训练集 测试集 验证集
时间: 2023-03-20 20:00:32 浏览: 296
以下是加载德国帕德博恩轴承数据集、并划分训练集、测试集和验证集的Python代码示例:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 加载数据集
data = pd.read_csv("path/to/dataset.csv")
# 划分数据集
train_data, test_data, train_labels, test_labels = train_test_split(
data.drop("label", axis=1),
data["label"],
test_size=0.3,
stratify=data["label"],
random_state=42,
)
train_data, val_data, train_labels, val_labels = train_test_split(
train_data,
train_labels,
test_size=0.2,
stratify=train_labels,
random_state=42,
)
# 输出数据集的大小
print("训练集大小:", len(train_data))
print("测试集大小:", len(test_data))
print("验证集大小:", len(val_data))
```
其中,`pd.read_csv()`函数用于从CSV文件中加载数据集。`train_test_split()`函数用于将数据集划分为训练集、测试集和验证集,其中`test_size`参数指定了测试集的比例,`stratify`参数保证了各个数据集中各个类别的比例相同。最后,使用`print()`函数输出了各个数据集的大小。
阅读全文