写一段python代码加载帕德博恩轴承数据集,并划分训练集 测试集 验证集
时间: 2023-03-20 10:00:32 浏览: 654
以下是加载帕德博恩轴承数据集并进行训练集、测试集、验证集划分的Python代码:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 加载帕德博恩轴承数据集
dataset = pd.read_csv('path/to/dataset.csv')
# 划分训练集、测试集、验证集
train_val, test = train_test_split(dataset, test_size=0.2, random_state=42)
train, val = train_test_split(train_val, test_size=0.25, random_state=42)
# 输出数据集大小
print(f"训练集大小: {len(train)}, 验证集大小: {len(val)}, 测试集大小: {len(test)}")
```
在上述代码中,我们首先使用Pandas库中的`read_csv()`函数加载帕德博恩轴承数据集,然后使用scikit-learn库中的`train_test_split()`函数将数据集划分为训练集、测试集和验证集。其中`test_size=0.2`表示测试集占20%的数据,`test_size=0.25`表示验证集占25%的数据。`random_state`参数用于设置随机种子,以确保每次运行程序时得到的数据集划分结果是一致的。最后,我们输出每个数据集的大小,以确保数据集划分成功。
阅读全文