写一段python代码加载帕德伯恩大学轴承数据集,并划分训练集、测试集、验证集
时间: 2024-01-31 10:02:45 浏览: 220
帕德博恩数据集详细解读(一看就懂)
假设你已经下载了帕德伯恩大学轴承数据集,并将其解压缩到了本地目录中。以下是加载数据集、划分数据集并返回数据集的Python代码示例:
```python
import os
import numpy as np
from sklearn.model_selection import train_test_split
# 定义数据集路径
data_dir = '/path/to/paderborn_dataset'
# 加载数据集
X = np.load(os.path.join(data_dir, 'X.npy'))
y = np.load(os.path.join(data_dir, 'y.npy'))
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=42)
# 打印数据集大小
print('训练集大小:', X_train.shape[0])
print('验证集大小:', X_val.shape[0])
print('测试集大小:', X_test.shape[0])
# 返回数据集
return X_train, y_train, X_val, y_val, X_test, y_test
```
这段代码首先定义了数据集目录的路径,然后使用NumPy加载数据集。接着使用`train_test_split`函数将数据集划分为训练集、测试集和验证集。最后,打印数据集的大小并返回数据集。
阅读全文