首页写一段python代码加载帕德博恩轴承数据集，并划分训练集测试集验证集

写一段python代码加载帕德博恩轴承数据集，并划分训练集测试集验证集

时间: 2023-03-20 10:00:32 浏览: 654

以下是加载帕德博恩轴承数据集并进行训练集、测试集、验证集划分的Python代码： ```python import pandas as pd from sklearn.model_selection import train_test_split # 加载帕德博恩轴承数据集 dataset = pd.read_csv('path/to/dataset.csv') # 划分训练集、测试集、验证集 train_val, test = train_test_split(dataset, test_size=0.2, random_state=42) train, val = train_test_split(train_val, test_size=0.25, random_state=42) # 输出数据集大小 print(f"训练集大小: {len(train)}, 验证集大小: {len(val)}, 测试集大小: {len(test)}") ``` 在上述代码中，我们首先使用Pandas库中的`read_csv()`函数加载帕德博恩轴承数据集，然后使用scikit-learn库中的`train_test_split()`函数将数据集划分为训练集、测试集和验证集。其中`test_size=0.2`表示测试集占20%的数据，`test_size=0.25`表示验证集占25%的数据。`random_state`参数用于设置随机种子，以确保每次运行程序时得到的数据集划分结果是一致的。最后，我们输出每个数据集的大小，以确保数据集划分成功。

阅读全文