首页python怎么对数据进行训练集和测试集划分程序

python怎么对数据进行训练集和测试集划分程序

时间: 2024-02-03 17:03:21 浏览: 175

你可以使用scikit-learn库中的train_test_split函数来进行训练集和测试集的划分。具体使用方法是将数据集分为X和y两个部分，其中X为数据的特征，y为所属的标签，然后使用train_test_split函数对X和y进行划分，指定测试集所占的比例，即可得到划分好的训练集和测试集。以下是一个示例代码： ```python from sklearn.model_selection import train_test_split # 假设X和y是已经准备好的数据集和标签 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) ``` 在这个示例中，将数据集划分为了70%的训练集和30%的测试集，随机种子为42。

阅读全文