首页划分训练集和测试集的python代码

划分训练集和测试集的python代码

时间: 2023-05-24 20:06:54 浏览: 109

划分训练集和测试集示例代码 python

划分训练集和测试集在这个示例中，我们使用train_test_split方法将数据集划分为训练集和测试集，并指定了测试集大小的比例和随机数种子。该方法会返回4个元素，分别表示训练集的特征数据、测试集的特征数据、训练集的目标数据和测试集的目标数据。需要注意的是，在实际使用过程中，我们需要根据具体的应用场景选择合适的划分方法，并根据需求对训练集和测试集进行进一步处理。

以下是使用sklearn库中train_test_split方法划分训练集和测试集的Python代码： ``` from sklearn.model_selection import train_test_split #加载数据集，X为数据特征，y为数据标签 X, y = load_data() #划分数据集，test_size为测试集占总数据的比例 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) ``` 其中，`X`为数据的特征，`y`为数据的标签，`test_size`表示测试集占总数据集的比例（例如`test_size=0.2`表示使用20%的数据作为测试集），`random_state`用于设定随机种子，保证每次随机划分的结果一致。 `train_test_split`方法会返回4个数组：`X_train`为训练集的特征数据，`y_train`为训练集的标签数据，`X_test`为测试集的特征数据，`y_test`为训练集的标签数据。

阅读全文