X_train, X_test, y_train, y_test = train_test_split(data, target, test_size=0.2, random_state=42)
时间: 2024-04-20 19:20:59 浏览: 149
数据集分割train和test程序
train_test_split函数是用于将数据集划分为训练集和测试集的常用函数。它的参数包括data(数据集),target(目标变量),test_size(测试集大小比例)和random_state(随机种子)。
具体来说,train_test_split函数将数据集data和目标变量target按照指定的比例(test_size)划分为训练集和测试集。其中,X_train和y_train是训练集的特征和目标变量,X_test和y_test是测试集的特征和目标变量。
在划分过程中,可以通过设置random_state参数来控制随机种子,以确保每次划分的结果一致。这对于实验的可重复性非常重要。
阅读全文