#拆分数据集为训练集0.8和测试集0.2 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
时间: 2023-07-20 14:41:36 浏览: 90
python 划分数据集为训练集和测试集的方法
这段代码使用 `train_test_split` 函数将数据集 `X` 和 `y` 拆分为训练集和测试集,其中 `test_size=0.2` 表示测试集占总样本的比例为 0.2,`random_state=0` 表示随机数种子为 0,确保每次运行代码得到的结果相同。
该函数的返回值是一个元组,包含四个数组,分别是 `X_train`、`X_test`、`y_train` 和 `y_test`,其中 `X_train` 和 `y_train` 是训练集的特征和标签,`X_test` 和 `y_test` 是测试集的特征和标签。
这里 `train_test_split` 函数是从 `sklearn.model_selection` 模块中导入的,需要先安装 scikit-learn 库。
阅读全文