首页python 数据集划分

python 数据集划分

时间: 2023-07-09 13:24:34 浏览: 93

在 Python 中，常用的数据集划分方法是使用 Scikit-learn 库中的 train_test_split 函数。这个函数可以将数据集按照一定比例划分为训练集和测试集。示例代码如下： ```python from sklearn.model_selection import train_test_split # X 是特征数据，y 是目标数据 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) ``` 其中，X 是特征数据，y 是目标数据。test_size 参数指定测试集占总数据集的比例，random_state 参数是随机数种子，用于保证每次划分的结果一致。函数返回值为四个变量，分别是训练集特征数据、测试集特征数据、训练集目标数据和测试集目标数据。

阅读全文