python 数据集划分
时间: 2023-07-09 13:24:34 浏览: 93
在 Python 中,常用的数据集划分方法是使用 Scikit-learn 库中的 train_test_split 函数。这个函数可以将数据集按照一定比例划分为训练集和测试集。
示例代码如下:
```python
from sklearn.model_selection import train_test_split
# X 是特征数据,y 是目标数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中,X 是特征数据,y 是目标数据。test_size 参数指定测试集占总数据集的比例,random_state 参数是随机数种子,用于保证每次划分的结果一致。函数返回值为四个变量,分别是训练集特征数据、测试集特征数据、训练集目标数据和测试集目标数据。
阅读全文