如何用python划分数据集为测试集和训练集
时间: 2023-09-27 19:09:08 浏览: 154
可以使用scikit-learn库中的train_test_split函数来划分数据集,具体实现代码如下:
```python
from sklearn.model_selection import train_test_split
# 生成特征数据X和标签数据y
# 划分数据集为训练集和测试集,test_size表示测试集占总数据集的比例
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中,X代表特征数据,y代表标签数据;test_size用于指定测试集所占的比例,random_state用于设置随机种子,保证划分的结果可重复。
阅读全文