python 如何将数据集分为训练集和测试集
时间: 2024-05-02 20:18:56 浏览: 150
可以使用scikit-learn库中的train_test_split函数来将数据集分为训练集和测试集。train_test_split函数的输入参数包括数据集中的特征和标签,以及测试集所占的比例等。函数的输出结果包括训练集特征、测试集特征、训练集标签、测试集标签等。
以下是一个使用train_test_split函数将数据集分为训练集和测试集的示例代码:
```python
from sklearn.model_selection import train_test_split
# 假设数据集的特征为X,标签为y
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
```
其中,test_size参数指定测试集所占的比例,random_state参数用于设置随机种子,保证每次运行的结果相同。
阅读全文