python 划分测试集训练集
时间: 2023-09-04 15:09:34 浏览: 81
python 划分数据集为训练集和测试集的方法
在 Python 中,可以使用 scikit-learn 库中的 train_test_split() 函数来将数据集分为训练集和测试集。
示例代码如下:
```python
from sklearn.model_selection import train_test_split
# 假设 X 和 y 是特征和标签数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中,X 和 y 是原始数据的特征和标签,test_size 参数表示测试集占总数据集的比例(这里是 20%),random_state 参数用于控制随机种子,以确保每次运行代码得到相同的结果。
train_test_split() 函数会返回四个数据集:X_train 和 y_train 是训练集的特征和标签,X_test 和 y_test 是测试集的特征和标签。
阅读全文