python中train_test_split函数的用法
时间: 2023-09-27 10:08:38 浏览: 111
kNN.rar_KNN 分类 python_分类 Python
train_test_split函数是sklearn.model_selection模块中的函数,用于将数据集随机分成训练集和测试集。它的用法如下:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
其中,X是特征数据集,y是标签数据集,test_size指定测试集的比例,random_state用于设定随机种子,确保每次运行得到的结果一致。该函数返回四个数据集:训练集的特征数据X_train,训练集的标签数据y_train,测试集的特征数据X_test,测试集的标签数据y_test。
train_test_split函数的主要作用是为了评估机器学习模型的性能。我们可以使用训练集来训练模型,然后使用测试集进行评估。通过测试集的评估结果,可以了解到模型的泛化能力,即对新数据的适应能力。
阅读全文