sklearn的 train_test_split 如何使用
时间: 2023-05-31 22:07:53 浏览: 118
train_test_split 是 sklearn 中用于将数据集划分为训练集和测试集的方法。它可以从给定的数据集中随机选择一部分数据作为训练集,另一部分数据作为测试集。
使用方法:
1. 导入 train_test_split 方法:from sklearn.model_selection import train_test_split
2. 将数据集划分为特征与标签两部分,如:X, y
3. 调用 train_test_split 方法,传入参数:X, y, test_size, random_state等。
例子:
```
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
# load iris dataset
iris = load_iris()
# split dataset into training set and test set
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
# print the shape of the datasets
print("X_train shape:", X_train.shape)
print("y_train shape:", y_train.shape)
print("X_test shape:", X_test.shape)
print("y_test shape:", y_test.shape)
```
在这个例子中,我们使用 iris 数据集,将数据集划分为训练集(70%)和测试集(30%)。
阅读全文