首页model_selection.train_test_spl

model_selection.train_test_spl

时间: 2024-01-13 21:04:34 浏览: 74

数据集分割train和test程序

`model_selection.train_test_split`是scikit-learn库中的一个函数，用于将数据集划分为训练集和测试集。下面是一个使用`train_test_split`函数的示例： ```python from sklearn.model_selection import train_test_split # 假设有一个特征矩阵X和目标向量y X = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] y = [1, 2, 3] # 将数据集划分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 打印划分后的训练集和测试集 print("训练集X:", X_train) print("测试集X:", X_test) print("训练集y:", y_train) print("测试集y:", y_test) ``` 这段代码将数据集X和y划分为训练集和测试集，其中`test_size=0.2`表示将20%的数据作为测试集，`random_state=42`表示设置随机种子，以确保每次运行代码时得到相同的划分结果。

阅读全文