首页train_test——split

train_test——split

时间: 2023-10-23 12:12:27 浏览: 48

train_test_split 是一个常用的函数，用于将数据集划分为训练集和测试集。这个函数可以帮助我们评估机器学习模型的性能。在Python中，可以使用 scikit-learn 库中的 train_test_split 函数来实现数据集的划分。该函数接受多个参数，其中最重要的是要划分的数据集和测试集的比例。下面是一个示例代码，演示了如何使用 train_test_split 函数： ``` python from sklearn.model_selection import train_test_split # 假设有一个特征矩阵 X 和目标向量 y X = [[1, 2, 3], [4, 5, 6], [7, 8, 9]] y = [1, 2, 3] # 将数据集划分为训练集和测试集，测试集占比为 0.2 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) # 打印划分后的训练集和测试集 print("训练集 X:", X_train) print("训练集 y:", y_train) print("测试集 X:", X_test) print("测试集 y:", y_test) ``` 在上述代码中，我们将特征矩阵 X 和目标向量 y 划分成了训练集和测试集。测试集的大小占总数据集大小的 0.2（20%）。注意，train_test_split 函数还有其他可选参数，例如 random_state 参数，用于设置随机种子，以确保每次划分的结果一致。希望这个示例能够帮助你理解 train_test_split 函数的用法！如果还有其他问题，请随时提问。