首页train_test_split 结果可视化

train_test_split 结果可视化

时间: 2023-10-04 08:04:57 浏览: 53

当你使用 `train_test_split` 函数将数据集划分为训练集和测试集时，可以使用可视化工具来查看划分结果。下面是一个简单的例子，演示如何使用 matplotlib 库来可视化划分结果： ```python import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split # 假设你有一个特征矩阵 X 和目标变量 y # 使用 train_test_split 函数划分数据集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 绘制训练集和测试集的散点图 plt.scatter(X_train, y_train, label='Train') plt.scatter(X_test, y_test, label='Test') plt.xlabel('X') plt.ylabel('y') plt.legend() plt.show() ``` 在这个例子中，我们假设 `X` 是特征矩阵，`y` 是目标变量。`train_test_split` 函数将数据集按照指定的比例（这里是 80% 训练集，20% 测试集）随机划分为训练集和测试集，并且指定了随机种子(`random_state`)以确保结果的可重复性。然后，我们使用 `plt.scatter` 函数绘制训练集和测试集的散点图。每个点的 x 坐标表示特征值，y 坐标表示目标变量值。最后，我们使用 `plt.xlabel` 和 `plt.ylabel` 来设置 x 轴和 y 轴的标签，使用 `plt.legend` 添加图例，并使用 `plt.show` 显示图形。这样，你就可以通过散点图直观地查看数据集的划分情况。