train_test_split 结果可视化
时间: 2023-10-04 11:04:57 浏览: 51
当你使用 `train_test_split` 函数将数据集划分为训练集和测试集时,可以使用可视化工具来查看划分结果。下面是一个简单的例子,演示如何使用 matplotlib 库来可视化划分结果:
```python
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
# 假设你有一个特征矩阵 X 和目标变量 y
# 使用 train_test_split 函数划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 绘制训练集和测试集的散点图
plt.scatter(X_train, y_train, label='Train')
plt.scatter(X_test, y_test, label='Test')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()
```
在这个例子中,我们假设 `X` 是特征矩阵,`y` 是目标变量。`train_test_split` 函数将数据集按照指定的比例(这里是 80% 训练集,20% 测试集)随机划分为训练集和测试集,并且指定了随机种子(`random_state`)以确保结果的可重复性。
然后,我们使用 `plt.scatter` 函数绘制训练集和测试集的散点图。每个点的 x 坐标表示特征值,y 坐标表示目标变量值。最后,我们使用 `plt.xlabel` 和 `plt.ylabel` 来设置 x 轴和 y 轴的标签,使用 `plt.legend` 添加图例,并使用 `plt.show` 显示图形。
这样,你就可以通过散点图直观地查看数据集的划分情况。