鸢尾花训练好的训练集与测试集的可视化输出
时间: 2024-01-22 07:03:41 浏览: 20
鸢尾花数据集是一个常用的分类数据集,包含了三个类别的鸢尾花(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的数据。在进行机器学习模型训练时,需要将数据集分为训练集和测试集,以便评估模型的性能。
下面是使用Python中的sklearn库对鸢尾花数据集进行训练集和测试集划分,并可视化输出的代码示例:
``` python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
# 加载数据集
iris = load_iris()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
# 将数据集可视化输出
plt.scatter(X_train[:, 0], X_train[:, 1], c=y_train, cmap=plt.cm.Set1, edgecolor='k')
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.show()
```
上述代码首先通过sklearn库加载鸢尾花数据集,然后使用train_test_split函数将数据集划分为训练集和测试集(test_size参数表示测试集所占的比例,random_state参数用于设置随机种子,以保证每次划分结果一致)。最后使用matplotlib库将训练集可视化输出,其中X_train[:, 0]表示训练集中所有样本的第一个特征(花萼长度),X_train[:, 1]表示训练集中所有样本的第二个特征(花萼宽度),c=y_train表示使用目标变量(即鸢尾花的类别)进行颜色编码。